Llama 2 7B

Создан 12.01.2024 11:15

Общая оценка: 0.327

Таблица скроллится влево

Задача Результат Метрика
BPS 0.426 Accuracy
LCS 0.106 Accuracy
RCB 0.349 / 0.272 Avg. F1 / Accuracy
USE 0.014 Grade Norm
RWSD 0.504 Accuracy
PARus 0.532 Accuracy
ruTiE 0.5 Accuracy
MultiQ 0.081 / 0.011 F1-score/EM
ruMMLU 0.452 Accuracy
CheGeKa 0.021 / 0 F1 / EM
ruModAr 0.367 Accuracy
SimpleAr 0.839 Accuracy
ruMultiAr 0.124 Accuracy
MathLogicQA 0.277 Accuracy
ruHumanEval 0.007 / 0.034 / 0.067 pass@k
ruWorldTree 0.545 / 0.543 Avg. F1 / Accuracy
ruOpenBookQA 0.475 / 0.471 Avg. F1 / Accuracy

Оценка на диагностических датасетах:

Не учитывается в общем рейтинге

Таблица скроллится влево

Задача Результат Метрика
ruHHH

0.5

  • Honest: 0.475
  • Harmless: 0.5
  • Helpful: 0.525
Accuracy
ruHateSpeech

0.536

  • Женщины : 0.593
  • Мужчины : 0.514
  • ЛГБТ : 0.588
  • Национальность : 0.486
  • Мигранты : 0.429
  • Другое : 0.475
Accuracy
ruDetox
  • 0.261
  • 0.588
  • 0.582
  • 0.611

Общая средняя оценка (J)

Оценка сохранения смысла (SIM)

Оценка натуральности (FL)

Точность переноса стиля (STA)

ruEthics
Правильно Хорошо Этично
Добродетель -0.115 -0.043 -0.114
Закон -0.124 -0.019 -0.112
Мораль -0.11 -0.037 -0.124
Справедливость -0.129 -0.058 -0.122
Утилитаризм -0.097 -0.05 -0.092

Результаты таблицы:

[[-0.115, -0.124 , -0.11, -0.129 , -0.097],
[-0.043, -0.019 , -0.037, -0.058 , -0.05],
[-0.114, -0.112 , -0.124, -0.122 , -0.092]]

5 MCC

Информация о сабмите:

Команда:

MERA

Название ML-модели:

Llama 2 7B

Ссылка на ML-модель:

https://huggingface.co/meta-llama/Llama-2-7b-hf

Дополнительные ссылки:

https://arxiv.org/abs/2307.09288

Описание архитектуры:

Llama 2 is an auto-regressive language model that uses an optimized transformer architecture.

Описание обучения:

Authors used custom training libraries, Meta's Research Super Cluster, and production clusters for pretraining. Fine-tuning, annotation, and evaluation were also performed on third-party cloud compute.

Данные претрейна:

Llama 2 was pretrained on 2 trillion tokens of data from publicly available sources.

Детали обучения:

Token counts refer to pretraining data only. All models are trained with a global batch-size of 4M tokens.

Лицензия:

A custom commercial license is available at: https://ai.meta.com/resources/models-and-libraries/llama-downloads/

Стратегия, генерация и параметры:

Code version v.1.1.0 All the parameters were not changed and are used as prepared by the organizers. Details: - 1 x NVIDIA A100 - dtype auto - Pytorch 2.1.2 + CUDA 12.1 - Transformers 4.36.2 - Context length 4096