MTS AI Chat 7B

MTS AI Создан 11.02.2024 22:10
0.479
Общий результат
Сабмит содержит не все обязательные задачи

Оценки по задачам лидерборда

Таблица скроллится влево

Задача Результат Метрика
LCS 0.094 Accuracy
RCB 0.532 / 0.53 Accuracy F1 macro
USE 0.128 Grade norm
RWSD 0.615 Accuracy
PARus 0.834 Accuracy
ruTiE 0.574 Accuracy
MultiQ 0.361 / 0.278 F1 Exact match
CheGeKa 0.083 / 0.046 F1 Exact match
ruModAr 0.717 Exact match
ruMultiAr 0.233 Exact match
MathLogicQA 0.407 Accuracy
ruWorldTree 0.846 / 0.845 Accuracy F1 macro
ruOpenBookQA 0.763 / 0.762 Accuracy F1 macro

Оценка на открытых задачах:

Перейти к оценкам по подкатегориям

Таблица скроллится влево

Задача Результат Метрика
BPS 0.276 Accuracy
ruMMLU 0.689 Accuracy
SimpleAr 0.955 Exact match
ruHumanEval 0.018 / 0.088 / 0.177 Pass@k
ruHHH 0.719
ruHateSpeech 0.758
ruDetox 0.229
ruEthics
Правильно Хорошо Этично
Добродетель -0.276 -0.313 -0.419
Закон -0.28 -0.283 -0.381
Мораль -0.279 -0.319 -0.417
Справедливость -0.247 -0.295 -0.378
Утилитаризм -0.223 -0.267 -0.338

Информация о сабмите:

Версия MERA
-
Версия Torch
-
Версия кодовой базы
-
Версия CUDA
-
Precision весов модели
-
Сид
-
Батч
-
Версия transformers
-
Количество GPU и их тип
-
Архитектура
-

Команда:

MTS AI

Название ML-модели:

MTS AI Chat 7B

Ссылка на ML-модель:

https://huggingface.co/mistralai/Mistral-7B-v0.1

Описание архитектуры:

Mistral 7B model architecture

Описание обучения:

Mistral trained on proprietary DPO and SFT datasets

Данные претрейна:

-

Детали обучения:

-

Лицензия:

Proprietary model developed by MTS AI

Стратегия, генерация и параметры:

Code version v.1.1.0 All the parameters were not changed. Inference details: torch 2.1.0 + Cuda 11.8. max length 6012 tokens

Комментарии об инференсе:

we run the model using MERA github repo without any changes using hf inference script

Развернуть информацию

Оценки по подкатегориям

Метрика: Точность
Модель, команда Честность Помощь Безопасность
MTS AI Chat 7B
MTS AI
0.672 0.661 0.828
Модель, команда Анатомия Вирусология Астрономия Маркетинг Нутрициология Социология Менеджмент Философия История древнего мира Геронтология Эконометрика Формальная логика Факторы глобального значения Юриспунденция Микс (разнообразный домен) Мораль Бизнес-этика Биология (школьная) Физика (школьная) Человеческая сексуальность Моральные сценарии Мировые религии Общая алгебра Медицина (школьная) Машинное обучение Генетика Профессиональное законодательство PR Безопасность Химия (школьная) Компьютерная безопасность Международное право Логические ошибки Политика Клинические знания Концептуальная физика Математика (школьная) Биология (университетская) Физика (университетская) Химия (университетская) География (университетская) Профессиональная медицина Электротехника Элементарная математика Психология (университетская) Статистика (университетская) История (университетская) Математика (университетская) Бухгалтерский учет Профессиональная психология Компьютерные науки (уровень колледжа) Мировая история (университетская) Макроэкономика Микроэкономика Компьютерные науки (университетские) История европы Государство и политика
MTS AI Chat 7B
MTS AI
0.8 0.625 0.6 0.743 0.762 0.8 0.667 0.647 0.5 0.9 0.727 0.6 0.9 0.577 0.545 0.6 0.8 0.667 0.4 0.9 0.2 0.788 0.8 0.706 0.6 0.636 0.875 0.714 0.9 0.636 0.3 0.667 0.4 0.8 0.818 0.9 0.7 0.714 0.6 0.5 0.772 0.7 0.8 0.5 0.875 0.9 0.9 0.4 0.5 0.9 0.591 0.75 0.765 0.867 0.542 0.394 0.704
Модель, команда SIM FL STA
MTS AI Chat 7B
MTS AI
0.724 0.584 0.517
Правильно
Хорошо
Этично
Модель, команда Добродетель Закон Мораль Справедливость Утилитаризм
MTS AI Chat 7B
MTS AI
-0.276 -0.28 -0.279 -0.247 -0.223
Модель, команда Добродетель Закон Мораль Справедливость Утилитаризм
MTS AI Chat 7B
MTS AI
-0.313 -0.283 -0.319 -0.295 -0.267
Модель, команда Добродетель Закон Мораль Справедливость Утилитаризм
MTS AI Chat 7B
MTS AI
-0.419 -0.381 -0.417 -0.378 -0.338
Модель, команда Женщины Мужчины ЛГБТ Национальности Мигранты Другое
MTS AI Chat 7B
MTS AI
0.75 0.771 0.765 0.757 0.571 0.787