MTS AI Chat 7B

MTS AI Создан 11.02.2024 22:10

0.479

Общий результат

Сабмит содержит не все обязательные задачи

Оценки по задачам лидерборда

Таблица скроллится влево

Задача	Результат	Метрика
LCS	0.094	Accuracy
RCB	0.532 / 0.53	Accuracy F1 macro
USE	0.128	Grade norm
RWSD	0.615	Accuracy
PARus	0.834	Accuracy
ruTiE	0.574	Accuracy
MultiQ	0.361 / 0.278	F1 Exact match
CheGeKa	0.083 / 0.046	F1 Exact match
ruModAr	0.717	Exact match
ruMultiAr	0.233	Exact match
MathLogicQA	0.407	Accuracy
ruWorldTree	0.846 / 0.845	Accuracy F1 macro
ruOpenBookQA	0.763 / 0.762	Accuracy F1 macro

Оценка на открытых задачах:

Перейти к оценкам по подкатегориям

Таблица скроллится влево

Задача

Результат

Метрика

BPS

0.276

Accuracy

ruMMLU

0.689

Accuracy

SimpleAr

0.955

Exact match

ruHumanEval

0.018 / 0.088 / 0.177

Pass@k

ruHHH

0.719

ruHateSpeech

0.758

ruDetox

0.229

ruEthics

	Правильно	Хорошо	Этично
Добродетель	-0.276	-0.313	-0.419
Закон	-0.28	-0.283	-0.381
Мораль	-0.279	-0.319	-0.417
Справедливость	-0.247	-0.295	-0.378
Утилитаризм	-0.223	-0.267	-0.338

Информация о сабмите

Версия MERA

Версия Torch

Версия кодовой базы

Версия CUDA

Precision весов модели

Сид

Батч

Версия transformers

Количество GPU и их тип

Архитектура

Команда:

MTS AI

Название ML-модели:

MTS AI Chat 7B

Ссылка на ML-модель:

https://huggingface.co/mistralai/Mistral-7B-v0.1

Описание архитектуры:

Mistral 7B model architecture

Описание обучения:

Mistral trained on proprietary DPO and SFT datasets

Данные претрейна:

Детали обучения:

Лицензия:

Proprietary model developed by MTS AI

Стратегия, генерация и параметры:

Code version v.1.1.0 All the parameters were not changed. Inference details: torch 2.1.0 + Cuda 11.8. max length 6012 tokens

Комментарии об инференсе:

we run the model using MERA github repo without any changes using hf inference script

Оценки по подкатегориям

Метрика: Grade Norm

Модель, команда	1	2	3	4	5	6	7	8	9	10	11	12	13	14	15	16	17	18	19	20	21	22	23	24	25	26	8_0	8_1	8_2	8_3	8_4
MTS AI Chat 7B MTS AI	-	-	-	-	-	-	-	-	-	-	-	-	-	-	-	-	-	-	-	-	-	-	-	-	-	-	-	-	-	-	-

Модель, команда	Честность	Помощь	Безопасность
MTS AI Chat 7B MTS AI	0.672	0.661	0.828

Модель, команда	Анатомия	Вирусология	Астрономия	Маркетинг	Нутрициология	Социология	Менеджмент	Философия	История древнего мира	Геронтология	Эконометрика	Формальная логика	Факторы глобального значения	Юриспунденция	Микс (разнообразный домен)	Мораль	Бизнес-этика	Биология (школьная)	Физика (школьная)	Человеческая сексуальность	Моральные сценарии	Мировые религии	Общая алгебра	Медицина (школьная)	Машинное обучение	Генетика	Профессиональное законодательство	PR	Безопасность	Химия (школьная)	Компьютерная безопасность	Международное право	Логические ошибки	Политика	Клинические знания	Концептуальная физика	Математика (школьная)	Биология (университетская)	Физика (университетская)	Химия (университетская)	География (университетская)	Профессиональная медицина	Электротехника	Элементарная математика	Психология (университетская)	Статистика (университетская)	История (университетская)	Математика (университетская)	Бухгалтерский учет	Профессиональная психология	Компьютерные науки (уровень колледжа)	Мировая история (университетская)	Макроэкономика	Микроэкономика	Компьютерные науки (университетские)	История европы	Государство и политика
MTS AI Chat 7B MTS AI	0.8	0.625	0.6	0.743	0.762	0.8	0.667	0.647	0.5	0.9	0.727	0.6	0.9	0.577	0.545	0.6	0.8	0.667	0.4	0.9	0.2	0.788	0.8	0.706	0.6	0.636	0.875	0.714	0.9	0.636	0.3	0.667	0.4	0.8	0.818	0.9	0.7	0.714	0.6	0.5	0.772	0.7	0.8	0.5	0.875	0.9	0.9	0.4	0.5	0.9	0.591	0.75	0.765	0.867	0.542	0.394	0.704

Модель, команда	SIM	FL	STA
MTS AI Chat 7B MTS AI	0.724	0.584	0.517

Правильно

Хорошо

Этично

Модель, команда	Добродетель	Закон	Мораль	Справедливость	Утилитаризм
MTS AI Chat 7B MTS AI	-0.276	-0.28	-0.279	-0.247	-0.223

Модель, команда	Добродетель	Закон	Мораль	Справедливость	Утилитаризм
MTS AI Chat 7B MTS AI	-0.313	-0.283	-0.319	-0.295	-0.267

Модель, команда	Добродетель	Закон	Мораль	Справедливость	Утилитаризм
MTS AI Chat 7B MTS AI	-0.419	-0.381	-0.417	-0.378	-0.338

Модель, команда	Женщины	Мужчины	ЛГБТ	Национальности	Мигранты	Другое
MTS AI Chat 7B MTS AI	0.75	0.771	0.765	0.757	0.571	0.787

MTS AI Chat 7B

Оценки по задачам лидерборда

Оценка на открытых задачах:

Информация о сабмите

Команда:

Название ML-модели:

Ссылка на ML-модель:

Описание архитектуры:

Описание обучения:

Данные претрейна:

Детали обучения:

Лицензия:

Стратегия, генерация и параметры:

Комментарии об инференсе:

Оценки по подкатегориям

Подтвердите удаление сабмита