GigaChat-Pro

GIGACHAT Создан 04.07.2024 10:42

0.537

Общий результат

Сабмит содержит не все обязательные задачи

Оценки по задачам лидерборда

Таблица скроллится влево

Задача	Результат	Метрика
LCS	0.09	Accuracy
RCB	0.53 / 0.449	Accuracy F1 macro
USE	0.338	Grade norm
RWSD	0.585	Accuracy
PARus	0.884	Accuracy
ruTiE	0.791	Accuracy
MultiQ	0.369 / 0.247	F1 Exact match
CheGeKa	0.104 / 0	F1 Exact match
ruModAr	0.866	Exact match
ruMultiAr	0.273	Exact match
MathLogicQA	0.467	Accuracy
ruWorldTree	0.939 / 0.939	Accuracy F1 macro
ruOpenBookQA	0.873 / 0.872	Accuracy F1 macro

Оценка на открытых задачах:

Перейти к оценкам по подкатегориям

Таблица скроллится влево

Задача

Результат

Метрика

BPS

0.318

Accuracy

ruMMLU

0.816

Accuracy

SimpleAr

0.971

Exact match

ruHumanEval

0.013 / 0.064 / 0.128

Pass@k

ruHHH

0.764

ruHateSpeech

0.751

ruDetox

0.238

ruEthics

	Правильно	Хорошо	Этично
Добродетель	-0.493	-0.449	-0.394
Закон	-0.493	-0.423	-0.392
Мораль	-0.492	-0.464	-0.399
Справедливость	-0.447	-0.4	-0.345
Утилитаризм	-0.422	-0.374	-0.322

Информация о сабмите:

Версия MERA

Версия Torch

Версия кодовой базы

Версия CUDA

Precision весов модели

Сид

Батч

Версия transformers

Количество GPU и их тип

Архитектура

Команда:

GIGACHAT

Название ML-модели:

GigaChat-Pro

Ссылка на ML-модель:

https://developers.sber.ru/portal/products/gigachat-api

Дополнительные ссылки:

https://developers.sber.ru/docs/ru/gigachat/api/overview

Описание архитектуры:

GigaChat Pro (version 1.0.26.8) is a Large Language Model (LLM) with 30B parameters that was fine-tuned on instruction corpus and has context length of 8192 tokens. The version is available for users via API since 13.07.

Описание обучения:

Данные претрейна:

Детали обучения:

Лицензия:

Proprietary model by Sber

Стратегия, генерация и параметры:

Code version v.1.1.0. All the parameters were not changed and are used as prepared by the organizers. Details: - 2 x NVIDIA A100 + accelerate - dtype float16 - Pytorch 2.3.1 + CUDA 12.1 - Transformers 4.42.3 - Context length 8192

Развернуть информацию

Оценки по подкатегориям

Метрика: Grade Norm

Модель, команда	1	2	3	4	5	6	7	8	9	10	11	12	13	14	15	16	17	18	19	20	21	22	23	24	25	26	8_0	8_1	8_2	8_3	8_4
GigaChat-Pro GIGACHAT	-	-	-	-	-	-	-	-	-	-	-	-	-	-	-	-	-	-	-	-	-	-	-	-	-	-	-	-	-	-	-

Модель, команда	Честность	Помощь	Безопасность
GigaChat-Pro GIGACHAT	0.689	0.78	0.828

Модель, команда	Анатомия	Вирусология	Астрономия	Маркетинг	Нутрициология	Социология	Менеджмент	Философия	История древнего мира	Геронтология	Эконометрика	Формальная логика	Факторы глобального значения	Юриспунденция	Микс (разнообразный домен)	Мораль	Бизнес-этика	Биология (школьная)	Физика (школьная)	Человеческая сексуальность	Моральные сценарии	Мировые религии	Общая алгебра	Медицина (школьная)	Машинное обучение	Генетика	Профессиональное законодательство	PR	Безопасность	Химия (школьная)	Компьютерная безопасность	Международное право	Логические ошибки	Политика	Клинические знания	Концептуальная физика	Математика (школьная)	Биология (университетская)	Физика (университетская)	Химия (университетская)	География (университетская)	Профессиональная медицина	Электротехника	Элементарная математика	Психология (университетская)	Статистика (университетская)	История (университетская)	Математика (университетская)	Бухгалтерский учет	Профессиональная психология	Компьютерные науки (уровень колледжа)	Мировая история (университетская)	Макроэкономика	Микроэкономика	Компьютерные науки (университетские)	История европы	Государство и политика
GigaChat-Pro GIGACHAT	0.9	0.938	0.8	0.657	0.952	1	0.867	0.647	0.7	1	0.818	0.9	0.7	0.769	0.682	0.6	0.8	0.889	0.9	1	0.4	0.846	0.9	0.863	0.9	0.727	0.75	0.643	1	0.818	0.6	0.944	0.7	1	0.818	1	0.8	0.905	0.7	0.6	0.899	1	1	0.5	1	0.9	1	0.3	0.9	0.9	0.636	0.875	0.941	0.867	0.583	0.727	0.778

Модель, команда	SIM	FL	STA
GigaChat-Pro GIGACHAT	0.59	0.76	0.459

Правильно

Хорошо

Этично

Модель, команда	Добродетель	Закон	Мораль	Справедливость	Утилитаризм
GigaChat-Pro GIGACHAT	-0.493	-0.493	-0.492	-0.447	-0.422

Модель, команда	Добродетель	Закон	Мораль	Справедливость	Утилитаризм
GigaChat-Pro GIGACHAT	-0.449	-0.423	-0.464	-0.4	-0.374

Модель, команда	Добродетель	Закон	Мораль	Справедливость	Утилитаризм
GigaChat-Pro GIGACHAT	-0.394	-0.392	-0.399	-0.345	-0.322

Модель, команда	Женщины	Мужчины	ЛГБТ	Национальности	Мигранты	Другое
GigaChat-Pro GIGACHAT	0.759	0.8	0.647	0.649	0.429	0.836

GigaChat-Pro

Оценки по задачам лидерборда

Оценка на открытых задачах:

Информация о сабмите:

Команда:

Название ML-модели:

Ссылка на ML-модель:

Дополнительные ссылки:

Описание архитектуры:

Описание обучения:

Данные претрейна:

Детали обучения:

Лицензия:

Стратегия, генерация и параметры:

Оценки по подкатегориям

Подтвердите удаление сабмита