GigaChat-Pro

GIGACHAT Создан 04.07.2024 10:42
0.537
Общий результат
Сабмит содержит не все обязательные задачи

Оценки по задачам лидерборда

Таблица скроллится влево

Задача Результат Метрика
LCS 0.09 Accuracy
RCB 0.53 / 0.449 Accuracy F1 macro
USE 0.338 Grade norm
RWSD 0.585 Accuracy
PARus 0.884 Accuracy
ruTiE 0.791 Accuracy
MultiQ 0.369 / 0.247 F1 Exact match
CheGeKa 0.104 / 0 F1 Exact match
ruModAr 0.866 Exact match
ruMultiAr 0.273 Exact match
MathLogicQA 0.467 Accuracy
ruWorldTree 0.939 / 0.939 Accuracy F1 macro
ruOpenBookQA 0.873 / 0.872 Accuracy F1 macro

Оценка на открытых задачах:

Перейти к оценкам по подкатегориям

Таблица скроллится влево

Задача Результат Метрика
BPS 0.318 Accuracy
ruMMLU 0.816 Accuracy
SimpleAr 0.971 Exact match
ruHumanEval 0.013 / 0.064 / 0.128 Pass@k
ruHHH 0.764
ruHateSpeech 0.751
ruDetox 0.238
ruEthics
Правильно Хорошо Этично
Добродетель -0.493 -0.449 -0.394
Закон -0.493 -0.423 -0.392
Мораль -0.492 -0.464 -0.399
Справедливость -0.447 -0.4 -0.345
Утилитаризм -0.422 -0.374 -0.322

Информация о сабмите:

Версия MERA
-
Версия Torch
-
Версия кодовой базы
-
Версия CUDA
-
Precision весов модели
-
Сид
-
Батч
-
Версия transformers
-
Количество GPU и их тип
-
Архитектура
-

Команда:

GIGACHAT

Название ML-модели:

GigaChat-Pro

Ссылка на ML-модель:

https://developers.sber.ru/portal/products/gigachat-api

Дополнительные ссылки:

https://developers.sber.ru/docs/ru/gigachat/api/overview

Описание архитектуры:

GigaChat Pro (version 1.0.26.8) is a Large Language Model (LLM) with 30B parameters that was fine-tuned on instruction corpus and has context length of 8192 tokens. The version is available for users via API since 13.07.

Описание обучения:

-

Данные претрейна:

-

Детали обучения:

-

Лицензия:

Proprietary model by Sber

Стратегия, генерация и параметры:

Code version v.1.1.0. All the parameters were not changed and are used as prepared by the organizers. Details: - 2 x NVIDIA A100 + accelerate - dtype float16 - Pytorch 2.3.1 + CUDA 12.1 - Transformers 4.42.3 - Context length 8192

Развернуть информацию

Оценки по подкатегориям

Метрика: Точность
Модель, команда Честность Помощь Безопасность
GigaChat-Pro
GIGACHAT
0.689 0.78 0.828
Модель, команда Анатомия Вирусология Астрономия Маркетинг Нутрициология Социология Менеджмент Философия История древнего мира Геронтология Эконометрика Формальная логика Факторы глобального значения Юриспунденция Микс (разнообразный домен) Мораль Бизнес-этика Биология (школьная) Физика (школьная) Человеческая сексуальность Моральные сценарии Мировые религии Общая алгебра Медицина (школьная) Машинное обучение Генетика Профессиональное законодательство PR Безопасность Химия (школьная) Компьютерная безопасность Международное право Логические ошибки Политика Клинические знания Концептуальная физика Математика (школьная) Биология (университетская) Физика (университетская) Химия (университетская) География (университетская) Профессиональная медицина Электротехника Элементарная математика Психология (университетская) Статистика (университетская) История (университетская) Математика (университетская) Бухгалтерский учет Профессиональная психология Компьютерные науки (уровень колледжа) Мировая история (университетская) Макроэкономика Микроэкономика Компьютерные науки (университетские) История европы Государство и политика
GigaChat-Pro
GIGACHAT
0.9 0.938 0.8 0.657 0.952 1 0.867 0.647 0.7 1 0.818 0.9 0.7 0.769 0.682 0.6 0.8 0.889 0.9 1 0.4 0.846 0.9 0.863 0.9 0.727 0.75 0.643 1 0.818 0.6 0.944 0.7 1 0.818 1 0.8 0.905 0.7 0.6 0.899 1 1 0.5 1 0.9 1 0.3 0.9 0.9 0.636 0.875 0.941 0.867 0.583 0.727 0.778
Модель, команда SIM FL STA
GigaChat-Pro
GIGACHAT
0.59 0.76 0.459
Правильно
Хорошо
Этично
Модель, команда Добродетель Закон Мораль Справедливость Утилитаризм
GigaChat-Pro
GIGACHAT
-0.493 -0.493 -0.492 -0.447 -0.422
Модель, команда Добродетель Закон Мораль Справедливость Утилитаризм
GigaChat-Pro
GIGACHAT
-0.449 -0.423 -0.464 -0.4 -0.374
Модель, команда Добродетель Закон Мораль Справедливость Утилитаризм
GigaChat-Pro
GIGACHAT
-0.394 -0.392 -0.399 -0.345 -0.322
Модель, команда Женщины Мужчины ЛГБТ Национальности Мигранты Другое
GigaChat-Pro
GIGACHAT
0.759 0.8 0.647 0.649 0.429 0.836