Задачи

Бенчмарк включает 23 задачи из различных областей, оценивающие различные навыки модели.

Тип задачи
Все задачи
{{ taskName }}
Выбрать домены
Все домены
{{ domain.title }}
Развернуть список доменов Свернуть список доменов
Фильтры Сбросить
Тип задачи
{{ taskName }}
Выбрать домены
{{ domain.title }}
Фильтры
Название датасета
Способность модели
Top Score | Human Baseline
Метрика