RU EN

Задачи

Бенчмарк включает 23 задачи из различных областей, оценивающие различные навыки модели.

Тип задачи

Все задачи

Выбрать домены

Все домены

Развернуть список доменов Свернуть список доменов

Фильтры

Название датасета

Способность модели

Top Score | Human Baseline

Метрика