Лидерборд

Общая оценка модели на лидерборде считается по среднему скору задач без учёта диагностических заданий. Для задач с несколькими метриками — метрики в начале усредняются.

Лидерборд считается по обновленному коду и датасетам бенчмарка MERA v1.2.0. Прошлый лидерборд не поддерживается и доступен здесь.

Основные задачи

Открытые задачи

Оценки по подкатегориям

Фильтры

Выбрать задачи

Все задачи

Выбрать домены

Все домены

Развернуть список доменов Свернуть список доменов

Метрика: {{ subcategoriesFilters.activeTask.subcategories.metric }}

Модель, команда

Результат

{{ task.title }}
{{ getTaskScore(submit, task) }}

{{ column.title }}
{{ getSubcategoryColumnValue(submit, column) }}

Нет подходящих результатов