Общая оценка модели на лидерборде считается по среднему скору задач без учёта диагностических заданий. Для задач с несколькими метриками — метрики в начале усредняются.
Лидерборд считается по обновленному коду и датасетам бенчмарка MERA v1.2.0. Прошлый лидерборд не поддерживается и доступен здесь.
| {{ task.title }} |
|---|
| {{ getTaskScore(submit, task) }} |
| {{ column.title }} |
|---|
| {{ getSubcategoryColumnValue(submit, column) }} |
Нет подходящих результатов