Общая оценка модели на лидерборде считается по среднему скору задач без учёта публичных заданий. Для задач с несколькими метриками — метрики в начале усредняются.
Лидерборд считается по обновленному коду и датасетам бенчмарка MERA v1.2.0. Прошлый лидерборд не поддерживается и доступен здесь.
{{ task.title }} |
---|
{{ getTaskScore(submit, task) }} |
{{ column.title }} |
---|
{{ getSubcategoryColumnValue(submit, column) }} |
Нет подходящих результатов