Лидерборд

Агрегированный скор для рейтинга позволяет честно сравнивать модели даже тогда, когда они запускались на разных наборах задач: за пропущенные задачи модель получает нули, а по тем, где модель дала ответы, результаты усредняются с равными весами для всех задач. Такой подход даёт одно итоговое число и позволяет сравнивать оценки с разным набором входящих задач.

Публичный рейтинг результатов настраиваемый. Используйте фильтр, чтобы выбрать интересующие вас задачу и модели, и проводите сравнение только важных для вас моделей и задач.

{{ name }}
Фильтры
Фильтры
Задачи
Все задачи
Приватные
{{ task.title }}
Модели
Все сабмиты
{{ submit.name }}
Модель, команда
Результат
{{ i + 1 }}
{{ submit.name }} {{ transformSize(submit.size) }}
{{ submit.team_name }}
{{ getScore(submit) }}
{{ task.title }}
{{ submit.task_scores?.[task.title.replace('-', '_')] ?? '-' }}

Ничего не нашлось

Измените или сбросьте запрос