Лидерборд

Агрегированный скор для рейтинга позволяет честно сравнивать модели даже тогда, когда они запускались на разных наборах задач: за пропущенные задачи модель получает нули, а по тем, где модель дала ответы, результаты усредняются с равными весами для всех задач. Такой подход даёт одно итоговое число и позволяет сравнивать оценки с разным набором входящих задач.

Публичный рейтинг результатов настраиваемый. Используйте фильтр, чтобы выбрать интересующие вас задачу и модели, и проводите сравнение только важных для вас моделей и задач.

Фильтры

Модель, команда

Результат

{{ task.title }}
{{ submit.task_scores?.[task.title.replace('-', '_')] ?? '-' }}

#	Модель, команда	Общий тотал	{{ task.title }}
{{ i + 1 }}	{{ submit.name }} {{ submit.size <= 0 ? '' : ('(' + transformSize(submit.size) + ') ') }}- {{ submit.team_name }}	{{ submit.score }}	{{ submit.task_scores?.[task.title.replace('-', '_')] ?? '-' }}

Ничего не нашлось

Измените или сбросьте запрос