Лидерборд

Общая оценка модели на лидерборде считается по среднему всех метрик для задачи. Общий тотал — это среднее по всем задачам, приватный тотал — по только приватным тестам.

Лидерборд MERA SWE для динамической оценки кодовых моделей доступен на отдельном сайте по ссылке

Фильтры

Выбрать задачи

Все задачи

Выбрать языки программирования

Все языки

Модель, команда

Общий тотал

Приватный тотал

{{ task.title }}
{{ getTaskScore(submit, task) }}

Нет подходящих результатов