Лидерборд

Общая оценка модели на лидерборде считается по среднему скору задач без учёта диагностических заданий. Для задач с несколькими метриками — метрики в начале усредняются.

Текущая версия бенчмарка представляет собой статичный рейтинг моделей. В ближайшее время добавится функционал для тестирования пользовательских моделей и отправки сабмитов. Следите за обновлениями!