<Бенчмарк для современных кодовых LLM>

Модель, команда

Общий тотал

Приватный тотал

{{ task.title }}
{{ getTaskScore(submit, task) }}

Нет подходящих результатов

#	Модель, команда	Общий тотал	Приватный тотал	{{ task.title }}	{{ column.title }}
{{ i + 1 }}	{{ submit.name }} {{ submit.size <= 0 ? '' : ('(' + transformSize(submit.size) + ') ') }}- {{ submit.team_name }}	{{ submit.score }}	{{ submit.private_score }}	{{ getTaskScore(submit, task) }}

Смотреть лидерборд Загрузить сабмит

Новый стандарт для независимой оценки моделей

Быстрая и точная оценка моделей за пару шагов

Экспертный подход

Методология создана экспертами индустрии и академии

Многозадачность и мультиязычность

Разнообразие задач для оценки кода от код-ревью до юнит-тестирования для 8 языков программирования

Доступность

Доступ к открытому коду, фиксированным промптам и параметрам запусков

Партнёры и участники

Что мы предлагаем

Количественные метрики и качественный анализ, фиксированные параметры запусков и единая методология промптов — для прозрачной и детальной оценки

Независимый лидерборд для оценки современных моделей

Сравнение последних фронтиер-моделей ИИ
Определение лучших моделей в конкретных областях и знаниях
Полезный инструмент для разработчиков для анализа и выбора оптимальной модели под свои нужды

Задачи для любого уровня экспертизы

Каталог кодовых задач с детальной информацией о тесте и его создании

Управляйте сабмитами в личном кабинете

Быстрая регистрация
Все активные сабмиты под рукой
Подробные результаты оценки по задачам

Прозрачная методология тестирования генеративных моделей

Ознакомьтесь с подробным описанием методологии создания бенчмарка

Оцените модели за минуты, а не недели

Отправляйте сабмиты, отслеживайте результаты и сравнивайте модели в одном месте

Объединяем лидеров для будущего технологий

Альянс в сфере искусственного интеллекта — это уникальная организация, созданная для объединения усилий ведущих технологических компаний, исследователей и экспертов. Наша миссия — ускоренное развитие и внедрение искусственного интеллекта в ключевые сферы: образование, науку и бизнес.

Узнать больше про Альянс

Новости

Смотреть все Все

24 Jul 2026

Альянс в сфере ИИ запустил открытый лидерборд для оценки способности моделей к рассуждению на русском языке

Альянс в сфере ИИ представил открытый лидерборд MERA TEXT для оценки способности современных языковых моделей к рассуждению на русском языке. Площадка объединяет четыре набора математических и логических задач и позволяет сравнивать модели в едином воспроизводимом окружении.

24 Sep 2025

Альянс в сфере ИИ представляет динамичесĸий бенчмарĸ SWE-MERA для оценĸи ĸодовых моделей

Линейĸа бенчмарĸов от Альянса в сфере ИИ пополнилась новым инструментом — динамичесĸим бенчмарĸом SWE-MERA, разработанным для ĸомплеĸсной оценĸи моделей для ĸодинга на задачах, приближенным к реальным условиям разработки. Создание SWE-MERA стало результатом сотрудничества ведущих российсĸих ĸоманд в области исĸусственного интеллеĸта: MWS AI (входит в МТС Web Services), Сбера и ИТМО.

18 Jul 2025

Альянс в сфере ИИ запустил MERA Code — первый открытый бенчмарк для оценки русскоязычных моделей на реальных задачах программирования

Альянс в сфере ИИ объявил о запуске новой ветки бенчмарков — MERA Code

04 Jun 2025

Альянс в сфере ИИ запустил MERA Industrial: новый стандарт оценки отраслевых LLM для решения бизнес-задач

Альянс в сфере ИИ объявил о запуске нового раздела MERA «MERA Industrial» — уникального бенчмарка для оценки больших языковых моделей (LLM) в различных отраслях.