Первый открытый мультимодальный бенчмарк для русского языка, созданный экспертами с учётом культурной специфики РФ, признанный сообществом как национальный стандарт.
Проверяем, насколько ИИ понимает визуальный контекст, умеет распознавать объекты, интерпретировать сцены и сопоставлять с текстом на русском. Это важно для генерации, поиска и безопасности в прикладных применениях мультимодальных моделей
Проверяем восприятие речи, интонаций, команд и аудиоконтекста на русском языке. Актуально для голосовых помощников и моделей, работающих в шумной среде
Оцениваем, как ИИ работает с динамикой, действиями, контекстом и причинно-следственными связями в видео. Это основа для сложных ассистентов, агентных систем и мультимодального поиска
Сценарии, где текст, изображение, аудио и видео переплетены. Это вершина ИИ — не просто распознавать, а понимать в контексте, моделировать и воспринимать мир как человек
ИИ стремительно проникает в повседневную жизнь: от поиска и генерации контента до диагностики, образования и принятия решений.
Но без честных тестов мы не знаем, что именно модель «понимает», и можем переоценить её возможности. Особенно в контексте русского языка и культурных реалий.
Мы создаём стандарт, чтобы измерять прогресс и развивать ИИ ответственно
Альянс в сфере искусственного интеллекта — это уникальная организация, созданная для объединения усилий ведущих технологических компаний, исследователей и экспертов. Наша миссия — ускоренное развитие и внедрение искусственного интеллекта в ключевые сферы: образование, науку и бизнес.
Узнать больше про Альянс24 Sep 2025
Альянс в сфере ИИ представляет динамичесĸий бенчмарĸ SWE-MERA для оценĸи ĸодовых моделейЛинейĸа бенчмарĸов от Альянса в сфере ИИ пополнилась новым инструментом — динамичесĸим бенчмарĸом SWE-MERA, разработанным для ĸомплеĸсной оценĸи моделей для ĸодинга на задачах, приближенным к реальным условиям разработки. Создание SWE-MERA стало результатом сотрудничества ведущих российсĸих ĸоманд в области исĸусственного интеллеĸта: MWS AI (входит в МТС Web Services), Сбера и ИТМО.
18 Jul 2025
Альянс в сфере ИИ запустил MERA Code — первый открытый бенчмарк для оценки русскоязычных моделей на реальных задачах программированияАльянс в сфере ИИ объявил о запуске новой ветки бенчмарков — MERA Code
04 Jun 2025
Альянс в сфере ИИ запустил MERA Industrial: новый стандарт оценки отраслевых LLM для решения бизнес-задачАльянс в сфере ИИ объявил о запуске нового раздела MERA «MERA Industrial» — уникального бенчмарка для оценки больших языковых моделей (LLM) в различных отраслях.