Kimi-VL-A3B-Instruct

MERA Создан 28.03.2026 14:57

Оценки по задачам лидерборда

Таблица скроллится влево

Борд	Результат	Attempted Score	Coverage	Место в рейтинге
Мульти	0.037	0.122	0.303	65
Изображения	0.111	0.122	0.909	43

Задачи

Таблица скроллится влево

Задача	Результат	Метрика
WEIRD	0.269	EM JudgeScore
RealVQA	0.132	EM JudgeScore
ruCLEVR	0.156	EM JudgeScore
LabTabVQA	0.05	EM JudgeScore
ruMathVQA	0.003	EM JudgeScore
ruCommonVQA	0.223	EM JudgeScore
ruHHH-Image	0.076	EM JudgeScore
UniScienceVQA	0.044	EM JudgeScore
culture	0 / 0.073
business	0.002 / 0.11
medicine	0.003 / 0.086
social_sciences	0.007 / 0.136
fundamental_sciences	0 / 0.066
applied_sciences	0 / 0.102
SchoolScienceVQA	0.098	EM JudgeScore
biology	0.003 / 0.239
chemistry	0.002 / 0.175
physics	0.003 / 0.251
economics	0.01 / 0.195
ru	0.008 / 0.144
all	0 / 0.156
ruNaturalScienceVQA	0.168	EM JudgeScore
biology	0 / 0.228
chemistry	0 / 0.299
physics	0.005 / 0.359
science	0 / 0.415

Информация о сабмите

Версия MERA

v1.0.0

Версия Torch

2.8.0

Версия кодовой базы

eea0c30

Версия CUDA

12.8

Precision весов модели

bfloat16

Сид

1234

Батч

Версия transformers

4.57.1

Количество GPU и их тип

4 x NVIDIA A100-SXM4-80GB

Архитектура

vllm-vlm

Команда:

MERA

Название ML-модели:

Kimi-VL-A3B-Instruct

Ссылка на ML-модель:

https://huggingface.co/moonshotai/Kimi-VL-A3B-Instruct

Размер модели

16.0B

Тип модели:

Открытая

SFT

Дополнительные ссылки:

https://arxiv.org/abs/2504.07491

Описание архитектуры:

The model adopts an MoE language model, a native-resolution visual encoder (MoonViT), and an MLP projector.

Лицензия:

MIT License

Параметры инференса

Параметры генерации:
labtabvqa - until=["\n\n"];do_sample=false;temperature=0; \nrealvqa - until=["\n\n"];do_sample=false;temperature=0; \nruclevr - until=["\n\n"];do_sample=false;temperature=0; \nrucommonvqa - until=["\n\n"];do_sample=false;temperature=0; \nruhhh_image - until=["\n\n"];do_sample=false;temperature=0; \nrumathvqa - until=["\n\n"];do_sample=false;temperature=0; \nrunaturalsciencevqa_biology - until=["\n\n"];do_sample=false;temperature=0; \nrunaturalsciencevqa_chemistry - until=["\n\n"];do_sample=false;temperature=0; \nrunaturalsciencevqa_earth_science - until=["\n\n"];do_sample=false;temperature=0; \nrunaturalsciencevqa_physics - until=["\n\n"];do_sample=false;temperature=0; \nschoolsciencevqa_biology - until=["\n\n"];do_sample=false;temperature=0; \nschoolsciencevqa_chemistry - until=["\n\n"];do_sample=false;temperature=0; \nschoolsciencevqa_earth_science - until=["\n\n"];do_sample=false;temperature=0; \nschoolsciencevqa_economics - until=["\n\n"];do_sample=false;temperature=0; \nschoolsciencevqa_history_all - until=["\n\n"];do_sample=false;temperature=0; \nschoolsciencevqa_history_ru - until=["\n\n"];do_sample=false;temperature=0; \nschoolsciencevqa_physics - until=["\n\n"];do_sample=false;temperature=0; \nunisciencevqa_applied_sciences - until=["\n\n"];do_sample=false;temperature=0; \nunisciencevqa_business - until=["\n\n"];do_sample=false;temperature=0; \nunisciencevqa_cultural_studies - until=["\n\n"];do_sample=false;temperature=0; \nunisciencevqa_fundamental_sciences - until=["\n\n"];do_sample=false;temperature=0; \nunisciencevqa_health_and_medicine - until=["\n\n"];do_sample=false;temperature=0; \nunisciencevqa_social_sciences - until=["\n\n"];do_sample=false;temperature=0; \nweird - until=["\n\n"];do_sample=false;temperature=0;

Размер контекста:
labtabvqa, realvqa, ruclevr, rucommonvqa, ruhhh_image, rumathvqa, runaturalsciencevqa_biology, runaturalsciencevqa_chemistry, runaturalsciencevqa_earth_science, runaturalsciencevqa_physics, schoolsciencevqa_biology, schoolsciencevqa_chemistry, schoolsciencevqa_earth_science, schoolsciencevqa_economics, schoolsciencevqa_history_all, schoolsciencevqa_history_ru, schoolsciencevqa_physics, unisciencevqa_applied_sciences, unisciencevqa_business, unisciencevqa_cultural_studies, unisciencevqa_fundamental_sciences, unisciencevqa_health_and_medicine, unisciencevqa_social_sciences, weird - 4096

Описание темплейта:
{%- for message in messages -%} \n {%- if loop.first and messages[0]['role'] != 'system' -%} \n {{'<|im_system|>system<|im_middle|>You are a helpful assistant<|im_end|>'}} \n {%- endif -%} \n {%- if message['role'] == 'system' -%} \n {{'<|im_system|>'}} \n {%- endif -%} \n {%- if message['role'] == 'user' -%} \n {{'<|im_user|>'}} \n {%- endif -%} \n {%- if message['role'] == 'assistant' -%} \n {{'<|im_assistant|>'}} \n {%- endif -%} \n {{- message['role'] -}} \n {{'<|im_middle|>'}} \n {%- if message['content'] is string -%} \n {{- message['content'] + '<|im_end|>' -}} \n {%- else -%} \n {%- for content in message['content'] -%} \n {%- if content['type'] == 'image' or 'image' in content or 'image_url' in content -%} \n {{'<|media_start|>image<|media_content|><|media_pad|><|media_end|>'}} \n {%- else -%} \n {{content['text']}} \n {%- endif -%} \n {%- endfor -%} \n {{'<|im_end|>'}} \n {%- endif -%} \n{%- endfor -%} \n{%- if add_generation_prompt -%} \n {{'<|im_assistant|>assistant<|im_middle|>'}} \n{%- endif -%}

Kimi-VL-A3B-Instruct

Оценки по задачам лидерборда

Задачи

Информация о сабмите

Команда:

Название ML-модели:

Ссылка на ML-модель:

Размер модели

Тип модели:

Дополнительные ссылки:

Описание архитектуры:

Лицензия:

Параметры инференса

Подтвердите удаление сабмита