Claude Opus 4.6

MERA Создан 26.02.2026 08:21
0.472
Общий результат

Оценки по задачам лидерборда

Таблица скроллится влево

Задача Результат Метрика
YABLoCo 0.13 / 0.149
EM pass@k
stRuCom 0.318
chrF
RealCode 0.501 / 0.943
pass@k execution_success
UnitTests 0.367
CodeBLEU
ruCodeEval 0.245 / 0.29 / 0.299
pass@k
JavaTestGen 0.405 / 0.639
pass@k compile@1
ruHumanEval 0.462 / 0.507 / 0.518
pass@k
RealCodeJava 0.433 / 0.966
pass@k execution_success
CodeLinterEval 0.973 / 0.973 / 0.973
pass@k
ruCodeReviewer 0.046 / 0.183 / 0.176 / 0.38 / 0.467
chrF BLEU judge@1 judge@5 judge@10
CodeCorrectness 0.912
EM

Информация о сабмите

Версия MERA
v1.0.0
Версия Torch
2.9.0
Версия кодовой базы
7030e16
Версия CUDA
12.8
Precision весов модели
auto
Сид
1234
Батч
1
Версия transformers
4.57.1
Количество GPU и их тип
1 x NVIDIA A100-SXM4-80GB
Архитектура
openai-chat-completions

Команда:

MERA

Название ML-модели:

Claude Opus 4.6

Ссылка на ML-модель:

https://www.anthropic.com/news/claude-opus-4-6

Тип модели:

Закрытая

API

SFT

Дополнительные ссылки:

Model was assessed with 1k tokens for reasoning.

Параметры инференса

Параметры генерации:
codecorrectness - until=[" \n \n"];do_sample=false;temperature=0; \ncodelintereval - do_sample=true;temperature=0.6;max_gen_toks=1024;until=[" \n \n"]; \njavatestgen - do_sample=true;max_gen_toks=4096;temperature=0.2;top_p=0.9;until=["<|endoftext|>","<|im_end|>"]; \nrealcode - do_sample=true;max_gen_toks=4096;temperature=0.7;repetition_penalty=1.05;top_p=0.8;until=["<|endoftext|>","<|im_end|>"]; \nrealcodejava - do_sample=true;max_gen_toks=4096;temperature=0.7;repetition_penalty=1.05;top_p=0.8;until=["<|endoftext|>","<|im_end|>"]; \nrucodeeval_code - do_sample=true;temperature=0.6;max_gen_toks=1024;until=[" \nclass"," \ndef"," \n#"," \nif"," \nprint"]; \nrucodereviewer - temperature=0;do_sample=false;max_gen_toks=1000;until=[" \n \n"]; \nruhumaneval_code - do_sample=true;temperature=0.6;max_gen_toks=1024;until=[" \nclass"," \ndef"," \n#"," \nif"," \nprint"]; \nstrucom - do_sample=false;max_gen_toks=512;until=[" \n \n"]; \nunittests - do_sample=false;max_gen_toks=1024;until=[" \n \n"]; \nyabloco_oracle - max_gen_toks=2048;do_sample=false;until=["<|endoftext|>","<|im_end|>"," \n \n \n","\sclass\s","\sdef\s","^def\s","^class\s","^if\s","@","^#"];