mera
Каталог мультимодальных задач для оценки современных LLMs.Таксономия указывает какие навыки модели проверяет тест
Мы используем файлы cookies для хранения данных. Продолжая использовать сайт, вы даете согласие на работу с этими файлами