GigaChat3-10B-A1.8B

GigaChat Создан 19.11.2025 19:15

Оценки по задачам лидерборда

Таблица скроллится влево

Задача Результат Место в рейтинге
Сельское хозяйство 0.545 3
Медицина и здравоохранение 0.629 10

Информация о сабмите

Версия MERA
1.0.0
Версия Torch
2.9.1+cu128
Версия кодовой базы
435b60a
Версия CUDA
1
Precision весов модели
bf8
Сид
1234
Батч
1
Версия transformers
4.57.1
Количество GPU и их тип
1 NVIDIA A100-SXM4-80GB
Архитектура
local-chat-completions

Команда:

GigaChat

Название ML-модели:

GigaChat3-10B-A1.8B

Ссылка на ML-модель:

https://huggingface.co/ai-sage/GigaChat3-10B-A1.8B

Размер модели

10.0B

Тип модели:

Открытая

SFT

MoE

Описание архитектуры:

Представляем `GigaChat3-10B-A1.8B` — инструктивную (instruct) модель семейства GigaChat. Модель основана на архитектуре Mixture-of-Experts (MoE) с 10B общих и 1.8B активных параметров. Архитектура включает **Multi-head Latent Attention (MLA)** и **Multi-Token Prediction (MTP)**, за счет этого модель оптимизированна для высокой пропускной способности (throughput) при инференсе.

Лицензия:

MIT