MiMo-V2-Flash от Xiaomi: открытая ИИ-модель уровня GPT-5 и Claude 4.5 Sonnet

2025-12-18 199 комментарии
Новая языковая модель Xiaomi MiMo-V2-Flash превосходит другие открытые решения и демонстрирует производительность на уровне GPT-5 и Claude 4.5 Sonnet в тестах SWE-Bench. Архитектура MoE и технология Multi-Token Prediction обеспечивают генерацию 150 токенов в секунду при крайне низких затратах на эксплуатацию

Компания Xiaomi официально анонсировала свою наиболее продвинутую на текущий момент большую языковую модель под названием MiMo-V2-Flash. Данная разработка является частью масштабной стратегии бренда по развитию базовых моделей ИИ. Основное внимание при создании новинки было уделено высокой скорости работы и эффективности архитектуры при сохранении значительных возможностей в области логических рассуждений и написания программного кода.

В Xiaomi позиционируют MiMo-V2-Flash как прямого конкурента ведущим решениям на рынке, включая DeepSeek V3.2 и Claude 4.5 Sonnet.

Архитектура и технические характеристики для работы агентов

MiMo-V2-Flash представляет собой модель на базе архитектуры Mixture-of-Experts (MoE) с общим числом параметров 309 миллиардов, из которых активными являются 15 миллиардов. Решение спроектировано специально для использования в сценариях с ИИ-агентами и многоэтапными диалогами, где критически важна высокая скорость вывода данных.

В архитектуре применяется гибридная система внимания 1:5, которая сочетает Global Attention и Sliding Window Attention (SWA) с окном в 128 токенов. Нативная длина контекста составляет 32 000 токенов, при этом во время обучения была реализована поддержка обработки до 256 000 токенов. Такая структура позволяет MiMo-V2-Flash демонстрировать высокую эффективность при масштабировании задач с длинным контекстом. По заявлениям разработчиков, модель выдает результат быстрее многих ведущих аналогов, таких как DeepSeek и Claude, обеспечивая при этом снижение эксплуатационных расходов.

Результаты тестирования и ценовая политика

Показатели производительности MiMo-V2-Flash соответствуют высшему уровню в различных категориях. Модель входит в двойку лидеров среди решений с открытым исходным кодом в задачах на логическое мышление, включая тесты AIME 2025 и GPQA-Diamond.

В специализированных бенчмарках для программной инженерии, таких как SWE-Bench Verified и SWE-Bench Multilingual, новинка превосходит другие открытые модели и достигает показателей, сопоставимых с GPT-5 и Claude 4.5 Sonnet.

Xiaomi установила стоимость доступа к API на уровне 0.1 доллара за миллион входных токенов и 0.3 доллара за миллион выходных токенов. В настоящее время API предоставляется бесплатно в течение ограниченного периода. Модель генерирует ответы со скоростью 150 токенов в секунду, при этом стоимость логического вывода составляет всего 2.5% от затрат на эксплуатацию Claude.

Технологические инновации и обучение

Одной из ключевых особенностей архитектуры является использование технологии Multi-Token Prediction (MTP). Данный метод позволяет генерировать несколько токенов параллельно и проводить их верификацию перед выводом. Это увеличивает пропускную способность декодирования без дополнительной нагрузки на память или механизмы внимания. Использование трехслойного MTP обеспечивает прирост скорости в 2.0-2.6 раза по сравнению со стандартными методами.

Также представлен новый метод дообучения - Multi-Teacher Online Policy Distillation (MOPD). Технология задействует несколько «моделей-учителей» для руководства процессом обучения через систему вознаграждений на уровне токенов. Такой подход позволил достичь высоких характеристик при использовании менее 1/50 ресурсов обучения, которые обычно требуются для традиционных конвейеров RL. Система MOPD поддерживает гибкое подключение новых «учителей», что создает условия для циклов постоянного самосовершенствования модели.

Доступ к модели

Для взаимодействия с MiMo-V2-Flash запущен веб-интерфейс MiMo Studio, доступный по адресу aistudio.xiaomimimo.com. Для доступа к сервису может потребоваться китайский IP адрес и учетная запись Xiaomi. Сервис поддерживает поиск в сети, сценарии работы агентов и генерацию программного кода. В интерфейсе предусмотрен переключатель между режимом мгновенных ответов и режимом углубленного мышления для решения сложных логических задач.

MiMo-V2-Flash — это полностью открытый проект, распространяемый под лицензией MIT.

© .
Комментарии и отзывы

Нашли ошибку?

Новое на сайте