Google выпустила модель Gemini 3.1 Flash-Lite со скоростью вывода на 45% выше версии 2.5 Flash

2026-03-03 172 комментарии
Google представила ИИ-модель Gemini 3.1 Flash-Lite стоимостью $0.25 за 1 млн входных токенов. Нейросеть работает в 2.5 раза быстрее версии 2.5 Flash, поддерживает настраиваемые уровни мышления в AI Studio и доступна разработчикам для массового перевода и модерации контента

Компания Google представила Gemini 3.1 Flash-Lite – самую быструю и доступную модель в серии Gemini 3. Новинка обрабатывает масштабные рабочие нагрузки разработчиков и выдает высокое качество генерации при минимальных затратах. С сегодняшнего дня разработчики могут тестировать предварительную версию Gemini 3.1 Flash-Lite через Gemini API в платформе Google AI Studio, а корпоративные клиенты - в Vertex AI.

Характеристики скорости и стоимость токенов

Gemini 3.1 Flash-Lite работает по цене $0.25 за миллион входных токенов и $1.50 за миллион выходных, предлагая высокую производительность за малую долю стоимости крупных моделей. По данным независимого бенчмарка Artificial Analysis, алгоритм выдает первый токен ответа в 2.5 раза быстрее версии 2.5 Flash, а скорость вывода возросла на 45%. Низкая задержка решает задачи высокочастотных рабочих процессов и позволяет разработчикам создавать приложения, гарантирующие стабильную работу и быстрый отклик в реальном времени.

Результаты в бенчмарках и логических тестах

На платформе Arena.ai новинка набрала 1432 балла Elo. В тестах на логические рассуждения и мультимодальное понимание алгоритм обходит решения аналогичного уровня: результат в GPQA Diamond достигает 86.9%, а в MMMU Pro - 76.8%. По данным показателям модель превосходит более крупные системы прошлых поколений, включая линейку 2.5 Flash.

Настраиваемое мышление для сложных задач

Инструмент штатно поддерживает уровни мышления в Google AI Studio и Vertex AI. Разработчики контролируют глубину анализа данных перед ответом, что критически важно при управлении высокочастотными нагрузками. Модель надежно масштабируется для массового перевода и модерации контента, где приоритет отдается экономии бюджета. Нейросеть также выполняет сложные команды: генерирует пользовательские интерфейсы, создает симуляции и точно следует инструкциям. Компании Latitude, Cartwheel и Whering уже решают комплексные задачи с помощью Gemini 3.1 Flash-Lite в рамках раннего доступа. Тестировщики выделяют эффективность платформы и способность обрабатывать сложные вводные данные с точностью крупных алгоритмов.

© .
Комментарии и отзывы

Нашли ошибку?

Новое на сайте