Google выпустила модель Gemini 3.1 Flash-Lite со скоростью вывода на 45% выше версии 2.5 Flash

Компания Google представила Gemini 3.1 Flash-Lite – самую быструю и доступную модель в серии Gemini 3. Новинка обрабатывает масштабные рабочие нагрузки разработчиков и выдает высокое качество генерации при минимальных затратах. С сегодняшнего дня разработчики могут тестировать предварительную версию Gemini 3.1 Flash-Lite через Gemini API в платформе Google AI Studio, а корпоративные клиенты - в Vertex AI.

Характеристики скорости и стоимость токенов

Gemini 3.1 Flash-Lite работает по цене $0.25 за миллион входных токенов и $1.50 за миллион выходных, предлагая высокую производительность за малую долю стоимости крупных моделей. По данным независимого бенчмарка Artificial Analysis, алгоритм выдает первый токен ответа в 2.5 раза быстрее версии 2.5 Flash, а скорость вывода возросла на 45%. Низкая задержка решает задачи высокочастотных рабочих процессов и позволяет разработчикам создавать приложения, гарантирующие стабильную работу и быстрый отклик в реальном времени.

Результаты в бенчмарках и логических тестах

На платформе Arena.ai новинка набрала 1432 балла Elo. В тестах на логические рассуждения и мультимодальное понимание алгоритм обходит решения аналогичного уровня: результат в GPQA Diamond достигает 86.9%, а в MMMU Pro - 76.8%. По данным показателям модель превосходит более крупные системы прошлых поколений, включая линейку 2.5 Flash.

Настраиваемое мышление для сложных задач

Инструмент штатно поддерживает уровни мышления в Google AI Studio и Vertex AI. Разработчики контролируют глубину анализа данных перед ответом, что критически важно при управлении высокочастотными нагрузками. Модель надежно масштабируется для массового перевода и модерации контента, где приоритет отдается экономии бюджета. Нейросеть также выполняет сложные команды: генерирует пользовательские интерфейсы, создает симуляции и точно следует инструкциям. Компании Latitude, Cartwheel и Whering уже решают комплексные задачи с помощью Gemini 3.1 Flash-Lite в рамках раннего доступа. Тестировщики выделяют эффективность платформы и способность обрабатывать сложные вводные данные с точностью крупных алгоритмов.

Обновления программ, что нового

• В Galaxy Buds4 Pro пять технологий отвечают за чистый голос
• Apple удалила из App Store приложения «Дзен», VK Видео, VK Музыка и «Одноклассники» для iPhone
• Яндекс запустил ИИ-ассистента для клиник на базе технологий Yandex AI Studio: автоматическое заполнение документов и анализ медкарт
• Обновления безопасности Samsung за июнь 2026 года – устранено 45 уязвимостей, включая 5 критических
• OpenAI обновила GPT-5.5 Instant ради более приятного диалога
• MagicOS 11: Honor открыла бету с оформлением Liquid Glass

Автор: Comss.one

Google выпустила модель Gemini 3.1 Flash-Lite со скоростью вывода на 45% выше версии 2.5 Flash

Характеристики скорости и стоимость токенов

Результаты в бенчмарках и логических тестах

Настраиваемое мышление для сложных задач

Обновления программ, что нового

Новое на сайте