Компания Google представила Gemini 3.1 Flash-Lite – самую быструю и доступную модель в серии Gemini 3. Новинка обрабатывает масштабные рабочие нагрузки разработчиков и выдает высокое качество генерации при минимальных затратах. С сегодняшнего дня разработчики могут тестировать предварительную версию Gemini 3.1 Flash-Lite через Gemini API в платформе Google AI Studio, а корпоративные клиенты - в Vertex AI.
Характеристики скорости и стоимость токенов
Gemini 3.1 Flash-Lite работает по цене $0.25 за миллион входных токенов и $1.50 за миллион выходных, предлагая высокую производительность за малую долю стоимости крупных моделей. По данным независимого бенчмарка Artificial Analysis, алгоритм выдает первый токен ответа в 2.5 раза быстрее версии 2.5 Flash, а скорость вывода возросла на 45%. Низкая задержка решает задачи высокочастотных рабочих процессов и позволяет разработчикам создавать приложения, гарантирующие стабильную работу и быстрый отклик в реальном времени.
Результаты в бенчмарках и логических тестах
На платформе Arena.ai новинка набрала 1432 балла Elo. В тестах на логические рассуждения и мультимодальное понимание алгоритм обходит решения аналогичного уровня: результат в GPQA Diamond достигает 86.9%, а в MMMU Pro - 76.8%. По данным показателям модель превосходит более крупные системы прошлых поколений, включая линейку 2.5 Flash.
Настраиваемое мышление для сложных задач
Инструмент штатно поддерживает уровни мышления в Google AI Studio и Vertex AI. Разработчики контролируют глубину анализа данных перед ответом, что критически важно при управлении высокочастотными нагрузками. Модель надежно масштабируется для массового перевода и модерации контента, где приоритет отдается экономии бюджета. Нейросеть также выполняет сложные команды: генерирует пользовательские интерфейсы, создает симуляции и точно следует инструкциям. Компании Latitude, Cartwheel и Whering уже решают комплексные задачи с помощью Gemini 3.1 Flash-Lite в рамках раннего доступа. Тестировщики выделяют эффективность платформы и способность обрабатывать сложные вводные данные с точностью крупных алгоритмов.
Обновления программ, что нового
• Google выпустила модель Gemini 3.1 Flash-Lite со скоростью вывода на 45% выше версии 2.5 Flash
• Обновление Intel Wi-Fi Drivers 24.20.2 для Windows 11 и Windows 10
• Apple представила MacBook Pro с чипами M5 Pro и M5 Max — до 8 раз быстрее в задачах ИИ
• Apple представила новые чипы M5 Pro и M5 Max
• Apple представила MacBook Air с чипом M5, 512 ГБ в базе и поддержкой Wi-Fi 7
• Драйвер NVIDIA GeForce 595.71 ограничивает напряжение RTX 50: пользователи сообщают о снижении частот ниже 3.0 ГГц

