Google представила Gemini 3.5 Flash и сделала её моделью по умолчанию

На конференции Google I/O 2026, которая прошла 19 мая, в Google анонсировали семейство ИИ-моделей Gemini 3.5. Первой из новой линейки стала Gemini 3.5 Flash — в компании называют её самой сильной агентной и кодинговой моделью среди собственных разработок. По данным Google DeepMind, на бенчмарках Terminal-Bench 2.1, GDPval-AA и MCP Atlas результаты новинки выше, чем у Gemini 3.1 Pro, представленного в феврале 2026 года. Gemini 3.5 Flash уже назначена моделью по умолчанию в приложении Gemini и в режиме AI Mode поиска Google.

Что показала Gemini 3.5 Flash на ключевых бенчмарках

Главный сюжет анонса — на трёх ключевых бенчмарках Google показатели Flash-модели нового семейства оказались выше, чем у Pro-флагмана прошлого. На агентном кодинговом бенчмарке Terminal-Bench 2.1 Gemini 3.5 Flash набирает 76,2%, тогда как у Gemini 3.1 Pro — 70,3%, а у Gemini 3 Flash — 58,0%. На MCP Atlas, где оцениваются многошаговые рабочие процессы через протокол MCP, у новой модели 83,6% против 78,2% у 3.1 Pro и 62,0% у 3 Flash. На GDPval-AA, где выполнение экономически значимых задач интеллектуального труда оценивается по Elo-системе, Gemini 3.5 Flash набирает 1656 пунктов против 1314 у 3.1 Pro и 1204 у 3 Flash.

В сравнительной таблице Google DeepMind показатели Gemini 3.5 Flash сопоставлены с Claude Sonnet 4.6, Claude Opus 4.7 и GPT-5.5 от OpenAI. По части бенчмарков лидируют конкуренты. На SWE-Bench Pro (Public) Claude Opus 4.7 набирает 64,3% против 55,1% у Gemini 3.5 Flash; на академическом Humanity's Last Exam соотношение 46,9% против 40,2% в пользу той же модели Anthropic. На бенчмарке абстрактных рассуждений ARC-AGI-2 впереди GPT-5.5 с результатом 84,6% против 72,1%. На задачах с длинным контекстом MRCR v2 при 128k токенов разрыв ещё заметнее: 94,8% у GPT-5.5 против 77,3% у Gemini 3.5 Flash.

В каких сценариях Gemini 3.5 Flash сильнее конкурентов

На MCP Atlas результат Gemini 3.5 Flash составляет 83,6% — против 79,1% у Claude Opus 4.7 и 75,3% у GPT-5.5. На Toolathlon, где измеряется использование инструментов в реальных сценариях, расклад тоньше: 56,5% у Gemini против 55,6% у GPT-5.5 (для моделей Claude и Gemini 3.1 Pro в Google данные не приводят). На бенчмарке финансовой аналитики Finance Agent v2 у новой модели 57,9% — против 51,5% у Claude Opus 4.7 и 51,8% у GPT-5.5. На задаче MMMU-Pro по мультимодальному пониманию без использования инструментов Gemini 3.5 Flash набирает 83,6%, тогда как у GPT-5.5 — 81,2%, а у Claude Opus 4.7 — 75,2%.

MCP (Model Context Protocol) — открытый протокол для подключения языковых моделей к внешним инструментам и источникам данных. Спецификацию опубликовали в Anthropic в ноябре 2024 года; протокол поддерживают Google, OpenAI и другие крупные разработчики ИИ.

Заявленная скорость и стоимость относительно конкурентов

В Google заявляют, что по числу выходных токенов в секунду Gemini 3.5 Flash вчетверо быстрее сравнимых моделей конкурентов и обходится менее чем в половину их стоимости. Сочетание скорости и качества разработчики называют ключевым преимуществом для задач с длинным горизонтом — разработки и сопровождения программного кода, подготовки финансовых документов, координации параллельных агентов. По данным компании, Gemini 3.5 Flash также генерирует более сложные интерактивные веб-интерфейсы и графику.

Как в Google перестроили обучение безопасности

В Google указывают, что семейство Gemini 3.5 в целом реже выдаёт вредоносные ответы и реже ошибочно отказывается отвечать на безопасные запросы. Результат достигнут за счёт переработанного обучения с упором на безопасность и за счёт инструментов интерпретируемости, с помощью которых разработчики проверяют внутреннюю цепочку рассуждений модели перед выдачей ответа.

Где доступна модель

Распространение Gemini 3.5 Flash началось глобально 19 мая 2026 года. Модель доступна в приложении Gemini и в режиме AI Mode поиска Google, где назначена моделью по умолчанию. Для разработчиков предусмотрен доступ через Gemini API в Google AI Studio и Android Studio, а также через агентную среду разработки Google Antigravity. Корпоративным пользователям модель доступна через Gemini Enterprise и платформу Gemini Enterprise Agent Platform.

На базе Gemini 3.5 Flash работает и Gemini Spark — персональный ИИ-агент, который выполняет задачи пользователя на отдельных виртуальных машинах Google Cloud в круглосуточном режиме. Доступ к Gemini Spark открыли для доверенных тестировщиков в день анонса; расширенная бета для подписчиков Google AI Ultra в США запланирована на следующую неделю.

Gemini 3.5 Pro — на подходе

В Google подтвердили, что параллельно ведётся работа над Gemini 3.5 Pro. Сотрудники компании уже используют Pro-версию во внутренних задачах; публичный запуск намечен на следующий месяц.

Заключение

Главный сигнал анонса для рынка — от выхода Gemini 3.1 Pro в феврале 2026 года до результата Flash-модели того же семейства, превышающего показатели Pro, прошло три месяца. Для разработчиков, использующих Gemini API и Google Antigravity, это означает доступ к более производительной модели по более низкой цене; для конечных пользователей — автоматическую смену модели по умолчанию в приложении Gemini и в AI Mode. Сравнение с Claude Opus 4.7 и GPT-5.5 показывает, что преимущество Gemini 3.5 Flash сконцентрировано в агентных сценариях и работе с инструментами; на академических рассуждениях и в задачах с длинным контекстом конкуренты остаются впереди.