На конференции Google I/O 2025 компания анонсировала важные обновления линейки ИИ-моделей Gemini 2.5. Главной новинкой стал режим глубокого мышления Gemini 2.5 Pro Deep Think, который, как утверждает Google, превосходит последние модели OpenAI серий o3 и o4 в популярных бенчмарках.
Ранее в мае Google уже выпустила модель Gemini 2.5 с улучшенными возможностями рассуждения. Новая модификация Deep Think не является полноценной новой моделью, а представляет собой расширение возможностей 2.5 Pro — с улучшенным рассуждением и способностью оценивать сразу несколько гипотез перед выдачей ответа.
Результаты Gemini 2.5 Pro Deep Think
Google опубликовала три ключевых результата тестов для новой модели:
- 49,4% — на математическом бенчмарке USAMO (версия 2025 года).
- 80,4% — в соревновании по программированию LiveCodeBench (уровень профессиональных разработчиков).
- 84,0% — в мультимодальном бенчмарке MMMU (Multimodal Multitask Understanding).
Все эти результаты считаются новыми рекордами SOTA (state of the art) и превосходят показатели OpenAI o3 и o4.
Пока режим Deep Think доступен только доверенным тестировщикам через API Gemini. Массовый запуск ожидается позже.
Обновление Gemini 2.5 Flash
Google также представила новую версию Gemini 2.5 Flash — облегчённой и более дешёвой модели. Обновлённый вариант Flash показывает лучшие результаты во всех тестах по сравнению с предыдущей версией.
Модель уже доступна в режиме предварительного просмотра:
- В Google AI Studio — для разработчиков.
- В Vertex AI — для бизнес-пользователей.
- В приложении Gemini.
Релиз стабильной версии Gemini 2.5 Flash намечен на июнь 2025 года.
Новые возможности для разработчиков
Google также сообщила об улучшениях в API и инструментах для разработчиков:
- Новый Live API Preview — поддержка нескольких голосов в режиме текст-в-речь и нативный аудиовывод.
- Поддержка Model Context Protocol (MCP) — упрощает интеграцию с open-source-инструментами.
- Gemini 2.5 Pro с thinking budgets — будет доступна для промышленного использования в ближайшие недели.
- Поддержка возможностей Project Mariner — для работы с ИИ в настольных приложениях через Gemini API и Vertex AI.
- Модели 2.5 Pro и Flash теперь умеют генерировать резюме мыслей (thought summaries) в API и Vertex AI.
Подробнее об обновлениях моделей Gemini 2.5 можно узнать на официальной странице проекта.
Обновления программ, что нового
• Обновления Samsung Galaxy с 19 по 25 января: статус бета-теста One UI 8.5 и список смартфонов, получивших январьский патч безопасности
• Обзор смарт-очков Xiaomi Mijia Smart Audio Glasses: титановая оправа и 13 часов автономности
• В Gemini появятся инструменты Veograms и создание музыкальных треков
• Обновление Intel Graphics Driver 32.0.101.7084 WHQL для процессоров Intel Core 11-го – 14-го поколения
• Состоялся релиз браузерного движка Servo 0.0.4 на базе Rust с поддержкой мультиоконности
• Утечка характеристик OnePlus 15T: экран 6.32 дюйма и батарея 7500 мАч
