Google представила Gemini 2.5 Pro Deep Think — мощнее моделей OpenAI o3 и o4

2025-05-21 1019 комментарии
На конференции Google I/O 2025 представлена модель Gemini 2.5 Pro с режимом Deep Think. Она превосходит OpenAI o3 и o4 в тестах по математике, программированию и мультимодальному ИИ. Улучшения также коснулись моделей Flash и инструментов для разработчиков

На конференции Google I/O 2025 компания анонсировала важные обновления линейки ИИ-моделей Gemini 2.5. Главной новинкой стал режим глубокого мышления Gemini 2.5 Pro Deep Think, который, как утверждает Google, превосходит последние модели OpenAI серий o3 и o4 в популярных бенчмарках.

Ранее в мае Google уже выпустила модель Gemini 2.5 с улучшенными возможностями рассуждения. Новая модификация Deep Think не является полноценной новой моделью, а представляет собой расширение возможностей 2.5 Pro — с улучшенным рассуждением и способностью оценивать сразу несколько гипотез перед выдачей ответа.

Результаты Gemini 2.5 Pro Deep Think

Google опубликовала три ключевых результата тестов для новой модели:

  • 49,4% — на математическом бенчмарке USAMO (версия 2025 года).
  • 80,4% — в соревновании по программированию LiveCodeBench (уровень профессиональных разработчиков).
  • 84,0% — в мультимодальном бенчмарке MMMU (Multimodal Multitask Understanding).

Все эти результаты считаются новыми рекордами SOTA (state of the art) и превосходят показатели OpenAI o3 и o4.

Пока режим Deep Think доступен только доверенным тестировщикам через API Gemini. Массовый запуск ожидается позже.

Обновление Gemini 2.5 Flash

Google также представила новую версию Gemini 2.5 Flash — облегчённой и более дешёвой модели. Обновлённый вариант Flash показывает лучшие результаты во всех тестах по сравнению с предыдущей версией.

Модель уже доступна в режиме предварительного просмотра:

  • В Google AI Studio — для разработчиков.
  • В Vertex AI — для бизнес-пользователей.
  • В приложении Gemini.

Релиз стабильной версии Gemini 2.5 Flash намечен на июнь 2025 года.

Новые возможности для разработчиков

Google также сообщила об улучшениях в API и инструментах для разработчиков:

  • Новый Live API Preview — поддержка нескольких голосов в режиме текст-в-речь и нативный аудиовывод.
  • Поддержка Model Context Protocol (MCP) — упрощает интеграцию с open-source-инструментами.
  • Gemini 2.5 Pro с thinking budgets — будет доступна для промышленного использования в ближайшие недели.
  • Поддержка возможностей Project Mariner — для работы с ИИ в настольных приложениях через Gemini API и Vertex AI.
  • Модели 2.5 Pro и Flash теперь умеют генерировать резюме мыслей (thought summaries) в API и Vertex AI.

Подробнее об обновлениях моделей Gemini 2.5 можно узнать на официальной странице проекта.

© .
Комментарии и отзывы

Нашли ошибку?

Новое на сайте