Google выпустил Gemini 2.5 Deep Think — ИИ-модель «рассуждений», опередившую OpenAI o3 и Grok 4 в тестах

2025-08-01 2266 комментарии
Компания Google запустила режим Deep Think на базе Gemini 2.5 для подписчиков AI Ultra. Новая ИИ-модель – «усовершенствованная» модель «рассуждений» с архитектурой «смеси экспертов». Она показывает выдающиеся результаты в тестах рассуждений и превосходит OpenAI o3 и Grok 4

Компания Google начала развёртывание обновлённого режима Deep Think на базе модели Gemini 2.5. Новый режим уже доступен подписчикам Google AI Ultra в приложении Gemini и демонстрирует превосходство над конкурентами — моделями OpenAI o3 и Grok 4 от xAI — по ключевым бенчмаркам.

Режим Deep Think впервые был анонсирован на конференции Google I/O 2025. Он основан на архитектуре «смеси экспертов» Mixture-of-Experts (MoE) и использует подход многогипотезного мышления: несколько «внутренних» агентов ИИ одновременно рассматривают разные идеи, пересматривают их и формируют финальный ответ. Этот метод позволяет достигать более высокого качества ответов за счёт глубокого анализа задач.

Gemini 2.5 Deep Think опережает лидеров индустрии

Обновлённая версия Deep Think — это доработанная модель, в которую вошли улучшения на основе отзывов доверенных тестировщиков и новых научных открытий. Google отмечает, что эта модель — улучшенная версия той, что ранее показала выдающиеся результаты на Международной математической олимпиаде (IMO), заняв золотую медаль. Однако для применения в реальной жизни она была ускорена, и теперь показывает «бронзовый» уровень на IMO-бенчмарке 2025 года.

На диаграммах, опубликованных Google, видно, что Gemini 2.5 Deep Think достигает лучших результатов по сравнению с моделями OpenAI o3 и Grok 4 в тестах LiveCodeBench V6, Humanity’s Last Exam, IMO 2025 и AIME 2025.

В Humanity’s Last Exam — тесте, имитирующем экзамены по математике, естественным и гуманитарным наукам — Deep Think набрала 34,8%, опередив Grok 4 (25,4%) и o3 (20,3%).

Доступ и ограничения

  • Deep Think доступен подписчикам плана Google AI Ultra в приложении Gemini. Стоимость подписки — от $249,99 (~20 070 руб. по курсу на 1 августа 2025 года).
  • Пользователи могут использовать ограниченное число запросов в день, активируя функцию Deep Think при выборе модели Gemini 2.5 Pro.
  • Deep Think автоматически использует инструменты, такие как выполнение кода и Google Поиск, если они доступны.
  • В ближайшие недели Google откроет доступ к Deep Think (с инструментами и без них) через API для избранных разработчиков.

Deep Think предназначен для сложных задач, включая программирование, инженерное проектирование и решение олимпиадных задач. Несмотря на высокие ресурсоёмкость и время обработки, пользователи получают качественные и продуманные ответы.

Сравнение Gemini 2.5 Pro, Flash и Deep Think

Остаётся вопрос, сможет ли грядущая модель OpenAI GPT-5 превзойти Deep Think в будущих тестах.

Подробнее об анонсе Google: официальный блог.

© .
Комментарии и отзывы

Нашли ошибку?

Новое на сайте