Компания Google начала развёртывание обновлённого режима Deep Think на базе модели Gemini 2.5. Новый режим уже доступен подписчикам Google AI Ultra в приложении Gemini и демонстрирует превосходство над конкурентами — моделями OpenAI o3 и Grok 4 от xAI — по ключевым бенчмаркам.
Режим Deep Think впервые был анонсирован на конференции Google I/O 2025. Он основан на архитектуре «смеси экспертов» Mixture-of-Experts (MoE) и использует подход многогипотезного мышления: несколько «внутренних» агентов ИИ одновременно рассматривают разные идеи, пересматривают их и формируют финальный ответ. Этот метод позволяет достигать более высокого качества ответов за счёт глубокого анализа задач.
Gemini 2.5 Deep Think опережает лидеров индустрии
Обновлённая версия Deep Think — это доработанная модель, в которую вошли улучшения на основе отзывов доверенных тестировщиков и новых научных открытий. Google отмечает, что эта модель — улучшенная версия той, что ранее показала выдающиеся результаты на Международной математической олимпиаде (IMO), заняв золотую медаль. Однако для применения в реальной жизни она была ускорена, и теперь показывает «бронзовый» уровень на IMO-бенчмарке 2025 года.
На диаграммах, опубликованных Google, видно, что Gemini 2.5 Deep Think достигает лучших результатов по сравнению с моделями OpenAI o3 и Grok 4 в тестах LiveCodeBench V6, Humanity’s Last Exam, IMO 2025 и AIME 2025.
В Humanity’s Last Exam — тесте, имитирующем экзамены по математике, естественным и гуманитарным наукам — Deep Think набрала 34,8%, опередив Grok 4 (25,4%) и o3 (20,3%).
Доступ и ограничения
- Deep Think доступен подписчикам плана Google AI Ultra в приложении Gemini. Стоимость подписки — от $249,99 (~20 070 руб. по курсу на 1 августа 2025 года).
- Пользователи могут использовать ограниченное число запросов в день, активируя функцию Deep Think при выборе модели Gemini 2.5 Pro.
- Deep Think автоматически использует инструменты, такие как выполнение кода и Google Поиск, если они доступны.
- В ближайшие недели Google откроет доступ к Deep Think (с инструментами и без них) через API для избранных разработчиков.
Deep Think предназначен для сложных задач, включая программирование, инженерное проектирование и решение олимпиадных задач. Несмотря на высокие ресурсоёмкость и время обработки, пользователи получают качественные и продуманные ответы.
Сравнение Gemini 2.5 Pro, Flash и Deep Think
Остаётся вопрос, сможет ли грядущая модель OpenAI GPT-5 превзойти Deep Think в будущих тестах.
Подробнее об анонсе Google: официальный блог.
Обновления программ, что нового
• Google выпустил Gemini 2.5 Deep Think — ИИ-модель «рассуждений», опередившую OpenAI o3 и Grok 4 в тестах
• Технология Intel XeSS 2 теперь работает на видеокартах AMD и NVIDIA
• OpenAI отключила индексируемые чаты ChatGPT — больше никаких утечек в поиск Google
• Статистика браузеров за июль 2025: Chrome достигает 70%, Edge теряет долю
• Ранний релиз Chrome 139 и обновление безопасности Chrome 138 с устранением уязвимости нулевого дня
• Яндекс Браузер теперь показывает отзывы и рейтинг интернет-магазинов прямо на сайте