Google выпустил Gemini 2.5 Deep Think — ИИ-модель «рассуждений», опередившую OpenAI o3 и Grok 4 в тестах

Компания Google начала развёртывание обновлённого режима Deep Think на базе модели Gemini 2.5. Новый режим уже доступен подписчикам Google AI Ultra в приложении Gemini и демонстрирует превосходство над конкурентами — моделями OpenAI o3 и Grok 4 от xAI — по ключевым бенчмаркам.

Режим Deep Think впервые был анонсирован на конференции Google I/O 2025. Он основан на архитектуре «смеси экспертов» Mixture-of-Experts (MoE) и использует подход многогипотезного мышления: несколько «внутренних» агентов ИИ одновременно рассматривают разные идеи, пересматривают их и формируют финальный ответ. Этот метод позволяет достигать более высокого качества ответов за счёт глубокого анализа задач.

Gemini 2.5 Deep Think опережает лидеров индустрии

Обновлённая версия Deep Think — это доработанная модель, в которую вошли улучшения на основе отзывов доверенных тестировщиков и новых научных открытий. Google отмечает, что эта модель — улучшенная версия той, что ранее показала выдающиеся результаты на Международной математической олимпиаде (IMO), заняв золотую медаль. Однако для применения в реальной жизни она была ускорена, и теперь показывает «бронзовый» уровень на IMO-бенчмарке 2025 года.

На диаграммах, опубликованных Google, видно, что Gemini 2.5 Deep Think достигает лучших результатов по сравнению с моделями OpenAI o3 и Grok 4 в тестах LiveCodeBench V6, Humanity’s Last Exam, IMO 2025 и AIME 2025.

В Humanity’s Last Exam — тесте, имитирующем экзамены по математике, естественным и гуманитарным наукам — Deep Think набрала 34,8%, опередив Grok 4 (25,4%) и o3 (20,3%).

Доступ и ограничения

Deep Think доступен подписчикам плана Google AI Ultra в приложении Gemini. Стоимость подписки — от $249,99 (~20 070 руб. по курсу на 1 августа 2025 года).
Пользователи могут использовать ограниченное число запросов в день, активируя функцию Deep Think при выборе модели Gemini 2.5 Pro.
Deep Think автоматически использует инструменты, такие как выполнение кода и Google Поиск, если они доступны.
В ближайшие недели Google откроет доступ к Deep Think (с инструментами и без них) через API для избранных разработчиков.

Deep Think предназначен для сложных задач, включая программирование, инженерное проектирование и решение олимпиадных задач. Несмотря на высокие ресурсоёмкость и время обработки, пользователи получают качественные и продуманные ответы.

Сравнение Gemini 2.5 Pro, Flash и Deep Think

Остаётся вопрос, сможет ли грядущая модель OpenAI GPT-5 превзойти Deep Think в будущих тестах.

Подробнее об анонсе Google: официальный блог.

Обновления программ, что нового

• Apple выпустила вторые бета-версии iOS 26.6, iPadOS 26.6 и macOS Tahoe 26.6 для разработчиков
• Обновления безопасности Samsung за июнь 2026 года – устранено 45 уязвимостей, включая 5 критических
• Новая версия Firefox 152 и обновления Firefox ESR 140.12.0 и 115.37.0 доступны для загрузки
• Российский Спидтест запустил бесплатный мониторинг серверов и интернет-каналов через единый CLI-агент
• На Galaxy S23 появляются зелёные полосы после One UI 8.5
• Слух: Samsung Galaxy S27 Ultra с перископом 5x и аккумулятором свыше 5000 мАч

Автор: Comss.one

Google выпустил Gemini 2.5 Deep Think — ИИ-модель «рассуждений», опередившую OpenAI o3 и Grok 4 в тестах

Gemini 2.5 Deep Think опережает лидеров индустрии

Доступ и ограничения

Обновления программ, что нового

Новое на сайте