Google представила Gemini 2.5 Pro Deep Think — мощнее моделей OpenAI o3 и o4

На конференции Google I/O 2025 компания анонсировала важные обновления линейки ИИ-моделей Gemini 2.5. Главной новинкой стал режим глубокого мышления Gemini 2.5 Pro Deep Think, который, как утверждает Google, превосходит последние модели OpenAI серий o3 и o4 в популярных бенчмарках.

Ранее в мае Google уже выпустила модель Gemini 2.5 с улучшенными возможностями рассуждения. Новая модификация Deep Think не является полноценной новой моделью, а представляет собой расширение возможностей 2.5 Pro — с улучшенным рассуждением и способностью оценивать сразу несколько гипотез перед выдачей ответа.

Результаты Gemini 2.5 Pro Deep Think

Google опубликовала три ключевых результата тестов для новой модели:

49,4% — на математическом бенчмарке USAMO (версия 2025 года).
80,4% — в соревновании по программированию LiveCodeBench (уровень профессиональных разработчиков).
84,0% — в мультимодальном бенчмарке MMMU (Multimodal Multitask Understanding).

Все эти результаты считаются новыми рекордами SOTA (state of the art) и превосходят показатели OpenAI o3 и o4.

Пока режим Deep Think доступен только доверенным тестировщикам через API Gemini. Массовый запуск ожидается позже.

Обновление Gemini 2.5 Flash

Google также представила новую версию Gemini 2.5 Flash — облегчённой и более дешёвой модели. Обновлённый вариант Flash показывает лучшие результаты во всех тестах по сравнению с предыдущей версией.

Модель уже доступна в режиме предварительного просмотра:

В Google AI Studio — для разработчиков.
В Vertex AI — для бизнес-пользователей.
В приложении Gemini.

Google тестирует Gemini 2.5 Flash — самую «выгодную» рассуждающую ИИ-модель. Как попробовать бесплатно в Google AI Studio

Релиз стабильной версии Gemini 2.5 Flash намечен на июнь 2025 года.

Новые возможности для разработчиков

Google также сообщила об улучшениях в API и инструментах для разработчиков:

Новый Live API Preview — поддержка нескольких голосов в режиме текст-в-речь и нативный аудиовывод.
Поддержка Model Context Protocol (MCP) — упрощает интеграцию с open-source-инструментами.
Gemini 2.5 Pro с thinking budgets — будет доступна для промышленного использования в ближайшие недели.
Поддержка возможностей Project Mariner — для работы с ИИ в настольных приложениях через Gemini API и Vertex AI.
Модели 2.5 Pro и Flash теперь умеют генерировать резюме мыслей (thought summaries) в API и Vertex AI.

Подробнее об обновлениях моделей Gemini 2.5 можно узнать на официальной странице проекта.

Обновления программ, что нового

• One UI 9 блокирует Galaxy навсегда после 13 ошибок ввода Pin-кода
• Ограничение ADB в Android грозит работе Shizuku и Termux
• Яндекс Контест впервые станет платформой Международной олимпиады по искусственному интеллекту
• Обновления Samsung Galaxy (20 – 26 июля 2026): Выход стабильной One UI 9 на Galaxy Unpacked и расширение июльского патча
• Двухканальная зарядка Samsung делит 45 Вт на два тракта в Fold 8 Ultra
• Обновление AMD Ryzen Master 3.1.1: добавлена функция Curve Shaper для тонкой настройки напряжения Ryzen 9000

Автор: Comss.one