5 июня 2025 года Google анонсировал обновленную модель Gemini 2.5, в которой реализованы значительные улучшения, зафиксированные в популярных ИИ-бенчмарках. Особое внимание компания уделила тому, что новая модель Gemini 2.5 Preview 06-05 «Thinking» показывает лучшие результаты в задачах программирования, математики, науки и логического мышления.
Генеральный директор Google Сундар Пичаи (Sundar Pichai) написал в X
Наша новая модель Gemini 2.5 Pro уже доступна для предварительного просмотра. Она демонстрирует лучшие результаты в программировании, логике, научных и математических задачах, а также превосходит предыдущие версии в ключевых тестах, таких как AIDER Polyglot, GPQA и HLE. В LMArena модель улучшила результат на 24 балла по шкале Elo
В прошлом месяце, на конференции Google I/O, уже была представлена первая улучшенная версия Gemini 2.5 Pro. Сегодняшний релиз стал продолжением этой работы. Помимо роста производительности в бенчмарках, по отзывам пользователей, модель также получила обновленный стиль и структуру генерации — это обеспечит более креативные и качественно оформленные ответы.
Gemini 2.5 Pro теперь считается одной из лучших (SOTA) в тестах на программирование, таких как Aider Polyglot. Она также показывает SOTA-результаты в бенчмарках GPQA и HLE (Humanity’s Last Exam), оценивающих знания в области математики, науки и логического мышления.
В практических тестах модель 2.5 Pro улучшила свой результат на 24 балла в LMArena, сохранив лидерство, и показала рост на 35 баллов в WebDevArena, достигнув 1443 баллов.
Разработчики могут получить доступ к новой версии Gemini 2.5 Pro через Gemini API в Google AI Studio и Vertex AI. Обычные пользователи смогут использовать модель в приложении Gemini. Google сообщает, что общедоступный релиз модели состоится в течение ближайших недель, после чего разработчики смогут внедрять ее в промышленные решения и корпоративные системы.
Обновления программ, что нового
• Google выпустил Gemini 2.5 Deep Think — ИИ-модель «рассуждений», опередившую OpenAI o3 и Grok 4 в тестах
• Технология Intel XeSS 2 теперь работает на видеокартах AMD и NVIDIA
• OpenAI отключила индексируемые чаты ChatGPT — больше никаких утечек в поиск Google
• Статистика браузеров за июль 2025: Chrome достигает 70%, Edge теряет долю
• Ранний релиз Chrome 139 и обновление безопасности Chrome 138 с устранением уязвимости нулевого дня
• Яндекс Браузер теперь показывает отзывы и рейтинг интернет-магазинов прямо на сайте