Gemini Deep Think достиг уровня золотой медали на IMO 2025

2025-07-21 351 комментарии
Продвинутая версия Gemini Deep Think от компании Google успешно решила 5 из 6 задач на IMO 2025, набрав 35 баллов и достигнув уровня золотой медали. Модель работает на естественном языке, применяя параллельное мышление в рамках 4,5 часа. Доступ к версии откроется для тестировщиков и Google AI Ultra

Компания Google представила результаты работы режима Gemini Deep Think, который показал выдающиеся результаты на Международной математической олимпиаде (IMO) 2025, решив пять из шести задач и набрав 35 баллов, что соответствует уровню золотой медали.

Что такое Международная математическая олимпиада?

Международная математическая олимпиада (IMO) — это престижное ежегодное соревнование для молодых математиков, проводимое с 1959 года. В нем участвуют команды из шести лучших школьников-математиков от каждой страны. Участники решают шесть сложных задач по алгебре, комбинаторике, геометрии и теории чисел. Медали присуждаются лучшей половине конкурсантов, при этом около 8% получают золотую медаль.

Достижения Gemini Deep Think на IMO 2025

На IMO 2025, проходившей на прошлой неделе, продвинутая версия Gemini Deep Think успешно справилась с пятью из шести задач, набрав 35 баллов. Это позволило модели достичь уровня золотой медали. Google опубликовала решения задач в формате PDF, доступном для ознакомления.

Для достижения таких результатов модель была дополнительно обучена с использованием новых методов обучения с подкреплением, которые усиливают способности к многоступенчатому рассуждению, решению задач и доказательству теорем. Также Gemini получила доступ к тщательно отобранной базе высококачественных решений математических задач и общим рекомендациям по подходу к задачам IMO.

Технические особенности Gemini Deep Think

В отличие от прошлогодних систем Google DeepMind, таких как AlphaGeometry и AlphaProof, которые в 2024 году набрали 28 баллов и получили серебряную медаль, Gemini Deep Think работает непосредственно с описаниями задач на естественном языке. Это устраняет необходимость предварительного перевода задач в специализированные языки. Все решения были созданы в рамках временного лимита соревнования — 4,5 часа.

Режим Deep Think использует передовые методы исследования, включая параллельное мышление. Такой подход позволяет модели одновременно анализировать и комбинировать несколько возможных решений, вместо следования линейной цепочке рассуждений. Это значительно повышает эффективность и точность при решении сложных задач.

Планы по внедрению Gemini Deep Think

Google сообщила, что версия Gemini Deep Think будет предоставлена ограниченному кругу доверенных тестировщиков, включая математиков. В дальнейшем модель станет доступна пользователям Google AI Ultra, подписка на который стоит 250 долларов в месяц. Точные сроки запуска пока не объявлены.

© . По материалам 9to5google
Комментарии и отзывы

Нашли ошибку?

Новое на сайте