Компания OpenAI анонсировала новое семейство языковых моделей «рассуждающего» типа — o3. Это продолжение серии, начатой моделью o1, preview-версия которой было представлено в сентябре 2024 года. Новые модели o3 и o3-mini обещают значительно улучшить возможности искусственного интеллекта в задачах, требующих сложных рассуждений.
Гендиректор OpenAI Сэм Альтман отметил, что компания намеренно пропустила номер «2» в названии, чтобы отдать дань уважения бренду O2, принадлежащему телекоммуникационной компании Telefonica, и «традиции придумывать плохие названия».
Ключевые особенности моделей o3
Модель o3 разработана с упором на рассуждение перед выдачей ответа. Это означает, что ИИ сначала анализирует запрос, затем пересказывает цепочку своих рассуждений, и только после этого предоставляет результат, который считает наиболее точным. Такой подход приводит к небольшой задержке при ответе, но значительно повышает качество обработки сложных задач.
«Пользователи смогут сами задавать время на рассуждение: чем больше времени дать модели, тем точнее она справится с запросом», — сообщает TechCrunch.
В тесте ARC-AGI, который оценивает способность ИИ выходить за пределы обучающих данных, o3 показала результат в 87,5%, что выше «человеческого уровня» (85%). Однако эксперты призывают воспринимать эти данные с осторожностью и дождаться независимых тестов.
Сравнение с предыдущими моделями
OpenAI опубликовала сравнение производительности моделей o1-preview, o1 и o3. На графиках представлены результаты в соревнованиях по математике и опросниках с научными вопросами уровня аспирантуры. Точность ответов у o3 оказалась заметно выше, что подчеркивает улучшенные алгоритмы рассуждения.
Доступность и планы на будущее
- Обе модели — o3 и o3-mini — пока недоступны для широкой аудитории. В ближайшее время их смогут протестировать только исследователи безопасности в рамках public safety tests.
- OpenAI планирует выпустить o3-mini к концу января 2025 года, а затем предложить и полноценную версию o3.
- Ранее, в декабре 2024 года, компания выпустила полную версию o1, дополнив её подпиской ChatGPT Pro с доступом к эксклюзивным функциям.
Обновления программ, что нового
• Слухи о слиянии OnePlus и Realme: что известно
• Samsung готовит ноутбуки Galaxy Book на Aluminium OS и One UI 9
• Умные устройства Яндекса в апреле: обновления Станции 3, ТВ Станций и запуск MiniLED
• NVIDIA выпустила прошивку G-SYNC Pulsar 1.1.6 для мониторов AOC и MSI
• Обновление Intel Killer Performance Suite 40.26.403.2234 с Wi-Fi-драйвером 24.40.0.4 и поддержкой новых адаптеров BE1735x и BE1730x
• Opera 131 Stable: обновление Chromium 147, новый блокировщик рекламы и доработки интерфейса

