Компания OpenAI анонсировала новое семейство языковых моделей «рассуждающего» типа — o3. Это продолжение серии, начатой моделью o1, preview-версия которой было представлено в сентябре 2024 года. Новые модели o3 и o3-mini обещают значительно улучшить возможности искусственного интеллекта в задачах, требующих сложных рассуждений.
Гендиректор OpenAI Сэм Альтман отметил, что компания намеренно пропустила номер «2» в названии, чтобы отдать дань уважения бренду O2, принадлежащему телекоммуникационной компании Telefonica, и «традиции придумывать плохие названия».
Ключевые особенности моделей o3
Модель o3 разработана с упором на рассуждение перед выдачей ответа. Это означает, что ИИ сначала анализирует запрос, затем пересказывает цепочку своих рассуждений, и только после этого предоставляет результат, который считает наиболее точным. Такой подход приводит к небольшой задержке при ответе, но значительно повышает качество обработки сложных задач.
«Пользователи смогут сами задавать время на рассуждение: чем больше времени дать модели, тем точнее она справится с запросом», — сообщает TechCrunch.
В тесте ARC-AGI, который оценивает способность ИИ выходить за пределы обучающих данных, o3 показала результат в 87,5%, что выше «человеческого уровня» (85%). Однако эксперты призывают воспринимать эти данные с осторожностью и дождаться независимых тестов.
Сравнение с предыдущими моделями
OpenAI опубликовала сравнение производительности моделей o1-preview, o1 и o3. На графиках представлены результаты в соревнованиях по математике и опросниках с научными вопросами уровня аспирантуры. Точность ответов у o3 оказалась заметно выше, что подчеркивает улучшенные алгоритмы рассуждения.
Доступность и планы на будущее
- Обе модели — o3 и o3-mini — пока недоступны для широкой аудитории. В ближайшее время их смогут протестировать только исследователи безопасности в рамках public safety tests.
- OpenAI планирует выпустить o3-mini к концу января 2025 года, а затем предложить и полноценную версию o3.
- Ранее, в декабре 2024 года, компания выпустила полную версию o1, дополнив её подпиской ChatGPT Pro с доступом к эксклюзивным функциям.
Обновления программ, что нового
• Релиз PeaZip 10.5.0: обновление архиватора с улучшенным файловым менеджером
• В бета-версии клиента Steam добавлены иконки поддержки контроллера для SteamOS
• Dimensity 9500: результаты тестов и сравнение с Snapdragon 8 Elite 2
• В Steam добавили информацию о функциях доступности: на страницу игр и в фильтр по поиску
• AMD Radeon Software Adrenalin 25.6.2 Non-WHQL. Поддержка The Alters и FBC: Firebreak
• Новый AI-браузер Dia — «Chrome с мозгами». Но безопасен ли он?