Компания OpenAI анонсировала новое семейство языковых моделей «рассуждающего» типа — o3. Это продолжение серии, начатой моделью o1, preview-версия которой было представлено в сентябре 2024 года. Новые модели o3 и o3-mini обещают значительно улучшить возможности искусственного интеллекта в задачах, требующих сложных рассуждений.
Гендиректор OpenAI Сэм Альтман отметил, что компания намеренно пропустила номер «2» в названии, чтобы отдать дань уважения бренду O2, принадлежащему телекоммуникационной компании Telefonica, и «традиции придумывать плохие названия».
Ключевые особенности моделей o3
Модель o3 разработана с упором на рассуждение перед выдачей ответа. Это означает, что ИИ сначала анализирует запрос, затем пересказывает цепочку своих рассуждений, и только после этого предоставляет результат, который считает наиболее точным. Такой подход приводит к небольшой задержке при ответе, но значительно повышает качество обработки сложных задач.
«Пользователи смогут сами задавать время на рассуждение: чем больше времени дать модели, тем точнее она справится с запросом», — сообщает TechCrunch.
В тесте ARC-AGI, который оценивает способность ИИ выходить за пределы обучающих данных, o3 показала результат в 87,5%, что выше «человеческого уровня» (85%). Однако эксперты призывают воспринимать эти данные с осторожностью и дождаться независимых тестов.
Сравнение с предыдущими моделями
OpenAI опубликовала сравнение производительности моделей o1-preview, o1 и o3. На графиках представлены результаты в соревнованиях по математике и опросниках с научными вопросами уровня аспирантуры. Точность ответов у o3 оказалась заметно выше, что подчеркивает улучшенные алгоритмы рассуждения.
Доступность и планы на будущее
- Обе модели — o3 и o3-mini — пока недоступны для широкой аудитории. В ближайшее время их смогут протестировать только исследователи безопасности в рамках public safety tests.
- OpenAI планирует выпустить o3-mini к концу января 2025 года, а затем предложить и полноценную версию o3.
- Ранее, в декабре 2024 года, компания выпустила полную версию o1, дополнив её подпиской ChatGPT Pro с доступом к эксклюзивным функциям.
Обновления программ, что нового
• Silicon Motion представила контроллер SSD PCIe Gen6: скорость до 28 ГБ/с
• В App Store появилось приложение «Делим вместе» с функциями «Альфа-банка» для iPhone
• YouTube закрывает страницу «В тренде»
• xAI представила Grok 4 и Grok 4 Heavy: превосходство над Grok 3 и Gemini
• Huawei Pura 80: Глобальный запуск с чипами Kirin и EMUI 15
• НСПК объяснила сбои в работе СБП: проблема на стороне провайдера