Компания OpenAI анонсировала новое семейство языковых моделей «рассуждающего» типа — o3. Это продолжение серии, начатой моделью o1, preview-версия которой было представлено в сентябре 2024 года. Новые модели o3 и o3-mini обещают значительно улучшить возможности искусственного интеллекта в задачах, требующих сложных рассуждений.
Гендиректор OpenAI Сэм Альтман отметил, что компания намеренно пропустила номер «2» в названии, чтобы отдать дань уважения бренду O2, принадлежащему телекоммуникационной компании Telefonica, и «традиции придумывать плохие названия».
Ключевые особенности моделей o3
Модель o3 разработана с упором на рассуждение перед выдачей ответа. Это означает, что ИИ сначала анализирует запрос, затем пересказывает цепочку своих рассуждений, и только после этого предоставляет результат, который считает наиболее точным. Такой подход приводит к небольшой задержке при ответе, но значительно повышает качество обработки сложных задач.
«Пользователи смогут сами задавать время на рассуждение: чем больше времени дать модели, тем точнее она справится с запросом», — сообщает TechCrunch.
В тесте ARC-AGI, который оценивает способность ИИ выходить за пределы обучающих данных, o3 показала результат в 87,5%, что выше «человеческого уровня» (85%). Однако эксперты призывают воспринимать эти данные с осторожностью и дождаться независимых тестов.
Сравнение с предыдущими моделями
OpenAI опубликовала сравнение производительности моделей o1-preview, o1 и o3. На графиках представлены результаты в соревнованиях по математике и опросниках с научными вопросами уровня аспирантуры. Точность ответов у o3 оказалась заметно выше, что подчеркивает улучшенные алгоритмы рассуждения.
Доступность и планы на будущее
- Обе модели — o3 и o3-mini — пока недоступны для широкой аудитории. В ближайшее время их смогут протестировать только исследователи безопасности в рамках public safety tests.
- OpenAI планирует выпустить o3-mini к концу января 2025 года, а затем предложить и полноценную версию o3.
- Ранее, в декабре 2024 года, компания выпустила полную версию o1, дополнив её подпиской ChatGPT Pro с доступом к эксклюзивным функциям.
Обновления программ, что нового
• VK запустит аналог WeChat в России – с госуслугами, платёжной системой и мини-приложениями
• В Рунете произошел масштабный сбой: недоступны Сбер, Steam, Epic Games, Anydesk и другие сервисы
• One UI 7: увеличение папок на главном экране для быстрого доступа к приложениям
• Google запускает функцию Astra: ИИ Gemini теперь понимает, что происходит на экране смартфона
• Cloudflare запустил инструмент AI Labyrinth для борьбы с ИИ-ботами, которые сканируют сайты без разрешения
• Google Pixel 9a составит серьёзную конкуренцию iPhone 16e и Samsung Galaxy A56