OpenAI представила новую версию своей модели GPT-4, названную GPT-4o. Эта версия заметно ускорена и обладает улучшенными функциями обработки текста, изображений и аудио. По словам технического директора OpenAI Миры Мурати, которая выступила с объявлением в прямом эфире в понедельник, новая модель будет доступна всем пользователям бесплатно, а платные пользователи смогут использовать до пяти раз больше ресурсов по сравнению с бесплатными пользователями.
В блоге компании указано, что возможности GPT-4o будут внедряться постепенно. Начиная с сегодняшнего дня, будут доступны улучшенные функции для работы с текстом и изображениями в ChatGPT.
Технический директор OpenAI Мира Мурати заявила, что GPT-4o обладает "интеллектом уровня GPT-4", но улучшен в работе с различными модальностями и медиа. Модель способна анализировать и реагировать на голос, текст и изображения, что, по словам Мурати, крайне важно для будущего взаимодействия человека с машинами.
Например, новая модель значительно улучшила возможности голосового общения в чат-боте ChatGPT от OpenAI. Теперь пользователи могут перебивать ChatGPT во время ответа, и модель будет реагировать в реальном времени, улавливая нюансы голоса пользователя и отвечая голосом в различных эмоциональных стилях, включая пение.
GPT-4o также улучшил возможности восприятия изображений в ChatGPT. Теперь, получив фотографию или изображение экрана компьютера, ChatGPT может быстро ответить на вопросы, касающиеся содержания изображения, например, что происходит в данном коде программирования или какой бренд носит человек на фото.
В дополнение, Мурати утверждает, что в будущем модель сможет, например, "смотреть" спортивные игры в прямом эфире и объяснять правила. GPT-4o также стала более многоязычной, с улучшенной работой примерно на 50 языках, и в два раза быстрее предыдущей модели GPT-4 Turbo по цене в два раза ниже.
Также был анонсирован запуск нового интерфейса ChatGPT и приложения для macOS, которое позволяет задавать вопросы с помощью горячих клавиш или обсуждать скриншоты, а также поддерживает голосовое общение. В ближайшее время ожидается также выпуск версии для Windows.
В блоге после прямой трансляции Сэм Альтман размышлял о траектории развития OpenAI. Он отметил, что первоначальная миссия компании заключалась в том, чтобы "создавать различные преимущества для мира", но признал, что теперь акцент сместился на предоставление моделей разработчикам через платные API, чтобы сторонние разработчики "могли создавать удивительные вещи, от которых выиграют все".
До сегодняшнего запуска GPT-4o существовали противоречивые отчеты, предсказывающие, что OpenAI объявит о поисковой системе ИИ, конкурирующей с Google и Perplexity, голосовом помощнике, встроенном в GPT-4, или совершенно новой и улучшенной модели GPT-5. Конечно, OpenAI выбрала время для этого запуска перед Google I/O, флагманской конференцией технологического гиганта, на которой ожидается запуск различных продуктов ИИ от команды Gemini.
Обновления программ, что нового
• Обновление Intel ARC Game On Driver 32.0.101.6319 Non-WHQL. Поддержка Indiana Jones and The Great Circle, Marvel Rivals и Path of Exile 2
• OpenAI представила ChatGPT Pro с эксклюзивной моделью o1 за 200$ в месяц
• Samsung выпустила бета-версию One UI 7 с редизайном интерфейса и Now Bar
• AMD Radeon Software Adrenalin 24.20.25.01 Non-WHQL: Расширенная поддержка расширений Vulkan
• AMD Radeon Software Adrenalin 24.12.1 WHQL. Поддержка новых игр
• Обновление NVIDIA GeForce Game Ready 566.36 WHQL. Поддержка Indiana Jones and the Great Circle и Marvel Rivals