OpenAI выпускает GPT-4o, более быструю модель, доступную для всех пользователей ChatGPT

2024-05-13 4114 комментарии
OpenAI представила GPT-4o — ускоренную модель GPT-4 для всех пользователей ChatGPT. Модель обладает улучшенными функциями для работы с текстом, изображениями и голосом в реальном времени

OpenAI представила новую версию своей модели GPT-4, названную GPT-4o. Эта версия заметно ускорена и обладает улучшенными функциями обработки текста, изображений и аудио. По словам технического директора OpenAI Миры Мурати, которая выступила с объявлением в прямом эфире в понедельник, новая модель будет доступна всем пользователям бесплатно, а платные пользователи смогут использовать до пяти раз больше ресурсов по сравнению с бесплатными пользователями.

В блоге компании указано, что возможности GPT-4o будут внедряться постепенно. Начиная с сегодняшнего дня, будут доступны улучшенные функции для работы с текстом и изображениями в ChatGPT.

Технический директор OpenAI Мира Мурати заявила, что GPT-4o обладает "интеллектом уровня GPT-4", но улучшен в работе с различными модальностями и медиа. Модель способна анализировать и реагировать на голос, текст и изображения, что, по словам Мурати, крайне важно для будущего взаимодействия человека с машинами.

Например, новая модель значительно улучшила возможности голосового общения в чат-боте ChatGPT от OpenAI. Теперь пользователи могут перебивать ChatGPT во время ответа, и модель будет реагировать в реальном времени, улавливая нюансы голоса пользователя и отвечая голосом в различных эмоциональных стилях, включая пение.

GPT-4o также улучшил возможности восприятия изображений в ChatGPT. Теперь, получив фотографию или изображение экрана компьютера, ChatGPT может быстро ответить на вопросы, касающиеся содержания изображения, например, что происходит в данном коде программирования или какой бренд носит человек на фото.

В дополнение, Мурати утверждает, что в будущем модель сможет, например, "смотреть" спортивные игры в прямом эфире и объяснять правила. GPT-4o также стала более многоязычной, с улучшенной работой примерно на 50 языках, и в два раза быстрее предыдущей модели GPT-4 Turbo по цене в два раза ниже.

Также был анонсирован запуск нового интерфейса ChatGPT и приложения для macOS, которое позволяет задавать вопросы с помощью горячих клавиш или обсуждать скриншоты, а также поддерживает голосовое общение. В ближайшее время ожидается также выпуск версии для Windows.

В блоге после прямой трансляции Сэм Альтман размышлял о траектории развития OpenAI. Он отметил, что первоначальная миссия компании заключалась в том, чтобы "создавать различные преимущества для мира", но признал, что теперь акцент сместился на предоставление моделей разработчикам через платные API, чтобы сторонние разработчики "могли создавать удивительные вещи, от которых выиграют все".

До сегодняшнего запуска GPT-4o существовали противоречивые отчеты, предсказывающие, что OpenAI объявит о поисковой системе ИИ, конкурирующей с Google и Perplexity, голосовом помощнике, встроенном в GPT-4, или совершенно новой и улучшенной модели GPT-5. Конечно, OpenAI выбрала время для этого запуска перед Google I/O, флагманской конференцией технологического гиганта, на которой ожидается запуск различных продуктов ИИ от команды Gemini.

© . По материалам TechCrunch
Комментарии и отзывы

Нашли ошибку?

Новое на сайте