OpenAI обновила инструменты генерации изображений до версии GPT Image 1.5

2025-12-17 167 комментарии
Релиз GPT Image 1.5 обеспечивает высокую детализацию и точный рендеринг текста на изображениях. Система поддерживает мультимодальные рабочие процессы и доступна пользователям платных тарифов и через API

Компания OpenAI анонсировала выпуск нового поколения инструментов для работы с изображениями - GPT Image 1.5. Обновление внедряет улучшенный единый интерфейс в ChatGPT, объединяя функции создания, редактирования и глубокого анализа визуального контента. Новые возможности доступны как в веб-версии, так и в мобильных приложениях сервиса.

Единая среда для работы с графикой

Представленное обновление заменяет предыдущие инструменты генерации интегрированной системой, которая обеспечивает более высокую детализацию изображений и строгое следование сложным текстовым подсказкам (промптам). Данный функционал глубоко интегрирован в текстовые рабочие процессы.

Развертывание новых функций начинается с пользователей платных тарифных планов, после чего доступ будет постепенно открыт для бесплатной аудитории. Сторонние разработчики программного обеспечения также получили возможность использовать эти алгоритмы через Images API.

Функциональные возможности и редактирование

Система позволяет пользователям генерировать изображения на основе текстовых описаний, а затем дорабатывать результат в режиме диалога. Одной из ключевых особенностей стала возможность редактирования без необходимости покидать интерфейс чата. Инструментарий включает:

  • Инпейнтинг (перерисовка областей).

  • Изменение фона.

  • Замена или удаление отдельных объектов.

Важной частью релиза стала функция понимания изображений. Пользователи могут загружать фотографии или скриншоты, после чего ChatGPT способен анализировать содержимое, составлять описания или трансформировать исходные файлы. В OpenAI позиционируют данное нововведение как шаг к полноценной работе с изображениями как с первичными входными и выходными данными мультимодальных рабочих процессов, отказываясь от концепции изображений как надстройки над чатом.

Технические характеристики и производительность

Внутренняя архитектура модели была оптимизирована для обеспечения согласованности при серийной генерации. Разработчики значительно улучшили рендеринг текста внутри изображений, а также повысили надежность контроля над стилем и композицией кадра.

Обновление решает ряд давних технических проблем, включая искажение типографики и визуальное смещение (visual drift) между итерациями. Модель спроектирована для бесшовной работы в тандеме с текстовыми моделями GPT, что позволяет пользователям проходить путь от идеи до готового визуального прототипа в рамках одной сессии. Основной целевой аудиторией инструментов названы создатели контента, маркетологи, работники сферы образования и продуктовые команды, которым требуется быстрое визуальное прототипирование.

Стратегия развития и безопасность

OpenAI рассматривает выпуск GPT Image 1.5 как часть глобальной стратегии по созданию мультимодальных систем, объединяющих текст, графику и другие медиа в едином интерфейсе. Компания подчеркивает, что в новой модели сохранены и усилены механизмы безопасности, применявшиеся в ранних инструментах, включая строгую фильтрацию контента и политики использования. Технология распространяется через подписки ChatGPT и API для стимулирования широкого внедрения как в потребительских, так и в профессиональных сценариях использования.

© .
Комментарии и отзывы

Нашли ошибку?

Новое на сайте