OpenAI обновила инструменты генерации изображений до версии GPT Image 1.5

Компания OpenAI анонсировала выпуск нового поколения инструментов для работы с изображениями - GPT Image 1.5. Обновление внедряет улучшенный единый интерфейс в ChatGPT, объединяя функции создания, редактирования и глубокого анализа визуального контента. Новые возможности доступны как в веб-версии, так и в мобильных приложениях сервиса.

Единая среда для работы с графикой

Представленное обновление заменяет предыдущие инструменты генерации интегрированной системой, которая обеспечивает более высокую детализацию изображений и строгое следование сложным текстовым подсказкам (промптам). Данный функционал глубоко интегрирован в текстовые рабочие процессы.

Развертывание новых функций начинается с пользователей платных тарифных планов, после чего доступ будет постепенно открыт для бесплатной аудитории. Сторонние разработчики программного обеспечения также получили возможность использовать эти алгоритмы через Images API.

Функциональные возможности и редактирование

Система позволяет пользователям генерировать изображения на основе текстовых описаний, а затем дорабатывать результат в режиме диалога. Одной из ключевых особенностей стала возможность редактирования без необходимости покидать интерфейс чата. Инструментарий включает:

Инпейнтинг (перерисовка областей).
Изменение фона.
Замена или удаление отдельных объектов.

Важной частью релиза стала функция понимания изображений. Пользователи могут загружать фотографии или скриншоты, после чего ChatGPT способен анализировать содержимое, составлять описания или трансформировать исходные файлы. В OpenAI позиционируют данное нововведение как шаг к полноценной работе с изображениями как с первичными входными и выходными данными мультимодальных рабочих процессов, отказываясь от концепции изображений как надстройки над чатом.

Технические характеристики и производительность

Внутренняя архитектура модели была оптимизирована для обеспечения согласованности при серийной генерации. Разработчики значительно улучшили рендеринг текста внутри изображений, а также повысили надежность контроля над стилем и композицией кадра.

Обновление решает ряд давних технических проблем, включая искажение типографики и визуальное смещение (visual drift) между итерациями. Модель спроектирована для бесшовной работы в тандеме с текстовыми моделями GPT, что позволяет пользователям проходить путь от идеи до готового визуального прототипа в рамках одной сессии. Основной целевой аудиторией инструментов названы создатели контента, маркетологи, работники сферы образования и продуктовые команды, которым требуется быстрое визуальное прототипирование.

Стратегия развития и безопасность

OpenAI рассматривает выпуск GPT Image 1.5 как часть глобальной стратегии по созданию мультимодальных систем, объединяющих текст, графику и другие медиа в едином интерфейсе. Компания подчеркивает, что в новой модели сохранены и усилены механизмы безопасности, применявшиеся в ранних инструментах, включая строгую фильтрацию контента и политики использования. Технология распространяется через подписки ChatGPT и API для стимулирования широкого внедрения как в потребительских, так и в профессиональных сценариях использования.

Обновления программ, что нового

• AMD представила Radeon RX 9050: младшая видеокарта RDNA 4 с 8 ГБ GDDR6 памяти и энергопотреблением 92 Вт
• Пять поколений Tensor не вывели Pixel на уровень iPhone и Galaxy
• В России основателю Telegram Павлу Дурову предъявили обвинение
• Яндекс запускает программу 75/75/75: к концу 2026 года ИИ будет участвовать в большинстве изменений кода
• Galaxy S25 Ultra и S24 Ultra быстрее разряжаются после июльского патча
• Find X9 Ultra отстал от Huawei Pura 80 Ultra на пять баллов в рейтинге камер DxOMark

Автор: Comss.one