Компания OpenAI анонсировала выпуск нового поколения инструментов для работы с изображениями - GPT Image 1.5. Обновление внедряет улучшенный единый интерфейс в ChatGPT, объединяя функции создания, редактирования и глубокого анализа визуального контента. Новые возможности доступны как в веб-версии, так и в мобильных приложениях сервиса.

Единая среда для работы с графикой
Представленное обновление заменяет предыдущие инструменты генерации интегрированной системой, которая обеспечивает более высокую детализацию изображений и строгое следование сложным текстовым подсказкам (промптам). Данный функционал глубоко интегрирован в текстовые рабочие процессы.
Развертывание новых функций начинается с пользователей платных тарифных планов, после чего доступ будет постепенно открыт для бесплатной аудитории. Сторонние разработчики программного обеспечения также получили возможность использовать эти алгоритмы через Images API.
Функциональные возможности и редактирование
Система позволяет пользователям генерировать изображения на основе текстовых описаний, а затем дорабатывать результат в режиме диалога. Одной из ключевых особенностей стала возможность редактирования без необходимости покидать интерфейс чата. Инструментарий включает:
-
Инпейнтинг (перерисовка областей).
-
Изменение фона.
-
Замена или удаление отдельных объектов.
Важной частью релиза стала функция понимания изображений. Пользователи могут загружать фотографии или скриншоты, после чего ChatGPT способен анализировать содержимое, составлять описания или трансформировать исходные файлы. В OpenAI позиционируют данное нововведение как шаг к полноценной работе с изображениями как с первичными входными и выходными данными мультимодальных рабочих процессов, отказываясь от концепции изображений как надстройки над чатом.
Технические характеристики и производительность
Внутренняя архитектура модели была оптимизирована для обеспечения согласованности при серийной генерации. Разработчики значительно улучшили рендеринг текста внутри изображений, а также повысили надежность контроля над стилем и композицией кадра.
Обновление решает ряд давних технических проблем, включая искажение типографики и визуальное смещение (visual drift) между итерациями. Модель спроектирована для бесшовной работы в тандеме с текстовыми моделями GPT, что позволяет пользователям проходить путь от идеи до готового визуального прототипа в рамках одной сессии. Основной целевой аудиторией инструментов названы создатели контента, маркетологи, работники сферы образования и продуктовые команды, которым требуется быстрое визуальное прототипирование.
Стратегия развития и безопасность
OpenAI рассматривает выпуск GPT Image 1.5 как часть глобальной стратегии по созданию мультимодальных систем, объединяющих текст, графику и другие медиа в едином интерфейсе. Компания подчеркивает, что в новой модели сохранены и усилены механизмы безопасности, применявшиеся в ранних инструментах, включая строгую фильтрацию контента и политики использования. Технология распространяется через подписки ChatGPT и API для стимулирования широкого внедрения как в потребительских, так и в профессиональных сценариях использования.
Обновления программ, что нового
• Мессенджер Макс для iPhone удалили из App Store
• Xiaomi Watch S5, Xiaomi Smart Band 10 Pro и Xiaomi Buds 6 стали доступны в России
• Apple назвала компьютеры Mac, которые не получат macOS 27
• Google добавляет в Android защиту от мошеннических звонков с ИИ-дипфейками
• Планшеты Samsung Galaxy Tab S9 FE и Tab S9 FE+ получили обновление One UI 8.5. Что нового
• Планшеты Samsung Galaxy Tab S9, Tab S9+ и Tab S9 Ultra получили обновление One UI 8.5 с одной функцией Galaxy AI