Компания OpenAI анонсировала выпуск нового поколения инструментов для работы с изображениями - GPT Image 1.5. Обновление внедряет улучшенный единый интерфейс в ChatGPT, объединяя функции создания, редактирования и глубокого анализа визуального контента. Новые возможности доступны как в веб-версии, так и в мобильных приложениях сервиса.

Единая среда для работы с графикой
Представленное обновление заменяет предыдущие инструменты генерации интегрированной системой, которая обеспечивает более высокую детализацию изображений и строгое следование сложным текстовым подсказкам (промптам). Данный функционал глубоко интегрирован в текстовые рабочие процессы.
Развертывание новых функций начинается с пользователей платных тарифных планов, после чего доступ будет постепенно открыт для бесплатной аудитории. Сторонние разработчики программного обеспечения также получили возможность использовать эти алгоритмы через Images API.
Функциональные возможности и редактирование
Система позволяет пользователям генерировать изображения на основе текстовых описаний, а затем дорабатывать результат в режиме диалога. Одной из ключевых особенностей стала возможность редактирования без необходимости покидать интерфейс чата. Инструментарий включает:
-
Инпейнтинг (перерисовка областей).
-
Изменение фона.
-
Замена или удаление отдельных объектов.
Важной частью релиза стала функция понимания изображений. Пользователи могут загружать фотографии или скриншоты, после чего ChatGPT способен анализировать содержимое, составлять описания или трансформировать исходные файлы. В OpenAI позиционируют данное нововведение как шаг к полноценной работе с изображениями как с первичными входными и выходными данными мультимодальных рабочих процессов, отказываясь от концепции изображений как надстройки над чатом.
Технические характеристики и производительность
Внутренняя архитектура модели была оптимизирована для обеспечения согласованности при серийной генерации. Разработчики значительно улучшили рендеринг текста внутри изображений, а также повысили надежность контроля над стилем и композицией кадра.
Обновление решает ряд давних технических проблем, включая искажение типографики и визуальное смещение (visual drift) между итерациями. Модель спроектирована для бесшовной работы в тандеме с текстовыми моделями GPT, что позволяет пользователям проходить путь от идеи до готового визуального прототипа в рамках одной сессии. Основной целевой аудиторией инструментов названы создатели контента, маркетологи, работники сферы образования и продуктовые команды, которым требуется быстрое визуальное прототипирование.
Стратегия развития и безопасность
OpenAI рассматривает выпуск GPT Image 1.5 как часть глобальной стратегии по созданию мультимодальных систем, объединяющих текст, графику и другие медиа в едином интерфейсе. Компания подчеркивает, что в новой модели сохранены и усилены механизмы безопасности, применявшиеся в ранних инструментах, включая строгую фильтрацию контента и политики использования. Технология распространяется через подписки ChatGPT и API для стимулирования широкого внедрения как в потребительских, так и в профессиональных сценариях использования.
Обновления программ, что нового
• Anthropic представила новую модель Claude Opus 4.6 с контекстом до 1 млн токенов
• Передача файлов через AirDrop станет доступна на любых Android-смартфонах
• В Firefox Beta появился переключатель для полного отключения ИИ-функций
• YouTube открыл автоматический ИИ-дубляж для всех: 27 языков и поддержка русского
• Яндекс запустил обучение школьников ИИ-робототехнике — онлайн и в очных кружках Яндекс Лицея
• Смартфоны Samsung серии Galaxy S21 получили последние обновления безопасности – поддержка завершена