Google представила модель Nano Banana 2 с функцией перевода текста на изображениях

2026-02-26 226 комментарии
Модель Nano Banana 2 (Gemini 3.1 Flash Image) генерирует изображения в разрешениях от 512px до 4K. Нейросеть поддерживает нативные форматы 4:1 и 8:1, функцию перевода текста прямо на картинке

Компания Google представила новую модель Nano Banana 2 (Gemini 3.1 Flash Image) для генерации детализированных изображений и быстрого редактирования на базе архитектуры Flash. Новинка позволяет массово создавать качественный визуальный контент и предлагает оптимальное соотношение цены и производительности.

Улучшенное понимание окружающего мира

Модель Nano Banana 2 задействует обширную базу знаний Gemini для формирования качественных изображений с применением данных из веб-поиска. Данная функциональность помогает разработчикам генерировать точные иллюстрации на основе реальных объектов и локаций.

Разработчики создали приложение Window Seat для демонстрации работы алгоритма. Программа использует базу знаний Nano Banana 2 и поиск картинок в сети для генерации фотореалистичных видов из окна, опираясь на информацию о мировых достопримечательностях и актуальные погодные сводки.

Точный рендеринг текста и локализация

Создание генераторов динамических интерфейсов и графических инструментов требует четкого отображения шрифтов. Nano Banana 2 превосходит предыдущие версии моделей Flash, обеспечивая надежный и правильный рендеринг текста.

Теперь надписи отображаются с той же детализацией, что и графические элементы, независимо от масштаба генерации. Модель поддерживает локализацию непосредственно на картинке, позволяя переводить слова на разные языки прямо внутри изображения.

В качестве примера компания разработала приложение Global Ad Localizer, которое переводит рекламные плакаты для международных рынков. Инструмент не только меняет текст с сохранением шрифтов, но и адаптирует визуальные элементы под культурные особенности выбранного региона.

Контроль над генерацией и новые форматы

Nano Banana 2 отличается высокой скоростью работы, предлагая естественное освещение, насыщенные текстуры и высокую резкость деталей. Создатели получили дополнительные инструменты для точного управления результатами:

  • Нативные соотношения сторон: модель поддерживает все существующие пропорции, к которым добавились форматы 4:1, 1:4, 8:1 и 1:8.

  • Новое разрешение 512px: в дополнение к существующим вариантам 1K, 2K и 4K появился формат, который снижает задержку для быстрых итераций.

  • Улучшенное следование инструкциям: алгоритм более точно обрабатывает сложные многоуровневые запросы.

  • Настраиваемые уровни рассуждения: пользователи получили возможность управлять логикой. Переключение между минимальным и высоким уровнями позволяет нейросети обдумать сложные промпты перед рендерингом, что заметно повышает качество результата.

Демонстрационное приложение Pet Passport берет одну фотографию домашнего животного и помещает питомца на фон известных мировых достопримечательностей. Нейросеть сохраняет внешний вид животного в разных локациях. Инженеры добавили различные параметры творческого контроля для индивидуальной настройки результата.

Партнеры компании активно внедряют Nano Banana 2 в рабочие процессы для масштабирования визуальных функций, отмечая стабильную работу и высокую функциональность решения.

Начать работу с моделью можно уже сегодня. Инструмент работает через Gemini API в Google AI Studio, поддерживает корпоративное использование в Vertex AI, а также в сервисах Google Antigravity и Firebase. Пользователи найдут подробности в документации для разработчиков, галерее приложений Google AI Studio и профильных руководствах.

© .
Комментарии и отзывы

Нашли ошибку?

Новое на сайте