Компания Google представила новую модель Nano Banana 2 (Gemini 3.1 Flash Image) для генерации детализированных изображений и быстрого редактирования на базе архитектуры Flash. Новинка позволяет массово создавать качественный визуальный контент и предлагает оптимальное соотношение цены и производительности.
Улучшенное понимание окружающего мира
Модель Nano Banana 2 задействует обширную базу знаний Gemini для формирования качественных изображений с применением данных из веб-поиска. Данная функциональность помогает разработчикам генерировать точные иллюстрации на основе реальных объектов и локаций.
Разработчики создали приложение Window Seat для демонстрации работы алгоритма. Программа использует базу знаний Nano Banana 2 и поиск картинок в сети для генерации фотореалистичных видов из окна, опираясь на информацию о мировых достопримечательностях и актуальные погодные сводки.
Точный рендеринг текста и локализация
Создание генераторов динамических интерфейсов и графических инструментов требует четкого отображения шрифтов. Nano Banana 2 превосходит предыдущие версии моделей Flash, обеспечивая надежный и правильный рендеринг текста.
Теперь надписи отображаются с той же детализацией, что и графические элементы, независимо от масштаба генерации. Модель поддерживает локализацию непосредственно на картинке, позволяя переводить слова на разные языки прямо внутри изображения.
В качестве примера компания разработала приложение Global Ad Localizer, которое переводит рекламные плакаты для международных рынков. Инструмент не только меняет текст с сохранением шрифтов, но и адаптирует визуальные элементы под культурные особенности выбранного региона.
Контроль над генерацией и новые форматы
Nano Banana 2 отличается высокой скоростью работы, предлагая естественное освещение, насыщенные текстуры и высокую резкость деталей. Создатели получили дополнительные инструменты для точного управления результатами:
-
Нативные соотношения сторон: модель поддерживает все существующие пропорции, к которым добавились форматы 4:1, 1:4, 8:1 и 1:8.
-
Новое разрешение 512px: в дополнение к существующим вариантам 1K, 2K и 4K появился формат, который снижает задержку для быстрых итераций.
-
Улучшенное следование инструкциям: алгоритм более точно обрабатывает сложные многоуровневые запросы.
-
Настраиваемые уровни рассуждения: пользователи получили возможность управлять логикой. Переключение между минимальным и высоким уровнями позволяет нейросети обдумать сложные промпты перед рендерингом, что заметно повышает качество результата.
Демонстрационное приложение Pet Passport берет одну фотографию домашнего животного и помещает питомца на фон известных мировых достопримечательностей. Нейросеть сохраняет внешний вид животного в разных локациях. Инженеры добавили различные параметры творческого контроля для индивидуальной настройки результата.
Партнеры компании активно внедряют Nano Banana 2 в рабочие процессы для масштабирования визуальных функций, отмечая стабильную работу и высокую функциональность решения.
Начать работу с моделью можно уже сегодня. Инструмент работает через Gemini API в Google AI Studio, поддерживает корпоративное использование в Vertex AI, а также в сервисах Google Antigravity и Firebase. Пользователи найдут подробности в документации для разработчиков, галерее приложений Google AI Studio и профильных руководствах.
Обновления программ, что нового
• NVIDIA отозвала драйвер GeForce Game Ready 595.59 WHQL после жалоб на проблемы с вентиляторами и частотами
• Google представила модель Nano Banana 2 с функцией перевода текста на изображениях
• AMD Radeon Software Adrenalin 26.2.2 WHQL. Поддержка Resident Evil Requiem и Marathon
• Opera 128 Stable: обновление Chromium 144, расширенный «Разделённый экран» и улучшения стабильности
• VMware Workstation Pro 25H2 Update 1: возвращение проверки обновлений и исправления уязвимостей
• Обновление NVIDIA GeForce Game Ready 595.59 WHQL. Поддержка DLSS 4 для Resident Evil Requiem

