Google начал тестирование следующего крупного обновления Gemini, ориентированного на работу с изображениями. Речь идет о функции разметки изображений, которая позволяет пользователю вручную указывать области, на которые должна обратить внимание нейросеть при анализе или редактировании визуального контента.

Разметка изображений в Gemini выходит на этап тестирования
В течение последних месяцев Google последовательно развивал инструменты для работы с изображениями в Gemini. Ранее компания уже внедрила ряд возможностей для визуального анализа, а несколько месяцев назад появились первые признаки разработки функции разметки изображений для Gemini в мобильном приложении. Позднее утечка подтвердила, что аналогичный инструмент готовится и для веб-версии Gemini.

На текущий момент оба варианта начали появляться у пользователей в рамках тестирования. Поддержка разметки изображений доступна как в приложении Gemini, так и в Gemini на десктопе через браузер Chrome. Функция охватывает как редактирование изображений, так и их анализ.

Как работает новая функция Gemini
После загрузки изображения в Gemini на Android пользователю показывается уведомление о новой возможности. Аналогичное вступительное сообщение, связанное с редактированием изображений, ранее уже фиксировалось в ходе анализа сборок приложения. Однако разметка используется не только для редактирования.
Инструмент позволяет явно указать конкретную часть изображения, к которой относится запрос. Таким образом, Gemini точнее интерпретирует пользовательские подсказки и лучше понимает контекст, особенно при работе со сложными или перегруженными визуальными сценами.
Анализ и редактирование с указанием нужной области
Тестирование показывает, что Gemini уверенно распознает выделенные участки изображения как при редактировании, так и при аналитических запросах. В одном из примеров анализ оказался не полностью точным, однако система корректно поняла, к какому именно объекту на изображении был адресован вопрос. Это подтверждает, что механизм фокусировки внимания нейросети через разметку работает корректно, даже если итоговый ответ требует доработки.
Доступность и перспективы внедрения
На данный момент нет точной информации о масштабах тестирования и о том, перешел ли Google к полноценному развертыванию функции разметки изображений в Gemini. Компания также не объявляла официальные сроки запуска. Ожидается, что в ближайшее время станет понятнее, насколько широко доступна новая возможность.
Пользователям рекомендуется проверить актуальные версии Gemini на своих устройствах, чтобы узнать, доступна ли им новая функция работы с изображениями.
Обновления программ, что нового
• Anthropic представила новую модель Claude Opus 4.6 с контекстом до 1 млн токенов
• Передача файлов через AirDrop станет доступна на любых Android-смартфонах
• В Firefox Beta появился переключатель для полного отключения ИИ-функций
• YouTube открыл автоматический ИИ-дубляж для всех: 27 языков и поддержка русского
• Яндекс запустил обучение школьников ИИ-робототехнике — онлайн и в очных кружках Яндекс Лицея
• Смартфоны Samsung серии Galaxy S21 получили последние обновления безопасности – поддержка завершена