Google тестирует функцию разметки изображений в Gemini для анализа и редактирования

Google начал тестирование следующего крупного обновления Gemini, ориентированного на работу с изображениями. Речь идет о функции разметки изображений, которая позволяет пользователю вручную указывать области, на которые должна обратить внимание нейросеть при анализе или редактировании визуального контента.

Разметка изображений в Gemini выходит на этап тестирования

В течение последних месяцев Google последовательно развивал инструменты для работы с изображениями в Gemini. Ранее компания уже внедрила ряд возможностей для визуального анализа, а несколько месяцев назад появились первые признаки разработки функции разметки изображений для Gemini в мобильном приложении. Позднее утечка подтвердила, что аналогичный инструмент готовится и для веб-версии Gemini.

На текущий момент оба варианта начали появляться у пользователей в рамках тестирования. Поддержка разметки изображений доступна как в приложении Gemini, так и в Gemini на десктопе через браузер Chrome. Функция охватывает как редактирование изображений, так и их анализ.

Как работает новая функция Gemini

После загрузки изображения в Gemini на Android пользователю показывается уведомление о новой возможности. Аналогичное вступительное сообщение, связанное с редактированием изображений, ранее уже фиксировалось в ходе анализа сборок приложения. Однако разметка используется не только для редактирования.

Инструмент позволяет явно указать конкретную часть изображения, к которой относится запрос. Таким образом, Gemini точнее интерпретирует пользовательские подсказки и лучше понимает контекст, особенно при работе со сложными или перегруженными визуальными сценами.

Анализ и редактирование с указанием нужной области

Тестирование показывает, что Gemini уверенно распознает выделенные участки изображения как при редактировании, так и при аналитических запросах. В одном из примеров анализ оказался не полностью точным, однако система корректно поняла, к какому именно объекту на изображении был адресован вопрос. Это подтверждает, что механизм фокусировки внимания нейросети через разметку работает корректно, даже если итоговый ответ требует доработки.

Доступность и перспективы внедрения

На данный момент нет точной информации о масштабах тестирования и о том, перешел ли Google к полноценному развертыванию функции разметки изображений в Gemini. Компания также не объявляла официальные сроки запуска. Ожидается, что в ближайшее время станет понятнее, насколько широко доступна новая возможность.

Пользователям рекомендуется проверить актуальные версии Gemini на своих устройствах, чтобы узнать, доступна ли им новая функция работы с изображениями.

Обновления программ, что нового

• OPPO откажется от OxygenOS в пользу ColorOS на смартфонах OnePlus
• Opera добавила функцию Paste Protect: защита от вредоносных команд в буфере обмена
• Pixel тормозят в играх после обновления до Android 17
• Claude Fable 5 снова доступна: условия до 7 июля и после
• Уязвимость «Скрыть e-mail»: Apple не чинит её с июня 2025 года
• Android 17 QPR1 Beta 6: пять исправлений и новые функции для Pixel

Автор: Comss.one По материалам androidauthority