Google запустила функцию анализа экрана с помощью ИИ Gemini в Chrome

Google начала поэтапно открывать доступ к новой функции анализа экрана с помощью искусственного интеллекта Gemini прямо в браузере Chrome. Первыми возможность опробовали подписчики тарифов AI Pro и AI Ultra в США, сообщает издание The Verge, поделившееся первыми впечатлениями от её работы.

Google интегрирует ИИ чат-бот Gemini в браузер Chrome

Как работает новая функция Gemini в Chrome

На презентации I/O 2025 компания анонсировала, что Gemini сможет просматривать содержимое экрана и камеры пользователя, отвечая на вопросы по содержанию сайтов. Активировать помощника можно с помощью новой иконки Gemini в браузере или сочетанием клавиш Alt+G. Пользователям доступен текстовый чат и голосовой режим Live.

Gemini умеет:

Пересказывать статьи и комментарии со страниц, которые пользователь просматривает;
Находить и обобщать информацию из видео, например, определять инструменты, используемые в роликах о ремонте;
Извлекать рецепты из видео на YouTube, избавляя пользователя от необходимости записывать их вручную;
Анализировать онлайн-магазины, например, выделять водонепроницаемые сумки на Amazon.

Gemini в Chrome также умеет извлекать рецепты из видео на YouTube. Рецепт соответствует оригинальному. Скриншот: The Verge

Ограничения и неточности работы Gemini

По наблюдениям журналистов The Verge, новая возможность Gemini имеет одно важное ограничение: она видит и анализирует только то, что отображено непосредственно на текущей вкладке браузера. Для полноценного пересказа статей или комментариев нужно предварительно пролистать всю страницу, чтобы модель «увидела» весь необходимый контент;
ИИ-анализатор пока ограничен одной вкладкой на запрос. При переходе на другую вкладку или сайт, Gemini не сможет объединить данные;
Gemini иногда не может точно определить детали без таймкодов в видео. Например, не сразу указала местонахождение MrBeast в ролике о городах майя;
Не всегда находит конкретные товары в интернет-магазинах, предлагая альтернативы;
Ответы Gemini могут быть слишком длинными для маленького всплывающего окна в браузере.

На видео: пользователь соцсети X тестирует Gemini в голосовом режиме, спрашивая, что демонстрирует Google в ролике для разработчиков с презентации I/O 2025 (Источник: Paul Couvert).

The Verge отмечает, что несмотря на небольшие недочёты, новая функция Gemini существенно упрощает получение полезной информации прямо в браузере, особенно при работе с видео.

Впервые ИИ-модель Gemini 2.0 Flash с функцией анализа экрана Google представила в декабре 2024 года. Изначально она была доступна только на платформе для разработчиков AI Studio.

Как использовать Google Gemini 2.0 Flash бесплатно – на сайте Gemini, в Google AI Studio и приложении

Обновления программ, что нового

• Яндекс Музыка добавила в «Мою волну» ИИ-рекомендации без интернета
• Зарядка смартфона только до 80% — защита или напрасная жертва
• Google выпустила Android 17 Beta 3 с раздельными переключателями Wi-Fi
• Google Gemini получил импорт чатов и памяти из ChatGPT и Claude
• Обновление Intel Killer Performance Suite 40.26.220.2126: новый драйвер Wi-Fi 24.30.1.1 и завершение поддержки AX1650
• AMD представила Ryzen 9 9950X3D2 Dual Edition – 16-ядерный процессор Zen 5 с 208 МБ кэша

Автор: Comss.one

Google запустила функцию анализа экрана с помощью ИИ Gemini в Chrome

Как работает новая функция Gemini в Chrome

Ограничения и неточности работы Gemini

Обновления программ, что нового

Новое на сайте