Google может представить собственный взгляд на концепцию крупномасштабной модели для автоматизации действий уже в декабре. Издание The Information сообщает, что «Проект Jarvis» (Project Jarvis) будет выполнять различные задачи для пользователей, включая «сбор информации, покупку товаров или бронирование билетов».
Jarvis будет работать на будущей версий Gemini и исключительно в браузере (настроен специально для Chrome). Инструмент поможет пользователям в «автоматизации повседневных задач в Интернете» путем захвата и анализа скриншотов, а также нажатия кнопок или ввода текста. В текущей реализации, как сообщается, между действиями происходит задержка в «несколько секунд».
Другие крупные компании, занимающиеся ИИ, работают над моделями, способными выполнять аналогичные задачи. Например, Microsoft разрабатывает Copilot Vision, который позволит общаться о просматриваемых веб-страницах. Ожидается, что в следующем году Apple Intelligence будет учитывать то, что отображается на экране, и выполнять действия за пользователя в нескольких приложениях.
Компания Anthropic представила «трудоемкое и склонное к ошибкам» бета-обновление Claude, которое может работать за пользователя, а OpenAI также работает над аналогичным проектом.
Нет гарантий, что Google представит Jarvis в декабре. Компания рассматривает возможность выпуска проекта для небольшой группы тестировщиков, чтобы найти и устранить баги.
Обновления программ, что нового
• Valve открыла доступ к Steam Replay 2025: детальная статистика игровой активности за год
• Актуальность специализированных игровых телефонов в 2026 году на фоне роста производительности флагманов
• Huawei опередила Xiaomi и Apple по объему глобальных поставок носимых устройств в третьем квартале 2025 года
• Характеристики Vivo V70: Android 16, Snapdragon 7 Gen 4 и батарея 6500 мАч
• Минцифры предлагает использовать мессенджер Max для банковских уведомлений вместо СМС
• Яндекс внедрил ИИ в умную IP-камеру: распознавание событий, сценарии и сводки дня
