Windows к 2030 году: «агентная» ОС, где голос и контекст заменят клики мышью
Microsoft намекает на радикальную эволюцию Windows: операционная система станет «агентной» (agentic) — то есть способной самостоятельно выполнять целые рабочие процессы по вашей просьбе и в тесной связке с приложениями и данными. Поводом для разговора стало новое видео из серии Windows 2030 Vision с участием Дэвида Уэстона (David Weston), корпоративного вице-президента Microsoft по безопасности ОС. В нём он утверждает, что «мир передвижения мышью и набора на клавиатуре со временем будет казаться таким же чуждым, как для зумеров — MS-DOS».
Идея проста: Windows получит естественный, мультимодальный интерфейс — компьютер «видит» то же, что видите вы, «слышит», что вы слышите, и понимает речь, жесты, контекст экрана и задачи. Вместо того чтобы открывать десятки окон и нажимать на кнопки, пользователь сформулирует цель, а система сама «оркестрирует» нужные приложения и шаги. Это не замена приложений, а новый способ их координации на уровне ОС.
Что именно показала Microsoft в «Windows 2030 Vision»
В первом ролике серии Уэстон описывает Windows будущего как систему с «мультимодальным» взаимодействием: можно говорить с ПК, показывать ему объект на экране или в камере, отдавать сложные команды на естественном языке — а система будет понимать намерение и исполнять его, подключая нужные сервисы и документы. При этом упор делается не только на удобство, но и на безопасность корпоративного уровня.
«Я искренне верю, что будущая версия Windows будет взаимодействовать мультимодально. Компьютер сможет видеть то, что видим мы, слышать то, что слышим мы, а мы сможем говорить с ним и просить делать более сложные вещи».
Дэвид Уэстон, Microsoft
Ролик также затрагивает тему ИИ-агентов в рабочих процессах: от автоматизации «рутинных» задач до полноценного участия в рабочих чатах и встречах в духе «цифровых коллег», которые получают задания, отвечают на письма и готовят материалы.
Агентная ОС: «внутри», «рядом» и «вне» приложений
Microsoft ещё на Build 2023 формализовала подход к интеграции ИИ: внутри приложения (функции в интерфейсе), рядом с приложением (ассистент, который помогает работать в нём), и вне приложений — когда ИИ живёт на уровне всей системы и координирует несколько приложений и сервисов, исходя из цели пользователя. До «вне приложений» индустрия пока почти не добралась — но именно туда, судя по сигналам, и движется Windows.
Как это изменит пользовательский опыт
- Голос и диалог — «третья рука». Управление голосом превратится из вспомогательной опции в равноправный способ взаимодействия: вы формулируете задачу («Собери мне бриф по проекту из переписки, добавь последние цифры из Excel и подготовь слайды к завтрашней встрече»), а система запускает серию действий и приносит результат. Клавиатура и мышь остаются — но отходят на второй план в сценариях, где быстрее сказать, чем кликать.
- Мультимодальность по умолчанию. ОС понимает контекст экрана, приложения, открытые файлы, изображение с камеры и ваш голос. Никаких «магических» жестов — достаточно указать цель или показать объект.
- Оркестрация вместо микроконтроля. Windows будет «склеивать» между собой несколько приложений и сервисов, избавляя от рутины: поиск, копирование данных, конвертации, сохранение в нужных местах, согласование с коллегами и т. п.
- Объяснимость и контроль. Ключевой вопрос — прозрачность: почему агент сделал именно так, какие данные использовал и где сохранил результат. Без этого доверия не будет — значит, появятся журналы действий, «сухие прогоны» (dry-run) и гибкие настройки разрешений.
Скепсис по поводу «окончательной смерти» мыши и клавиатуры закономерен: для многих задач точные курсор и хоткеи останутся незаменимыми. Но в массовых сценариях (поиск, составление документов, сводки, бронирования, отчётность) голос и агентная автоматизация действительно могут стать быстрее.
Безопасность и «постквант» — фундамент новой Windows
Если агентная ОС должна видеть и понимать больше, чем раньше, то безопасность и шифрование выходят на первый план. Уэстон подчёркивает переход к «квантово-стойким» (post-quantum) алгоритмам и влияние квантовых вычислений на угрозы и защиту. Уже сейчас Microsoft внедряет квантово-устойчивые протоколы, готовясь к будущему, где вычислительные мощности кратно возрастут.
Где уже можно увидеть «агентность» сегодня
Пока Windows только рисует контуры такой трансформации, «агентные» идеи пробуют в браузерах. Показательный пример — браузер Comet от Perplexity: это «ИИ-браузер», который обещает выполнять исследования, сравнивать товары, бронировать встречи и вести «многошаговые» сценарии из одного диалога. Пока доступ открыт подписчикам за $200/месяц (Perplexity Max) и через инвайты, но концептуально это первая волна «оркестровки» действий на потребительском рынке.
Ранее также были анонсированы ИИ-браузер Opera Neon, Яндекс.Браузер с функциями ИИ-агента. Microsoft представила «Режим Copilot» в браузере Edge — экспериментальную функцию, превращающую Edge в агентный ИИ-браузер. Copilot анализирует вкладки, помогает выполнять задачи на сайтах и работает как полноценный цифровой ассистент. The Browser Company выпустила бета-версию ИИ-браузера Dia для macOS: браузер на Chromium с чат-ботом анализирует вкладки, историю и куки, чтобы помогать в работе и покупках. OpenAI также готовится выпустить собственный ИИ-браузер с интеграцией ChatGPT.
Принцип тот же, что у агентной ОС: вы формулируете цель, а система ходит по страницам, собирает сведения, делает сводку и отдаёт результат. Разница в том, что Windows замахивается на уровень всей ОС, где у агента есть доступ к локальным данным, приложениям, настройкам и корпоративной инфраструктуре — а значит, и к более сложным, «сквозным» процессам.
Что это значит для пользователей и компаний
- Новые навыки. Главным «языком» для ПК станет не набор горячих клавиш, а умение формулировать задачи и критерии качества. Появятся шаблоны промптов, «стилевая» настройка агента, корпоративные глоссарии.
- ИТ-архитектура под агента. Чтобы агент «видел» данные и мог действовать, компаниям придётся переосмыслить доступы, классификацию информации, аудит и политику хранения.
- Комплаенс и приватность. Нужны понятные границы: какие почтовые ящики, чаты и документы агент может читать; где хранит промежуточные данные; как отключить сбор в чувствительных процессах.
- Инклюзивность. Для пользователей с ограниченными возможностями мультимодальность — шанс сделать ПК по-настоящему доступным. Но и традиционные методы ввода должны остаться.
Когда ждать и как будет называться будущая Windows
Microsoft не называет дат и версий (Windows 12 или Windows 13) и не обещает, что мыши и клавиатуры исчезнут. Но тренд очевиден: дальнейшая интеграция Copilot, рост роли локальных NPU (ускорителей ИИ) и переход к сценариям «задача - результат» вместо «окна - клики». Внутри Microsoft уже обсуждают «агентную» Windows — как минимум на уровне видения.
Windows движется от «инструмента для кликов» к «партнёру по задачам». Ставка на агентность, голос и мультимодальность может существенно снизить «трение» повседневной работы — особенно там, где сегодня тратятся часы на поиск, копирование, сборки презентаций и отчётов. Прорыв потребует не только ИИ-моделей и NPU-железа, но и новых подходов к безопасности, управлению доступом и объяснимости решений. И хотя мышь с клавиатурой ещё долго не уйдут, привычные «клик–клик–клик» действительно станут реже — потому что будет быстрее просто сказать, показать и сформулировать цель.
Последние статьи #Microsoft
• Microsoft показала видение Windows 2030: агентная ОС, где голос и ИИ заменят клики мышью
• Microsoft Copilot получил функцию преобразования 2D-изображений в 3D-объекты
• Обновление KB5064075 (Build 26120.5742) для Windows 11, версия 24H2 (Beta)
• Обновление KB5064075 (Build 26200.5742) для Windows 11, версия 25H2 (Dev)
• Windows 11 Build 27919 (Canary): Что нового, готовые ISO-образы
• Релиз Microsoft Edge 139: прирост производительности и улучшения менеджера паролей