Компания Brave открыла исходный код нового инструмента под названием Cookiecrumbler, который использует большие языковые модели (LLM) для выявления уведомлений о согласии на использование cookies, а также обзоры сообщества для их проверки и блокировки там, где это не нарушает работу сайта.
Браузер Brave по умолчанию блокирует баннеры согласия на использование куки на всех сайтах с 2022 года, однако выяснилось, что такое блокирование иногда вызывает серьезные проблемы — сайт становится неудобным или вообще неработоспособным.
Brave поясняет:
Слишком широкая или неправильная блокировка может нарушить критически важные функции сайта — от оформления заказов до некорректного отображения страниц.
Мы сталкивались с множеством проблем (сломанная прокрутка, пустые страницы) при бездумной блокировке уведомлений о cookies.
Cookiecrumbler использует ИИ для поиска сайтов, использующих платформы управления согласием (Сonsent Management Platforms, CMP), и регистрирует такие случаи в своем проекте на GitHub. Предложения Cookiecrumbler затем проходят ручную проверку, чтобы избежать поломки функциональности сайтов.
Работа инструмента устроена следующим образом:
- Обходит популярные сайты с помощью прокси-серверов для разных регионов.
- Загружает страницы с помощью Puppeteer для поиска потенциальных баннеров cookies.
- Передает найденное LLM для классификации и предложений по исправлению.
- Публикует результаты обнаружения в виде задач на GitHub для дальнейшей проверки и улучшений сообществом.
Таким образом, Cookiecrumbler позволяет масштабно и с учетом региональных особенностей обнаруживать и блокировать баннеры cookies, снижая количество ошибок и проблем с работой сайтов.
Так как Brave ориентирован на защиту конфиденциальности, в анонсе подчеркивается, что Cookiecrumbler не раскрывает никаких чувствительных данных:
- Во-первых, Cookiecrumbler работает полностью на стороне серверов Brave, а не в браузере пользователя, поэтому пользовательские данные не участвуют в процессе обнаружения и анализа.
- Во-вторых, инструмент не взаимодействует с реальными пользовательскими сессиями: вместо этого он использует прокси и автоматизированные краулеры, которые имитируют просмотр сайтов из разных регионов, используя публичные списки сайтов, такие как Tranco.
Забота о приватности — главная причина, по которой Cookiecrumbler пока не интегрирован в браузер Brave, а используется только как внутренний инструмент для анализа.
Компания Brave Software отмечает, что Cookiecrumbler будет встроен в браузер только после полной проверки на соответствие строгим требованиям к приватности пользователей.
Поскольку Cookiecrumbler — это открытый и бесплатный проект, доступный на GitHub, им могут пользоваться и другие разработчики инструментов защиты конфиденциальности, аудиторы сайтов, составители списков для блокировщиков рекламы или просто технически подкованные пользователи, которые хотят создавать или улучшать собственные фильтры.
Обновления программ, что нового
• Anthropic представила Claude Sonnet 4 и Claude Opus 4 — новые языковые модели с упором на код и рассуждения
• Xiaomi представила смартфон 15S Pro с новым флагманским чипом Xring O1
• AMD анонсировала поддержку ROCm для Windows, Ryzen AI MAX и серии Radeon RX 9000
• Яндекс запускает «Вертикали Поиска» — поиск по товарам, квартирам и финансам в одном окне
• Алиса на YandexGPT 5 Lite стала доступна всем — без подписки и на всех устройствах
• Яндекс добавил в Поиск режим рассуждений и генерацию контента с помощью Алисы на базе YandexGPT