На фоне растущей популярности генеративного ИИ и увеличивающегося спроса на данные для обучения моделей, одной из новых проблем для владельцев веб-сайтов являются боты, которые собирают контент для обучения искусственного интеллекта. Компания Cloudflare объявила о выпуске нового инструмента, который поможет бороться с такими ботами. Эта функция доступна для всех пользователей, включая тех, кто использует бесплатный тарифный план.
Что представляет собой новый инструмент?
Инструмент Cloudflare для блокировки ботов был создан с целью защиты контента сайтов от несанкционированного использования. Компания отмечает, что некоторые разработчики собирают данные без разрешения, обходя даже установленные ограничения, и не платят за использование этих данных для тренировки своих моделей ИИ.
Чтобы воспользоваться новой функцией, пользователям нужно зайти в настройки безопасности (Security) своего аккаунта на Cloudflare и перейти в раздел «Боты» (Bots). Там можно найти опцию, которая позволяет блокировать ИИ-ботов всего одним нажатием. Cloudflare утверждает, что их алгоритмы способны выявлять даже тех роботов, которые маскируются под обычных пользователей.
Как это работает?
Новый инструмент от Cloudflare автоматически обновляется, чтобы отслеживать и блокировать новых ботов, которые занимаются сбором данных для обучения ИИ. Компания регулярно анализирует трафик на своей платформе, чтобы выявлять новые типы ботов и их поведение. Это позволяет своевременно вносить изменения в алгоритмы и обеспечивать надежную защиту.
Cloudflare также создала специальную форму, через которую владельцы сайтов могут сообщить о ботах, которых не удалось остановить с помощью автоматических алгоритмов. Это позволяет компании оперативно реагировать на новые угрозы и улучшать свои защитные механизмы.
Примеры использования и статистика
Согласно данным Cloudflare, самые популярные ИИ-боты, которые совершают наибольшее количество запросов, включают Bytespider, Amazonbot, ClaudeBot и GPTBot. Например, Bytespider, управляемый китайской компанией ByteDance, используется для сбора данных для языковых моделей, таких как Doubao, аналог ChatGPT. GPTBot от OpenAI также активно собирает данные для своих продуктов, таких как ChatGPT.
Cloudflare отмечает, что многие сайты не блокируют ботов, несмотря на их активность. В июне этого года ИИ-боты получили доступ к 39% из миллиона топовых сайтов, защищенных Cloudflare, но лишь 2.98% этих сайтов предприняли меры для блокировки запросов. Чем популярнее сайт, тем больше он привлекает ботов, и тем чаще предпринимаются попытки их блокировки.
Новый инструмент от Cloudflare позволяет владельцам сайтов эффективно блокировать ботов, собирающих данные для обучения ИИ, и тем самым защищать свой контент.
Обновления программ, что нового
• Firefox 139 Beta: повышена производительность загрузки по HTTP/3, улучшены перевод страниц и поддержка PNG
• Обновление NVIDIA GeForce Game Ready 576.28 WHQL. Исправления для RTX 50 и улучшения стабильности работы игр
• Новые функции «Алисы» и «Яндекс Станций» за апрель 2025 года
• Релиз Chrome 136: Обновления безопасности и исправление уязвимости, которая существовала более 20 лет
• Обновление до Windows 11, версия 24H2 блокируется на старых версиях Windows 11 из-за бага в службе WSUS
• Обновление Intel Bluetooth Drivers 23.130.0 для Windows 11 и Windows 10: функциональные улучшения