Новая GPT-5.5-Cyber от OpenAI обошла Claude Mythos 5 в бенчмарке по уязвимостям

88 комментарии
OpenAI представила GPT-5.5-Cyber и расширила инициативу Daybreak для поиска и устранения уязвимостей. Новая модель показала лучшие результаты в специализированных тестах по кибербезопасности, опередив Claude Mythos 5, а также стала доступна проверенным специалистам и партнёрам отрасли
OpenAI официально объявила о значительном расширении своей инициативы Daybreak в сфере кибербезопасности, предоставив участникам продвинутые ИИ-инструменты.

Компания OpenAI объявила о крупном расширении Daybreak — инициативы в сфере кибербезопасности, созданной для того, чтобы помогать находить, проверять и исправлять уязвимости в ПО на более раннем этапе процесса разработки.

Доступность мощных ИИ-моделей изменила ландшафт кибербезопасности, сделав поиск уязвимостей гораздо более быстрым. Однако более серьезным узким местом для отрасли теперь является исправление этих уязвимостей. Командам разработчиков ПО нужно подтвердить обнаруженные проблемы, понять их влияние, разработать исправления, протестировать их и развернуть патчи.

Еще в марте OpenAI запустила предварительную версию Codex Security, который использует агентное рассуждение с автоматической проверкой для обнаружения серьезных проблем и практических исправлений, специфичных для конкретной кодовой базы. С тех пор он просканировал более 30 миллионов коммитов в более чем 30 000 кодовых баз. Более 70 000 находок были отмечены как исправленные людьми-рецензентами, а более 500 000 находок были автоматически определены как исправленные.

Теперь OpenAI выпускает обновленный плагин Codex Security, который позволяет:

  • Выполнять глубокое сканирование
  • Проверять недавние изменения в коде
  • Генерировать отчеты по безопасности
  • Отслеживать пути атаки
  • Проверять находки
  • Создавать специфичные для кодовой базы патчи для проверки человеком.
  • Сортировать находки из существующих сканеров, рекомендаций по безопасности, отчетов программ bugbounty и систем управления заявками.
  • Экспортировать результаты в системы управления уязвимостями и интегрироваться с рабочими процессами с помощью файлов SARIF, запросов CodeQL, Codex CLI и приложения Codex.

В мае 2026 года OpenAI объявила о предварительной версии GPT-5.5-Cyber — новой модели, построенной на базе недавно выпущенной GPT-5.5 и предназначенной для специализированной работы в сфере кибербезопасности. Теперь OpenAI запустила полную версию GPT-5.5-Cyber в рамках ограниченного релиза для проверенных защитников. В тесте CyberGym модель GPT-5.5-Cyber показала результат 85,6%. Для сравнения, обычная GPT-5.5 набрала 81,8%, а Claude Mythos 5 — 83,8%. В ExploitGym результат GPT-5.5-Cyber составил 39,5% против 25,95% у GPT-5.5. В SEC-bench Pro новая модель набрала 69,8%, тогда как GPT-5.5 показала 63,1%.

CyberGym

OpenAI также объявила о новой партнерской программе Daybreak Cyber Partner Program, которая позволит поставщикам решений и услуг в сфере безопасности использовать GPT-5.5 с Trusted Access for Cyber в своих продуктах и сервисах. Среди первых партнеров программы указаны Accenture, Akamai, Cisco, Cloudflare, CrowdStrike, IBM, Palo Alto Networks, Proofpoint, SentinelOne, Wiz, Zscaler и другие компании.

OpenAI также запускает Patch the Planet совместно с Trail of Bits, HackerOne, Calif, исследователями и мейнтейнерами. Более 30 проектов с открытым исходным кодом уже согласились принять участие, включая cURL, Go, Python, Sigstore и pyca/cryptography.

Автор:
Комментарии и отзывы

Нашли ошибку?

Новое на сайте