Anthropic выпустила Claude Sonnet 5 – агентную модель в линейке Sonnet, рассчитанную на планирование и автономную работу с инструментами вроде браузера и терминала. По результатам тестов она приближается к Opus 4.8, оставаясь существенно дешевле. Sonnet 5 стала моделью по умолчанию на тарифах Free и Pro и доступна подписчикам Max, Team и Enterprise, а также в Claude Code и на платформе Claude. На старте, до 31 августа 2026 года, действует сниженная цена – 2 доллара за миллион входных токенов и 10 долларов за миллион выходных.

Что изменилось относительно Sonnet 4.6
В Sonnet 5 разработчики улучшили рассуждение, работу с инструментами, программирование и интеллектуальную работу относительно Sonnet 4.6. На части агентных задач модель приближается к Opus 4.8 – более мощной и универсальной модели, которую в таблице приводят для сравнения.

Агентная модель – модель, способная самостоятельно планировать шаги, вызывать внешние инструменты (браузер, терминал) и выполнять многошаговые задачи с минимальным участием человека.
| Оценка | Sonnet 5 | Sonnet 4.6 | Opus 4.8 |
|---|---|---|---|
| SWE-bench Pro (агентное программирование) | 63,2% | 58,1% | 69,2% |
| Terminal-Bench 2.1 (агентное программирование) | 80,4% | 67,0% | 82,7% |
| Humanity's Last Exam, без инструментов (междисциплинарное рассуждение) | 43,2% | 34,6% | 49,8% |
| Humanity's Last Exam, с инструментами | 57,4% | 46,8% | 57,9% |
| OSWorld-Verified (управление компьютером) | 81,2% | 78,5% | 83,4% |
| GDPval-AA v2 (интеллектуальная работа, балл) | 1618 | 1395 | 1615 |
По отзывам партнёров раннего доступа, Sonnet 5 доводит до конца сложные задачи, на которых прежние модели Sonnet останавливались, и проверяет собственный вывод без явного запроса.
Уровни усилий и соотношение цены и качества

Между Sonnet 5 и Opus 4.8 пользователь может регулировать уровень усилий, подбирая баланс стоимости и точности. На графиках агентного поиска BrowseComp и управления компьютером OSWorld-Verified Sonnet 5 показывает результаты выше, чем у Sonnet 4.6, на всех уровнях усилий. Для максимальной точности на этих задачах по-прежнему подходит Opus 4.8, тогда как Sonnet 5 доступна по более низкой цене при заметно более высоком качестве, чем было доступно раньше. Обозначение xhigh на графиках соответствует особо высокому уровню усилий.
Безопасность в агентных сценариях
Проверки перед выпуском показали, что по безопасности Sonnet 5 в целом превосходит Sonnet 4.6. В агентных сценариях модель надёжнее отклоняет вредоносные запросы и устойчивее к попыткам перехвата управления в атаках prompt injection. Частота галлюцинаций и угодливости ниже, чем у Sonnet 4.6.
Prompt injection – класс атак, при которых во входные данные модели внедряют скрытые инструкции, чтобы заставить её отойти от исходной задачи или выдать нежелательный результат.
В автоматическом поведенческом аудите, который проверяет широкий набор нежелательных проявлений – от содействия злоупотреблениям до обмана, – Sonnet 5 набрала меньше баллов, то есть оказалась безопаснее. При этом по сравнению с более мощными Opus 4.8 и Claude Mythos Preview уровень нежелательного поведения у неё несколько выше.
Кибербезопасность и эксплойты для Firefox 147

Модель целенаправленно не обучали кибербезопасности. Она выполняет часть рутинных безвредных задач в этой сфере, но на тестах потенциально опасных навыков – например, разработки эксплойтов – результаты заметно ниже, чем у Opus 4.8 и Mythos 5. В одном из тестов, подготовленном совместно с Mozilla, модели разрабатывали эксплойты для уязвимостей в браузере Firefox 147; все эти уязвимости закрыты в Firefox 148. Sonnet 5 ни разу не создала рабочий эксплойт и показала лишь чуть более высокую долю частичного успеха, чем Sonnet 4.6. Этот сдвиг, вероятно, связан с ростом общего интеллекта модели, а не со специальной подготовкой.
Эксплойт – программа или фрагмент кода, который использует уязвимость в ПО для выполнения непредусмотренных действий.
Поскольку на этих задачах Sonnet 5 несколько сильнее предшественника, модель выпустили с включёнными по умолчанию защитными механизмами против киберугроз. Они в реальном времени выявляют и блокируют опасное применение и совпадают с механизмами в Opus 4.7 и 4.8. Общий уровень киберриска от Sonnet 5 сочли низким, поэтому ограничения мягче, чем у Fable 5, где блокируется значительно более широкий круг задач по кибербезопасности.
Цены и доступность на тарифах
Sonnet 5 доступна сразу на всех тарифах. На бесплатном плане и в Pro она используется по умолчанию, доступ есть и у подписчиков Max, Team и Enterprise, а также в Claude Code и на платформе Claude. В API модель доступна под идентификатором claude-sonnet-5.
На старте, до , действует сниженная цена – 2 доллара за миллион входных токенов и 10 долларов за миллион выходных. После этого цена вырастет до 3 долларов за миллион входных токенов и 15 за миллион выходных. Для сравнения, Opus 4.8 стоит 5 и 25 долларов за миллион входных и выходных токенов. Лимиты запросов повысили в Chat, Cowork, Claude Code и на платформе Claude, поскольку повышенные уровни усилий расходуют больше токенов.
Заключение
Sonnet 5 сокращает разрыв со старшим классом моделей: по агентным задачам она близка к Opus 4.8, но обходится дешевле, особенно на старте продаж. Перед разработчиками – выбор между двумя моделями одного диапазона: более дешёвой Sonnet 5 с регулируемым уровнем усилий и более точной, но дорогой Opus 4.8. По безопасности модель в целом превосходит Sonnet 4.6, тогда как кибернавыки остаются заметно слабее, чем у старших моделей.