Claude Sonnet 5 стала моделью по умолчанию на тарифах Free и Pro

Anthropic выпустила Claude Sonnet 5 – агентную модель в линейке Sonnet, рассчитанную на планирование и автономную работу с инструментами вроде браузера и терминала. По результатам тестов она приближается к Opus 4.8, оставаясь существенно дешевле. Sonnet 5 стала моделью по умолчанию на тарифах Free и Pro и доступна подписчикам Max, Team и Enterprise, а также в Claude Code и на платформе Claude. На старте, до 31 августа 2026 года, действует сниженная цена – 2 доллара за миллион входных токенов и 10 долларов за миллион выходных.

Что изменилось относительно Sonnet 4.6

В Sonnet 5 разработчики улучшили рассуждение, работу с инструментами, программирование и интеллектуальную работу относительно Sonnet 4.6. На части агентных задач модель приближается к Opus 4.8 – более мощной и универсальной модели, которую в таблице приводят для сравнения.

Агентная модель – модель, способная самостоятельно планировать шаги, вызывать внешние инструменты (браузер, терминал) и выполнять многошаговые задачи с минимальным участием человека.

Оценка	Sonnet 5	Sonnet 4.6	Opus 4.8
SWE-bench Pro (агентное программирование)	63,2%	58,1%	69,2%
Terminal-Bench 2.1 (агентное программирование)	80,4%	67,0%	82,7%
Humanity's Last Exam, без инструментов (междисциплинарное рассуждение)	43,2%	34,6%	49,8%
Humanity's Last Exam, с инструментами	57,4%	46,8%	57,9%
OSWorld-Verified (управление компьютером)	81,2%	78,5%	83,4%
GDPval-AA v2 (интеллектуальная работа, балл)	1618	1395	1615

По отзывам партнёров раннего доступа, Sonnet 5 доводит до конца сложные задачи, на которых прежние модели Sonnet останавливались, и проверяет собственный вывод без явного запроса.

Уровни усилий и соотношение цены и качества

Между Sonnet 5 и Opus 4.8 пользователь может регулировать уровень усилий, подбирая баланс стоимости и точности. На графиках агентного поиска BrowseComp и управления компьютером OSWorld-Verified Sonnet 5 показывает результаты выше, чем у Sonnet 4.6, на всех уровнях усилий. Для максимальной точности на этих задачах по-прежнему подходит Opus 4.8, тогда как Sonnet 5 доступна по более низкой цене при заметно более высоком качестве, чем было доступно раньше. Обозначение xhigh на графиках соответствует особо высокому уровню усилий.

Безопасность в агентных сценариях

Проверки перед выпуском показали, что по безопасности Sonnet 5 в целом превосходит Sonnet 4.6. В агентных сценариях модель надёжнее отклоняет вредоносные запросы и устойчивее к попыткам перехвата управления в атаках prompt injection. Частота галлюцинаций и угодливости ниже, чем у Sonnet 4.6.

Prompt injection – класс атак, при которых во входные данные модели внедряют скрытые инструкции, чтобы заставить её отойти от исходной задачи или выдать нежелательный результат.

В автоматическом поведенческом аудите, который проверяет широкий набор нежелательных проявлений – от содействия злоупотреблениям до обмана, – Sonnet 5 набрала меньше баллов, то есть оказалась безопаснее. При этом по сравнению с более мощными Opus 4.8 и Claude Mythos Preview уровень нежелательного поведения у неё несколько выше.

Кибербезопасность и эксплойты для Firefox 147

Модель целенаправленно не обучали кибербезопасности. Она выполняет часть рутинных безвредных задач в этой сфере, но на тестах потенциально опасных навыков – например, разработки эксплойтов – результаты заметно ниже, чем у Opus 4.8 и Mythos 5. В одном из тестов, подготовленном совместно с Mozilla, модели разрабатывали эксплойты для уязвимостей в браузере Firefox 147; все эти уязвимости закрыты в Firefox 148. Sonnet 5 ни разу не создала рабочий эксплойт и показала лишь чуть более высокую долю частичного успеха, чем Sonnet 4.6. Этот сдвиг, вероятно, связан с ростом общего интеллекта модели, а не со специальной подготовкой.

Эксплойт – программа или фрагмент кода, который использует уязвимость в ПО для выполнения непредусмотренных действий.

Поскольку на этих задачах Sonnet 5 несколько сильнее предшественника, модель выпустили с включёнными по умолчанию защитными механизмами против киберугроз. Они в реальном времени выявляют и блокируют опасное применение и совпадают с механизмами в Opus 4.7 и 4.8. Общий уровень киберриска от Sonnet 5 сочли низким, поэтому ограничения мягче, чем у Fable 5, где блокируется значительно более широкий круг задач по кибербезопасности.

Цены и доступность на тарифах

Sonnet 5 доступна сразу на всех тарифах. На бесплатном плане и в Pro она используется по умолчанию, доступ есть и у подписчиков Max, Team и Enterprise, а также в Claude Code и на платформе Claude. В API модель доступна под идентификатором claude-sonnet-5.

На старте, до 31 августа, действует сниженная цена – 2 доллара за миллион входных токенов и 10 долларов за миллион выходных. После этого цена вырастет до 3 долларов за миллион входных токенов и 15 за миллион выходных. Для сравнения, Opus 4.8 стоит 5 и 25 долларов за миллион входных и выходных токенов. Лимиты запросов повысили в Chat, Cowork, Claude Code и на платформе Claude, поскольку повышенные уровни усилий расходуют больше токенов.

Заключение

Sonnet 5 сокращает разрыв со старшим классом моделей: по агентным задачам она близка к Opus 4.8, но обходится дешевле, особенно на старте продаж. Перед разработчиками – выбор между двумя моделями одного диапазона: более дешёвой Sonnet 5 с регулируемым уровнем усилий и более точной, но дорогой Opus 4.8. По безопасности модель в целом превосходит Sonnet 4.6, тогда как кибернавыки остаются заметно слабее, чем у старших моделей.