Anthropic выпустила Claude Opus 4.7 с режимом усилий xhigh

181 комментарии
Модель принимает изображения ~3,75 МП, трактует промпты буквальнее и помнит заметки между сессиями. Старые промпты под Opus 4.6 придётся перенастроить из-за нового токенизатора

Компания Anthropic открыла общий доступ к Claude Opus 4.7 — обновлённой флагманской модели, которая приходит на смену Opus 4.6. Главный акцент сделан на сложной разработке ПО: разработчики заявляют о заметном приросте на самых трудных задачах программирования и на длительных агентных сценариях. Новая версия также умеет работать с изображениями втрое более высокого разрешения, лучше следует инструкциям и использует файловую память для многосессионной работы. Одновременно Opus 4.7 получила встроенные механизмы защиты от запрещённых сценариев в области кибербезопасности.

comss img 2026 04 16 194043

Что нового в сравнении с Opus 4.6

По заявлению Anthropic, Opus 4.7 заметно продвинулась именно на тех задачах программирования, где раньше требовался плотный надзор человека: длительные цепочки действий, многошаговые рефакторинги, отладка в большом коде. Модель рассчитывает стратегию проверки собственных результатов до того, как сообщит об окончании работы — это сокращает число ложных срабатываний «готово».

Отдельно подчёркивается прирост в поддержке анализа изображений. Opus 4.7 принимает изображения размером до 2576 пикселей по длинной стороне (около 3,75 мегапикселя) — это более чем втрое больше, чем у предыдущих моделей Claude. Изменение реализовано на уровне модели, а не параметра API: любое изображение, переданное в Claude, теперь обрабатывается в более высоком разрешении. Anthropic выделяют три целевых сценария: агенты с управлением компьютером, которые читают плотные скриншоты; извлечение данных из сложных схем; работа, требующая попиксельных ориентиров.

В оценках по ряду бенчмарков Opus 4.7 обходит Opus 4.6, оставаясь при этом менее способной в широком смысле, чем ограниченно доступная Claude Mythos Preview. На независимой оценке GDPval-AA (экономически значимая интеллектуальная работа в финансах, юриспруденции и смежных областях) и на Finance Agent модель показала лучший результат на момент релиза. Внутреннее тестирование Anthropic также зафиксировало более качественные финансовые анализы, презентации и согласованность между связанными задачами.

comss img 2026 04 16 193305

Следование инструкциям и память

Anthropic предупреждают: Opus 4.7 интерпретирует инструкции буквальнее, чем предшественники. Промпты, написанные под Opus 4.6 и ранее, могут давать неожиданные результаты — там, где старые модели трактовали указания свободно или тихо пропускали их часть, Opus 4.7 выполнит их дословно. Разработчикам рекомендуется перенастроить промпты и обвязку под новую модель.

comss img 2026 04 16 193515

Отдельное улучшение касается памяти на основе файловой системы. Модель лучше обращается к заметкам, сохранённым в файлах, и использует их между сессиями длительной работы — за счёт этого для новых задач требуется меньше вводного контекста.

Память на основе файловой системы — подход, при котором модель самостоятельно ведёт рабочие записи в файлах и обращается к ним в последующих запусках, а не полагается только на содержимое текущего окна контекста.

Кибербезопасность: встроенные фильтры и программа верификации

На прошлой неделе Anthropic анонсировали Project Glasswing — инициативу, в рамках которой Claude Mythos Preview используется для поиска уязвимостей в критической инфраструктуре ограниченным кругом партнёров. Компания сразу заявили, что широкая доступность Mythos Preview не планируется, а новые механизмы защиты от нецелевого использования будут сначала обкатываться на менее способных моделях.

Opus 4.7 — первая такая модель. Её кибервозможности ниже, чем у Mythos Preview: во время обучения в Anthropic проводили эксперименты по дифференцированному подавлению именно этого класса способностей. Дополнительно Opus 4.7 выпущена со встроенными средствами защиты, которые автоматически выявляют и блокируют запросы с признаками запрещённого или высокорискованного применения в области кибербезопасности. Anthropic рассматривают Opus 4.7 как испытательный полигон перед возможным широким релизом моделей класса Mythos.

Для легитимных задач — исследования уязвимостей, тестирования на проникновение, red-teaming — открыта программа Cyber Verification Program: специалисты по безопасности могут подать заявку и получить доступ к Opus 4.7 без стандартных ограничений.

Red-teaming — моделирование действий реального злоумышленника для проверки защищённости системы. В контексте ИИ так называют и целенаправленный поиск способов обойти ограничения модели.

Уровень усилий xhigh, бюджеты задач и обновления Claude Code

Вместе с моделью Anthropic ввели новый уровень усилий — xhigh («extra high»), который занимает место между high и max. Он даёт более тонкий контроль над балансом между глубиной рассуждений и задержкой ответа на сложных задачах. В Claude Code уровень xhigh стал значением по умолчанию для всех тарифов. При использовании Opus 4.7 для программирования и агентных сценариев разработчики рекомендуют стартовать с high или xhigh.

На платформе Claude (API), помимо поддержки изображений более высокого разрешения, в публичной бете запущены task budgets — бюджеты задач. Они позволяют направлять расход токенов моделью так, чтобы Claude расставлял приоритеты между подзадачами на протяжении длительных запусков.

В Claude Code появилась команда /ultrareview: она запускает отдельный сеанс ревью, в котором модель проходит по изменениям и отмечает ошибки и дефекты проектирования, которые заметил бы внимательный рецензент. Пользователям Claude Code по тарифам Pro и Max дают три бесплатных запуска для ознакомления. Помимо этого режим auto mode, в котором Claude принимает решения о разрешениях самостоятельно, распространён на подписчиков Max — это позволяет запускать длительные задачи с меньшим числом прерываний и меньшим риском, чем при полном отключении проверок разрешений.

Уровень усилий (effort level) — параметр API Claude, регулирующий, сколько токенов модель тратит на внутренние рассуждения перед ответом. Возможные значения от low до max; чем выше уровень, тем глубже анализ и тем дороже запрос.


comss img 2026 04 16 193706

Доступность и цены

Opus 4.7 доступна уже сегодня во всех продуктах Claude и через Claude API, а также на Amazon Bedrock, Google Cloud Vertex AI и Microsoft Foundry. Идентификатор модели для API — claude-opus-4-7. Цена сохранена на уровне Opus 4.6: за миллион входных токенов и за миллион выходных.

При переходе с Opus 4.6 стоит учитывать два фактора, напрямую влияющих на расход токенов. Первое — в Opus 4.7 используется обновлённый токенизатор: тот же самый входной текст может отображаться в большее число токенов, примерно в диапазоне 1,0—1,35x в зависимости от типа контента. Второе — на высоких уровнях усилий модель тратит больше токенов на внутренние рассуждения, особенно на поздних итерациях агентных сессий. Надёжность на сложных задачах при этом растёт, но увеличивается и выходной счёт. Anthropic указывают, что на внутренней оценке по программированию совокупный расход токенов на всех уровнях усилий улучшился, однако для реального трафика рекомендуется провести собственные замеры.

Безопасность и согласованность

По внутренним оценкам Anthropic профиль безопасности Opus 4.7 близок к Opus 4.6: низкие показатели обмана, подхалимства и готовности к нецелевому использованию. По честности и устойчивости к prompt injection новая модель превосходит предшественницу. Есть и регрессии: Opus 4.7 охотнее, чем Opus 4.6, даёт излишне подробные рекомендации по снижению вреда при употреблении контролируемых веществ. Итоговая формулировка аудита согласованности — модель «в основном хорошо согласована и заслуживает доверия, хотя её поведение не идеально». Mythos Preview по совокупности оценок остаётся наиболее согласованной моделью Anthropic.

Prompt injection — атака, при которой во внешних данных (файле, веб-странице, письме) прячутся инструкции, заставляющие модель выполнить нежелательное действие вместо задачи пользователя.

Заключение

Opus 4.7 — прямое обновление Opus 4.6 с прицелом на долгие агентные задачи программирования, работу с изображениями высокого разрешения и профессиональные сценарии в финансах и юриспруденции. Для разработчиков это значит одно: новая версия требует более аккуратно сформулированных инструкций и измерения реального расхода токенов из-за нового токенизатора и более глубоких рассуждений на xhigh. Специалистам по безопасности, которым встроенные фильтры мешают в легитимной работе, открыта программа Cyber Verification Program. Модель уже доступна в Claude, Claude Code, а также через Claude API, Amazon Bedrock, Google Cloud Vertex AI и Microsoft Foundry по ценам Opus 4.6.

Как получить доступ к Claude в России

Comss.one DNS предоставляет бесплатный доступ к популярным зарубежным сервисам, которые ограничили свою работу в России. В том числе вы сможете использовать все популярные ИИ-сервисы (ChatGPT и Sora, Microsoft Copilot, Google Gemini и Google ImageFX, xAI Grok), а также выполнять установку антивирусов и их обновлений, инсайдерских сборок и обновлений Windows.

Примечание. Стоит учитывать, что хотя Comss.one DNS может помочь в получении доступа к сайту, будет невозможно получить доступ к заблокированным учетным записям.

Примечание. Comss.one DNS не позволяет получать доступ к сайтам и сервисам, заблокированным Роскомнадзором (РКН) на территории России.

Настройка Comss.one DNS:

Проверка работы Comss.one DNS:

  • Для проверки корректности настройки DNS перейдите на страницу Comss.one DNS. Вы должны увидеть, что Comss.one DNS настроен.

  • Если проверка не пройдена, убедитесь, что в вашей ОС или браузере не настроен другой DNS-over-HTTPS.
  • После проверки перезагрузите устройство, чтобы изменения вступили в силу.

Использование Claude Sonnet:

Автор: По материалам anthropic
Комментарии и отзывы

Нашли ошибку?

Новое на сайте