Anthropic представила Claude Sonnet 4 и Claude Opus 4 — новые языковые модели с упором на код и рассуждения

2025-05-22 253 комментарии
Компания Anthropic представила усовершенствованные ИИ-модели с акцентом на программирование и точное выполнение инструкций. Claude Opus 4 лидирует в тестах на кодинг, а Claude Sonnet 4 предлагает быстрые и качественные ответы для повседневных задач

Компания Anthropic представила две новые языковые модели — Claude Sonnet 4 и Claude Opus 4. По заявлению разработчиков, обе версии способны работать в двух режимах: с включёнными «рассуждениями» (chain-of-thought), обеспечивающими более точные ответы, и в быстром режиме — практически мгновенно, но без сложных рассуждений.

Claude Opus 4 — мощная модель для разработки и сложных задач

Claude Opus 4 стала самой мощной моделью в линейке Anthropic. Разработчики утверждают, что это «лучшая в мире модель для работы с кодом» — она отлично справляется с решением комплексных задач и подходит для долгосрочных сценариев, включая создание и поддержку ИИ-агентов, работающих в течение нескольких часов и выполняющих тысячи шагов.

В тестах Opus 4 показала впечатляющие результаты:

  • 72,5% в SWE-Bench Verified — выше, чем у GPT-4.1 от OpenAI и Gemini 2.5 Pro от Google.
  • 43,2% в Terminal-Bench — также превосходя конкурентов.

Новая модель также продемонстрировала улучшения в многозадачности, запоминании информации, следовании инструкциям и интеграции внешних инструментов — включая интернет-поиск в режиме «рассуждений».

Claude Opus 4 играет в Pokemon. Источник: Anthropic

Claude Sonnet 4 — сбалансированная модель для повседневных задач

Claude Sonnet 4 — это упрощённая, но продвинутая версия, которая демонстрирует «передовую» производительность в стандартных сценариях и значительно превосходит своего предшественника — Sonnet 3.7. В бенчмарке SWE-Bench Verified модель набрала 72,7%, что ставит её на один уровень с Opus 4 по качеству решений в этой категории.

Сравнение моделей на популярных бенчмарках. Источник: Anthropic

GitHub выберет Sonnet 4 в качестве основы для нового кодового помощника в GitHub Copilot — это дополнительное подтверждение эффективности модели в разработке ПО.

Доступ и стоимость

  • Пользователи бесплатного тарифа получат доступ к Claude Sonnet 4.
  • Подписчики Pro, Max, Team и Enterprise смогут использовать обе модели, включая Opus 4.
  • Обе модели уже доступны через API Anthropic, а также в облачных платформах Amazon Bedrock и Vertex AI (Google Cloud).

Цены за 1 миллион токенов:

  • Opus 4: $15 (входные), $75 (выходные)
  • Sonnet 4: $3 (входные), $15 (выходные)
© . По материалам VC
Комментарии и отзывы

Нашли ошибку?

Новое на сайте