Anthropic представила Claude Sonnet 4 и Claude Opus 4 — новые языковые модели с упором на код и рассуждения

Компания Anthropic представила две новые языковые модели — Claude Sonnet 4 и Claude Opus 4. По заявлению разработчиков, обе версии способны работать в двух режимах: с включёнными «рассуждениями» (chain-of-thought), обеспечивающими более точные ответы, и в быстром режиме — практически мгновенно, но без сложных рассуждений.

Claude Opus 4 — мощная модель для разработки и сложных задач

Claude Opus 4 стала самой мощной моделью в линейке Anthropic. Разработчики утверждают, что это «лучшая в мире модель для работы с кодом» — она отлично справляется с решением комплексных задач и подходит для долгосрочных сценариев, включая создание и поддержку ИИ-агентов, работающих в течение нескольких часов и выполняющих тысячи шагов.

В тестах Opus 4 показала впечатляющие результаты:

72,5% в SWE-Bench Verified — выше, чем у GPT-4.1 от OpenAI и Gemini 2.5 Pro от Google.
43,2% в Terminal-Bench — также превосходя конкурентов.

Новая модель также продемонстрировала улучшения в многозадачности, запоминании информации, следовании инструкциям и интеграции внешних инструментов — включая интернет-поиск в режиме «рассуждений».

Claude Opus 4 играет в Pokemon. Источник: Anthropic

Claude Sonnet 4 — сбалансированная модель для повседневных задач

Claude Sonnet 4 — это упрощённая, но продвинутая версия, которая демонстрирует «передовую» производительность в стандартных сценариях и значительно превосходит своего предшественника — Sonnet 3.7. В бенчмарке SWE-Bench Verified модель набрала 72,7%, что ставит её на один уровень с Opus 4 по качеству решений в этой категории.

Сравнение моделей на популярных бенчмарках. Источник: Anthropic

GitHub выберет Sonnet 4 в качестве основы для нового кодового помощника в GitHub Copilot — это дополнительное подтверждение эффективности модели в разработке ПО.

Доступ и стоимость

Пользователи бесплатного тарифа получат доступ к Claude Sonnet 4.
Подписчики Pro, Max, Team и Enterprise смогут использовать обе модели, включая Opus 4.
Обе модели уже доступны через API Anthropic, а также в облачных платформах Amazon Bedrock и Vertex AI (Google Cloud).

Цены за 1 миллион токенов:

Opus 4: $15 (входные), $75 (выходные)
Sonnet 4: $3 (входные), $15 (выходные)

Обновления программ, что нового

• Opera 133.0.5932.34 Stable: доработки закреплённых вкладок в Early Bird, исправления закладок и поиска
• Яндекс расширил возможности умной ИИ-камеры с Алисой
• Новая бета Steam: улучшена поддержка контроллеров, Remote Play и Steam Deck
• Релиз Vivaldi 8.1. Что нового
• Обновление Intel Killer Performance Suite 40.26.506.2332 с Wi-Fi-драйвером 24.50.0.4 и поддержкой Intel Wi-Fi 6 AX231
• SpaceXAI выпустила Grok 4.5 для кода и агентских сценариев

Автор: Comss.one По материалам VC

Anthropic представила Claude Sonnet 4 и Claude Opus 4 — новые языковые модели с упором на код и рассуждения

Claude Opus 4 — мощная модель для разработки и сложных задач

Claude Sonnet 4 — сбалансированная модель для повседневных задач

Доступ и стоимость

Обновления программ, что нового

Новое на сайте