Компания Anthropic представила две новые языковые модели — Claude Sonnet 4 и Claude Opus 4. По заявлению разработчиков, обе версии способны работать в двух режимах: с включёнными «рассуждениями» (chain-of-thought), обеспечивающими более точные ответы, и в быстром режиме — практически мгновенно, но без сложных рассуждений.
Claude Opus 4 — мощная модель для разработки и сложных задач
Claude Opus 4 стала самой мощной моделью в линейке Anthropic. Разработчики утверждают, что это «лучшая в мире модель для работы с кодом» — она отлично справляется с решением комплексных задач и подходит для долгосрочных сценариев, включая создание и поддержку ИИ-агентов, работающих в течение нескольких часов и выполняющих тысячи шагов.
В тестах Opus 4 показала впечатляющие результаты:
- 72,5% в SWE-Bench Verified — выше, чем у GPT-4.1 от OpenAI и Gemini 2.5 Pro от Google.
- 43,2% в Terminal-Bench — также превосходя конкурентов.
Новая модель также продемонстрировала улучшения в многозадачности, запоминании информации, следовании инструкциям и интеграции внешних инструментов — включая интернет-поиск в режиме «рассуждений».
Claude Opus 4 играет в Pokemon. Источник: Anthropic
Claude Sonnet 4 — сбалансированная модель для повседневных задач
Claude Sonnet 4 — это упрощённая, но продвинутая версия, которая демонстрирует «передовую» производительность в стандартных сценариях и значительно превосходит своего предшественника — Sonnet 3.7. В бенчмарке SWE-Bench Verified модель набрала 72,7%, что ставит её на один уровень с Opus 4 по качеству решений в этой категории.
Сравнение моделей на популярных бенчмарках. Источник: Anthropic
GitHub выберет Sonnet 4 в качестве основы для нового кодового помощника в GitHub Copilot — это дополнительное подтверждение эффективности модели в разработке ПО.
Доступ и стоимость
- Пользователи бесплатного тарифа получат доступ к Claude Sonnet 4.
- Подписчики Pro, Max, Team и Enterprise смогут использовать обе модели, включая Opus 4.
- Обе модели уже доступны через API Anthropic, а также в облачных платформах Amazon Bedrock и Vertex AI (Google Cloud).
Цены за 1 миллион токенов:
- Opus 4: $15 (входные), $75 (выходные)
- Sonnet 4: $3 (входные), $15 (выходные)
Обновления программ, что нового
• Anthropic представила Claude Sonnet 4 и Claude Opus 4 — новые языковые модели с упором на код и рассуждения
• Xiaomi представила смартфон 15S Pro с новым флагманским чипом Xring O1
• AMD анонсировала поддержку ROCm для Windows, Ryzen AI MAX и серии Radeon RX 9000
• Яндекс запускает «Вертикали Поиска» — поиск по товарам, квартирам и финансам в одном окне
• Алиса на YandexGPT 5 Lite стала доступна всем — без подписки и на всех устройствах
• Яндекс добавил в Поиск режим рассуждений и генерацию контента с помощью Алисы на базе YandexGPT