Ключевые обновления
Компания Anthropic объявила о выпуске усовершенствованной версии Claude 3.5 Sonnet и новой модели Claude 3.5 Haiku. Главным нововведением стала революционная функция computer use, позволяющая ИИ управлять компьютером подобно человеку. Это первая модель AI на рынке, предлагающая такую возможность в открытом бета-тестировании.
Возможности функции computer use
Находящаяся в открытой бета-версии функция computer use позволяет ИИ взаимодействовать с компьютерным интерфейсом: просматривать экран, перемещать курсор, нажимать кнопки и вводить текст. Несмотря на экспериментальный характер и некоторые ограничения, технология уже используется такими компаниями как Asana, Canva и DoorDash для автоматизации сложных многоэтапных задач.
В тестах на платформе OSWorld, оценивающей способность ИИ использовать компьютер подобно человеку, Claude 3.5 Sonnet достиг показателя 14.9% в категории работы со скриншотами, значительно превзойдя ближайшего конкурента с результатом 7.8%. При увеличении количества доступных шагов для выполнения задачи показатель вырос до 22.0%.
Улучшения в моделях
Обновленная версия Claude 3.5 Sonnet демонстрирует значительный прогресс в области программирования, достигнув показателя 49% в тесте SWE-bench Verified, что превосходит все публично доступные модели. При этом стоимость использования и скорость работы остались на прежнем уровне.
Компания GitLab, тестировавшая модель для задач DevSecOps, отметила улучшение качества рассуждений до 10% по различным сценариям использования без увеличения задержек. The Browser Company подтвердила, что Claude 3.5 Sonnet превзошел все ранее тестируемые ими модели в автоматизации веб-процессов.
Особенности Claude 3.5 Haiku
Claude 3.5 Haiku, самая быстрая модель компании, теперь соответствует производительности предыдущей флагманской модели Claude 3 Opus, сохраняя при этом высокую скорость работы и доступную стоимость. Особенно впечатляющие результаты модель показывает в задачах программирования, достигая 40.6% в SWE-bench Verified, что превосходит показатели многих современных моделей, включая первоначальную версию Claude 3.5 Sonnet и GPT-4o.
Благодаря низкой задержке, улучшенному следованию инструкциям и более точному использованию инструментов, Claude 3.5 Haiku особенно хорошо подходит для пользовательских продуктов, специализированных подзадач и генерации персонализированного опыта на основе больших объемов данных.
Доступность и безопасность
Обновленная версия Claude 3.5 Sonnet уже доступна всем пользователям. Функция computer use доступна черезAPI Anthropic, Amazon Bedrock и Google Cloud Vertex AI. Выпуск Claude 3.5 Haiku запланирован на конец текущего месяца, первоначально только для работы с текстом, поддержка изображений появится позже.
Для обеспечения безопасности новой функции computer use компания разработала специальные классификаторы, способные определять использование этой функции и выявлять потенциальные угрозы. Перед выпуском обновленная модель Claude 3.5 Sonnet прошла тестирование в Институтах безопасности искусственного интеллекта США и Великобритании.
Обновления программ, что нового
• В Германии могут запретить блокировщики рекламы? Судебное разбирательство против Adblock Plus продолжается
• Обновление NVIDIA GeForce Game Ready 581.08 WHQL. Поддержка Smooth Motion на видеокартах RTX 40
• Приложение NVIDIA: Глобальный переключатель Замещения DLSS и Smooth Motion на видеокартах RTX 40
• Flex Magic Pixel в Galaxy S26 Ultra: ИИ-регулировка углов обзора экрана
• Яндекс добавил новые ИИ-возможности для ТВ Станций на YaOS X: умные рекомендации, «Ночной сеанс» и подсказки для игр
• Xiaomi анонсировала Redmi 15 5G — бюджетный смартфон с большим аккумулятором