Ключевые обновления
Компания Anthropic объявила о выпуске усовершенствованной версии Claude 3.5 Sonnet и новой модели Claude 3.5 Haiku. Главным нововведением стала революционная функция computer use, позволяющая ИИ управлять компьютером подобно человеку. Это первая модель AI на рынке, предлагающая такую возможность в открытом бета-тестировании.
Возможности функции computer use
Находящаяся в открытой бета-версии функция computer use позволяет ИИ взаимодействовать с компьютерным интерфейсом: просматривать экран, перемещать курсор, нажимать кнопки и вводить текст. Несмотря на экспериментальный характер и некоторые ограничения, технология уже используется такими компаниями как Asana, Canva и DoorDash для автоматизации сложных многоэтапных задач.
В тестах на платформе OSWorld, оценивающей способность ИИ использовать компьютер подобно человеку, Claude 3.5 Sonnet достиг показателя 14.9% в категории работы со скриншотами, значительно превзойдя ближайшего конкурента с результатом 7.8%. При увеличении количества доступных шагов для выполнения задачи показатель вырос до 22.0%.
Улучшения в моделях
Обновленная версия Claude 3.5 Sonnet демонстрирует значительный прогресс в области программирования, достигнув показателя 49% в тесте SWE-bench Verified, что превосходит все публично доступные модели. При этом стоимость использования и скорость работы остались на прежнем уровне.
Компания GitLab, тестировавшая модель для задач DevSecOps, отметила улучшение качества рассуждений до 10% по различным сценариям использования без увеличения задержек. The Browser Company подтвердила, что Claude 3.5 Sonnet превзошел все ранее тестируемые ими модели в автоматизации веб-процессов.
Особенности Claude 3.5 Haiku
Claude 3.5 Haiku, самая быстрая модель компании, теперь соответствует производительности предыдущей флагманской модели Claude 3 Opus, сохраняя при этом высокую скорость работы и доступную стоимость. Особенно впечатляющие результаты модель показывает в задачах программирования, достигая 40.6% в SWE-bench Verified, что превосходит показатели многих современных моделей, включая первоначальную версию Claude 3.5 Sonnet и GPT-4o.
Благодаря низкой задержке, улучшенному следованию инструкциям и более точному использованию инструментов, Claude 3.5 Haiku особенно хорошо подходит для пользовательских продуктов, специализированных подзадач и генерации персонализированного опыта на основе больших объемов данных.
Доступность и безопасность
Обновленная версия Claude 3.5 Sonnet уже доступна всем пользователям. Функция computer use доступна черезAPI Anthropic, Amazon Bedrock и Google Cloud Vertex AI. Выпуск Claude 3.5 Haiku запланирован на конец текущего месяца, первоначально только для работы с текстом, поддержка изображений появится позже.
Для обеспечения безопасности новой функции computer use компания разработала специальные классификаторы, способные определять использование этой функции и выявлять потенциальные угрозы. Перед выпуском обновленная модель Claude 3.5 Sonnet прошла тестирование в Институтах безопасности искусственного интеллекта США и Великобритании.
Обновления программ, что нового
• Обновление до Windows 11, версия 24H2 блокируется на старых версиях Windows 11 из-за бага в службе WSUS
• Обновление Intel Bluetooth Drivers 23.130.0 для Windows 11 и Windows 10: функциональные улучшения
• Обновление Intel Wi-Fi Drivers 23.130.1: исправления установщика и улучшенная поддержка Wi-Fi 6E и Wi-Fi 7
• Обновление Steam для ПК устраняет проблемы с DLC, а Steam Deck получает исправления запуска и обновлений BIOS
• Сбой в работе Интернета в России: ERR_CONNECTION_RESET: Не удается получить доступ к сайту
• Расширенная защита в Android 16 предотвращает атаки через USB