Ключевые обновления
Компания Anthropic объявила о выпуске усовершенствованной версии Claude 3.5 Sonnet и новой модели Claude 3.5 Haiku. Главным нововведением стала революционная функция computer use, позволяющая ИИ управлять компьютером подобно человеку. Это первая модель AI на рынке, предлагающая такую возможность в открытом бета-тестировании.
Возможности функции computer use
Находящаяся в открытой бета-версии функция computer use позволяет ИИ взаимодействовать с компьютерным интерфейсом: просматривать экран, перемещать курсор, нажимать кнопки и вводить текст. Несмотря на экспериментальный характер и некоторые ограничения, технология уже используется такими компаниями как Asana, Canva и DoorDash для автоматизации сложных многоэтапных задач.
В тестах на платформе OSWorld, оценивающей способность ИИ использовать компьютер подобно человеку, Claude 3.5 Sonnet достиг показателя 14.9% в категории работы со скриншотами, значительно превзойдя ближайшего конкурента с результатом 7.8%. При увеличении количества доступных шагов для выполнения задачи показатель вырос до 22.0%.
Улучшения в моделях
Обновленная версия Claude 3.5 Sonnet демонстрирует значительный прогресс в области программирования, достигнув показателя 49% в тесте SWE-bench Verified, что превосходит все публично доступные модели. При этом стоимость использования и скорость работы остались на прежнем уровне.
Компания GitLab, тестировавшая модель для задач DevSecOps, отметила улучшение качества рассуждений до 10% по различным сценариям использования без увеличения задержек. The Browser Company подтвердила, что Claude 3.5 Sonnet превзошел все ранее тестируемые ими модели в автоматизации веб-процессов.
Особенности Claude 3.5 Haiku
Claude 3.5 Haiku, самая быстрая модель компании, теперь соответствует производительности предыдущей флагманской модели Claude 3 Opus, сохраняя при этом высокую скорость работы и доступную стоимость. Особенно впечатляющие результаты модель показывает в задачах программирования, достигая 40.6% в SWE-bench Verified, что превосходит показатели многих современных моделей, включая первоначальную версию Claude 3.5 Sonnet и GPT-4o.
Благодаря низкой задержке, улучшенному следованию инструкциям и более точному использованию инструментов, Claude 3.5 Haiku особенно хорошо подходит для пользовательских продуктов, специализированных подзадач и генерации персонализированного опыта на основе больших объемов данных.
Доступность и безопасность
Обновленная версия Claude 3.5 Sonnet уже доступна всем пользователям. Функция computer use доступна черезAPI Anthropic, Amazon Bedrock и Google Cloud Vertex AI. Выпуск Claude 3.5 Haiku запланирован на конец текущего месяца, первоначально только для работы с текстом, поддержка изображений появится позже.
Для обеспечения безопасности новой функции computer use компания разработала специальные классификаторы, способные определять использование этой функции и выявлять потенциальные угрозы. Перед выпуском обновленная модель Claude 3.5 Sonnet прошла тестирование в Институтах безопасности искусственного интеллекта США и Великобритании.
Обновления программ, что нового
• Релиз PeaZip 10.5.0: обновление архиватора с улучшенным файловым менеджером
• В бета-версии клиента Steam добавлены иконки поддержки контроллера для SteamOS
• Dimensity 9500: результаты тестов и сравнение с Snapdragon 8 Elite 2
• В Steam добавили информацию о функциях доступности: на страницу игр и в фильтр по поиску
• AMD Radeon Software Adrenalin 25.6.2 Non-WHQL. Поддержка The Alters и FBC: Firebreak
• Новый AI-браузер Dia — «Chrome с мозгами». Но безопасен ли он?