Ключевые обновления
Компания Anthropic объявила о выпуске усовершенствованной версии Claude 3.5 Sonnet и новой модели Claude 3.5 Haiku. Главным нововведением стала революционная функция computer use, позволяющая ИИ управлять компьютером подобно человеку. Это первая модель AI на рынке, предлагающая такую возможность в открытом бета-тестировании.
Возможности функции computer use
Находящаяся в открытой бета-версии функция computer use позволяет ИИ взаимодействовать с компьютерным интерфейсом: просматривать экран, перемещать курсор, нажимать кнопки и вводить текст. Несмотря на экспериментальный характер и некоторые ограничения, технология уже используется такими компаниями как Asana, Canva и DoorDash для автоматизации сложных многоэтапных задач.
В тестах на платформе OSWorld, оценивающей способность ИИ использовать компьютер подобно человеку, Claude 3.5 Sonnet достиг показателя 14.9% в категории работы со скриншотами, значительно превзойдя ближайшего конкурента с результатом 7.8%. При увеличении количества доступных шагов для выполнения задачи показатель вырос до 22.0%.
Улучшения в моделях
Обновленная версия Claude 3.5 Sonnet демонстрирует значительный прогресс в области программирования, достигнув показателя 49% в тесте SWE-bench Verified, что превосходит все публично доступные модели. При этом стоимость использования и скорость работы остались на прежнем уровне.
Компания GitLab, тестировавшая модель для задач DevSecOps, отметила улучшение качества рассуждений до 10% по различным сценариям использования без увеличения задержек. The Browser Company подтвердила, что Claude 3.5 Sonnet превзошел все ранее тестируемые ими модели в автоматизации веб-процессов.
Особенности Claude 3.5 Haiku
Claude 3.5 Haiku, самая быстрая модель компании, теперь соответствует производительности предыдущей флагманской модели Claude 3 Opus, сохраняя при этом высокую скорость работы и доступную стоимость. Особенно впечатляющие результаты модель показывает в задачах программирования, достигая 40.6% в SWE-bench Verified, что превосходит показатели многих современных моделей, включая первоначальную версию Claude 3.5 Sonnet и GPT-4o.
Благодаря низкой задержке, улучшенному следованию инструкциям и более точному использованию инструментов, Claude 3.5 Haiku особенно хорошо подходит для пользовательских продуктов, специализированных подзадач и генерации персонализированного опыта на основе больших объемов данных.
Доступность и безопасность
Обновленная версия Claude 3.5 Sonnet уже доступна всем пользователям. Функция computer use доступна черезAPI Anthropic, Amazon Bedrock и Google Cloud Vertex AI. Выпуск Claude 3.5 Haiku запланирован на конец текущего месяца, первоначально только для работы с текстом, поддержка изображений появится позже.
Для обеспечения безопасности новой функции computer use компания разработала специальные классификаторы, способные определять использование этой функции и выявлять потенциальные угрозы. Перед выпуском обновленная модель Claude 3.5 Sonnet прошла тестирование в Институтах безопасности искусственного интеллекта США и Великобритании.
Обновления программ, что нового
• OnePlus 15 не выдержал продолжительный стресс-тест 3DMark из-за перегрева
• Samsung обновила только Galaxy Tab A9, но ускорила выпуск ноябрьского патча
• OnePlus 15: различия в скорости LPDDR5X между версиями на 12 и 16 ГБ
• Приложение Comss DNS & Новости для Android: обновления сайта и доступ к ИИ-сервисам
• OnePlus 15 сравнили по автономности с Oppo Find X9 Pro и iPhone 17 Pro Max
• Telegram не попал в обновлённый «белый список» мобильного интернета

