Компания опубликовала первую версию Android Bench - официального рейтинга языковых моделей для разработки Android-приложений. Цель проекта - дать разработчикам и создателям моделей надежный ориентир: какие ИИ-инструменты реально справляются со спецификой Android-платформы, а не просто хорошо выглядят на универсальных тестах.
Бенчмарк проверяет модели по нескольким направлениям: работа с Jetpack Compose для построения UI, Coroutines и Flows для асинхронного программирования, Room для хранения данных, Hilt для внедрения зависимостей. Дополнительно тестируются навигационные миграции, конфигурация Gradle и обработка критических изменений между версиями SDK. Отдельный блок охватывает специфические компоненты платформы - камеру, системный UI, медиа и адаптацию под складные смартфоны.
Позицию Google по поводу необходимости такого инструмента лаконично передает официальный блог для разработчиков:
«ИИ-ассистированная разработка программного обеспечения породила целый ряд бенчмарков для оценки возможностей языковых моделей. Однако Android-разработчики сталкиваются со специфическими задачами, которые существующие тесты не охватывают, - именно поэтому мы создали бенчмарк, сфокусированный на разработке под Android.»
Результаты первого выпуска
Лучший результат среди всех участников показал Gemini 3.1 Pro Preview - 72,4%. Второе место занял Claude Opus 4.6 от Anthropic с 66,6%, третье - GPT-5.2 Codex от OpenAI с 62,5%. Замыкает список Gemini 2.5 Flash с 16,1%.
Полный рейтинг Android Bench:
- Gemini 3.1 Pro Preview: 72,4%
- Claude Opus 4.6: 66,6%
- GPT-5.2 Codex: 62,5%
- Claude Opus 4.5: 61,9%
- Gemini 3 Pro Preview: 60,4%
- Claude Sonnet 4.6: 58,4%
- Claude Sonnet 4.5: 54,2%
- Gemini 3 Flash Preview: 42%
- Gemini 2.5 Flash: 16,1%
Что дальше
Публикуя рейтинг, Google рассчитывает стимулировать улучшение языковых моделей конкретно для Android-разработки, повысить продуктивность разработчиков и в конечном счете поднять качество приложений в Android-экосистеме в целом.
Обновления программ, что нового
• Apple выпустила вторые бета-версии iOS 26.6, iPadOS 26.6 и macOS Tahoe 26.6 для разработчиков
• Обновления безопасности Samsung за июнь 2026 года – устранено 45 уязвимостей, включая 5 критических
• Новая версия Firefox 152 и обновления Firefox ESR 140.12.0 и 115.37.0 доступны для загрузки
• Российский Спидтест запустил бесплатный мониторинг серверов и интернет-каналов через единый CLI-агент
• На Galaxy S23 появляются зелёные полосы после One UI 8.5
• Слух: Samsung Galaxy S27 Ultra с перископом 5x и аккумулятором свыше 5000 мАч
