Google Android Bench: рейтинг ИИ-моделей для Android-разработки

Компания опубликовала первую версию Android Bench - официального рейтинга языковых моделей для разработки Android-приложений. Цель проекта - дать разработчикам и создателям моделей надежный ориентир: какие ИИ-инструменты реально справляются со спецификой Android-платформы, а не просто хорошо выглядят на универсальных тестах.

Бенчмарк проверяет модели по нескольким направлениям: работа с Jetpack Compose для построения UI, Coroutines и Flows для асинхронного программирования, Room для хранения данных, Hilt для внедрения зависимостей. Дополнительно тестируются навигационные миграции, конфигурация Gradle и обработка критических изменений между версиями SDK. Отдельный блок охватывает специфические компоненты платформы - камеру, системный UI, медиа и адаптацию под складные смартфоны.

Позицию Google по поводу необходимости такого инструмента лаконично передает официальный блог для разработчиков:

«ИИ-ассистированная разработка программного обеспечения породила целый ряд бенчмарков для оценки возможностей языковых моделей. Однако Android-разработчики сталкиваются со специфическими задачами, которые существующие тесты не охватывают, - именно поэтому мы создали бенчмарк, сфокусированный на разработке под Android.»

Результаты первого выпуска

Лучший результат среди всех участников показал Gemini 3.1 Pro Preview - 72,4%. Второе место занял Claude Opus 4.6 от Anthropic с 66,6%, третье - GPT-5.2 Codex от OpenAI с 62,5%. Замыкает список Gemini 2.5 Flash с 16,1%.

Полный рейтинг Android Bench:

Gemini 3.1 Pro Preview: 72,4%
Claude Opus 4.6: 66,6%
GPT-5.2 Codex: 62,5%
Claude Opus 4.5: 61,9%
Gemini 3 Pro Preview: 60,4%
Claude Sonnet 4.6: 58,4%
Claude Sonnet 4.5: 54,2%
Gemini 3 Flash Preview: 42%
Gemini 2.5 Flash: 16,1%

Что дальше

Публикуя рейтинг, Google рассчитывает стимулировать улучшение языковых моделей конкретно для Android-разработки, повысить продуктивность разработчиков и в конечном счете поднять качество приложений в Android-экосистеме в целом.

Обновления программ, что нового

• Apple выпустила вторые бета-версии iOS 26.6, iPadOS 26.6 и macOS Tahoe 26.6 для разработчиков
• Обновления безопасности Samsung за июнь 2026 года – устранено 45 уязвимостей, включая 5 критических
• Новая версия Firefox 152 и обновления Firefox ESR 140.12.0 и 115.37.0 доступны для загрузки
• Российский Спидтест запустил бесплатный мониторинг серверов и интернет-каналов через единый CLI-агент
• На Galaxy S23 появляются зелёные полосы после One UI 8.5
• Слух: Samsung Galaxy S27 Ultra с перископом 5x и аккумулятором свыше 5000 мАч

Автор: Comss.one

Google Android Bench: рейтинг ИИ-моделей для Android-разработки

Результаты первого выпуска

Что дальше

Обновления программ, что нового

Новое на сайте