Российская визуально-текстовая модель Alice AI VLM, разработанная компанией «Яндекс», заняла второе место в лидборде бенчмарка MWS Vision Bench — первого русскоязычного теста для бизнес-OCR и мультимодальных моделей, ориентированного на реальные прикладные сценарии. В рейтинге модель опередила такие решения, как Gemini 2.5 Flash (Google), GPT-4.1 mini (OpenAI), Claude 4.5 Sonnet (Anthropic) и другие, уступив лишь Gemini 2.5 Pro от Google.
Бенчмарк MWS Vision Bench оценивает, насколько эффективно модели анализируют изображения и текст в условиях, приближённых к реальным бизнес-задачам. В тестах используются сложные русскоязычные документы — договоры, счета, формы, сканы с искажениями и смешанной версткой. Результаты Alice AI VLM показывают, что российская разработка уже конкурирует с ведущими мировыми мультимодальными моделями и по качеству распознавания русскоязычного текста превосходит многие зарубежные решения.
По итогам испытаний Alice AI VLM продемонстрировала высокую точность извлечения текста, корректную интерпретацию визуально-текстовой информации и устойчивость к типичным проблемам OCR — шумам, нестандартным шрифтам и сложной структуре документов. Это делает модель востребованной для автоматизации документооборота и аналитики в корпоративных системах.
«Результаты MWS Vision Bench подтверждают, что российские модели перешли от экспериментальных наработок к реальной прикладной ценности. Alice AI VLM и другие визуально-языковые модели ускорят автоматизацию документооборота, снизят долю ручной правки и повысят качество данных в бизнес-процессах. Для компаний это означает более быстрые решения, меньше ошибок и экономию в операционной работе — от банков и страховых компаний до логистики и госуслуг», — прокомментировал Павел Голосов, директор ИОН РАНХиГС.
Ранее «Яндекс» представил новое семейство генеративных моделей для практических задач Alice AI, в состав которого вошла и визуально-языковая модель Alice AI VLM. Она поддерживает контекст до 32k токенов, обучена на расширенном наборе данных и использует обновлённый OCR-датасет, что повышает точность и эффективность работы с текстом на изображениях.
Успех Alice AI VLM в независимом русскоязычном бенчмарке подчёркивает растущую конкурентоспособность отечественных ИИ-разработок и их готовность к применению в реальных бизнес- и государственных системах.
Обновления программ, что нового
• Представлен бюджетный смартфон Realme P4 Lite 4G: батарея 6300 мАч и защита MIL-STD-810H
• Новые функции Android 17 – нативная блокировка программ и общий буфер обмена
• Google Chrome получил новые инструменты для продуктивной работы
• Утечка: Google готовит чип безопасности Titan M3 для процессоров Tensor G6
• Google выпустила Gemini 3.1 Pro с двукратным ростом в ARC-AGI-2 и поддержкой визуальных интерфейсов
• Технология Microsoft Project Silica: запись терабайтов данных на стеклянные пластины для хранения 10 000 лет

