«Сбер» выложил в открытый доступ Kandinsky Video Lite – модель для генерации видео по тексту

2025-09-30 459 комментарии
«Сбер» представил Kandinsky 5.0 Video Lite — новую модель для генерации видео по тексту, и Giga-Embeddings для построения RAG-систем. Обе нейросети доступны в open-source и демонстрируют высокие результаты на русском языке

«Сбер» выложил в открыты доступ две новые модели искусственного интеллекта — Kandinsky Video Lite для генерации видео и Giga-Embeddings для работы с текстовыми данными. Об этом сообщили в пресс-службе компании.

Kandinsky Video Lite

Модель Kandinsky Video Lite преобразует текстовые описания в видеоролики длительностью до 10 секунд с разрешением SD или HD. При размере всего в 2 млрд параметров она демонстрирует качество выше, чем у более крупных решений — Wan 2.1 14B, Wan 2.2 5B и оригинальной Sora, согласно внутренним тестам «Сбера».

Особенностью модели стало дополнительное обучение на миллионе изображений и видео, отражающих российский культурный код. Это позволяет нейросети лучше понимать характерные для страны объекты и сцены. Также доступна оптимизированная версия Kandinsky Video Lite Flash, работающая в 6 раз быстрее основной.

Технические возможности модели:

  • Генерация роликов до 10 секунд;
  • Поддержка разрешений SD и HD;
  • Компактный размер — 2 млрд параметров;
  • Ускоренная версия Flash с шестикратным ростом скорости инференса;
  • Обучение на датасете с учётом российского культурного кода для улучшенного понимания национального контекста.

Kandinsky Video Lite опубликована в открытом доступе на платформах Hugging Face, GitVerse и GitHub.

Примеры генерации видео

Giga-Embeddings

Вторая разработка — Giga-Embeddings, модель для преобразования текстов в векторные представления. Она предназначена для построения RAG-систем (Retrieval-Augmented Generation), которые могут использоваться для интеллектуального поиска по документам, анализа данных и автоматизированной поддержки клиентов.

По данным «Сбера», Giga-Embeddings заняла первое место в общем зачёте бенчмарка ruMTEB с результатом 74.1, показав лучшие способности работы с русским языком.

Модель доступна на Hugging Face и GitVerse.

«Сбер» активно развивает линейку генеративных моделей Kandinsky. Kandinsky 5.0 Video Lite стала первой моделью нового поколения, ориентированной на эффективность и скорость работы при сохранении высокого качества генерации. Кроме того, компания планирует расширять возможности моделей и развивать поддержку генерации текста на русском языке в будущем.

© .
Комментарии и отзывы

Нашли ошибку?

Новое на сайте