Китайский стартап DeepSeek выпустил новые мультимодальные модели Janus Pro, которые могут анализировать изображения и создавать новые. По словам компании, в тестах GenEval и DPG-Bench модель Janus-Pro-7B превосходит такие решения, как Stable Diffusion 3 Medium и DALL-E 3 от OpenAI.
Ключевые особенности Janus Pro
- Модели поддерживают мультимодальные функции: анализ изображений и генерацию контента.
- Доступны варианты с количеством параметров от 1 млрд до 7 млрд.
- Имеют открытый исходный код и доступны на Hugging Face. Там же можно протестировать бесплатную демоверсию модели.
- Поддерживаемое разрешение для генерации изображений — до 384x384 пикселей.
«Только что попробовал сгенерировать изображение птички, которая выглядит как теннисный мяч, с помощью новой Janus-Pro-7B, вот что получилось», — @avrecum
Сравнение и успехи
Новая модель является обновлённой версией Janus, выпущенной в конце 2024 года. По словам DeepSeek, Janus Pro превосходит предшественника благодаря усовершенствованным процессам обучения, качеству данных и увеличенному размеру модели.
Сравнение результатов Janus и Janus-Pro-7B. Источник: DeepSeek
Резонанс вокруг DeepSeek
- 27 января приложение компании стало самым скачиваемым в американском App Store, обогнав ChatGPT от OpenAI, что привело к падению акций крупнейших IT-компаний.
- После этого пользователи столкнулись со сбоями и кибератакам на сервисы DeepSeek.
- В ответ стартап временно ограничил регистрацию новых пользователей.
Обновления программ, что нового
• Xiaomi представит новые устройства 24 сентября: планшеты, умные часы и гаджеты для дома
• Владельцы Google Pixel 7 сталкиваются с вздутием батарей, приводящим к отслоению экрана
• Бюджетный монитор Redmi A27Q 2026: 2K, 120 Гц и IPS-матрица
• Обновление Opera: новая История, поиск через Google Lens, динамические темы и функция «Пропуск видео»
• Релиз Firefox 143: чат-бот Microsoft Copilot, поддержка веб-приложений (PWA) и другие улучшения
• Xiaomi расширяет бета-тестирование HyperOS 3 на новые устройства