Китайский стартап DeepSeek представил масштабное обновление своей популярной модели DeepSeek V3. Новая версия, получившая название DeepSeek-V3-0324, доступна на платформе Hugging Face и уже показала выдающиеся результаты в тестах на математику и программирование. По ряду метрик она превосходит последние версии моделей Claude и GPT от OpenAI.
Чем примечательна новая DeepSeek V3-0324
DeepSeek V3-0324 значительно улучшила показатели по сравнению с предыдущей версией, особенно в таких задачах, как логическое рассуждение и написание кода. Согласно результатам бенчмарков, опубликованным на Hugging Face, модель добилась существенного прироста в нескольких ключевых тестах:
- MMLU-Pro: рост с 75,9 до 81,2 (+5,3)
- GPQA: улучшение с 59,1 до 68,4 (+9,3)
- AIME: значительный скачок с 39,6 до 59,4 (+19,8), установив новый рекорд
- LiveCodeBench: рост с 39,2 до 49,2 (+10,0)
Обновлённая модель DeepSeek обошла показатели Claude 3.5 (последняя версия не была представлена в сравнении), хотя, по заявлениям разработчиков, она превосходит также и более новую Claude 3.7.
Что ещё улучшилось в модели?
Разработчики подчёркивают заметный прогресс в веб-разработке:
- Код стал чище и лучше исполняется без ошибок.
- Генерируемые веб-страницы и игровые интерфейсы теперь выглядят более эстетично.
Также значительно улучшилась работа функции Function Calling, то есть вызова кастомных инструментов. DeepSeek-V3-0324 отлично справляется с чтением и обработкой данных из файлов, а также результатами веб-поиска. Это делает модель перспективной для использования в агентских системах и интеграции с такими инструментами, как Cursor.
Ещё один интересный момент — модель успешно запускается локально на мощных компьютерах, таких как Mac Studio, показывая скорость примерно 20 токенов в секунду. Это не так быстро по меркам серверных решений, но для локального запуска модели такого масштаба результат впечатляющий.
Усиливающаяся конкуренция с OpenAI и Anthropic
Выпуск новой модели стал очередным шагом DeepSeek в борьбе за глобальный рынок искусственного интеллекта. Компания быстро завоевала популярность, предлагая мощные решения с низкими операционными затратами по сравнению с западными аналогами. На фоне обновлений DeepSeek конкуренция на рынке генеративных моделей заметно обострилась, особенно между китайскими стартапами и американскими гигантами вроде OpenAI и Anthropic.
Таким образом, новая версия DeepSeek V3-0324 показывает, что китайские компании продолжают активно наступать на лидирующие позиции западных разработчиков ИИ, предлагая мощные и доступные инструменты для разработчиков и бизнеса.
Обновления программ, что нового
• Обновление Intel ARC Game On Driver 32.0.101.6739 Non-WHQL. Исправления для PyTorch 2.7
• Какие устройства OnePlus получат OxygenOS 16 на базе Android 16
• OpenAI представила бесплатную версию функции «Глубокое исследование» для ChatGPT на базе модели o4-mini
• Первые фото AMD Radeon RX 9070 GRE: Подтверждено наличие 12 ГБ видеопамяти
• Приложение Comss DNS & Новости для Android: обновления сайта и доступ к ИИ-сервисам
• Обновление Steam: исправлены ошибки со скриншотами, заметками и запуском игр на ПК и Steam Deck