xAI представила Grok 4 и Grok 4 Heavy: превосходство над Grok 3 и Gemini

2025-07-11 1210 комментарии
xAI выпустила Grok 4 и Grok 4 Heavy, превосходящие Grok 3 и Gemini 2.5 Pro. Разработанные на суперкомпьютере Colossus, Grok 4 набрал 44,4% в ARC-AGI-2 против 26,9% у Gemini, а Grok 4 Heavy — 50% в HLE. Подписка SuperGrok Heavy за 0/мес. включает мультимодальность и анализ кода

Компания xAI, основанная Илоном Маском, объявила о выпуске новых моделей искусственного интеллекта — Grok 4 и Grok 4 Heavy. Эти разработки стали значительным шагом вперед, обойдя ожидаемое обновление Grok 3.5. Вместе с моделями представлена подписка SuperGrok Heavy стоимостью 300 долларов в месяц, ориентированная на профессиональных пользователей, которым необходимы передовые возможности ИИ.

Grok 4: передовые технологии и мультимодальность

Разработанные на суперкомпьютере Colossus в Мемфисе, модели Grok 4 и Grok 4 Heavy предлагают улучшенные способности к рассуждениям и обработке естественного языка. В ближайшие недели ожидается запуск специализированной модели Grok 4 Code, предназначенной для анализа и создания кода. Новые модели поддерживают мультимодальные данные, включая текст, изображения и, в перспективе, видео. Они также способны интерпретировать мемы, что обеспечивает глубокую интеграцию культурного контекста.

Превосходство в тестах производительности

Grok 4 демонстрирует выдающиеся результаты в бенчмарках. Модель набрала 44,4% в тесте ARC-AGI-2 с использованием инструментов, опередив Gemini 2.5 Pro с результатом 26,9%. В задачах визуального рассуждения Grok 4 почти вдвое превзошел ближайшего конкурента. Grok 4 Heavy, представляющий собой многоагентную систему, достиг 50% в тесте HLE, что подчеркивает его потенциал для сложных вычислений.

Целевая аудитория и возможности

Новые модели ориентированы на разработчиков, исследователей и технических специалистов, которым требуются глубокие аналитические способности, научные выводы и анализ кода. Илон Маск заявил, что Grok 4 может начать создавать новые технологии уже к концу 2025 года, а к 2026 году, возможно, совершит прорывы в физике. Доступ к моделям предоставляется через подписку X Premium или SuperGrok Heavy, причем пользователи последней получат ранний доступ к новым функциям, включая генерацию видео.

Устранение прошлых недостатков

Ранее Grok подвергался критике за проблемные ответы, включая антисемитские и экстремистские высказывания. В преддверии выпуска Grok 4 компания xAI устранила спорные системные подсказки и усилила меры модерации, чтобы обеспечить безопасность и соответствие этическим стандартам.

Инфраструктура xAI и вызов конкурентам

Основанная в конце 2023 года, компания xAI за два года создала полноценную инфраструктуру для разработки ИИ. Суперкомпьютер Colossus, запущенный в декабре 2024 года, обеспечивает обучение всех моделей. Однако его энергопотребление и использование метановых источников энергии вызывают вопросы у экологов. Grok 4 позиционируется как конкурент моделям OpenAI ChatGPT, Google DeepMind Gemini и Anthropic Claude, предлагая уникальные возможности в области открытого рассуждения и понимания мемов.

Grok 4 сочетает специализированные возможности рассуждений, мультимодальный интеллект и лидерство в бенчмарках. xAI продолжает развивать свои технологии, стремясь к цели Маска — созданию ИИ, способного к саморазвитию. Компания также акцентирует внимание на балансе между инновациями и ответственным подходом к разработке.

© . По материалам testingcatalog
Комментарии и отзывы

Нашли ошибку?

Новое на сайте