- ESA подтвердило крупную утечку данных и... (640)
- Intel создала для этих процессоров отдельный... (805)
- Wi-Fi 7, до 512 устройств и порт Ethernet... (692)
- Трёхдиапазонная скорость до 12 000 Мбит/с,... (627)
- Представлена видеокарта половинной высоты... (683)
- Устройства с Wi-Fi 8 показали на CES 2026,... (1080)
- Wi-Fi 7 до 5,8 Гбит/с, до 64 устройств,... (1206)
- Honor Magic 8 RSR Porsche Design и Magic 8... (711)
- Землю накроют магнитные бури 9 января 2026.... (711)
- Телевизор HVA Ultra Infinity View и первый в... (996)
- Времена меняются: Qualcomm ведёт переговоры... (647)
- WhatsApp добавил в групповые чаты теги,... (846)
- Гарантия 5 лет, проверенный корейский бренд... (1167)
- Компания по выпуску твердотельных... (811)
- ЧП на МКС: NASA следит за состоянием... (1120)
- Компактный 6,3-дюймовый экран с частотой 165... (794)
Grok 4 обходит OpenAI и Google: новая модель ИИ от Маска выходит в лидеры
Дата: 2025-07-11 09:45
Илон Маск и его компания xAI объявили о запуске новой флагманской языковой модели Grok 4 и премиального тарифа SuperGrok Heavy стоимостью $300 в месяц. Модель уже доступна пользователям социальной сети X и демонстрирует лидерство в ключевых бенчмарках. Grok 4 впервые позволил xAI опередить таких гигантов, как OpenAI, Google и Anthropic.
Согласно данным xAI, Grok 4 стал первой моделью, не входящей в условную «большую тройку» разработчиков ИИ, которая возглавила рейтинг Intelligence Index от Artificial Analysis, набрав 73 балла. Для сравнения: OpenAI o3 получил 70, Google Gemini 2.5 Pro — тоже 70, а Anthropic Claude 4 Opus — 64.
Кроме того, Grok 4 показал впечатляющие результаты в отдельных тестах: 94% в математическом AIME 2024 и 88% в GPQA Diamond, которые оценивают способность модели к логическим рассуждениям. Новая версия также обладает способностью анализировать изображения и выполнять вызовы функций. Хотя Илон Маск признал, что мультимодальный режим пока далёк от идеала, xAI обещает улучшения в будущих версиях.
Фото: xAI Особое внимание вызвал результат модели на тесте ARC-AGI — одном из самых строгих бенчмарков, предназначенных для оценки гибкого интеллекта. По словам команды ARC, Grok 4 набрал 15.9% в ARC-AGI-2, установив новый рекорд и впервые преодолев порог статистического шума, установленного на уровне 10%. Для сравнения, предыдущий лидер — Claude Opus 4 — набрал лишь около 8%. Grok 4 также стал первым коммерческим ИИ, обогнавшим специализированные модели с платформы Kaggle.
Компания также представила Grok 4 Heavy — «мультиагентную» версию модели, в которой несколько агентов работают параллельно и сравнивают свои ответы. Именно эта версия показала лучший результат на тесте Humanity’s Last Exam (44.4% с инструментами), обогнав Gemini 2.5 Pro (26.9%) и OpenAI o3 (21%).
Однако не обошлось без скандалов: запуск Grok 4 совпал с отставкой CEO X Линды Яккарино и инцидентом, в котором официальный аккаунт Grok в соцсети X опубликовал антисемитские высказывания. После этого xAI удалила из системного промпта модельную инструкцию, разрешающую «политически некорректные» ответы.
Несмотря на это, xAI делает ставку на коммерческий успех. Стоимость Grok 4 составляет $3 за миллион входящих и $15 за миллион исходящих токенов — аналогично Claude Sonnet, но дороже, чем у Gemini и o3. Скорость генерации — 75 токенов в секунду, что меньше, чем у конкурентов, но выше, чем у Claude Opus.
Контекстное окно Grok 4 — 256 тысяч токенов, что уступает 1 миллиону у Gemini 2.5 Pro, но превышает лимиты у большинства других моделей.
Подробнее на iXBT
Предыдущие новости
OpenAI представит браузер с ИИ в ближайшие недели
OpenAI готовится выпустить веб-браузер с искусственным интеллектом в ближайшие недели, сообщает Reuters. Разработка станет прямым конкурентом Google Chrome и последует за недавним запуском браузера Comet от Perplexity. По данным источников, браузер OpenAI переосмыслит взаимодействие пользователей с интернетом с помощью ИИ. Ключевой особенностью станет удержание действий внутри...
Рекомендуется установить как можно скорее: приложение «Альфа-Банка» появилось в App Store
Для российских пользователей для мобильных устройств Apple в App Store стало доступно новое приложение «Альфа-Банка». В банке уже подтвердили, что приложение под названием «Делим вместе» вполне официальное, а не вредоносный клон, созданный киберпреступниками. Скриншот из App Store В «Альфа-Банке» советуют не откладывать загрузку и установку: Кто не успеет, тот опоздает....
Sony показала 17 минут геймплея Ghost of Yotei и анонсировала лимитированные PS5 в стиле игры
Как и было обещано, издатель Sony Interactive Entertainment и разработчики из Sucker Punch Productions в ночь на 11 июля провели особый выпуск State of Play, посвящённый приключенческому экшену с открытым миром Ghost of Yotei. Источник изображений: Sony Interactive...
Slate Auto, созданный при поддержке Безоса, корректирует цену модульного электрогрузовика после отмены налоговой льготы
3 июля 2025 года администрация Трампа прекратила действие федерального налогового кредита в $7500 для покупателей электромобилей, что немедленно отразилось на ценовой стратегии стартапа Slate Auto. Компания оперативно удалила с официального сайта упоминание целевой цены «ниже $20 000» для своего модульного электрогрузовика, поскольку эта сумма достигалась исключительно за счёт...