- Chery переосмыслила минивэн: представлен... (4199)
- Обломки Falcon 9 приземлились в... (807)
- Стали известны цены на iPhone 16e в... (3768)
- Vodafone откроет в Испании центр разработки... (2059)
- BMW создала компьютер-«супермозг» Heart of... (3015)
- BMW iX xDrive60 2026 получил четырехзонный... (971)
- Представлен BMW iX xDrive60 (938)
- Замена Mercedes-Maybach GLS и BMW X7,... (864)
- 1000 TOPS: новейшая SoC Nvidia Drive Thor в... (842)
- Космическое агентство NASA избежало массовых... (828)
- Создана передовая камера, которая позволит... (1044)
- Каждый третий Solaris российской сборки... (966)
- Intel стоит $1 трлн и продавать её за... (692)
- У России появится свой аналог Falcon 9 —... (753)
- Перед отправкой в последний путь космический... (934)
- «Самый умный ИИ на Земле», который... (766)
И снова китайцы из DeepSeek показали всем, как надо работать с ИИ. Их алгоритм повышает производительность ускорителей Nvidia для ИИ в восемь раз
Дата: 2025-02-25 22:43
Китай не имеет нормального доступа к современным и самым мощным ускорителям для ИИ от Nvidia, но, похоже, теперь они им не очень уж и нужны. Компания DeepSeek, создавшая нашумевшую нейросеть, теперь сообщает, что им удалось выжать 580 TFLOPS производительности в режиме BF16 на ускорителе Nvidia H800. Чтобы было понятнее, это примерно в восемь раз превышает стандартный показатель модели.

Более того, благодаря эффективному использованию памяти декодирующее ядро FlashMLA — изюминка новой разработки — обеспечивает пропускную способность памяти до 3000 ГБ/с, что почти в два раза превышает теоретический пик H800. Речь тут именно о программных оптимизациях, что говорит о том, что вовсе не обязательно гнаться за самыми мощными вычислительными устройствами — иногда можно получить даже больший прирост просто благодаря ПО.
Напомним, относительно информации о невероятной дешевизне обучения DeepSeek есть альтернативное мнение. А вот если другие компании смогут добиться такого же прироста на старых ускорителях, это может заметно и очень быстро изменить рынок, который сейчас активно растёт в том числе из-за активной гонки за всё большей производительностью ускорителей для ИИ.
Подробнее на iXBT
Предыдущие новости
Perplexity анонсировала свой первый веб-браузер Comet
Компания Perplexity, известная своей поисковой системой на основе искусственного интеллекта, объявила о разработке собственного веб-браузера под названием Comet. Анонс Comet был сделан через социальную сеть X (ранее Twitter) с помощью эффектной анимации, однако конкретных деталей о функциональности или позиционировании браузера пока не раскрывается. Компания предложила...
Nvidia обещает, что среди GeForce RTX 5070 точно не будет дефектных карт. Проблему с RTX 5080 компания подтвердила
Вчера мы узнали, что дефектные GeForce RTX 5080 без части блоков ROP тоже встречаются, и сегодня Nvidia это подтвердила. фото WCCF Tech После дальнейшего расследования мы обнаружили, что ранняя производственная сборка графических процессоров GeForce RTX 5080 также была затронута той же проблемой. Потребители, у которых возникла эта проблема, могут обратиться к производителю...
Toyota верна традициям: Toyota RAV4 нового поколения сохранит 2,5-литровый мотор — в отличие от многочисленных «китайцев»
Toyota завершает работы над кроссовером RAV4 шестого поколения: машина официально дебютирует уже в текущем году. Японский ресурс раскрыл новые технические подробности о новом поколении одного из самых популярных кроссоверов в мире. Фото: Best Car Web Toyota RAV4 шестого поколения получит обычную гибридную силовую установку, а также подключаемую гибридную. Третий вариант —...
Новое расширение превращает ChatGPT в поисковик для iOS
Компания OpenAI представила обновление для приложения ChatGPT, которое существенно расширяет возможности использования популярного чат-бота на устройствах Apple. Теперь пользователи iPhone и iPad могут установить ChatGPT в качестве основной поисковой системы в браузере Safari. Новая функция реализована в виде расширения для Safari, которое становится доступным после обновления...