- «Пока наши серверы не расплавятся»: Илон... (1051)
- Новейшие Chery Tiggo 4 начали продавать... (847)
- «Прогресс» поднял орбиту МКС на 3,4 км в... (928)
- Лебединая песня легендарного мотора W16.... (1044)
- 5800 мАч, ИИ-фоторедактор и подводная съёмка... (813)
- Судный день всё ближе? DeepSeek теперь будут... (6689)
- Китай поручил чиновникам использовать... (773)
- Supergiant добавила в Hades II бога войны и... (914)
- В NASA резко повысили вероятность... (761)
- Первый отчёт Kioxia после IPO: прибыль... (839)
- Infineon получит почти миллиард евро... (672)
- «Яндекс» впервые в истории заработал за год... (862)
- «Китайский Cadillac», который стал... (741)
- Уходит эпоха: у Apple не осталось ни одного... (1582)
- Неконтролируемая ступень ракеты SpaceX... (773)
- Представлена новая Toyota... (632)
И снова китайцы из DeepSeek показали всем, как надо работать с ИИ. Их алгоритм повышает производительность ускорителей Nvidia для ИИ в восемь раз
Дата: 2025-02-25 22:43
Китай не имеет нормального доступа к современным и самым мощным ускорителям для ИИ от Nvidia, но, похоже, теперь они им не очень уж и нужны. Компания DeepSeek, создавшая нашумевшую нейросеть, теперь сообщает, что им удалось выжать 580 TFLOPS производительности в режиме BF16 на ускорителе Nvidia H800. Чтобы было понятнее, это примерно в восемь раз превышает стандартный показатель модели.

Более того, благодаря эффективному использованию памяти декодирующее ядро FlashMLA — изюминка новой разработки — обеспечивает пропускную способность памяти до 3000 ГБ/с, что почти в два раза превышает теоретический пик H800. Речь тут именно о программных оптимизациях, что говорит о том, что вовсе не обязательно гнаться за самыми мощными вычислительными устройствами — иногда можно получить даже больший прирост просто благодаря ПО.
Напомним, относительно информации о невероятной дешевизне обучения DeepSeek есть альтернативное мнение. А вот если другие компании смогут добиться такого же прироста на старых ускорителях, это может заметно и очень быстро изменить рынок, который сейчас активно растёт в том числе из-за активной гонки за всё большей производительностью ускорителей для ИИ.
Подробнее на iXBT
Предыдущие новости
Perplexity анонсировала свой первый веб-браузер Comet
Компания Perplexity, известная своей поисковой системой на основе искусственного интеллекта, объявила о разработке собственного веб-браузера под названием Comet. Анонс Comet был сделан через социальную сеть X (ранее Twitter) с помощью эффектной анимации, однако конкретных деталей о функциональности или позиционировании браузера пока не раскрывается. Компания предложила...
Nvidia обещает, что среди GeForce RTX 5070 точно не будет дефектных карт. Проблему с RTX 5080 компания подтвердила
Вчера мы узнали, что дефектные GeForce RTX 5080 без части блоков ROP тоже встречаются, и сегодня Nvidia это подтвердила. фото WCCF Tech После дальнейшего расследования мы обнаружили, что ранняя производственная сборка графических процессоров GeForce RTX 5080 также была затронута той же проблемой. Потребители, у которых возникла эта проблема, могут обратиться к производителю...
Toyota верна традициям: Toyota RAV4 нового поколения сохранит 2,5-литровый мотор — в отличие от многочисленных «китайцев»
Toyota завершает работы над кроссовером RAV4 шестого поколения: машина официально дебютирует уже в текущем году. Японский ресурс раскрыл новые технические подробности о новом поколении одного из самых популярных кроссоверов в мире. Фото: Best Car Web Toyota RAV4 шестого поколения получит обычную гибридную силовую установку, а также подключаемую гибридную. Третий вариант —...
Новое расширение превращает ChatGPT в поисковик для iOS
Компания OpenAI представила обновление для приложения ChatGPT, которое существенно расширяет возможности использования популярного чат-бота на устройствах Apple. Теперь пользователи iPhone и iPad могут установить ChatGPT в качестве основной поисковой системы в браузере Safari. Новая функция реализована в виде расширения для Safari, которое становится доступным после обновления...