- Огромный аккумулятор 8000 мАч, 90 Вт, 144... (3)
- Над PUBG Mobile нависла угроза блокировки в... (30)
- В Apple расцвёл кризис кадров: компанию... (31)
- Пока россияне активно покупают Lada Granta и... (30)
- Пока россияне активно покупают Lada Granta и... (47)
- Geely снизила цены в России. Скидки... (50)
- Samsung идет против своих же традиций:... (52)
- На смену иностранным решениям: «МегаФон»... (52)
- Largus, который не смог: один из немногих... (54)
- В «Яндекс Лавке» запустили первый... (60)
- Аналог Toyota Alphard российской сборки с... (65)
- Рамный внедорожник с тяговитым мотором — за... (57)
- «СберМобайл» перезапустил детский тариф... (69)
- ИИ-мегапроект Stargate буксует: SoftBank... (73)
- Судиться с Apple — очень дорого. И теперь... (73)
- Марсианское благолепие: ровер Perseverance... (75)
И снова китайцы из DeepSeek показали всем, как надо работать с ИИ. Их алгоритм повышает производительность ускорителей Nvidia для ИИ в восемь раз
Дата: 2025-02-25 22:43
Китай не имеет нормального доступа к современным и самым мощным ускорителям для ИИ от Nvidia, но, похоже, теперь они им не очень уж и нужны. Компания DeepSeek, создавшая нашумевшую нейросеть, теперь сообщает, что им удалось выжать 580 TFLOPS производительности в режиме BF16 на ускорителе Nvidia H800. Чтобы было понятнее, это примерно в восемь раз превышает стандартный показатель модели.

Более того, благодаря эффективному использованию памяти декодирующее ядро FlashMLA — изюминка новой разработки — обеспечивает пропускную способность памяти до 3000 ГБ/с, что почти в два раза превышает теоретический пик H800. Речь тут именно о программных оптимизациях, что говорит о том, что вовсе не обязательно гнаться за самыми мощными вычислительными устройствами — иногда можно получить даже больший прирост просто благодаря ПО.
Напомним, относительно информации о невероятной дешевизне обучения DeepSeek есть альтернативное мнение. А вот если другие компании смогут добиться такого же прироста на старых ускорителях, это может заметно и очень быстро изменить рынок, который сейчас активно растёт в том числе из-за активной гонки за всё большей производительностью ускорителей для ИИ.
Подробнее на iXBT
Предыдущие новости
Perplexity анонсировала свой первый веб-браузер Comet
Компания Perplexity, известная своей поисковой системой на основе искусственного интеллекта, объявила о разработке собственного веб-браузера под названием Comet. Анонс Comet был сделан через социальную сеть X (ранее Twitter) с помощью эффектной анимации, однако конкретных деталей о функциональности или позиционировании браузера пока не раскрывается. Компания предложила...
Nvidia обещает, что среди GeForce RTX 5070 точно не будет дефектных карт. Проблему с RTX 5080 компания подтвердила
Вчера мы узнали, что дефектные GeForce RTX 5080 без части блоков ROP тоже встречаются, и сегодня Nvidia это подтвердила. фото WCCF Tech После дальнейшего расследования мы обнаружили, что ранняя производственная сборка графических процессоров GeForce RTX 5080 также была затронута той же проблемой. Потребители, у которых возникла эта проблема, могут обратиться к производителю...
Toyota верна традициям: Toyota RAV4 нового поколения сохранит 2,5-литровый мотор — в отличие от многочисленных «китайцев»
Toyota завершает работы над кроссовером RAV4 шестого поколения: машина официально дебютирует уже в текущем году. Японский ресурс раскрыл новые технические подробности о новом поколении одного из самых популярных кроссоверов в мире. Фото: Best Car Web Toyota RAV4 шестого поколения получит обычную гибридную силовую установку, а также подключаемую гибридную. Третий вариант —...
Новое расширение превращает ChatGPT в поисковик для iOS
Компания OpenAI представила обновление для приложения ChatGPT, которое существенно расширяет возможности использования популярного чат-бота на устройствах Apple. Теперь пользователи iPhone и iPad могут установить ChatGPT в качестве основной поисковой системы в браузере Safari. Новая функция реализована в виде расширения для Safari, которое становится доступным после обновления...