- Представлен обновленный Geely Preface: 272... (25)
- Обновленный Haval H7 с силовой установкой... (49)
- Кровавый геймплейный трейлер раскрыл дату... (61)
- Dell впервые больше заработала на серверах... (61)
- Новая статья: Inkshade — навстречу бездне.... (64)
- Семейный Hyundai без тормозов: в Китае... (125)
- Новый уровень китайского премиума: Hongqi... (77)
- Рама, честный полный привод, мотор V6, 354... (73)
- В WhatsApp экстренно закрыли опасную... (75)
- Подорожание видеокарт в США снова отложили —... (83)
- Китайская альтернатива BMW 7-й серии и... (94)
- 7000 мАч, 100 Вт, новое поколение камеры... (110)
- Qualcomm может удивить: вместо Snapdragon 8... (132)
- Intel признаёт, что в этом году у неё не... (97)
- «Заканчиваем консольные войны»: за три дня в... (73)
- Квантовый интернет впервые пустили по... (85)
И снова китайцы из DeepSeek показали всем, как надо работать с ИИ. Их алгоритм повышает производительность ускорителей Nvidia для ИИ в восемь раз
Дата: 2025-02-25 22:43
Китай не имеет нормального доступа к современным и самым мощным ускорителям для ИИ от Nvidia, но, похоже, теперь они им не очень уж и нужны. Компания DeepSeek, создавшая нашумевшую нейросеть, теперь сообщает, что им удалось выжать 580 TFLOPS производительности в режиме BF16 на ускорителе Nvidia H800. Чтобы было понятнее, это примерно в восемь раз превышает стандартный показатель модели.

Более того, благодаря эффективному использованию памяти декодирующее ядро FlashMLA — изюминка новой разработки — обеспечивает пропускную способность памяти до 3000 ГБ/с, что почти в два раза превышает теоретический пик H800. Речь тут именно о программных оптимизациях, что говорит о том, что вовсе не обязательно гнаться за самыми мощными вычислительными устройствами — иногда можно получить даже больший прирост просто благодаря ПО.
Напомним, относительно информации о невероятной дешевизне обучения DeepSeek есть альтернативное мнение. А вот если другие компании смогут добиться такого же прироста на старых ускорителях, это может заметно и очень быстро изменить рынок, который сейчас активно растёт в том числе из-за активной гонки за всё большей производительностью ускорителей для ИИ.
Подробнее на iXBT
Предыдущие новости
Perplexity анонсировала свой первый веб-браузер Comet
Компания Perplexity, известная своей поисковой системой на основе искусственного интеллекта, объявила о разработке собственного веб-браузера под названием Comet. Анонс Comet был сделан через социальную сеть X (ранее Twitter) с помощью эффектной анимации, однако конкретных деталей о функциональности или позиционировании браузера пока не раскрывается. Компания предложила...
Nvidia обещает, что среди GeForce RTX 5070 точно не будет дефектных карт. Проблему с RTX 5080 компания подтвердила
Вчера мы узнали, что дефектные GeForce RTX 5080 без части блоков ROP тоже встречаются, и сегодня Nvidia это подтвердила. фото WCCF Tech После дальнейшего расследования мы обнаружили, что ранняя производственная сборка графических процессоров GeForce RTX 5080 также была затронута той же проблемой. Потребители, у которых возникла эта проблема, могут обратиться к производителю...
Toyota верна традициям: Toyota RAV4 нового поколения сохранит 2,5-литровый мотор — в отличие от многочисленных «китайцев»
Toyota завершает работы над кроссовером RAV4 шестого поколения: машина официально дебютирует уже в текущем году. Японский ресурс раскрыл новые технические подробности о новом поколении одного из самых популярных кроссоверов в мире. Фото: Best Car Web Toyota RAV4 шестого поколения получит обычную гибридную силовую установку, а также подключаемую гибридную. Третий вариант —...
Новое расширение превращает ChatGPT в поисковик для iOS
Компания OpenAI представила обновление для приложения ChatGPT, которое существенно расширяет возможности использования популярного чат-бота на устройствах Apple. Теперь пользователи iPhone и iPad могут установить ChatGPT в качестве основной поисковой системы в браузере Safari. Новая функция реализована в виде расширения для Safari, которое становится доступным после обновления...