- Key Point ввела в строй вторую очередь... (895)
- Представлены телевизоры KTC: теперь и... (812)
- Мировой Интернет упал из-за «внутренней... (807)
- Сбой Cloudflare снова «положил» половину... (785)
- Cloudflare заблокировала 416 млрд запросов... (861)
- Куда столько: представлен 1000-герцевый... (907)
- Canon не выдержала конкуренции и закрыла... (784)
- Canon нет выдержала конкуренции и закрыла... (893)
- Автомобили Haval подорожали в... (863)
- Nvidia списала GeForce GTX 10 и GTX 900: для... (771)
- Представлена новая версия Motorola Edge... (884)
- Первый в мире на Snapdragon 8 Gen 5, с АКБ... (1051)
- «Невероятно атмосферное приключение»:... (878)
- Скидки до 560 тыс. рублей: началась... (881)
- Новая студия создателя Just Cause... (932)
- «Москвич 5» появился у дилеров до... (1121)
И снова китайцы из DeepSeek показали всем, как надо работать с ИИ. Их алгоритм повышает производительность ускорителей Nvidia для ИИ в восемь раз
Дата: 2025-02-25 22:43
Китай не имеет нормального доступа к современным и самым мощным ускорителям для ИИ от Nvidia, но, похоже, теперь они им не очень уж и нужны. Компания DeepSeek, создавшая нашумевшую нейросеть, теперь сообщает, что им удалось выжать 580 TFLOPS производительности в режиме BF16 на ускорителе Nvidia H800. Чтобы было понятнее, это примерно в восемь раз превышает стандартный показатель модели.
фото WCCF Tech Более того, благодаря эффективному использованию памяти декодирующее ядро FlashMLA — изюминка новой разработки — обеспечивает пропускную способность памяти до 3000 ГБ/с, что почти в два раза превышает теоретический пик H800. Речь тут именно о программных оптимизациях, что говорит о том, что вовсе не обязательно гнаться за самыми мощными вычислительными устройствами — иногда можно получить даже больший прирост просто благодаря ПО.
Напомним, относительно информации о невероятной дешевизне обучения DeepSeek есть альтернативное мнение. А вот если другие компании смогут добиться такого же прироста на старых ускорителях, это может заметно и очень быстро изменить рынок, который сейчас активно растёт в том числе из-за активной гонки за всё большей производительностью ускорителей для ИИ.
Подробнее на iXBT
Предыдущие новости
Perplexity анонсировала свой первый веб-браузер Comet
Компания Perplexity, известная своей поисковой системой на основе искусственного интеллекта, объявила о разработке собственного веб-браузера под названием Comet. Анонс Comet был сделан через социальную сеть X (ранее Twitter) с помощью эффектной анимации, однако конкретных деталей о функциональности или позиционировании браузера пока не раскрывается. Компания предложила...
Nvidia обещает, что среди GeForce RTX 5070 точно не будет дефектных карт. Проблему с RTX 5080 компания подтвердила
Вчера мы узнали, что дефектные GeForce RTX 5080 без части блоков ROP тоже встречаются, и сегодня Nvidia это подтвердила. фото WCCF Tech После дальнейшего расследования мы обнаружили, что ранняя производственная сборка графических процессоров GeForce RTX 5080 также была затронута той же проблемой. Потребители, у которых возникла эта проблема, могут обратиться к производителю...
Toyota верна традициям: Toyota RAV4 нового поколения сохранит 2,5-литровый мотор — в отличие от многочисленных «китайцев»
Toyota завершает работы над кроссовером RAV4 шестого поколения: машина официально дебютирует уже в текущем году. Японский ресурс раскрыл новые технические подробности о новом поколении одного из самых популярных кроссоверов в мире. Фото: Best Car Web Toyota RAV4 шестого поколения получит обычную гибридную силовую установку, а также подключаемую гибридную. Третий вариант —...
Новое расширение превращает ChatGPT в поисковик для iOS
Компания OpenAI представила обновление для приложения ChatGPT, которое существенно расширяет возможности использования популярного чат-бота на устройствах Apple. Теперь пользователи iPhone и iPad могут установить ChatGPT в качестве основной поисковой системы в браузере Safari. Новая функция реализована в виде расширения для Safari, которое становится доступным после обновления...