Добро пожаловать на форум PHP программистов!
За последние 24 часа нас посетили 16634 программиста и 1808 роботов. Сейчас ищут 1769 программистов ...
Последние
Популярные

Никакого чуда китайская нейросеть DeepSeek из себя не представляет? Затраты на её обучение могли быть в 400 раз выше заявленных

Дата: 2025-02-01 21:35

Возможно, китайская языковая модель DeepSeek, запуск которой обвалил фондовый рынок США и привёл к падению капитализации Nvidia на невероятные 600 млрд долларов, на самом деле обошлась китайской компании не в разы, а на порядки дороже, чем сообщалось. 

создано DALL-E

Напомним, затраты на обучение модели якобы составили всего 5-6 млн долларов, что поражает на фоне сотен миллионов, которые тратят западные гиганты. Однако аналитики SemiAnalysis провели анализ имеющихся данных и сообщают, что на самом деле затраты DeepSeek были примерно на два порядка выше заявленных! 

фото SemiAnalysis  фото SemiAnalysis 

В отчете говорится, что DeepSeek имеет около 10 000 графических процессоров Nvidia H800, предназначенных для китайского рынка, и 10 000 более дорогих чипов H100. Более того, компания инвестировала в ускорители H20, и у них есть пул ресурсов, которые DeepSeek и китайский хедж-фонд High-Flyer совместно используют для торговли, вывода, обучения и исследований. Суммарно всё это уже тянет примерно на 1,6 млрд долларов, и это только капитальные вложения. Эксплуатационные расходы, по слухам, составляют около 944 млн долларов. Эти цифры примерно в четыреста раз выше, чем изначально предполагали рынки. 

Судя по всему, те самые 5-6 млн долларов — это определенная часть расходов на обучение, вероятно, связанных с запуском окончательной модели. 

Таким образом, если расчёты источника верны, никакого чуда не произошло и DeepSeek не смогла изменить правила рынка, когда большие языковые модели требуют гигантского количества денежных средств.  



Подробнее на iXBT
 

Предыдущие новости

3Dnews.ru, 2025-02-01 21:55
Galax выпустила GeForce RTX 5080 HOF OC LAB Plus-X для экстремального разгона

Компания Galax выпустила видеокарту GeForce RTX 5080 в своём фирменном исполнении HOF OC LAB Plus-X. По традиции карта рассчитана на экстремальный разгон. Для этого новинка оснащена значительно усиленной 26-фазной подсистемой питания VRM со схемой фаз 14+6+6 (70А DrMOS), а также качественной компонентной базой и 12-слойной печатной платой. Система охлаждения и печатная...

iXBT, 2025-02-01 21:06
RTX 5090 и RTX 5080 очень дорогие и в дефиците, но ждать выхода RTX 5060 Ti и RTX 5060 долго не придётся

Похоже, ранние слухи о том, что Nvidia выпустит всю или почти всю настольную линейку видеокарт GeForce RTX 50 в сжатые сроки, подтверждаются.  фото Videocardz Компания Colorful поделилась данными, согласно которым, модели RTX 5060 Ti и RTX 5060 выйдут уже в марте. Напомним, RTX 5070 Ti ожидается в феврале, и относительно RTX 5070 есть такие же слухи.  То есть вся основная...

iXBT, 2025-02-01 21:12
Samsung Galaxy S25 Ultra попытались согнуть, сжечь, поцарапать и отклеить накладки на камере. JerryRigEverything добрался до нового флагмана

Блогер JerryRigEverything, число подписчиков которого уже перевалило за 9 млн, добрался до новейшего Samsung Galaxy S25 Ultra, что испытать его на прочность.  скриншот видео Как обычно, экран можно поцарапать материалом с твёрдостью 6 по шкале Мооса, и тут как минимум для обычных смартфонов ничего нового нет. Но зато блогер решил попробовать сковырнуть кольца вокруг модулей...

iXBT, 2025-02-01 21:12
Вечный полёт в атмосфере Венеры: NASA одобрило проект самоподдерживающегося зонда

Российские и американские учёные объединили усилия для разработки проекта по исследованию атмосферы Венеры. Проект под названием «Исследование Венеры с помощью электролиза» (EVE) получил грант от Института перспективных концепций NASA (NIAC). Руководителем проекта выступает доктор Майкл Хехт, главный исследователь системы MOXIE и профессор Массачусетского технологического...

© 2025 «PHP.RU — Сообщество PHP-Программистов»
Главная | Форум | Реклама на сайте | Контакты VIP Сувениры
Разработка компании ODware