- ЕС выпустил руководство по использованию ИИ,... (710)
- Новая статья: Обзор SSD-накопителя Samsung... (858)
- Кроссоверы больше не нужны? Новейший седан... (645)
- Age of Mythology: Retold и Age of Empires... (802)
- Mozilla Firefox получил интеграцию с ChatGPT... (845)
- «Когда предзаказ оправдывает ожидания»: на... (846)
- G.Skill представила модули DDR5 на 16 и 48... (788)
- Государственное управление по регулированию... (899)
- Астрономы поймали момент распада экзопланет... (848)
- Blue Origin успешно симулировала лунную... (788)
- Пользователи пожаловались на GeForce RTX... (872)
- Инженеры создали сверхтонкие «спиральные»... (731)
- У молодого двойника Солнца обнаружена редкая... (622)
- Электромобили догнали и перегнали машины с... (728)
- Где искать двойников Земли: астрономы... (860)
- Распад ложного вакуума: физики смоделировали... (907)
Никакого чуда китайская нейросеть DeepSeek из себя не представляет? Затраты на её обучение могли быть в 400 раз выше заявленных
Дата: 2025-02-01 21:35
Возможно, китайская языковая модель DeepSeek, запуск которой обвалил фондовый рынок США и привёл к падению капитализации Nvidia на невероятные 600 млрд долларов, на самом деле обошлась китайской компании не в разы, а на порядки дороже, чем сообщалось.

Напомним, затраты на обучение модели якобы составили всего 5-6 млн долларов, что поражает на фоне сотен миллионов, которые тратят западные гиганты. Однако аналитики SemiAnalysis провели анализ имеющихся данных и сообщают, что на самом деле затраты DeepSeek были примерно на два порядка выше заявленных!


В отчете говорится, что DeepSeek имеет около 10 000 графических процессоров Nvidia H800, предназначенных для китайского рынка, и 10 000 более дорогих чипов H100. Более того, компания инвестировала в ускорители H20, и у них есть пул ресурсов, которые DeepSeek и китайский хедж-фонд High-Flyer совместно используют для торговли, вывода, обучения и исследований. Суммарно всё это уже тянет примерно на 1,6 млрд долларов, и это только капитальные вложения. Эксплуатационные расходы, по слухам, составляют около 944 млн долларов. Эти цифры примерно в четыреста раз выше, чем изначально предполагали рынки.
Судя по всему, те самые 5-6 млн долларов — это определенная часть расходов на обучение, вероятно, связанных с запуском окончательной модели.
Таким образом, если расчёты источника верны, никакого чуда не произошло и DeepSeek не смогла изменить правила рынка, когда большие языковые модели требуют гигантского количества денежных средств.
Подробнее на iXBT
Предыдущие новости
Galax выпустила GeForce RTX 5080 HOF OC LAB Plus-X для экстремального разгона
Компания Galax выпустила видеокарту GeForce RTX 5080 в своём фирменном исполнении HOF OC LAB Plus-X. По традиции карта рассчитана на экстремальный разгон. Для этого новинка оснащена значительно усиленной 26-фазной подсистемой питания VRM со схемой фаз 14+6+6 (70А DrMOS), а также качественной компонентной базой и 12-слойной печатной платой. Система охлаждения и печатная...
RTX 5090 и RTX 5080 очень дорогие и в дефиците, но ждать выхода RTX 5060 Ti и RTX 5060 долго не придётся
Похоже, ранние слухи о том, что Nvidia выпустит всю или почти всю настольную линейку видеокарт GeForce RTX 50 в сжатые сроки, подтверждаются. фото Videocardz Компания Colorful поделилась данными, согласно которым, модели RTX 5060 Ti и RTX 5060 выйдут уже в марте. Напомним, RTX 5070 Ti ожидается в феврале, и относительно RTX 5070 есть такие же слухи. То есть вся основная...
Samsung Galaxy S25 Ultra попытались согнуть, сжечь, поцарапать и отклеить накладки на камере. JerryRigEverything добрался до нового флагмана
Блогер JerryRigEverything, число подписчиков которого уже перевалило за 9 млн, добрался до новейшего Samsung Galaxy S25 Ultra, что испытать его на прочность. скриншот видео Как обычно, экран можно поцарапать материалом с твёрдостью 6 по шкале Мооса, и тут как минимум для обычных смартфонов ничего нового нет. Но зато блогер решил попробовать сковырнуть кольца вокруг модулей...
Вечный полёт в атмосфере Венеры: NASA одобрило проект самоподдерживающегося зонда
Российские и американские учёные объединили усилия для разработки проекта по исследованию атмосферы Венеры. Проект под названием «Исследование Венеры с помощью электролиза» (EVE) получил грант от Института перспективных концепций NASA (NIAC). Руководителем проекта выступает доктор Майкл Хехт, главный исследователь системы MOXIE и профессор Массачусетского технологического...