- Большой сюрприз для владельцев смартфонов... (942)
- Авторы Clair Obscur: Expedition 33... (710)
- Когда связи нет: в «Делимобиле» заработало... (942)
- Китайские поставщики кремниевых пластин... (1057)
- Не Windows, а золото: из старых британских... (1204)
- 7000 мАч, 80 Вт, IP69 и кожаная крышка,... (608)
- Гарантия 5 лет или 150 тыс. км пробега,... (628)
- Selectel представила российскую серверную... (776)
- От 2,68 млн рублей и только под заказ: в... (629)
- Контракты Пентагона показывают удорожание... (658)
- Настольные суперкомпьютеры Nvidia DGX Spark... (1796)
- Поставки автомобилей из Южной Кореи в Россию... (730)
- SpaceX отправила в космос 28 спутников... (773)
- ExoMars и Mars Express получили фото... (863)
- Американские претензии к ASML из-за поставок... (900)
- Qualcomm приобрела Arduino и представила... (780)
Обучение модели DeepSeek R1 обошлось в сотни раз дешевле, чем обучение базовых моделей OpenAI: названа точная сумма
Дата: 2025-09-20 08:04
Китайский разработчик DeepSeek заявил, что потратил 294 000 долларов на обучение своей модели R1, что значительно меньше показателей, озвученных американскими конкурентами.
В начале года DeepSeek произвела фурор со своей новой моделью, с тех пор компания и ее основатель Лян Вэньфэн практически исчезли из поля зрения общественности, за исключением нескольких обновлений. В статье в журнале Nature, где Лян указан в качестве одного из соавторов, говорится, что обучение модели DeepSeek R1, ориентированной на рассуждения, обошлось в 294 000 долларов, для чего было использовано 512 процессоров Nvidia H800. Они были разработаны компанией Nvidia для китайского рынка после того, как в октябре 2022 года США запретили компании экспортировать в Китай более мощные ИИ-чипы H100 и A100.
Сэм Альтман, генеральный директор американского гиганта искусственного интеллекта OpenAI, заявил в 2023 году, что обучение базовых моделей обошлось «гораздо дороже» 100 миллионов долларов, хотя его компания не предоставила подробных данных ни по одному из своих релизов.
Некоторые заявления DeepSeek о расходах на разработку и использованных технологиях подверглись сомнению со стороны американских компаний и официальных лиц.

В июне американские официальные лица сообщили агентству Reuters, что DeepSeek имеет доступ к «большим объёмам» чипов H100, закупленных после введения экспортного контроля США. В то же время Nvidia сообщила агентству Reuters, что DeepSeek использовала законно приобретённые процессоры H800, а не H100.
Теперь же компания впервые признала, что владеет процессорами A100, и сообщила, что использовала их на подготовительных этапах разработки.
«Что касается нашего исследования DeepSeek-R1, мы использовали графические процессоры A100 для подготовки к экспериментам с меньшей моделью», — написали исследователи. После этого начального этапа R1 обучался в общей сложности 80 часов на кластере из 512 чипов H800, добавили они.
Ранее агентство Reuters сообщало, что одной из причин, по которой DeepSeek удалось привлечь самые яркие умы Китая, стало то, что она была одной из немногих китайских компаний, эксплуатировавших суперкомпьютерный кластер с процессорами A100.
DeepSeek готовится к запуску ИИ-агента нового поколения к концу 2025 года. Компания из Ханчжоу разрабатывает систему, способную выполнять сложные многоэтапные задачи с минимальным участием пользователя. Модель также будет обучаться на основе своих прошлых действий, чтобы со временем повысить свою производительность. Компания также теперь добавляет обязательные метки контента, генерируемые ИИ.
Подробнее на iXBT
Предыдущие новости
Oracle стремительно становится техногигантом: на переговорном столе — сделка с M**a на $20 млрд
Oracle вступила в переговоры с M**a на предмет сделки в сфере облачных вычислений на сумму около $20 млрд, сообщает Bloomberg со ссылкой на информированные источники. Это свидетельствует, что компания стала крупным поставщиком услуг облачной инфраструктуры. В рамках многолетнего соглашения Oracle обеспечит гиганта соцсетей вычислительными мощностями для обучения и...
Intel не забросит выпуск видеокарт Arc после сделки с Nvidia, а также не откажется от выпуска намеченных процессоров
Описывая условия сделки, в рамках которой Nvidia вложит $5 млрд в Intel и будет совместно с ней разрабатывать центральные процессоры, её участники изначально не касались темы дискретной графики, а ведь в своё время Intel вложила немало ресурсов ради возвращения в этот сегмент рынка. После сделки с Nvidia она от своих амбиций на рынке дискретной графики отказываться не...
Samsung представила смартфон Galaxy A17 4G — чип Helio G99, батарея на 5000 мА·ч и цена от €199
Компания Samsung официально представила смартфон Galaxy A17 4G, который в плане технических характеристик во многом повторяет Galaxy A17 5G. Новинка уже доступна в некоторых странах европейского региона по цене от €199. Источник изображений: GSM...
AMD выразила уверенность в своей способности потеснить Intel даже на фоне её сотрудничества с Nvidia
Естественно, тщательно скрываемая на этапе подготовки сделка между Intel и Nvidia не могла не затрагивать интересов AMD, которая конкурирует с обеими компаниями. Представители AMD предпочли заявить, что сотрудничество Intel и Nvidia не сможет поколебать способность компании предлагать инновации и увеличивать собственную долю рынка. Источник изображения:...