- Представлен первый черновик спецификации PCI... (46)
- Похожая на Землю экзопланета может быть... (36)
- Xiaomi раскрыла перечень, из которого ясно,... (60)
- От 6300 до 7500 мАч. Названа емкость... (76)
- Oracle стремительно становится... (162)
- AMD выразила уверенность в своей способности... (85)
- Samsung представила смартфон Galaxy A17 4G —... (100)
- При участии бывшего главного дизайнера Apple... (139)
- 98 дюймов, 4K, до 330 Гц, 3864 зоны... (95)
- Когда производитель не сомневается в... (118)
- Обучение модели DeepSeek R1 обошлось в сотни... (86)
- Обучение хитового DeepSeek обошлось в сотни... (466)
- Li Auto начинает выпуск собственных... (138)
- Тим Кук заявил, что повышение цен на... (146)
- Глава Xiaomi перешёл на Xiaomi 17 Pro Max и... (101)
- Глава Xiaomi перешёл на Xiaomi 17 Pro Max и... (135)
Обучение модели DeepSeek R1 обошлось в сотни раз дешевле, чем обучение базовых моделей OpenAI: названа точная сумма
Дата: сегодня 08:04
Китайский разработчик DeepSeek заявил, что потратил 294 000 долларов на обучение своей модели R1, что значительно меньше показателей, озвученных американскими конкурентами.
В начале года DeepSeek произвела фурор со своей новой моделью, с тех пор компания и ее основатель Лян Вэньфэн практически исчезли из поля зрения общественности, за исключением нескольких обновлений. В статье в журнале Nature, где Лян указан в качестве одного из соавторов, говорится, что обучение модели DeepSeek R1, ориентированной на рассуждения, обошлось в 294 000 долларов, для чего было использовано 512 процессоров Nvidia H800. Они были разработаны компанией Nvidia для китайского рынка после того, как в октябре 2022 года США запретили компании экспортировать в Китай более мощные ИИ-чипы H100 и A100.
Сэм Альтман, генеральный директор американского гиганта искусственного интеллекта OpenAI, заявил в 2023 году, что обучение базовых моделей обошлось «гораздо дороже» 100 миллионов долларов, хотя его компания не предоставила подробных данных ни по одному из своих релизов.
Некоторые заявления DeepSeek о расходах на разработку и использованных технологиях подверглись сомнению со стороны американских компаний и официальных лиц.

В июне американские официальные лица сообщили агентству Reuters, что DeepSeek имеет доступ к «большим объёмам» чипов H100, закупленных после введения экспортного контроля США. В то же время Nvidia сообщила агентству Reuters, что DeepSeek использовала законно приобретённые процессоры H800, а не H100.
Теперь же компания впервые признала, что владеет процессорами A100, и сообщила, что использовала их на подготовительных этапах разработки.
«Что касается нашего исследования DeepSeek-R1, мы использовали графические процессоры A100 для подготовки к экспериментам с меньшей моделью», — написали исследователи. После этого начального этапа R1 обучался в общей сложности 80 часов на кластере из 512 чипов H800, добавили они.
Ранее агентство Reuters сообщало, что одной из причин, по которой DeepSeek удалось привлечь самые яркие умы Китая, стало то, что она была одной из немногих китайских компаний, эксплуатировавших суперкомпьютерный кластер с процессорами A100.
DeepSeek готовится к запуску ИИ-агента нового поколения к концу 2025 года. Компания из Ханчжоу разрабатывает систему, способную выполнять сложные многоэтапные задачи с минимальным участием пользователя. Модель также будет обучаться на основе своих прошлых действий, чтобы со временем повысить свою производительность. Компания также теперь добавляет обязательные метки контента, генерируемые ИИ.
Подробнее на iXBT
Предыдущие новости
Oracle стремительно становится техногигантом: на переговорном столе — сделка с M**a на $20 млрд
Oracle вступила в переговоры с M**a на предмет сделки в сфере облачных вычислений на сумму около $20 млрд, сообщает Bloomberg со ссылкой на информированные источники. Это свидетельствует, что компания стала крупным поставщиком услуг облачной инфраструктуры. В рамках многолетнего соглашения Oracle обеспечит гиганта соцсетей вычислительными мощностями для обучения и...
Intel не забросит выпуск видеокарт Arc после сделки с Nvidia, а также не откажется от выпуска намеченных процессоров
Описывая условия сделки, в рамках которой Nvidia вложит $5 млрд в Intel и будет совместно с ней разрабатывать центральные процессоры, её участники изначально не касались темы дискретной графики, а ведь в своё время Intel вложила немало ресурсов ради возвращения в этот сегмент рынка. После сделки с Nvidia она от своих амбиций на рынке дискретной графики отказываться не...
Samsung представила смартфон Galaxy A17 4G — чип Helio G99, батарея на 5000 мА·ч и цена от €199
Компания Samsung официально представила смартфон Galaxy A17 4G, который в плане технических характеристик во многом повторяет Galaxy A17 5G. Новинка уже доступна в некоторых странах европейского региона по цене от €199. Источник изображений: GSM...
AMD выразила уверенность в своей способности потеснить Intel даже на фоне её сотрудничества с Nvidia
Естественно, тщательно скрываемая на этапе подготовки сделка между Intel и Nvidia не могла не затрагивать интересов AMD, которая конкурирует с обеими компаниями. Представители AMD предпочли заявить, что сотрудничество Intel и Nvidia не сможет поколебать способность компании предлагать инновации и увеличивать собственную долю рынка. Источник изображения:...