Добро пожаловать на форум PHP программистов!
За последние 24 часа нас посетили 76054 программиста и 2998 роботов. Сейчас ищут 1405 программистов ...
Последние
Популярные

Обучение модели DeepSeek R1 обошлось в сотни раз дешевле, чем обучение базовых моделей OpenAI: названа точная сумма

Дата: сегодня 08:04

Китайский разработчик DeepSeek заявил, что потратил 294 000 долларов на обучение своей модели R1, что значительно меньше показателей, озвученных американскими конкурентами. 

В начале года DeepSeek произвела фурор со своей новой моделью, с тех пор компания и ее основатель Лян Вэньфэн практически исчезли из поля зрения общественности, за исключением нескольких обновлений. В статье в журнале Nature, где Лян указан в качестве одного из соавторов, говорится, что обучение модели DeepSeek R1, ориентированной на рассуждения, обошлось в 294 000 долларов, для чего было использовано 512 процессоров Nvidia H800. Они были разработаны компанией Nvidia для китайского рынка после того, как в октябре 2022 года США запретили компании экспортировать в Китай более мощные ИИ-чипы H100 и A100.

Сэм Альтман, генеральный директор американского гиганта искусственного интеллекта OpenAI, заявил в 2023 году, что обучение базовых моделей обошлось «гораздо дороже» 100 миллионов долларов, хотя его компания не предоставила подробных данных ни по одному из своих релизов.

Некоторые заявления DeepSeek о расходах на разработку и использованных технологиях подверглись сомнению со стороны американских компаний и официальных лиц.

Изображение Midjourney

В июне американские официальные лица сообщили агентству Reuters, что DeepSeek имеет доступ к «большим объёмам» чипов H100, закупленных после введения экспортного контроля США. В то же время Nvidia сообщила агентству Reuters, что DeepSeek использовала законно приобретённые процессоры H800, а не H100.

Теперь же компания впервые признала, что владеет процессорами A100, и сообщила, что использовала их на подготовительных этапах разработки.

«Что касается нашего исследования DeepSeek-R1, мы использовали графические процессоры A100 для подготовки к экспериментам с меньшей моделью», — написали исследователи. После этого начального этапа R1 обучался в общей сложности 80 часов на кластере из 512 чипов H800, добавили они.

Ранее агентство Reuters сообщало, что одной из причин, по которой DeepSeek удалось привлечь самые яркие умы Китая, стало то, что она была одной из немногих китайских компаний, эксплуатировавших суперкомпьютерный кластер с процессорами A100.

DeepSeek готовится к запуску ИИ-агента нового поколения к концу 2025 года. Компания из Ханчжоу разрабатывает систему, способную выполнять сложные многоэтапные задачи с минимальным участием пользователя. Модель также будет обучаться на основе своих прошлых действий, чтобы со временем повысить свою производительность. Компания также теперь добавляет обязательные метки контента, генерируемые ИИ.



Подробнее на iXBT
 

Предыдущие новости

3Dnews.ru, сегодня 10:30
Oracle стремительно становится техногигантом: на переговорном столе — сделка с M**a на $20 млрд

Oracle вступила в переговоры с M**a на предмет сделки в сфере облачных вычислений на сумму около $20 млрд, сообщает Bloomberg со ссылкой на информированные источники. Это свидетельствует, что компания стала крупным поставщиком услуг облачной инфраструктуры. В рамках многолетнего соглашения Oracle обеспечит гиганта соцсетей вычислительными мощностями для обучения и...

3Dnews.ru, 2025-09-19 09:58
Intel не забросит выпуск видеокарт Arc после сделки с Nvidia, а также не откажется от выпуска намеченных процессоров

Описывая условия сделки, в рамках которой Nvidia вложит $5 млрд в Intel и будет совместно с ней разрабатывать центральные процессоры, её участники изначально не касались темы дискретной графики, а ведь в своё время Intel вложила немало ресурсов ради возвращения в этот сегмент рынка. После сделки с Nvidia она от своих амбиций на рынке дискретной графики отказываться не...

3Dnews.ru, сегодня 09:07
Samsung представила смартфон Galaxy A17 4G — чип Helio G99, батарея на 5000 мА·ч и цена от €199

Компания Samsung официально представила смартфон Galaxy A17 4G, который в плане технических характеристик во многом повторяет Galaxy A17 5G. Новинка уже доступна в некоторых странах европейского региона по цене от €199. Источник изображений: GSM...

3Dnews.ru, сегодня 09:28
AMD выразила уверенность в своей способности потеснить Intel даже на фоне её сотрудничества с Nvidia

Естественно, тщательно скрываемая на этапе подготовки сделка между Intel и Nvidia не могла не затрагивать интересов AMD, которая конкурирует с обеими компаниями. Представители AMD предпочли заявить, что сотрудничество Intel и Nvidia не сможет поколебать способность компании предлагать инновации и увеличивать собственную долю рынка. Источник изображения:...

© 2025 «PHP.RU — Сообщество PHP-Программистов»
Главная | Форум | Реклама на сайте | Контакты VIP Сувениры
Разработка компании ODware