- Испанский суд оштрафовал M**a на €479 млн —... (897)
- Глава AMD заявила, что недальновидно бояться... (869)
- «Сбер» представил «Грина» —... (1019)
- Осколки зелёного болида, замеченного в небе... (1445)
- Воксельный вестерн Erosion отправит игроков... (1015)
- Perplexity выпустила ИИ-браузер Comet для... (896)
- Nvidia на крючке: 61 % выручки компании... (1361)
- Назван самый популярный бренд смартфонов... (1236)
- У Джеффа Безоса появится своя лунная ракета... (1359)
- «Это слухи и домыслы»: Тан отверг... (1206)
- Отечественная ОС «Аврора» получила большое... (848)
- «Одна из самых безумных битв с боссом, что я... (924)
- Представлены телевизоры Sber 7000 с... (1061)
- Samsung Electronics снова провела... (1110)
- «Сбер» представил ИИ-модели Kandinsky 5.0... (983)
- Owlcat рассказала о проработке космоса в The... (1026)
Из-за санкций США у китайской компании 01.ai было слишком мало видеокарт, и они обучили модель ИИ с затратами в 25-30 раз меньше, чем у OpenAI
Дата: 2024-11-14 22:40
Китайская компания 01.ai, похоже, совершила революцию в области обучения больших генеративных моделей искусственного интеллекта. По крайней мере собственные заявления этой компании указывают именно на это.
создано Gemini Кай-Фу Ли, основатель и руководитель компании, рассказал, что его компания обучила одну из своих передовых моделей искусственного интеллекта, используя всего 2000 графических процессоров и затратив всего 3 млн долларов.
Для сравнения, GPT-4, по разным данным, обучали с использованием десятков тысяч ускорителей Nvidia H100 и потратив 80-100 млн долларов, а на GPT-5 якобы уже потрачено около 1 млрд долларов.
Согласно диаграмме на сайте 01.ai, модель Yi-Lightning занимает шестое место по производительности, согласно измерениям LMSIS в Калифорнийском университете в Беркли. При этом, конечно, сравнивать современные модели можно по множеству разных параметров, так что тут пока маловато данных.
Даже если модель 01.ai и не сможет полноценно конкурировать с GPT-4, результаты всё равно впечатляют. Чтобы повысить производительность модели, 01.ai сосредоточилась на сокращении узких мест в своем процессе вывода, построив многослойную систему кэширования и разработав специализированный механизм вывода для оптимизации скорости и распределения ресурсов. В результате затраты на вывод значительно ниже, чем у аналогичных моделей — 10 центов за миллион токенов. Это примерно 1/30 от типичной цены у сопоставимых моделей конкурентов.
Что интересно, таких успехов удалось добиться фактически благодаря санкциям США, так как у компании было всего 2000 ускорителей и они не могли купить больше.
Когда у нас всего 2000 графических процессоров, команда должна выяснить, как их использовать на полную
Подробнее на iXBT
Предыдущие новости
Геосервис 2ГИС представил крупное обновление: появилась навигация на лобовом стекле и цифровой приборной панели
Компания 2ГИС провела масштабную презентацию, на которой представила новые возможности своего картографического сервиса. В числе нововведений — «Лента активности»: пользователи могут увидеть, какие места посещают их друзья и знакомые, и изучить их отзывы или фотографии. Отзывы друзей также появились в поисковой выдаче, а если отзыв написал кто-то, кого нет в друзьях, можно...
Более 50 смартфонов и планшетов Xiaomi, Redmi и Poco получат HyperOS 2 на Android 15 уже в ноябре и декабре. Полный официальный список
Xiaomi опубликовала перечень устройств, для которых выйдет HyperOS 2, еще в день премьеры Xiaomi 15 и Xiaomi 15 Pro, но тот список был актуален для китайского рынка. Сейчас же Лей Цзунь (Lei Jun) опубликовал перечень смартфонов Xiaomi, Redmi и Poco получат HyperOS 2 на Android 15 на глобальном рынке. Фото: Лей Цзунь В ноябре HyperOS 2 выйдет для следующих глобальных моделей: ...
Steam обвиняют в в том, что она не препятствует распространению нацизма и ненависти. В США
Компанию Valve обвиняют в том, что она не препятствует распространению нацизма и ненависти на игровой платформе Steam. создано DALL-E Американская организация Anti-Defamation League (ADL) обвинила Steam в том, что на платформе просто гигантское количество публикаций, так или иначе связанных с проявлением нацизма или экстремизма. Речь тут не о том, что в Steam множество игр...
Три десятилетия наблюдений за блазаром AO 0235+164: результаты исследования САО меняют понимание процессов в активных галактиках
Астрономы провели подробное исследование переменного блазара AO 0235+164, используя многоволновые данные с различных телескопов Специальной астрофизической обсерватории (САО) в России. Результаты исследования, опубликованные на сервере препринтов arXiv, предоставляют новое понимание долгосрочной изменчивости и поведения этого блазара. Блазары, такие как AO 0235+164, являются...