- После запуска ракеты «Союз МС-28» на... (1215)
- Apple обвиняют в плагиате: компания отменила... (1023)
- Остался месяц: госорганы в России переводят... (1453)
- Так дальше продолжаться не может:... (1486)
- Видео по текстовому запросу, улучшенный... (1281)
- Grok Илона Маска стал ещё лучше: видео по... (1457)
- Строительство новых российских спутников... (1130)
- SpaceX поджигает тепловой щит Starship на... (1214)
- Крупные производители ПК нагнетают: ИИ-бум... (1331)
- Рост цен на память на фоне бума ИИ... (1411)
- Представлен самый внедорожный Mitsubishi... (1614)
- Роботы Fanuc и Yaskawa, 760 граммов воска и... (1812)
- Тайваньские следователи обыскали дома... (1460)
- Как построить 5000-ваттный GPU будущего —... (1490)
- Аккумулятор больше 8000 мАч, 100 Вт, 165 Гц,... (1956)
- Аккумулятор больше 8000 мАч, 100 Вт, 165,... (1086)
Из-за санкций США у китайской компании 01.ai было слишком мало видеокарт, и они обучили модель ИИ с затратами в 25-30 раз меньше, чем у OpenAI
Дата: 2024-11-14 22:40
Китайская компания 01.ai, похоже, совершила революцию в области обучения больших генеративных моделей искусственного интеллекта. По крайней мере собственные заявления этой компании указывают именно на это.
создано Gemini Кай-Фу Ли, основатель и руководитель компании, рассказал, что его компания обучила одну из своих передовых моделей искусственного интеллекта, используя всего 2000 графических процессоров и затратив всего 3 млн долларов.
Для сравнения, GPT-4, по разным данным, обучали с использованием десятков тысяч ускорителей Nvidia H100 и потратив 80-100 млн долларов, а на GPT-5 якобы уже потрачено около 1 млрд долларов.
Согласно диаграмме на сайте 01.ai, модель Yi-Lightning занимает шестое место по производительности, согласно измерениям LMSIS в Калифорнийском университете в Беркли. При этом, конечно, сравнивать современные модели можно по множеству разных параметров, так что тут пока маловато данных.
Даже если модель 01.ai и не сможет полноценно конкурировать с GPT-4, результаты всё равно впечатляют. Чтобы повысить производительность модели, 01.ai сосредоточилась на сокращении узких мест в своем процессе вывода, построив многослойную систему кэширования и разработав специализированный механизм вывода для оптимизации скорости и распределения ресурсов. В результате затраты на вывод значительно ниже, чем у аналогичных моделей — 10 центов за миллион токенов. Это примерно 1/30 от типичной цены у сопоставимых моделей конкурентов.
Что интересно, таких успехов удалось добиться фактически благодаря санкциям США, так как у компании было всего 2000 ускорителей и они не могли купить больше.
Когда у нас всего 2000 графических процессоров, команда должна выяснить, как их использовать на полную
Подробнее на iXBT
Предыдущие новости
Геосервис 2ГИС представил крупное обновление: появилась навигация на лобовом стекле и цифровой приборной панели
Компания 2ГИС провела масштабную презентацию, на которой представила новые возможности своего картографического сервиса. В числе нововведений — «Лента активности»: пользователи могут увидеть, какие места посещают их друзья и знакомые, и изучить их отзывы или фотографии. Отзывы друзей также появились в поисковой выдаче, а если отзыв написал кто-то, кого нет в друзьях, можно...
Более 50 смартфонов и планшетов Xiaomi, Redmi и Poco получат HyperOS 2 на Android 15 уже в ноябре и декабре. Полный официальный список
Xiaomi опубликовала перечень устройств, для которых выйдет HyperOS 2, еще в день премьеры Xiaomi 15 и Xiaomi 15 Pro, но тот список был актуален для китайского рынка. Сейчас же Лей Цзунь (Lei Jun) опубликовал перечень смартфонов Xiaomi, Redmi и Poco получат HyperOS 2 на Android 15 на глобальном рынке. Фото: Лей Цзунь В ноябре HyperOS 2 выйдет для следующих глобальных моделей: ...
Steam обвиняют в в том, что она не препятствует распространению нацизма и ненависти. В США
Компанию Valve обвиняют в том, что она не препятствует распространению нацизма и ненависти на игровой платформе Steam. создано DALL-E Американская организация Anti-Defamation League (ADL) обвинила Steam в том, что на платформе просто гигантское количество публикаций, так или иначе связанных с проявлением нацизма или экстремизма. Речь тут не о том, что в Steam множество игр...
Три десятилетия наблюдений за блазаром AO 0235+164: результаты исследования САО меняют понимание процессов в активных галактиках
Астрономы провели подробное исследование переменного блазара AO 0235+164, используя многоволновые данные с различных телескопов Специальной астрофизической обсерватории (САО) в России. Результаты исследования, опубликованные на сервере препринтов arXiv, предоставляют новое понимание долгосрочной изменчивости и поведения этого блазара. Блазары, такие как AO 0235+164, являются...