- GeForce RTX 5090 Laptop, 64 ГБ ОЗУ и... (348)
- Настольная ностальгия: Sega выпустила... (457)
- У SoC MediaTek Dimensity 9600 будет кое-что... (443)
- «Голос игроков»: на сайте The Game Awards... (438)
- Samsung и Hynix не собираются заметно... (474)
- Первый iPhone SE официально признан... (359)
- Техпроцесс TSMC A16 оказался никому не нужен... (376)
- Календарь релизов 1 – 7 декабря: Metroid... (791)
- «Так не хочется, чтобы эта игра... (375)
- Дефицит DRAM ударил по Raspberry Pi 5 —... (395)
- Цельнометаллический корпус, масса менее 1... (523)
- Акции Intel подскочили на 10 % после слухов... (357)
- Microsoft признала, что ИИ-агенты... (385)
- Взлетевшие цены DDR5 обрушили продажи... (397)
- Кристаллы Сваровски, американский бренд и... (490)
- Грандиозное возвращение мастера скрытности... (704)
Из-за санкций США у китайской компании 01.ai было слишком мало видеокарт, и они обучили модель ИИ с затратами в 25-30 раз меньше, чем у OpenAI
Дата: 2024-11-14 22:40
Китайская компания 01.ai, похоже, совершила революцию в области обучения больших генеративных моделей искусственного интеллекта. По крайней мере собственные заявления этой компании указывают именно на это.
создано Gemini Кай-Фу Ли, основатель и руководитель компании, рассказал, что его компания обучила одну из своих передовых моделей искусственного интеллекта, используя всего 2000 графических процессоров и затратив всего 3 млн долларов.
Для сравнения, GPT-4, по разным данным, обучали с использованием десятков тысяч ускорителей Nvidia H100 и потратив 80-100 млн долларов, а на GPT-5 якобы уже потрачено около 1 млрд долларов.
Согласно диаграмме на сайте 01.ai, модель Yi-Lightning занимает шестое место по производительности, согласно измерениям LMSIS в Калифорнийском университете в Беркли. При этом, конечно, сравнивать современные модели можно по множеству разных параметров, так что тут пока маловато данных.
Даже если модель 01.ai и не сможет полноценно конкурировать с GPT-4, результаты всё равно впечатляют. Чтобы повысить производительность модели, 01.ai сосредоточилась на сокращении узких мест в своем процессе вывода, построив многослойную систему кэширования и разработав специализированный механизм вывода для оптимизации скорости и распределения ресурсов. В результате затраты на вывод значительно ниже, чем у аналогичных моделей — 10 центов за миллион токенов. Это примерно 1/30 от типичной цены у сопоставимых моделей конкурентов.
Что интересно, таких успехов удалось добиться фактически благодаря санкциям США, так как у компании было всего 2000 ускорителей и они не могли купить больше.
Когда у нас всего 2000 графических процессоров, команда должна выяснить, как их использовать на полную
Подробнее на iXBT
Предыдущие новости
Геосервис 2ГИС представил крупное обновление: появилась навигация на лобовом стекле и цифровой приборной панели
Компания 2ГИС провела масштабную презентацию, на которой представила новые возможности своего картографического сервиса. В числе нововведений — «Лента активности»: пользователи могут увидеть, какие места посещают их друзья и знакомые, и изучить их отзывы или фотографии. Отзывы друзей также появились в поисковой выдаче, а если отзыв написал кто-то, кого нет в друзьях, можно...
Более 50 смартфонов и планшетов Xiaomi, Redmi и Poco получат HyperOS 2 на Android 15 уже в ноябре и декабре. Полный официальный список
Xiaomi опубликовала перечень устройств, для которых выйдет HyperOS 2, еще в день премьеры Xiaomi 15 и Xiaomi 15 Pro, но тот список был актуален для китайского рынка. Сейчас же Лей Цзунь (Lei Jun) опубликовал перечень смартфонов Xiaomi, Redmi и Poco получат HyperOS 2 на Android 15 на глобальном рынке. Фото: Лей Цзунь В ноябре HyperOS 2 выйдет для следующих глобальных моделей: ...
Steam обвиняют в в том, что она не препятствует распространению нацизма и ненависти. В США
Компанию Valve обвиняют в том, что она не препятствует распространению нацизма и ненависти на игровой платформе Steam. создано DALL-E Американская организация Anti-Defamation League (ADL) обвинила Steam в том, что на платформе просто гигантское количество публикаций, так или иначе связанных с проявлением нацизма или экстремизма. Речь тут не о том, что в Steam множество игр...
Три десятилетия наблюдений за блазаром AO 0235+164: результаты исследования САО меняют понимание процессов в активных галактиках
Астрономы провели подробное исследование переменного блазара AO 0235+164, используя многоволновые данные с различных телескопов Специальной астрофизической обсерватории (САО) в России. Результаты исследования, опубликованные на сервере препринтов arXiv, предоставляют новое понимание долгосрочной изменчивости и поведения этого блазара. Блазары, такие как AO 0235+164, являются...