- Toyota предлагает 40 лет на одном... (1018)
- Живой Илон Маск или обманка? В Wildberries... (1067)
- Foxconn и Nvidia запускают фабрику будущего... (1042)
- Это крошечный поезд, который ездит прямо по... (969)
- От громоздких систем к прибору «на ладони»:... (1514)
- «Магический угол» в действии: физики увидели... (1381)
- Энтузиаст превратил 500 вейпов в... (964)
- Micron задержит строительство мегафабрик... (1607)
- Чудовищно огромные и сложные GPU Nvidia Vera... (940)
- Один из уволенных Intel сотрудников решил... (944)
- «Ведомости»: российские операторы связи... (1513)
- «Ведомости»: операторы связи в России будут... (860)
- Apple разрабатывает собственный... (1022)
- Dynamic Island уйдёт в историю, а на экране... (927)
- Как будто курил не владелец ПК, а сама... (841)
- Готовый ПК Corsair сломал три Core i9-14900K... (1551)
Из-за санкций США у китайской компании 01.ai было слишком мало видеокарт, и они обучили модель ИИ с затратами в 25-30 раз меньше, чем у OpenAI
Дата: 2024-11-14 22:40
Китайская компания 01.ai, похоже, совершила революцию в области обучения больших генеративных моделей искусственного интеллекта. По крайней мере собственные заявления этой компании указывают именно на это.
создано Gemini Кай-Фу Ли, основатель и руководитель компании, рассказал, что его компания обучила одну из своих передовых моделей искусственного интеллекта, используя всего 2000 графических процессоров и затратив всего 3 млн долларов.
Для сравнения, GPT-4, по разным данным, обучали с использованием десятков тысяч ускорителей Nvidia H100 и потратив 80-100 млн долларов, а на GPT-5 якобы уже потрачено около 1 млрд долларов.
Согласно диаграмме на сайте 01.ai, модель Yi-Lightning занимает шестое место по производительности, согласно измерениям LMSIS в Калифорнийском университете в Беркли. При этом, конечно, сравнивать современные модели можно по множеству разных параметров, так что тут пока маловато данных.
Даже если модель 01.ai и не сможет полноценно конкурировать с GPT-4, результаты всё равно впечатляют. Чтобы повысить производительность модели, 01.ai сосредоточилась на сокращении узких мест в своем процессе вывода, построив многослойную систему кэширования и разработав специализированный механизм вывода для оптимизации скорости и распределения ресурсов. В результате затраты на вывод значительно ниже, чем у аналогичных моделей — 10 центов за миллион токенов. Это примерно 1/30 от типичной цены у сопоставимых моделей конкурентов.
Что интересно, таких успехов удалось добиться фактически благодаря санкциям США, так как у компании было всего 2000 ускорителей и они не могли купить больше.
Когда у нас всего 2000 графических процессоров, команда должна выяснить, как их использовать на полную
Подробнее на iXBT
Предыдущие новости
Геосервис 2ГИС представил крупное обновление: появилась навигация на лобовом стекле и цифровой приборной панели
Компания 2ГИС провела масштабную презентацию, на которой представила новые возможности своего картографического сервиса. В числе нововведений — «Лента активности»: пользователи могут увидеть, какие места посещают их друзья и знакомые, и изучить их отзывы или фотографии. Отзывы друзей также появились в поисковой выдаче, а если отзыв написал кто-то, кого нет в друзьях, можно...
Более 50 смартфонов и планшетов Xiaomi, Redmi и Poco получат HyperOS 2 на Android 15 уже в ноябре и декабре. Полный официальный список
Xiaomi опубликовала перечень устройств, для которых выйдет HyperOS 2, еще в день премьеры Xiaomi 15 и Xiaomi 15 Pro, но тот список был актуален для китайского рынка. Сейчас же Лей Цзунь (Lei Jun) опубликовал перечень смартфонов Xiaomi, Redmi и Poco получат HyperOS 2 на Android 15 на глобальном рынке. Фото: Лей Цзунь В ноябре HyperOS 2 выйдет для следующих глобальных моделей: ...
Steam обвиняют в в том, что она не препятствует распространению нацизма и ненависти. В США
Компанию Valve обвиняют в том, что она не препятствует распространению нацизма и ненависти на игровой платформе Steam. создано DALL-E Американская организация Anti-Defamation League (ADL) обвинила Steam в том, что на платформе просто гигантское количество публикаций, так или иначе связанных с проявлением нацизма или экстремизма. Речь тут не о том, что в Steam множество игр...
Три десятилетия наблюдений за блазаром AO 0235+164: результаты исследования САО меняют понимание процессов в активных галактиках
Астрономы провели подробное исследование переменного блазара AO 0235+164, используя многоволновые данные с различных телескопов Специальной астрофизической обсерватории (САО) в России. Результаты исследования, опубликованные на сервере препринтов arXiv, предоставляют новое понимание долгосрочной изменчивости и поведения этого блазара. Блазары, такие как AO 0235+164, являются...