- Apple упростила поиск потерянных гаджетов и... (552)
- «Такими темпами дай бог штук 800 произвести... (492)
- Переосмысление данных Voyager 2 дало ответ... (568)
- SpaceX повторила рекорд повторного... (547)
- Полноприводный Chery Tiggo 8 Pro российского... (583)
- На блоке №1 АЭС «Аккую» забетонировали купол... (579)
- «Имеет все шансы оказаться официально... (563)
- Приключение зовёт: Bethesda показала 14... (547)
- Pizza Hut превратила PlayStation 5 в... (532)
- Приложение ИИ-чат-бота Google Gemini... (570)
- Календарь релизов 11 – 17 ноября: Lego... (550)
- Дефицит Ryzen 7 9800X3D может затянуться —... (572)
- Победа Трампа запустила бурный рост акций... (567)
- Bitcoin за день установил несколько... (587)
- Издатель PUBG подтвердил, что Inzoi получит... (702)
- X откроет доступ к ИИ-чат-боту Grok для... (683)
Из-за санкций США у китайской компании 01.ai было слишком мало видеокарт, и они обучили модель ИИ с затратами в 25-30 раз меньше, чем у OpenAI
Дата: 2024-11-14 22:40
Китайская компания 01.ai, похоже, совершила революцию в области обучения больших генеративных моделей искусственного интеллекта. По крайней мере собственные заявления этой компании указывают именно на это.
создано GeminiКай-Фу Ли, основатель и руководитель компании, рассказал, что его компания обучила одну из своих передовых моделей искусственного интеллекта, используя всего 2000 графических процессоров и затратив всего 3 млн долларов.
Для сравнения, GPT-4, по разным данным, обучали с использованием десятков тысяч ускорителей Nvidia H100 и потратив 80-100 млн долларов, а на GPT-5 якобы уже потрачено около 1 млрд долларов.
Согласно диаграмме на сайте 01.ai, модель Yi-Lightning занимает шестое место по производительности, согласно измерениям LMSIS в Калифорнийском университете в Беркли. При этом, конечно, сравнивать современные модели можно по множеству разных параметров, так что тут пока маловато данных.
Даже если модель 01.ai и не сможет полноценно конкурировать с GPT-4, результаты всё равно впечатляют. Чтобы повысить производительность модели, 01.ai сосредоточилась на сокращении узких мест в своем процессе вывода, построив многослойную систему кэширования и разработав специализированный механизм вывода для оптимизации скорости и распределения ресурсов. В результате затраты на вывод значительно ниже, чем у аналогичных моделей — 10 центов за миллион токенов. Это примерно 1/30 от типичной цены у сопоставимых моделей конкурентов.
Что интересно, таких успехов удалось добиться фактически благодаря санкциям США, так как у компании было всего 2000 ускорителей и они не могли купить больше.
Когда у нас всего 2000 графических процессоров, команда должна выяснить, как их использовать на полную
Подробнее на iXBT
Предыдущие новости
Геосервис 2ГИС представил крупное обновление: появилась навигация на лобовом стекле и цифровой приборной панели
Компания 2ГИС провела масштабную презентацию, на которой представила новые возможности своего картографического сервиса. В числе нововведений — «Лента активности»: пользователи могут увидеть, какие места посещают их друзья и знакомые, и изучить их отзывы или фотографии. Отзывы друзей также появились в поисковой выдаче, а если отзыв написал кто-то, кого нет в друзьях, можно...
Более 50 смартфонов и планшетов Xiaomi, Redmi и Poco получат HyperOS 2 на Android 15 уже в ноябре и декабре. Полный официальный список
Xiaomi опубликовала перечень устройств, для которых выйдет HyperOS 2, еще в день премьеры Xiaomi 15 и Xiaomi 15 Pro, но тот список был актуален для китайского рынка. Сейчас же Лей Цзунь (Lei Jun) опубликовал перечень смартфонов Xiaomi, Redmi и Poco получат HyperOS 2 на Android 15 на глобальном рынке. Фото: Лей Цзунь В ноябре HyperOS 2 выйдет для следующих глобальных моделей: ...
Steam обвиняют в в том, что она не препятствует распространению нацизма и ненависти. В США
Компанию Valve обвиняют в том, что она не препятствует распространению нацизма и ненависти на игровой платформе Steam. создано DALL-E Американская организация Anti-Defamation League (ADL) обвинила Steam в том, что на платформе просто гигантское количество публикаций, так или иначе связанных с проявлением нацизма или экстремизма. Речь тут не о том, что в Steam множество игр...
Три десятилетия наблюдений за блазаром AO 0235+164: результаты исследования САО меняют понимание процессов в активных галактиках
Астрономы провели подробное исследование переменного блазара AO 0235+164, используя многоволновые данные с различных телескопов Специальной астрофизической обсерватории (САО) в России. Результаты исследования, опубликованные на сервере препринтов arXiv, предоставляют новое понимание долгосрочной изменчивости и поведения этого блазара. Блазары, такие как AO 0235+164, являются...