- Флагманский смартфон iQOO 13 поступит в... (781)
- Прожиг на отлично: успешные испытания... (457)
- Илона Маска обвиняют в том, что Starlink... (364)
- Космический грузовик SpaceX Dragon вернулся... (718)
- Раньше эти Skoda собирали в России. На... (785)
- Анимационный сериал Secret Level от авторов... (532)
- Выяснилось, где и когда появится первая... (404)
- Так снимает «первый в отрасли 100-кратный... (523)
- TSMC со дня на день начнёт выпускать чипы с... (430)
- Возвращение экипажа Starliner снова... (543)
- Это первая переднеприводная модель АвтоВАЗа.... (544)
- Илон Маск и SpaceX умолчали о «большой... (574)
- Редкий случай: китайская полупроводниковая... (405)
- «Яндекс Путешествия» запустили приложение... (556)
- УАЗ «Патриот» и УАЗ «Пикап» начнут выпускать... (514)
- Третий крупнейший производитель флеш-памяти... (514)
Cerebras бросает вызов Nvidia DGX100: миллион-ядерный супер-чип для ИИ
Дата: 2024-09-08 22:19
Компания Cerebras представила свой новый чип для обработки задач искусственного интеллекта, который позиционируется как грозный конкурент DGX100 от Nvidia. Этот чип оснащён 44 ГБ высокоскоростной памяти, что позволяет ему обрабатывать модели ИИ до триллионов параметров. Для моделей, которые превосходят ёмкость памяти одного чипа, Cerebras может распределить их по нескольким системам CS-3. Одна система CS-3 может вместить 20 миллиардов моделей параметров, а 70 миллиардов параметров моделей могут управляться всего четырьмя системами.
Целью Cerebras является предоставление высокопроизводительной платформы для разработки и развёртывания открытых моделей языкового моделирования (LLM). Для достижения этой цели компания использует 16-битные веса модели, которые обеспечивают более высокую точность по сравнению с 8-битными моделями, используемыми некоторыми конкурентами.
Источник: CerebrasПо словам Cerebras, 16-битные модели работают на 5% лучше в языковых моделях, математике и задачах рассуждения по сравнению с 8-битными моделями, обеспечивая более точные и надёжные выходные данные.
Платформа вывода Cerebras доступна через чат и API-доступ и разработана для лёгкой интеграции разработчиками, знакомыми с форматом OpenAI Chat Completions. Платформа может похвастаться возможностью запускать модели Llama3.1 70B со скоростью 450 токенов в секунду, что делает её единственным решением для достижения мгновенной скорости для таких больших моделей.
Для разработчиков Cerebras предлагает 1 миллион бесплатных токенов ежедневно при запуске и цены значительно ниже, чем в популярных облаках GPU.
Cerebras изначально запускается с моделями Llama3.1 8B и 70B, с планами добавить поддержку более крупных моделей, таких как Llama3 405B и Mistral Large 2, в ближайшем будущем. Компания подчёркивает, что возможности быстрого вывода имеют решающее значение для обеспечения более сложных рабочих процессов ИИ и улучшения «интеллекта» LLM в реальном времени, особенно в таких методах, как скаффолдинг, который требует значительного использования токенов.
Патрик Кеннеди из ServeTheHome увидел продукт в действии на недавнем симпозиуме Hot Chips 2024 и отметил: «У меня была возможность посидеть с Эндрю Фельдманом [генеральным директором Cerebras] перед выступлением, и он показал мне демонстрации вживую. Это неприлично быстро. Причина, по которой это важно, заключается не только в том, чтобы человек мог инициировать взаимодействие. Вместо этого в мире агентов, где компьютерные агенты ИИ общаются с несколькими другими компьютерными агентами ИИ — представьте себе, что каждому агенту требуются секунды, чтобы выдать результат, и в этом конвейере есть несколько шагов. Если вы думаете об автоматизированных конвейерах агентов ИИ, то вам нужен быстрый вывод, чтобы сократить время для всей цепочки».
Cerebras позиционирует свою платформу как установку нового стандарта в разработке и развёртывании открытых LLM, предлагая рекордную производительность, конкурентоспособные цены и широкий доступ к API.
Подробнее на iXBT
Предыдущие новости
«Буханка» больше не нужна? Рассекречен совершенно новый полноприводный ГАЗ «Соболь NN» в экспедиционной версии: силовые бамперы, дополнительный свет и 200 тыс. км гарантии
На сайте группы компаний «Современные транспортные технологии» появилась страничка с описанием совершенно нового ГАЗ «Соболь NN 4х4». Там перечислены ключевые особенности машины и приводятся официальные цены на две версии машины — цельнометаллический фургон и семиместное исполнение «Комби». Цены, соответственно, 3,615 млн рублей и 3,74 млн рублей. Фото: Группа ГАЗ/Современные...
Электроны без трения: новое открытие в физике конденсированного состояния
Физики из Массачусетского технологического института (MIT) сделали важное открытие в области физики конденсированного состояния. Они наблюдали за так называемыми краевыми состояниями в облаке ультрахолодных атомов. Краевые состояния представляют собой редкое явление, при котором электроны могут течь без трения вдоль границы материала. «Можно представить себе создание небольших...
NASA отменило запуск спутников на Марс из-за проблем с ракетой New Glenn компании Blue Origin
NASA отменило запуск двух малых спутников на Марс в ходе первого полёта ракеты New Glenn компании Blue Origin в октябре из-за опасений, что ракета может не быть готова вовремя. Агентство приняло решение остановить предпусковую подготовку двух малых спутников Escape и Plasma Acceleration and Dynamics Explorers (ESCAPADE) 6 сентября. Космические аппараты должны были быть...
Новое открытие в области экзопланет: суперземля L98-59 d имеет атмосферу, богатую серой
Используя космический телескоп «Джеймс Уэбб» (JWST), астрономы из Научного института космического телескопа (STScI) в Балтиморе (штат Мэриленд) провели трансмиссионную спектроскопию близлежащей суперземли, известной как L98-59 d. Результаты этих наблюдений, доступные в исследовательской статье, опубликованной на сервере препринтов arXiv, предполагают, что у планеты богатая...