- Ещё один Ryzen 7 9800X3D умер на системной... (494)
- США добились своего: заключено соглашение с... (343)
- Власти США признали парниковые газы... (339)
- У NASA снова испортилась лунная ракета SLS —... (331)
- Голливуд вовсю осваивает ИИ: растёт число... (373)
- «Карманный» стартап Amazon получил лицензию... (535)
- На Луне нашли «экзотическое» железо из... (523)
- Обеспеченные россияне предпочитают Bentley... (596)
- 7 лет обновлений, 5100 мАч, IP68 и... (667)
- Honda CBR и Jawa 350 — самые популярные в... (522)
- Глобальный Honor Magic7 Pro наконец-то... (659)
- Совсем не мощный, но зато с аккумулятором... (585)
- «Золотая» память диктует новые цены: Acer... (559)
- Современный Android-смартфон с полноценной... (756)
- Сердце в небе: Mira A выбросила гигантские... (781)
- Одни отказываются от выпуска электромобилей,... (814)
Nvidia утверждает, что её ИИ-платформа Blackwell позволила клиентам снизить затраты на ИИ в 10 раз
Дата: сегодня 16:01
Компания Nvidia рассказала, что её разработки уже позволили ведущим поставщикам решений для машинного обучения сократить затраты на ИИ до 10 раз. Это стало возможным благодаря моделям с открытым исходным кодом на платформе Blackwell.
Речь в данном случае о токеномике и снижении на порядок именно стоимости одного токена. Nvidia объясняет это так:
Если станок производит в 10 раз больше продукции при дополнительных инвестициях в чернила, энергию и сам станок, стоимость печати каждой отдельной страницы снижается. Точно так же инвестиции в инфраструктуру искусственного интеллекта могут привести к значительному увеличению выпуска токенов по сравнению с ростом затрат, что приведет к существенному снижению стоимости одного токена
Фото Nvidia В ходе обсуждения токеномики Nvidia упомянула такие организации, как Baseten и Sully.ai, а также ориентированные на игры DeepInfra и Latitude. Для каждой из этих компаний архитектура Blackwell позволила добиться меньшей задержки, оптимальных затрат на вывод и надежных ответов, поэтому этот технологический стек сегодня является предпочтительным вариантом для компаний, занимающихся разработкой ИИ.
Компания говорит, что с помощью ускорителей Vera Rubin она планирует вывести эффективность инфраструктуры на совершенно новый уровень, используя достижения в архитектуре, специализированные механизмы, такие как CPX для предварительного заполнения, и многое другое.
Подробнее на iXBT
Предыдущие новости
Астрономы впервые проследили, как звезда без взрыва превратилась в чёрную дыру
Астрономы зафиксировали самый полный на сегодняшний день набор наблюдений того, как массивная звезда завершила свою жизнь, не взорвавшись сверхновой, а напрямую превратившись в чёрную дыру. Вместо мощной вспышки её ядро коллапсировало, а внешние слои медленно рассеялись. Объект исследования — звезда M31-2014-DS1 в соседней галактике Андромеды, расположенной примерно в 2,5...
Анализ 10 рынков показал, что видеокарты GeForce RTX 50 подорожали почти вдвое сильнее, чем Radeon RX 9000
Авторы Hardware Unboxed решили плотнее изучить вопрос удорожания видеокарт за последние два месяца и провели анализ цен на все актуальные модели, причём не в каком-то одном регионе, а сразу в десяти: США, Австралии, Германии, Великобритании, Канаде, Индии, Филиппинах, Бразилии, Польши и Нидерландах. Это даёт намного более полную картину того, что происходит с ценами. ...
Samsung анонсировала то, что на рынке уже два года? MSI говорит, что использует панели QD-OLED Penta-Tandem ещё с 2024 года
Компания Samsung пару дней назад представила технологию QD-OLED Penta-Tandem, отметив, что некоторые соответствующие устройства уже продаются. А теперь MSI сообщает, что на самом деле она уже давно продаёт немало моделей мониторов с такими панелями. К примеру, модель MAG 341CQP опирается именно на такую панель, при этом анонсирован этот монитор был ещё два года назад. Фото...
ByteDance представила Doubao 2.0 — самый популярный ИИ-бот Китая стал мощнее и подготовился к «эре агентов»
Китайская компания ByteDance, разработчик видеосервиса TikTok, представила обновлённую версию чат-бота Doubao 2.0 — самого популярного в стране приложения на базе искусственного интеллекта. Doubao 2.0 позиционируется как решение для «эры ИИ-агентов», когда модели будут способны самостоятельно выполнять сложные задачи, а не только отвечать на вопросы. Источник изображения:...