- Тодд Говард объяснил, почему Bethesda не... (4765)
- Tesla вот-вот выпустит для всех прорывной... (7105)
- Tesla вот-вот выпустит для всех прорывной... (5013)
- Космический грузовик «Прогресс МС-33»... (6233)
- 200, 200, 50 и 50 Мп, 7050 мАч, 100 Вт и... (5951)
- Смартфоны серии Honor Magic 9 получит разные... (5185)
- Выпуск DDR5 стал прибыльнее HBM для всех... (4711)
- 16 ГБ оперативной памяти, которые ощущаются... (5223)
- Samsung уже разрабатывает HBM5 — в ней будут... (5472)
- Первый смартфон Huawei с активным... (5284)
- Экран 165 Гц, аккумулятор емкостью 9000 мАч... (5430)
- Doogee S300 Plus — сверхпрочный смартфон на... (4475)
- Плохие новости для США и Европы. Инсайдер... (6685)
- «Ждал этого пять лет»: ролевой экшен... (5027)
- Зафиксирован всплеск жалоб на работу... (4907)
- Китай усиливает навигацию: на орбиту... (4933)
Nvidia утверждает, что её ИИ-платформа Blackwell позволила клиентам снизить затраты на ИИ в 10 раз
Дата: 2026-02-14 16:01
Компания Nvidia рассказала, что её разработки уже позволили ведущим поставщикам решений для машинного обучения сократить затраты на ИИ до 10 раз. Это стало возможным благодаря моделям с открытым исходным кодом на платформе Blackwell.
Речь в данном случае о токеномике и снижении на порядок именно стоимости одного токена. Nvidia объясняет это так:
Если станок производит в 10 раз больше продукции при дополнительных инвестициях в чернила, энергию и сам станок, стоимость печати каждой отдельной страницы снижается. Точно так же инвестиции в инфраструктуру искусственного интеллекта могут привести к значительному увеличению выпуска токенов по сравнению с ростом затрат, что приведет к существенному снижению стоимости одного токена
Фото Nvidia В ходе обсуждения токеномики Nvidia упомянула такие организации, как Baseten и Sully.ai, а также ориентированные на игры DeepInfra и Latitude. Для каждой из этих компаний архитектура Blackwell позволила добиться меньшей задержки, оптимальных затрат на вывод и надежных ответов, поэтому этот технологический стек сегодня является предпочтительным вариантом для компаний, занимающихся разработкой ИИ.
Компания говорит, что с помощью ускорителей Vera Rubin она планирует вывести эффективность инфраструктуры на совершенно новый уровень, используя достижения в архитектуре, специализированные механизмы, такие как CPX для предварительного заполнения, и многое другое.
Подробнее на iXBT
Предыдущие новости
Астрономы впервые проследили, как звезда без взрыва превратилась в чёрную дыру
Астрономы зафиксировали самый полный на сегодняшний день набор наблюдений того, как массивная звезда завершила свою жизнь, не взорвавшись сверхновой, а напрямую превратившись в чёрную дыру. Вместо мощной вспышки её ядро коллапсировало, а внешние слои медленно рассеялись. Объект исследования — звезда M31-2014-DS1 в соседней галактике Андромеды, расположенной примерно в 2,5...
Анализ 10 рынков показал, что видеокарты GeForce RTX 50 подорожали почти вдвое сильнее, чем Radeon RX 9000
Авторы Hardware Unboxed решили плотнее изучить вопрос удорожания видеокарт за последние два месяца и провели анализ цен на все актуальные модели, причём не в каком-то одном регионе, а сразу в десяти: США, Австралии, Германии, Великобритании, Канаде, Индии, Филиппинах, Бразилии, Польши и Нидерландах. Это даёт намного более полную картину того, что происходит с ценами. ...
Samsung анонсировала то, что на рынке уже два года? MSI говорит, что использует панели QD-OLED Penta-Tandem ещё с 2024 года
Компания Samsung пару дней назад представила технологию QD-OLED Penta-Tandem, отметив, что некоторые соответствующие устройства уже продаются. А теперь MSI сообщает, что на самом деле она уже давно продаёт немало моделей мониторов с такими панелями. К примеру, модель MAG 341CQP опирается именно на такую панель, при этом анонсирован этот монитор был ещё два года назад. Фото...
ByteDance представила Doubao 2.0 — самый популярный ИИ-бот Китая стал мощнее и подготовился к «эре агентов»
Китайская компания ByteDance, разработчик видеосервиса TikTok, представила обновлённую версию чат-бота Doubao 2.0 — самого популярного в стране приложения на базе искусственного интеллекта. Doubao 2.0 позиционируется как решение для «эры ИИ-агентов», когда модели будут способны самостоятельно выполнять сложные задачи, а не только отвечать на вопросы. Источник изображения:...