- Новому главе Apple Джону Тернусу придётся... (1504)
- «Яндекс» нарастил выручку, прибыль и... (1548)
- ChatGPT Plus потеряет 80 % подписчиков в... (2129)
- От GTX 1070 до RTX 5090: ролевая игра The... (1641)
- TSMC избавилась от акций Arm на сумму $231... (2211)
- Ubuntu 26.10 получит встроенные... (2029)
- Framework оценила мобильную GeForce RTX 5070... (2072)
- Apple и Google активно интересуются услугами... (1587)
- Выручка Seagate в прошлом квартале взлетела... (2757)
- ЕС обязал производителей ноутбуков перейти... (1899)
- Илон Маск выступил в суде против Альтмана и... (2356)
- Власти США заблокировали поставки... (1745)
- Новая статья: Обзор Infinix NOTE 60:... (2234)
- Новая статья: Обзор DIGMA DiCam 970:... (2661)
- Corsair выпустила кабель питания для... (2858)
- «Такой мы её и запомнили»: художник... (2048)
Nvidia утверждает, что её ИИ-платформа Blackwell позволила клиентам снизить затраты на ИИ в 10 раз
Дата: 2026-02-14 16:01
Компания Nvidia рассказала, что её разработки уже позволили ведущим поставщикам решений для машинного обучения сократить затраты на ИИ до 10 раз. Это стало возможным благодаря моделям с открытым исходным кодом на платформе Blackwell.
Речь в данном случае о токеномике и снижении на порядок именно стоимости одного токена. Nvidia объясняет это так:
Если станок производит в 10 раз больше продукции при дополнительных инвестициях в чернила, энергию и сам станок, стоимость печати каждой отдельной страницы снижается. Точно так же инвестиции в инфраструктуру искусственного интеллекта могут привести к значительному увеличению выпуска токенов по сравнению с ростом затрат, что приведет к существенному снижению стоимости одного токена
Фото Nvidia В ходе обсуждения токеномики Nvidia упомянула такие организации, как Baseten и Sully.ai, а также ориентированные на игры DeepInfra и Latitude. Для каждой из этих компаний архитектура Blackwell позволила добиться меньшей задержки, оптимальных затрат на вывод и надежных ответов, поэтому этот технологический стек сегодня является предпочтительным вариантом для компаний, занимающихся разработкой ИИ.
Компания говорит, что с помощью ускорителей Vera Rubin она планирует вывести эффективность инфраструктуры на совершенно новый уровень, используя достижения в архитектуре, специализированные механизмы, такие как CPX для предварительного заполнения, и многое другое.
Подробнее на iXBT
Предыдущие новости
Астрономы впервые проследили, как звезда без взрыва превратилась в чёрную дыру
Астрономы зафиксировали самый полный на сегодняшний день набор наблюдений того, как массивная звезда завершила свою жизнь, не взорвавшись сверхновой, а напрямую превратившись в чёрную дыру. Вместо мощной вспышки её ядро коллапсировало, а внешние слои медленно рассеялись. Объект исследования — звезда M31-2014-DS1 в соседней галактике Андромеды, расположенной примерно в 2,5...
Анализ 10 рынков показал, что видеокарты GeForce RTX 50 подорожали почти вдвое сильнее, чем Radeon RX 9000
Авторы Hardware Unboxed решили плотнее изучить вопрос удорожания видеокарт за последние два месяца и провели анализ цен на все актуальные модели, причём не в каком-то одном регионе, а сразу в десяти: США, Австралии, Германии, Великобритании, Канаде, Индии, Филиппинах, Бразилии, Польши и Нидерландах. Это даёт намного более полную картину того, что происходит с ценами. ...
Samsung анонсировала то, что на рынке уже два года? MSI говорит, что использует панели QD-OLED Penta-Tandem ещё с 2024 года
Компания Samsung пару дней назад представила технологию QD-OLED Penta-Tandem, отметив, что некоторые соответствующие устройства уже продаются. А теперь MSI сообщает, что на самом деле она уже давно продаёт немало моделей мониторов с такими панелями. К примеру, модель MAG 341CQP опирается именно на такую панель, при этом анонсирован этот монитор был ещё два года назад. Фото...
ByteDance представила Doubao 2.0 — самый популярный ИИ-бот Китая стал мощнее и подготовился к «эре агентов»
Китайская компания ByteDance, разработчик видеосервиса TikTok, представила обновлённую версию чат-бота Doubao 2.0 — самого популярного в стране приложения на базе искусственного интеллекта. Doubao 2.0 позиционируется как решение для «эры ИИ-агентов», когда модели будут способны самостоятельно выполнять сложные задачи, а не только отвечать на вопросы. Источник изображения:...