- Частота 5 ГГц и производительность как у... (2848)
- Hyundai, LG и Samsung не планируют... (2864)
- Два мотора, ультрафиолет и высокоточная... (2867)
- Экипаж МКС впервые начал использовать... (2810)
- Появилось множество снимков Луны в высоком... (3110)
- 9000 мАч, 80 Вт, IP69K, 50-мегапиксельная... (2537)
- SpaceX перекрывает дороги в районе... (2838)
- 10 000 мАч, 33 Вт и магнитная зарядка —... (2401)
- Фильтр на 8 лет, 2 крана, удаление 145 видов... (2570)
- Впервые в истории люди у Луны позвонили... (3039)
- Новейшие телевизоры Xiaomi с подсветкой Mini... (2695)
- Anthropic объединилась с Google, Apple и... (2465)
- Anthropic объявила о создании консорциума... (2640)
- 9100 мАч, экран 8,8 дюйма и топовая... (3169)
- Спутник «Космос-1812» сошел с орбиты, а... (2579)
- «Космическое серебро», тонкий корпус,... (2803)
Nvidia утверждает, что её ИИ-платформа Blackwell позволила клиентам снизить затраты на ИИ в 10 раз
Дата: 2026-02-14 16:01
Компания Nvidia рассказала, что её разработки уже позволили ведущим поставщикам решений для машинного обучения сократить затраты на ИИ до 10 раз. Это стало возможным благодаря моделям с открытым исходным кодом на платформе Blackwell.
Речь в данном случае о токеномике и снижении на порядок именно стоимости одного токена. Nvidia объясняет это так:
Если станок производит в 10 раз больше продукции при дополнительных инвестициях в чернила, энергию и сам станок, стоимость печати каждой отдельной страницы снижается. Точно так же инвестиции в инфраструктуру искусственного интеллекта могут привести к значительному увеличению выпуска токенов по сравнению с ростом затрат, что приведет к существенному снижению стоимости одного токена
Фото Nvidia В ходе обсуждения токеномики Nvidia упомянула такие организации, как Baseten и Sully.ai, а также ориентированные на игры DeepInfra и Latitude. Для каждой из этих компаний архитектура Blackwell позволила добиться меньшей задержки, оптимальных затрат на вывод и надежных ответов, поэтому этот технологический стек сегодня является предпочтительным вариантом для компаний, занимающихся разработкой ИИ.
Компания говорит, что с помощью ускорителей Vera Rubin она планирует вывести эффективность инфраструктуры на совершенно новый уровень, используя достижения в архитектуре, специализированные механизмы, такие как CPX для предварительного заполнения, и многое другое.
Подробнее на iXBT
Предыдущие новости
Астрономы впервые проследили, как звезда без взрыва превратилась в чёрную дыру
Астрономы зафиксировали самый полный на сегодняшний день набор наблюдений того, как массивная звезда завершила свою жизнь, не взорвавшись сверхновой, а напрямую превратившись в чёрную дыру. Вместо мощной вспышки её ядро коллапсировало, а внешние слои медленно рассеялись. Объект исследования — звезда M31-2014-DS1 в соседней галактике Андромеды, расположенной примерно в 2,5...
Анализ 10 рынков показал, что видеокарты GeForce RTX 50 подорожали почти вдвое сильнее, чем Radeon RX 9000
Авторы Hardware Unboxed решили плотнее изучить вопрос удорожания видеокарт за последние два месяца и провели анализ цен на все актуальные модели, причём не в каком-то одном регионе, а сразу в десяти: США, Австралии, Германии, Великобритании, Канаде, Индии, Филиппинах, Бразилии, Польши и Нидерландах. Это даёт намного более полную картину того, что происходит с ценами. ...
Samsung анонсировала то, что на рынке уже два года? MSI говорит, что использует панели QD-OLED Penta-Tandem ещё с 2024 года
Компания Samsung пару дней назад представила технологию QD-OLED Penta-Tandem, отметив, что некоторые соответствующие устройства уже продаются. А теперь MSI сообщает, что на самом деле она уже давно продаёт немало моделей мониторов с такими панелями. К примеру, модель MAG 341CQP опирается именно на такую панель, при этом анонсирован этот монитор был ещё два года назад. Фото...
ByteDance представила Doubao 2.0 — самый популярный ИИ-бот Китая стал мощнее и подготовился к «эре агентов»
Китайская компания ByteDance, разработчик видеосервиса TikTok, представила обновлённую версию чат-бота Doubao 2.0 — самого популярного в стране приложения на базе искусственного интеллекта. Doubao 2.0 позиционируется как решение для «эры ИИ-агентов», когда модели будут способны самостоятельно выполнять сложные задачи, а не только отвечать на вопросы. Источник изображения:...