- Россия уже отправила готовый детектор лунной... (2615)
- Framework попросила не радоваться раньше... (2584)
- Кот владельца GeForce RTX 4090 «позвал»... (2588)
- Сегодня Рунету исполнилось 32... (2352)
- Российские интернет-компании выступили... (2396)
- Россия на годы отложила запуск трёх лунных... (2635)
- Выход годных чипов по техпроцессу Intel 18A... (2405)
- Анонсирован смартфон Realme C100 5G с... (2390)
- Назад в будущее: кассетный плеер Maxell с... (2956)
- «Мод моей мечты»: энтузиаст показал, как... (2973)
- Мессенджер Max уже работает в... (2727)
- В Китае разработали натриевые батареи,... (2688)
- OpenAI, Anthropic и Google объединились для... (2592)
- LG оценила 39-дюймовый изогнутый 5K2K... (2634)
- Финальная One UI 8.5 для Samsung Galaxy S25,... (2906)
- Представлена новейшая бритва Xiaomi Mijia... (2727)
Nvidia утверждает, что её ИИ-платформа Blackwell позволила клиентам снизить затраты на ИИ в 10 раз
Дата: 2026-02-14 16:01
Компания Nvidia рассказала, что её разработки уже позволили ведущим поставщикам решений для машинного обучения сократить затраты на ИИ до 10 раз. Это стало возможным благодаря моделям с открытым исходным кодом на платформе Blackwell.
Речь в данном случае о токеномике и снижении на порядок именно стоимости одного токена. Nvidia объясняет это так:
Если станок производит в 10 раз больше продукции при дополнительных инвестициях в чернила, энергию и сам станок, стоимость печати каждой отдельной страницы снижается. Точно так же инвестиции в инфраструктуру искусственного интеллекта могут привести к значительному увеличению выпуска токенов по сравнению с ростом затрат, что приведет к существенному снижению стоимости одного токена
Фото Nvidia В ходе обсуждения токеномики Nvidia упомянула такие организации, как Baseten и Sully.ai, а также ориентированные на игры DeepInfra и Latitude. Для каждой из этих компаний архитектура Blackwell позволила добиться меньшей задержки, оптимальных затрат на вывод и надежных ответов, поэтому этот технологический стек сегодня является предпочтительным вариантом для компаний, занимающихся разработкой ИИ.
Компания говорит, что с помощью ускорителей Vera Rubin она планирует вывести эффективность инфраструктуры на совершенно новый уровень, используя достижения в архитектуре, специализированные механизмы, такие как CPX для предварительного заполнения, и многое другое.
Подробнее на iXBT
Предыдущие новости
Астрономы впервые проследили, как звезда без взрыва превратилась в чёрную дыру
Астрономы зафиксировали самый полный на сегодняшний день набор наблюдений того, как массивная звезда завершила свою жизнь, не взорвавшись сверхновой, а напрямую превратившись в чёрную дыру. Вместо мощной вспышки её ядро коллапсировало, а внешние слои медленно рассеялись. Объект исследования — звезда M31-2014-DS1 в соседней галактике Андромеды, расположенной примерно в 2,5...
Анализ 10 рынков показал, что видеокарты GeForce RTX 50 подорожали почти вдвое сильнее, чем Radeon RX 9000
Авторы Hardware Unboxed решили плотнее изучить вопрос удорожания видеокарт за последние два месяца и провели анализ цен на все актуальные модели, причём не в каком-то одном регионе, а сразу в десяти: США, Австралии, Германии, Великобритании, Канаде, Индии, Филиппинах, Бразилии, Польши и Нидерландах. Это даёт намного более полную картину того, что происходит с ценами. ...
Samsung анонсировала то, что на рынке уже два года? MSI говорит, что использует панели QD-OLED Penta-Tandem ещё с 2024 года
Компания Samsung пару дней назад представила технологию QD-OLED Penta-Tandem, отметив, что некоторые соответствующие устройства уже продаются. А теперь MSI сообщает, что на самом деле она уже давно продаёт немало моделей мониторов с такими панелями. К примеру, модель MAG 341CQP опирается именно на такую панель, при этом анонсирован этот монитор был ещё два года назад. Фото...
ByteDance представила Doubao 2.0 — самый популярный ИИ-бот Китая стал мощнее и подготовился к «эре агентов»
Китайская компания ByteDance, разработчик видеосервиса TikTok, представила обновлённую версию чат-бота Doubao 2.0 — самого популярного в стране приложения на базе искусственного интеллекта. Doubao 2.0 позиционируется как решение для «эры ИИ-агентов», когда модели будут способны самостоятельно выполнять сложные задачи, а не только отвечать на вопросы. Источник изображения:...