- Представлен первый настольный ПК на базе... (78)
- Новый метод анализа галактических карт... (62)
- Большинство машин Geely и BelGee, которые... (70)
- Гарантия до 8 лет или 150 000 км. В... (55)
- Представлены доступные современные... (1328)
- Глава Nvidia пообещал, что отрисовка игр... (1260)
- Инсайдер утверждает, что Apple собирается... (95)
- Asus представила конкурента MacBook Air... (96)
- Новейшая видеокарта Nvidia GeForce RTX 5090... (137)
- В Geely Galaxy приготовили пять новинок с... (115)
- Chery со всеми брендами может занять две... (127)
- Пришло время «дешёвых» летающих транспортных... (142)
- Зачем нам Rolls-Royce и Maybach, когда есть... (137)
- Цукерберг ослабил цензуру в F******k и... (141)
- Рама, дизельный мотор, клиренс 215 мм: в РФ... (123)
- SanDisk выпустила портативный SSD для... (129)
Apple и Nvidia объединили усилия для ускорения работы языковых моделей
Дата: 2025-01-07 10:47
Apple объявила о сотрудничестве с Nvidia в целях ускорения работы крупных языковых моделей (LLM) с использованием технологии с открытым исходным кодом Recurrent Drafter (сокращённо ReDrafter). Партнёрство направлено на решение вычислительных задач при авторегрессивной генерации токенов, что критически важно для повышения эффективности и снижения задержек в приложениях с языковыми моделями, работающими в реальном времени.
ReDrafter, представленный Apple в ноябре 2024 года, использует подход спекулятивного декодирования, объединяя рекуррентную нейронную сеть (RNN) с поиском и динамическим древовидным вниманием. Согласно тестам Apple, этот метод генерирует в 2,7 раза больше токенов в секунду по сравнению с традиционной авторегрессией.
Источник: BloombergБлагодаря интеграции во фреймворк Nvidia TensorRT-LLM, ReDrafter расширяет своё влияние, обеспечивая более быструю работу языковых моделей на GPU Nvidia, широко используемых в производственных средах. Для поддержки алгоритмов ReDrafter компания Nvidia внедрила новые операторы и модифицировала существующие в TensorRT-LLM, сделав технологию доступной для разработчиков, стремящихся оптимизировать производительность крупномасштабных моделей.
Помимо увеличения скорости, Apple утверждает, что ReDrafter способен снизить задержку для пользователей при использовании меньшего количества GPU. Такая эффективность не только снижает вычислительные затраты, но и уменьшает энергопотребление, что является важным фактором для организаций, работающих с искусственным интеллектом в больших масштабах.
Хотя в настоящее время сотрудничество сфокусировано на инфраструктуре Nvidia, в будущем аналогичные преимущества производительности могут быть распространены и на конкурирующие GPU от AMD или Intel.
По словам представителей Nvidia: «Это сотрудничество сделало TensorRT-LLM более мощным и гибким, позволяя сообществу разработчиков языковых моделей создавать более сложные модели и легко развёртывать их с помощью TensorRT-LLM для достижения непревзойдённой производительности на GPU Nvidia. Новые возможности открывают захватывающие перспективы, и мы с нетерпением ждём следующего поколения передовых моделей от сообщества, использующих возможности TensorRT-LLM, что приведёт к дальнейшему улучшению работы языковых моделей».
Подробнее на iXBT
Предыдущие новости
Заменитель Toyota Alphard подешевел на 1,5 млн рублей в России: объявлена новая цена на премиальный минивэн GAC M8
Семиместный минивэн GAC M8 появился в продаже еще прошлой весной по цене от 6,7 млн рублей, однако производитель пересмотрел ценовую политику, в результате чего сегодня минивэн можно приобрести гораздо дешевле. Фото GAC Согласно информации, указанной на официальном сайте, до 31 января модель предлагается за 5,2 млн рублей при оформлении кредита под 0,01%, при этом действует...
Представлен обновлённый игровой ноутбук Razer Blade 16 на AMD Ryzen AI и Nvidia GeForce RTX 5000
Компания Razer представила обновлённый ноутбук Razer Blade 16. Производитель называет его самым тонким игровым лэптопом в своём ассортименте — его толщина составляет всего 1,5 см. Новинка предлагает процессоры из серии AMD Ryzen AI и видеокарты Nvidia нового поколения Blackwell. Источник изображений:...
Самый большой внедорожник Great Wall и самый продаваемый в России пикап подешевел. Цена KingKong опустилась почти до 3 млн рублей
Компания Great Wall снизила цены на самый популярный в России внедорожник в кузове пикапа, которым является Great Wall Poer KingKong. Сегодня скидка составляет 200 000 рублей, а стартовая цена составляет 3 099 000 рублей. Нужно отметить, что в августе прошлого года эта модель стоилf 3 199 000 рублей. Официальный дебют Great Wall Poer KingKong в России состоялся в конце апреля...
Экономичная замена Skoda Octavia, Kia Cerato и Hyundai Elantra. Выпускаемый в России седан BAIC U5 Plus CNG подешевел до 2 млн рублей
Автомобиль BAIC U5 Plus CNG, который выпускают в Калининграде и позиционируется как замена Skoda Octavia, Kia Cerato и Hyundai Elantra, сегодня предлагается примерно за 2 млн рублей. Сегодня версия Luxury с пятиступенчатой механической коробкой передач стоит 2 090 522 руб., а с «вариатором» за машину просят 2 160 535 руб. Изображение BAIC BAIC U5 Plus CNG — это битопливный...