- Мучениям Apple придёт конец: запрет на... (303)
- Аудитория Netflix взлетела до 302 млн... (378)
- Новый литий-серный аккумулятор выдерживает... (372)
- Jeep, Opel, Peugeot, Ram, Chrysler и многие... (431)
- NASA создаёт гибкие шины из «умного» сплава... (396)
- Первое за 10 лет технодемо легендарного... (451)
- Владелец TikTok потратит в этом году $12... (443)
- Energizer представила ноутбуки EnergyBook за... (410)
- «Перебор. Столько рынку не нужно». В России... (473)
- Первый в истории минивэн Volvo так и не... (405)
- Blue Origin поделилась кадрами исторического... (473)
- Первый премиальный российский минивэн... (508)
- $500 млрд на ИИ-инфраструктуру в США: Трамп... (468)
- Презентации Samsung Galaxy 2025 можно не... (444)
- Samsung меняет подход к покупке смартфонов.... (490)
- Samsung вложит в контрактное производство... (404)
Apple и Nvidia объединили усилия для ускорения работы языковых моделей
Дата: 2025-01-07 10:47
Apple объявила о сотрудничестве с Nvidia в целях ускорения работы крупных языковых моделей (LLM) с использованием технологии с открытым исходным кодом Recurrent Drafter (сокращённо ReDrafter). Партнёрство направлено на решение вычислительных задач при авторегрессивной генерации токенов, что критически важно для повышения эффективности и снижения задержек в приложениях с языковыми моделями, работающими в реальном времени.
ReDrafter, представленный Apple в ноябре 2024 года, использует подход спекулятивного декодирования, объединяя рекуррентную нейронную сеть (RNN) с поиском и динамическим древовидным вниманием. Согласно тестам Apple, этот метод генерирует в 2,7 раза больше токенов в секунду по сравнению с традиционной авторегрессией.
Источник: BloombergБлагодаря интеграции во фреймворк Nvidia TensorRT-LLM, ReDrafter расширяет своё влияние, обеспечивая более быструю работу языковых моделей на GPU Nvidia, широко используемых в производственных средах. Для поддержки алгоритмов ReDrafter компания Nvidia внедрила новые операторы и модифицировала существующие в TensorRT-LLM, сделав технологию доступной для разработчиков, стремящихся оптимизировать производительность крупномасштабных моделей.
Помимо увеличения скорости, Apple утверждает, что ReDrafter способен снизить задержку для пользователей при использовании меньшего количества GPU. Такая эффективность не только снижает вычислительные затраты, но и уменьшает энергопотребление, что является важным фактором для организаций, работающих с искусственным интеллектом в больших масштабах.
Хотя в настоящее время сотрудничество сфокусировано на инфраструктуре Nvidia, в будущем аналогичные преимущества производительности могут быть распространены и на конкурирующие GPU от AMD или Intel.
По словам представителей Nvidia: «Это сотрудничество сделало TensorRT-LLM более мощным и гибким, позволяя сообществу разработчиков языковых моделей создавать более сложные модели и легко развёртывать их с помощью TensorRT-LLM для достижения непревзойдённой производительности на GPU Nvidia. Новые возможности открывают захватывающие перспективы, и мы с нетерпением ждём следующего поколения передовых моделей от сообщества, использующих возможности TensorRT-LLM, что приведёт к дальнейшему улучшению работы языковых моделей».
Подробнее на iXBT
Предыдущие новости
Заменитель Toyota Alphard подешевел на 1,5 млн рублей в России: объявлена новая цена на премиальный минивэн GAC M8
Семиместный минивэн GAC M8 появился в продаже еще прошлой весной по цене от 6,7 млн рублей, однако производитель пересмотрел ценовую политику, в результате чего сегодня минивэн можно приобрести гораздо дешевле. Фото GAC Согласно информации, указанной на официальном сайте, до 31 января модель предлагается за 5,2 млн рублей при оформлении кредита под 0,01%, при этом действует...
Представлен обновлённый игровой ноутбук Razer Blade 16 на AMD Ryzen AI и Nvidia GeForce RTX 5000
Компания Razer представила обновлённый ноутбук Razer Blade 16. Производитель называет его самым тонким игровым лэптопом в своём ассортименте — его толщина составляет всего 1,5 см. Новинка предлагает процессоры из серии AMD Ryzen AI и видеокарты Nvidia нового поколения Blackwell. Источник изображений:...
Самый большой внедорожник Great Wall и самый продаваемый в России пикап подешевел. Цена KingKong опустилась почти до 3 млн рублей
Компания Great Wall снизила цены на самый популярный в России внедорожник в кузове пикапа, которым является Great Wall Poer KingKong. Сегодня скидка составляет 200 000 рублей, а стартовая цена составляет 3 099 000 рублей. Нужно отметить, что в августе прошлого года эта модель стоилf 3 199 000 рублей. Официальный дебют Great Wall Poer KingKong в России состоялся в конце апреля...
Экономичная замена Skoda Octavia, Kia Cerato и Hyundai Elantra. Выпускаемый в России седан BAIC U5 Plus CNG подешевел до 2 млн рублей
Автомобиль BAIC U5 Plus CNG, который выпускают в Калининграде и позиционируется как замена Skoda Octavia, Kia Cerato и Hyundai Elantra, сегодня предлагается примерно за 2 млн рублей. Сегодня версия Luxury с пятиступенчатой механической коробкой передач стоит 2 090 522 руб., а с «вариатором» за машину просят 2 160 535 руб. Изображение BAIC BAIC U5 Plus CNG — это битопливный...