- Очень редкий 25-летний «Москвич», похожий на... (211)
- Android-смартфоны научатся выявлять опасные... (196)
- В Россию привезли особую Toyota Corolla — со... (187)
- Valve полностью переработала Train для... (167)
- Несмотря на недавний провальный отчёт, ASML... (150)
- Россияне распробовали автомобили GAC,... (146)
- Phison представила PCIe 5.0 SSD серии... (163)
- «Волги» с японским мотором, «автоматом»,... (171)
- Первый «лёгкий внедорожник» Geely с шинами... (139)
- «Волги» с японским мотором, «автоматом»,... (188)
- Представлен лучший внедорожник Honda всех... (147)
- В России создадут суперкомпьютер нового... (151)
- В Китае установили рекорд по времени... (156)
- Tesla объявила шестой отзыв Cybertruck за... (181)
- Chery представила внедорожный минивэн... (163)
- Solidigm представила самый ёмкий SSD в мире... (128)
В Яндексе придумали новый способ сжатия нейросетей
Дата: 2024-07-23 13:03
Учёные Яндекса разработали и опубликовали в свободном доступе новые методы сжатия больших языковых моделей. По мнению специалистов Yandex Research, они позволят бизнесу сократить расходы на вычислительные ресурсы до восьми раз. Разработка будет полезна корпорациям, стартапам и исследователям, которые запускают нейросети на своём оборудовании.
Чтобы большая языковая модель отвечала качественно и быстро, требуется множество дорогостоящих мощных графических процессоров. Решение Яндекса позволяет уменьшить модель в несколько раз, сократить количество необходимых процессоров и запустить её на устройствах с меньшей вычислительной мощностью. А значит внедрение нейросетей и обслуживание оборудования станет дешевле для бизнеса.
Решение Яндекса включает в себя два инструмента. Первый позволяет получить уменьшенную до восьми раз нейросеть, которая быстрее работает и может быть запущена, например, на одном графическом процессоре вместо четырёх. Второй инструмент исправляет ошибки, которые возникают в процессе сжатия большой языковой модели.
Качество ответов оригинальной и сжатой версии нейросети сравнивали на англоязычных бенчмарках. Новый подход показал лучший результат среди всех существующих методов сжатия, отмечают в Яндексе. Метод, созданный в Yandex Research, сохраняет в среднем 95% качества ответов нейросети, а другие популярные инструменты сохраняют для тех же моделей лишь 59% — 90% качества. Код нового метода опубликован на GitHub, также можно скачать уже сжатые с его помощью популярные модели с открытым исходным кодом и обучающие материалы.
Подробнее на iXBT
Предыдущие новости
Chery собирается подвинуть Kia Sportage с новейшим гибридом Jaecoo J7 PHEV
Китайский автопроизводитель Chery собирается начать продажи автомобилей Omoda и Jaecoo в Европе в начале 2025 года. В частности, гибридный Jaecoo J7 PHEV поступит в продажу даже раньше, чем ожидалось: в первом квартале 2025 года. Jaecoo уже договаривается с местными с дилерами об открытии фирменных салонов. Производитель позиционирует Jaecoo J7 PHEV как конкурента бестселлеру...
Volkswagen Tiguan на минималках: Tiguan XR представят 30 августа
На рынок Китая скоро выйдет еще один Volkswagen Tiguan — новая модель от совместного предприятия SAIC Volkswagen называется Tiguan XR и внешне сильно напоминает представленный несколько месяцев назад Tiguan L Pro. Премьера Tiguan XR состоится 30 августа на автосалоне в Чэнду. Tiguan XR гораздо компактнее обычного Tiguan: габариты модели составляют 4355 x 1762 x 1605 мм,...
Строительство города будущего миллиардеров Кремниевой долины заморозили из-за бюрократии
Проект экологического техно-города «Калифорния навсегда» (California Forever) оказался замороженным на неопределённое время. Как минимум, придётся дождаться завершения экологической экспертизы, которая может продолжаться не менее двух лет. Повторная подача документов для получения разрешения на строительство города-мечты состоится в 2026 году. Также местные жители хотят...
На замену Chromecast выйдет ТВ-приставка Google TV Streamer
В апреле появились сведения, что Google работает над обновлённой версией ТВ-приставки Chromecast с Google TV (4K) — актуальная версия вышла ещё в 2020 году. Теперь стало известно, что устройство получит название Google TV Streamer, сообщает ресурс 9to5Google, который также опубликовал изображения грядущей новинки. Источник изображений:...