- «Джеймс Уэбб» создал первую трёхмерную карту... (1820)
- Ubisoft уволила 40 разработчиков ремейка... (2505)
- Nvidia вложит в OpenAI $30 млрд — прежняя... (1971)
- Кроссовер Chery Tiggo 7 Pro провалился в... (2151)
- 6300 мАч, защита от падений, ударов и воды... (2055)
- Подзаряжаемые гибриды потребляют гораздо... (2801)
- Выбираем гаджеты в подарок к 23 февраля и 8... (2903)
- MSI Katana 17 HX B14W —... (2158)
- Toyota наняла семь человекоподобных роботов... (2230)
- Смартфон Infinix NOTE 60 Pro с... (2272)
- OpenAI «спит с одним открытым глазом», чтобы... (2070)
- ESET выявила первый вирус для Android,... (2153)
- Умный диктофон TicNote с поддержкой... (2511)
- Доступный смартфон Infinix NOTE Edge с... (2385)
- Google добавила в Chrome разделённый экран и... (2809)
- Возвращение Дефекта, кооператив и дата... (1998)
Российский датасет Яндекса ускорил обучение ИИ-рекомендаций в 60 раз
Дата: 2026-02-26 14:42
Ученые из Амстердамского университета добились рекордного ускорения обучения рекомендательных систем — почти в 60 раз. Это стало возможным благодаря использованию российского датасета Yambda, предоставленного Яндексом в открытый доступ в 2025 году. Об этом сообщила пресс-служба Яндекса.
Сгенерировано нейросетью Grok Исследователи улучшили модель Seater, которая организует товары и контент в иерархический каталог, похожий на дерево папок. Это позволяет быстрее и точнее выдавать рекомендации. Однако подготовка такого каталога была медленной и занимала до 20% времени обучения. Ученые предложили два новых метода подготовки данных: один — максимально быстрый, другой — быстрый с последующей доработкой.
На Yambda быстрый метод сократил время подготовки данных с 82 минут до 83 секунд, сохранив качество рекомендаций. Комбинированный подход ускорил процесс в 15 раз и даже повысил точность рекомендаций. Эксперимент подтвердил лидерство Seater по сравнению с популярными системами SASRec, BERT4Rec и GRU4Rec на 13–17%.
Авторы эксперимента подчеркивают, что Yambda позволил доказать практическую применимость генеративных рекомендательных систем на больших каталогах. Весь код улучшенной модели Seater выложен в открытый доступ, что позволяет использовать и развивать предложенные улучшения в реальных продуктах. Yambda содержит почти 5 миллиардов обезличенных событий из «Яндекс Музыки» и является одним из крупнейших публичных наборов данных в мире.
Подробнее на iXBT
Предыдущие новости
Snapdragon 8 Elite Gen 5, аккумулятор 7150 мА·ч, 120 Вт, 200 Мп, перископический модуль. Honor показала, как снимает Magic V6
Опубликованы примеры фотографий, сделанных с помощью складного телефона Honor Magic V6, демонстрирующие возможности технологии AiMAGE. Официальный аккаунт Honor Imaging в Weibo сегодня опубликовал примеры фотографий, сделанных с помощью нового смартфона Magic V6. Фото Honor В марте прошлого года компания Honor официально представила на выставке Mobile World Congress (MWC)...
Xiaomi 17 Ultra получил гигантское обновление HyperOS почти на 10 ГБ, работу камеры улучшили
Xiaomi 17 Ultra получил новое обновление – HyperOS 3.0.15.0.WPACNXM. Размер обновление составляет приблизительно 9,4 ГБ, прошивка добавляет функцию Leica Instant Mode 1х Tap Zoom. Смартфон Xiaomi Mi 17 Ultra получил обновление до Surge OS 3.0.15.0, при этом версия Leica добавила режим мгновенного просмотра Leica Instant Mode и функцию мгновенного масштабирования 1x Tap Zoom. ...
Samsung Galaxy S25, Galaxy S25 Plus и Galaxy S25 Ultra получили свежее обновление One UI 8.5 сразу после премьеры Galaxy S26, но это все-еще бета-версия
Новые флагманы Samsung Galaxy S26 получили из коробки One UI 8.5, и ожидалось, что сразу за ними финальную версию прошивки получат смартфоны линейки Galaxy S25. И они действительно получили новую версию OneUI 8.5, но это лишь бета-версия, а финальная выйдет позже. Изображение: Sammobile Почему Samsung не успела «зафиналить» One UI 8.5 для Galaxy S25 к моменту премьеры Galaxy...
Rutube открыл авторам подробную статистику
Видеохостинг Rutube представил новую функцию для авторов — подробную статистику удержания внимания зрителей. Теперь блогеры могут детально отслеживать, как пользователи смотрят их контент. Новая функция уже доступна в «Студии Rutube» в веб-версии платформы. Сгенерировано нейросетью Grok Авторы смогут увидеть, какие фрагменты видео пересматриваются чаще всего, определить...