- На что способен 5-ядерный процессор Intel, у... (17)
- OnePlus готовит мощное расширение бюджетной... (19)
- PS5, PS5 Pro и PlayStation Portal скоро... (13)
- Motorola Razr 70 Ultra показался на... (15)
- Ветеран Microsoft рассказал, как Windows 95... (8)
- Google представила ИИ для создания... (76)
- Батарея 6500 мАч и 45 Вт, 120 Гц, IP64,... (64)
- На БАК обнаружена новая тяжёлая частица:... (126)
- На БАК обнаружена новая тяжёлая частица:... (113)
- Подделка века? Фальшивый Samsung 990 Pro... (84)
- Colliers: инвестиции в ЦОД впервые обогнали... (159)
- General Motors начала тестирование новой... (158)
- В Telegram появился ИИ-переписчик... (82)
- Магнитное поле Земли защищает Луну от... (91)
- «Яндекс Карты» научились подбирать заведения... (84)
- Впервые в истории: телескоп «Хаббл»... (95)
Российский датасет Яндекса ускорил обучение ИИ-рекомендаций в 60 раз
Дата: 2026-02-26 14:42
Ученые из Амстердамского университета добились рекордного ускорения обучения рекомендательных систем — почти в 60 раз. Это стало возможным благодаря использованию российского датасета Yambda, предоставленного Яндексом в открытый доступ в 2025 году. Об этом сообщила пресс-служба Яндекса.
Сгенерировано нейросетью Grok Исследователи улучшили модель Seater, которая организует товары и контент в иерархический каталог, похожий на дерево папок. Это позволяет быстрее и точнее выдавать рекомендации. Однако подготовка такого каталога была медленной и занимала до 20% времени обучения. Ученые предложили два новых метода подготовки данных: один — максимально быстрый, другой — быстрый с последующей доработкой.
На Yambda быстрый метод сократил время подготовки данных с 82 минут до 83 секунд, сохранив качество рекомендаций. Комбинированный подход ускорил процесс в 15 раз и даже повысил точность рекомендаций. Эксперимент подтвердил лидерство Seater по сравнению с популярными системами SASRec, BERT4Rec и GRU4Rec на 13–17%.
Авторы эксперимента подчеркивают, что Yambda позволил доказать практическую применимость генеративных рекомендательных систем на больших каталогах. Весь код улучшенной модели Seater выложен в открытый доступ, что позволяет использовать и развивать предложенные улучшения в реальных продуктах. Yambda содержит почти 5 миллиардов обезличенных событий из «Яндекс Музыки» и является одним из крупнейших публичных наборов данных в мире.
Подробнее на iXBT
Предыдущие новости
Snapdragon 8 Elite Gen 5, аккумулятор 7150 мА·ч, 120 Вт, 200 Мп, перископический модуль. Honor показала, как снимает Magic V6
Опубликованы примеры фотографий, сделанных с помощью складного телефона Honor Magic V6, демонстрирующие возможности технологии AiMAGE. Официальный аккаунт Honor Imaging в Weibo сегодня опубликовал примеры фотографий, сделанных с помощью нового смартфона Magic V6. Фото Honor В марте прошлого года компания Honor официально представила на выставке Mobile World Congress (MWC)...
Xiaomi 17 Ultra получил гигантское обновление HyperOS почти на 10 ГБ, работу камеры улучшили
Xiaomi 17 Ultra получил новое обновление – HyperOS 3.0.15.0.WPACNXM. Размер обновление составляет приблизительно 9,4 ГБ, прошивка добавляет функцию Leica Instant Mode 1х Tap Zoom. Смартфон Xiaomi Mi 17 Ultra получил обновление до Surge OS 3.0.15.0, при этом версия Leica добавила режим мгновенного просмотра Leica Instant Mode и функцию мгновенного масштабирования 1x Tap Zoom. ...
Samsung Galaxy S25, Galaxy S25 Plus и Galaxy S25 Ultra получили свежее обновление One UI 8.5 сразу после премьеры Galaxy S26, но это все-еще бета-версия
Новые флагманы Samsung Galaxy S26 получили из коробки One UI 8.5, и ожидалось, что сразу за ними финальную версию прошивки получат смартфоны линейки Galaxy S25. И они действительно получили новую версию OneUI 8.5, но это лишь бета-версия, а финальная выйдет позже. Изображение: Sammobile Почему Samsung не успела «зафиналить» One UI 8.5 для Galaxy S25 к моменту премьеры Galaxy...
Rutube открыл авторам подробную статистику
Видеохостинг Rutube представил новую функцию для авторов — подробную статистику удержания внимания зрителей. Теперь блогеры могут детально отслеживать, как пользователи смотрят их контент. Новая функция уже доступна в «Студии Rutube» в веб-версии платформы. Сгенерировано нейросетью Grok Авторы смогут увидеть, какие фрагменты видео пересматриваются чаще всего, определить...