- США не дают Китаю закупать новейшие... (312)
- Lada Largus с пробегом дороже, чем новой:... (160)
- В смартфонах Samsung появятся батареи в 10... (179)
- Samsung Galaxy S25, Galaxy S25 Plus и Galaxy... (214)
- Xiaomi 17 Ultra получил гигантское... (414)
- Snapdragon 8 Elite Gen 5, аккумулятор 7150... (411)
- Российский датасет Яндекса ускорил обучение... (411)
- «МегаФон»: февраль оказался абсолютным... (414)
- Цена около 250 долларов и SoC Dimensity... (210)
- Rutube открыл авторам подробную статистику... (466)
- В музей и театр по QR-коду: Минкультуры... (291)
- Xiaomi выпустила очиститель воды Mijia Water... (418)
- Салоны новейших «Москвича M70» и «Москвича... (351)
- Поэтому Китай и хочет запретить... (504)
- Чуда не случилось: Exynos 2600 в Samsung... (607)
- Китайцы нарушили правила: DeepSeek скрывает... (660)
Российский датасет Яндекса ускорил обучение ИИ-рекомендаций в 60 раз
Дата: сегодня 14:42
Ученые из Амстердамского университета добились рекордного ускорения обучения рекомендательных систем — почти в 60 раз. Это стало возможным благодаря использованию российского датасета Yambda, предоставленного Яндексом в открытый доступ в 2025 году. Об этом сообщила пресс-служба Яндекса.
Сгенерировано нейросетью Grok Исследователи улучшили модель Seater, которая организует товары и контент в иерархический каталог, похожий на дерево папок. Это позволяет быстрее и точнее выдавать рекомендации. Однако подготовка такого каталога была медленной и занимала до 20% времени обучения. Ученые предложили два новых метода подготовки данных: один — максимально быстрый, другой — быстрый с последующей доработкой.
На Yambda быстрый метод сократил время подготовки данных с 82 минут до 83 секунд, сохранив качество рекомендаций. Комбинированный подход ускорил процесс в 15 раз и даже повысил точность рекомендаций. Эксперимент подтвердил лидерство Seater по сравнению с популярными системами SASRec, BERT4Rec и GRU4Rec на 13–17%.
Авторы эксперимента подчеркивают, что Yambda позволил доказать практическую применимость генеративных рекомендательных систем на больших каталогах. Весь код улучшенной модели Seater выложен в открытый доступ, что позволяет использовать и развивать предложенные улучшения в реальных продуктах. Yambda содержит почти 5 миллиардов обезличенных событий из «Яндекс Музыки» и является одним из крупнейших публичных наборов данных в мире.
Подробнее на iXBT
Предыдущие новости
Snapdragon 8 Elite Gen 5, аккумулятор 7150 мА·ч, 120 Вт, 200 Мп, перископический модуль. Honor показала, как снимает Magic V6
Опубликованы примеры фотографий, сделанных с помощью складного телефона Honor Magic V6, демонстрирующие возможности технологии AiMAGE. Официальный аккаунт Honor Imaging в Weibo сегодня опубликовал примеры фотографий, сделанных с помощью нового смартфона Magic V6. Фото Honor В марте прошлого года компания Honor официально представила на выставке Mobile World Congress (MWC)...
Xiaomi 17 Ultra получил гигантское обновление HyperOS почти на 10 ГБ, работу камеры улучшили
Xiaomi 17 Ultra получил новое обновление – HyperOS 3.0.15.0.WPACNXM. Размер обновление составляет приблизительно 9,4 ГБ, прошивка добавляет функцию Leica Instant Mode 1х Tap Zoom. Смартфон Xiaomi Mi 17 Ultra получил обновление до Surge OS 3.0.15.0, при этом версия Leica добавила режим мгновенного просмотра Leica Instant Mode и функцию мгновенного масштабирования 1x Tap Zoom. ...
Samsung Galaxy S25, Galaxy S25 Plus и Galaxy S25 Ultra получили свежее обновление One UI 8.5 сразу после премьеры Galaxy S26, но это все-еще бета-версия
Новые флагманы Samsung Galaxy S26 получили из коробки One UI 8.5, и ожидалось, что сразу за ними финальную версию прошивки получат смартфоны линейки Galaxy S25. И они действительно получили новую версию OneUI 8.5, но это лишь бета-версия, а финальная выйдет позже. Изображение: Sammobile Почему Samsung не успела «зафиналить» One UI 8.5 для Galaxy S25 к моменту премьеры Galaxy...
Rutube открыл авторам подробную статистику
Видеохостинг Rutube представил новую функцию для авторов — подробную статистику удержания внимания зрителей. Теперь блогеры могут детально отслеживать, как пользователи смотрят их контент. Новая функция уже доступна в «Студии Rutube» в веб-версии платформы. Сгенерировано нейросетью Grok Авторы смогут увидеть, какие фрагменты видео пересматриваются чаще всего, определить...