- Анонсирован духовный наследник Zeus: Master... (105)
- Новая статья: Обзор TWS-наушников realme... (101)
- Глава NASA не верит в возобновление полётов... (184)
- Представлена эталонная ИИ-платформа для... (371)
- Alphabet продаст акций на $80 млрд, чтобы... (500)
- Адская пошаговая ролевая игра Entropy от... (363)
- Ограничения VPN-трафика затруднили... (402)
- Apple научит iPhone разделять совместный... (397)
- Критические уязвимости обнаружены в 84 %... (451)
- Intel предупредила, что путь ПК-чипов Nvidia... (423)
- MSI представила портативный игровой... (663)
- Anthropic передала американским регуляторам... (655)
- Роскомнадзор заявил, что не блокировал... (552)
- MSI анонсировала тонкий 16-дюймовый... (733)
- Некоторые смартфоны Xiaomi научились... (636)
- Новая статья: Обзор и тестирование корпуса... (906)
Российский датасет Яндекса ускорил обучение ИИ-рекомендаций в 60 раз
Дата: 2026-02-26 14:42
Ученые из Амстердамского университета добились рекордного ускорения обучения рекомендательных систем — почти в 60 раз. Это стало возможным благодаря использованию российского датасета Yambda, предоставленного Яндексом в открытый доступ в 2025 году. Об этом сообщила пресс-служба Яндекса.
Сгенерировано нейросетью Grok Исследователи улучшили модель Seater, которая организует товары и контент в иерархический каталог, похожий на дерево папок. Это позволяет быстрее и точнее выдавать рекомендации. Однако подготовка такого каталога была медленной и занимала до 20% времени обучения. Ученые предложили два новых метода подготовки данных: один — максимально быстрый, другой — быстрый с последующей доработкой.
На Yambda быстрый метод сократил время подготовки данных с 82 минут до 83 секунд, сохранив качество рекомендаций. Комбинированный подход ускорил процесс в 15 раз и даже повысил точность рекомендаций. Эксперимент подтвердил лидерство Seater по сравнению с популярными системами SASRec, BERT4Rec и GRU4Rec на 13–17%.
Авторы эксперимента подчеркивают, что Yambda позволил доказать практическую применимость генеративных рекомендательных систем на больших каталогах. Весь код улучшенной модели Seater выложен в открытый доступ, что позволяет использовать и развивать предложенные улучшения в реальных продуктах. Yambda содержит почти 5 миллиардов обезличенных событий из «Яндекс Музыки» и является одним из крупнейших публичных наборов данных в мире.
Подробнее на iXBT
Предыдущие новости
Snapdragon 8 Elite Gen 5, аккумулятор 7150 мА·ч, 120 Вт, 200 Мп, перископический модуль. Honor показала, как снимает Magic V6
Опубликованы примеры фотографий, сделанных с помощью складного телефона Honor Magic V6, демонстрирующие возможности технологии AiMAGE. Официальный аккаунт Honor Imaging в Weibo сегодня опубликовал примеры фотографий, сделанных с помощью нового смартфона Magic V6. Фото Honor В марте прошлого года компания Honor официально представила на выставке Mobile World Congress (MWC)...
Xiaomi 17 Ultra получил гигантское обновление HyperOS почти на 10 ГБ, работу камеры улучшили
Xiaomi 17 Ultra получил новое обновление – HyperOS 3.0.15.0.WPACNXM. Размер обновление составляет приблизительно 9,4 ГБ, прошивка добавляет функцию Leica Instant Mode 1х Tap Zoom. Смартфон Xiaomi Mi 17 Ultra получил обновление до Surge OS 3.0.15.0, при этом версия Leica добавила режим мгновенного просмотра Leica Instant Mode и функцию мгновенного масштабирования 1x Tap Zoom. ...
Samsung Galaxy S25, Galaxy S25 Plus и Galaxy S25 Ultra получили свежее обновление One UI 8.5 сразу после премьеры Galaxy S26, но это все-еще бета-версия
Новые флагманы Samsung Galaxy S26 получили из коробки One UI 8.5, и ожидалось, что сразу за ними финальную версию прошивки получат смартфоны линейки Galaxy S25. И они действительно получили новую версию OneUI 8.5, но это лишь бета-версия, а финальная выйдет позже. Изображение: Sammobile Почему Samsung не успела «зафиналить» One UI 8.5 для Galaxy S25 к моменту премьеры Galaxy...
Rutube открыл авторам подробную статистику
Видеохостинг Rutube представил новую функцию для авторов — подробную статистику удержания внимания зрителей. Теперь блогеры могут детально отслеживать, как пользователи смотрят их контент. Новая функция уже доступна в «Студии Rutube» в веб-версии платформы. Сгенерировано нейросетью Grok Авторы смогут увидеть, какие фрагменты видео пересматриваются чаще всего, определить...