- Премьера геймплея и дата выхода Star Wars... (416)
- Square Enix анонсировала Final Fantasy VII... (479)
- Stellar Blade 2 получила первый трейлер и... (295)
- Первый трейлер хоррора Alien: Isolation 2 —... (664)
- Capcom наконец анонсировала ремейк Resident... (409)
- Новая статья: 007 First Light — успех после... (531)
- Назад в будущее и обратно: анонсирована... (284)
- Silicon Motion представила SSD-контроллеры с... (497)
- Ангстремные мобильные процессоры Intel... (463)
- Ремейк «Готики» вышел на ПК и консолях —... (543)
- В российской части МКС обнаружены две утечки... (1163)
- Google исправила рекордные 429 уязвимостей в... (941)
- Google исправила рекордные 429 уязвимости в... (873)
- Аша Шарма подтвердила, что Xbox нужны... (879)
- Межзвёздная комета 3I/ATLAS заинтриговала... (659)
- Thermal Grizzly показала водоблок для... (832)
Специалистами Центра исследования больших данных НИТУ разработан механизм семантического быстрого поиска по специализированным базам данных
Дата: 2021-12-22 19:58
Пресс-служба НИТУ «МИСиС» сообщила, что группой ученых НИТУ «МИСиС», решавших задачу корректного поиска объемных документов, близких по смыслу, разработан механизм семантического быстрого поиска по специализированным базам данных.
Как утверждается, разработка, выполненная в рамках гранта Российского научного фонда, может помочь улучшить качество информационного поиска и анализа данных в специализированных поисковых системах. Речь идет о системах, используемых научными и промышленными организациями для поиска по отчетам, патентам, научным публикациям.
В основе механизма лежит метод сегментирования. Он позволяет корректно справляться с ситуацией, когда большие сложные документы охватывают сразу несколько тем, что при обычном подходе сильно затрудняет автоматический поиск. После разбиения на тематически однородные куски текста алгоритм выполняет поиск более эффективно.
«В рамках исследования мы использовали метод, основанный на подходе аддитивной регуляризации тематических моделей (additive regularization of topic models, ARTM) и алгоритме TopicTiling. В результате экспериментов удалось улучшить точность работы узкоспециального поиска по научным публикациям с 55% до почти 82%», — так прокомментировал выбранный подход Никита Никитинский, научный сотрудник Центра исследования больших данных НИТУ «МИСиС».
Разработка уже реализована в российском проекте создания Реестра обязательных требований.
Подробнее на iXBT
Предыдущие новости
Американский регулятор оценит безопасность 580 000 электромобилей Tesla, в которых есть игры
Национальное управление безопасности дорожного движения (NHTSA) США сообщило, что начало официальное расследование с целью оценить безопасность 580 000 электромобилей Tesla, проданных с 2017 года. Это расследование связано с решением автопроизводителя разрешить играть в игры на центральном сенсорном экране. Регулятор включил в рассмотрение электромобили Tesla Model 3, S, X и...
Alien: Isolation на флагманском смартфоне выглядит хуже, чем на Nintendo Switch со старой платформой
На днях для iOS и Android вышла игра Alien: Isolation. Сама игра неновая: на ПК и домашних консолях она вышла ещё в 2014 году, на Switch игра появилась в 2019 году. В итоге Alien: Isolation — одна из очень немногих игр, графику которых можно сравнить на совершенно разных платформах. И особенно интересно сравнение со смартфонами. В данном случае авторы сравнили игру на Xbox...
Процессоры AMD, которые обеспечат «феноменальные впечатления». Компания расскажет об архитектуре Zen 4 уже через две недели
4 января на выставке CES 2022 компания AMD покажет новые процессоры и видеокарты. Как стало известно, ещё компания приоткроет завесу тайны над совершенно новой архитектурой Zen 4. Об этом в свежем интервью рассказал технический директор AMD Марк Пейпермастер (Mark Papermaster). Что касается следующего поколения — это будет на CES в январе. Мы будем рады раскрыть некоторые...
Серию Smart Modular DuraFlash ME2 SATA пополнили твердотельные накопители трех типоразмеров
Компания Smart Modular, специализирующаяся на выпуске решений для хранения данных, объявила о расширении линейки продуктов DuraFlash ME2 SATA твердотельными накопителями трех типоразмеров: M.2 2242 SATA, mSATA (MO-300A) и Slim SATA (MO-297A). Эти изделия присоединились к ранее выпущенным SSD M.2 2280 и типоразмера 2,5 дюйма с интерфейсом SATA. По словам производителя, новые...