- 27-дюймовый Xiaomi за небольшие деньги. На... (159)
- В этот ноутбук можно установить до 256 ГБ... (123)
- Новая статья: Обзор ASUS ROG Strix G16... (165)
- Представлен экстремальный Tank 300 Polar... (165)
- Представлен внедорожный пикап Great Wall... (270)
- Представлен очередной «китайский Hummer»... (194)
- Представлен лимитированный Lexus NX Aurora... (240)
- Представлены недорогие телевизоры Blaupunkt... (244)
- «Китайский Maybach»: на автосалоне в... (231)
- Apple устала от раздутого кода — в iOS 27... (269)
- Seasonic выпустит киловаттный блок питания с... (194)
- Представлен флагманский кроссовер Chery... (186)
- «Роботы могут проломить череп»: Figure AI... (187)
- Meta* ещё с 2020 года достоверно знала, что... (207)
- ИИ-пузырь «витает в воздухе», но Google всё... (249)
- Владелец iPhone 17 Pro Max взломал его и... (247)
Специалистами Центра исследования больших данных НИТУ разработан механизм семантического быстрого поиска по специализированным базам данных
Дата: 2021-12-22 19:58
Пресс-служба НИТУ «МИСиС» сообщила, что группой ученых НИТУ «МИСиС», решавших задачу корректного поиска объемных документов, близких по смыслу, разработан механизм семантического быстрого поиска по специализированным базам данных.
Как утверждается, разработка, выполненная в рамках гранта Российского научного фонда, может помочь улучшить качество информационного поиска и анализа данных в специализированных поисковых системах. Речь идет о системах, используемых научными и промышленными организациями для поиска по отчетам, патентам, научным публикациям.
В основе механизма лежит метод сегментирования. Он позволяет корректно справляться с ситуацией, когда большие сложные документы охватывают сразу несколько тем, что при обычном подходе сильно затрудняет автоматический поиск. После разбиения на тематически однородные куски текста алгоритм выполняет поиск более эффективно.
«В рамках исследования мы использовали метод, основанный на подходе аддитивной регуляризации тематических моделей (additive regularization of topic models, ARTM) и алгоритме TopicTiling. В результате экспериментов удалось улучшить точность работы узкоспециального поиска по научным публикациям с 55% до почти 82%», — так прокомментировал выбранный подход Никита Никитинский, научный сотрудник Центра исследования больших данных НИТУ «МИСиС».
Разработка уже реализована в российском проекте создания Реестра обязательных требований.
Подробнее на iXBT
Предыдущие новости
Американский регулятор оценит безопасность 580 000 электромобилей Tesla, в которых есть игры
Национальное управление безопасности дорожного движения (NHTSA) США сообщило, что начало официальное расследование с целью оценить безопасность 580 000 электромобилей Tesla, проданных с 2017 года. Это расследование связано с решением автопроизводителя разрешить играть в игры на центральном сенсорном экране. Регулятор включил в рассмотрение электромобили Tesla Model 3, S, X и...
Alien: Isolation на флагманском смартфоне выглядит хуже, чем на Nintendo Switch со старой платформой
На днях для iOS и Android вышла игра Alien: Isolation. Сама игра неновая: на ПК и домашних консолях она вышла ещё в 2014 году, на Switch игра появилась в 2019 году. В итоге Alien: Isolation — одна из очень немногих игр, графику которых можно сравнить на совершенно разных платформах. И особенно интересно сравнение со смартфонами. В данном случае авторы сравнили игру на Xbox...
Процессоры AMD, которые обеспечат «феноменальные впечатления». Компания расскажет об архитектуре Zen 4 уже через две недели
4 января на выставке CES 2022 компания AMD покажет новые процессоры и видеокарты. Как стало известно, ещё компания приоткроет завесу тайны над совершенно новой архитектурой Zen 4. Об этом в свежем интервью рассказал технический директор AMD Марк Пейпермастер (Mark Papermaster). Что касается следующего поколения — это будет на CES в январе. Мы будем рады раскрыть некоторые...
Серию Smart Modular DuraFlash ME2 SATA пополнили твердотельные накопители трех типоразмеров
Компания Smart Modular, специализирующаяся на выпуске решений для хранения данных, объявила о расширении линейки продуктов DuraFlash ME2 SATA твердотельными накопителями трех типоразмеров: M.2 2242 SATA, mSATA (MO-300A) и Slim SATA (MO-297A). Эти изделия присоединились к ранее выпущенным SSD M.2 2280 и типоразмера 2,5 дюйма с интерфейсом SATA. По словам производителя, новые...