За последние 24 часа нас посетили 18395 программистов и 1632 робота. Сейчас ищут 1103 программиста ...

Анализ текстов на схожесть

Тема в разделе "Решения, алгоритмы", создана пользователем Argentum, 14 апр 2018.

Метки:
  1. Argentum

    Argentum Активный пользователь

    С нами с:
    31 окт 2007
    Сообщения:
    24
    Симпатии:
    0
    Адрес:
    Москва
    Привет тебе, великий All!

    Задам вопрос, может быть, тривиальный. А может, наоборот, из области фантастики. Тебе видней.

    Предположим, у нас имеется 100 текстов на русском языке. Стоит задача провести их анализ и в итоге получить следующую инфу:
    1. Какие тексты, скорее всего, посвящены одной и той же теме (событию, явлению).
    2. Список ключевых слов, связанных с этими темами.
    Что это? Как это делается? Есть ли какие-то готовые алгоритмы, проекты, библиотеки?
     
  2. igordata

    igordata Суперстар
    Команда форума Модератор

    С нами с:
    18 мар 2010
    Сообщения:
    32.408
    Симпатии:
    1.768
    хyйня вопрос, но для начала нужно решить задачу определения тематики. =)

    ну... короче, есть сервисы, которые могут это сделать. Пытаться родить это самостоятельно - дохлый номер.
     
  3. nospiou

    nospiou Старожил

    С нами с:
    4 фев 2018
    Сообщения:
    3.400
    Симпатии:
    510
    Создаешь словарь принадлежности к какой то тематике проверяешь текст по всем словарям и смотришь где больше совпадений
     
  4. igordata

    igordata Суперстар
    Команда форума Модератор

    С нами с:
    18 мар 2010
    Сообщения:
    32.408
    Симпатии:
    1.768
    =)
     
  5. nospiou

    nospiou Старожил

    С нами с:
    4 фев 2018
    Сообщения:
    3.400
    Симпатии:
    510
    А что смешного? В инете полно русско-английских словарей разбитых по тематикам. Берешь за основу и все готово
     
  6. igordata

    igordata Суперстар
    Команда форума Модератор

    С нами с:
    18 мар 2010
    Сообщения:
    32.408
    Симпатии:
    1.768
    ну можно, конечно.