За последние 24 часа нас посетили 30836 программистов и 1477 роботов. Сейчас ищут 1149 программистов ...

Выбор ключевых сло из текста

Тема в разделе "Прочие вопросы по PHP", создана пользователем R22, 17 май 2008.

  1. R22

    R22 Активный пользователь

    С нами с:
    24 мар 2008
    Сообщения:
    78
    Симпатии:
    0
    Адрес:
    Odessa
    Условие:
    Есть блоки новостей на странице. (порядка 500 слов на странице).
    Meta теги html (keywords, description) и title формируются динамически. Т.е. в зависимости от содержания идет наполнение данных тегов. Новости попадают на сайт тоже автоматически.
    -------------------------------------------
    Задача:
    наполнить автоматически данные теги. Собственно, выбрать из этого массива слов наиболее подходящие слова для тематики сайта.
    ------------------------------------------
    Есть ли какие- то мысли по алгоритму. Придумал два варианта, но есть еще сомнения.
    --------------------------------------------


    ...Два мозга пожалуй будет лучше
     
  2. Kreker

    Kreker Старожил

    С нами с:
    8 апр 2007
    Сообщения:
    5.433
    Симпатии:
    0
    Рыбку купите себе - вот и будет второй мозг.

    -Из заголовка берите ключи. По-другому мне кажется, что вряд ли получиться, ибо нужно создавать ИИ для определения тематики и нахождения ключевых слов.
    -Обычно ключевые слова указываются автором статьи.
    -Поисковики сейчас смотрят больше на текст, нежели на метатеги.
     
  3. MaXyC_Web_Studio

    MaXyC_Web_Studio Активный пользователь

    С нами с:
    31 дек 2006
    Сообщения:
    678
    Симпатии:
    3
    Адрес:
    Новоуральск
    я по умолчанию сделол чтобы выдиралось из страницы текст. для каждога слова ставил вес. затем сортировал и указывал к лунцщквы самые тяжелые 10-15 слов
     
  4. Mr.M.I.T.

    Mr.M.I.T. Старожил

    С нами с:
    28 янв 2008
    Сообщения:
    4.586
    Симпатии:
    1
    Адрес:
    у тебя канфетка?
    разбиваем весь текст на массив слов, удаляем из массива все ненужные знаки и пустоты, оставляем только слова,выбираем из массива слова нужной нам длины, а теперь
    раС плюнуть - вот оно =)) array_rand()
    КонеЦ =)