За последние 24 часа нас посетили 15904 программиста и 1666 роботов. Сейчас ищут 940 программистов ...

парсинг html

Тема в разделе "Прочие вопросы по PHP", создана пользователем _axl, 25 ноя 2008.

  1. _axl

    _axl Активный пользователь

    С нами с:
    25 ноя 2008
    Сообщения:
    5
    Симпатии:
    0
    Подскажите, пожайлуста, чем можно воспользоваться, чтобы отпарсить html( не xhtml ) ? Очень не хочется полностью писать на регулярках, может есть какие-то классы/продукты заточенные под эти цели?
    Спасибо!
     
  2. [vs]

    [vs] Суперстар
    Команда форума Модератор

    С нами с:
    27 сен 2007
    Сообщения:
    10.559
    Симпатии:
    632
    А с какой целью парсинг?
     
  3. _axl

    _axl Активный пользователь

    С нами с:
    25 ноя 2008
    Сообщения:
    5
    Симпатии:
    0
    да прост на предприятии есть что-то вроде БД товаров, в виде html )) не знаю, кто ее делал, но мне надо все это перегнать в mysql
     
  4. Hight

    Hight Старожил
    Команда форума Модератор

    С нами с:
    5 мар 2006
    Сообщения:
    7.153
    Симпатии:
    0
    Адрес:
    из злой параллельной вселенной
    ручками :)
     
  5. _axl

    _axl Активный пользователь

    С нами с:
    25 ноя 2008
    Сообщения:
    5
    Симпатии:
    0
    всмысле copy-paste ??? там много очень!
     
  6. Frozen

    Frozen Активный пользователь

    С нами с:
    20 окт 2008
    Сообщения:
    540
    Симпатии:
    0
    Адрес:
    Москва
    ну так принимайся быстрей - раньше начнеш, раньше закончиш :)
     
  7. _axl

    _axl Активный пользователь

    С нами с:
    25 ноя 2008
    Сообщения:
    5
    Симпатии:
    0
    это все, конечно, забавно.
    ну а если по существу?
     
  8. Hight

    Hight Старожил
    Команда форума Модератор

    С нами с:
    5 мар 2006
    Сообщения:
    7.153
    Симпатии:
    0
    Адрес:
    из злой параллельной вселенной
    А по существу надо погуглить.
    http://www.onderstekop.nl/articles/114/
     
  9. S.t.A.M.

    S.t.A.M. Активный пользователь

    С нами с:
    10 сен 2007
    Сообщения:
    1.041
    Симпатии:
    0
    Hight
    Эта приблуда хороша для того чтобы мыло таскать... а для целей _axl мне кажется она не сгодится...
    там надо не теги парсить а поля по ключевым словам... хотя фиг знает я ее глубоко не копал...

    _axl
    Если надумаешь во фриланс обращаться пиши - есть у меня одна программа самаписная как раз для таких целей, но при условии, что докажешь, что это твое предприятие.
     
  10. _axl

    _axl Активный пользователь

    С нами с:
    25 ноя 2008
    Сообщения:
    5
    Симпатии:
    0
    все решилось довольно просто, нашел класс http://sourceforge.net/projects/simplehtmldom/ с ним скрипт занял 300 строк и всего 9 регулярок :)
    если кому надо - советую, программить одно удовольствие + включает отличную, простую документацию
     
  11. Frozen

    Frozen Активный пользователь

    С нами с:
    20 окт 2008
    Сообщения:
    540
    Симпатии:
    0
    Адрес:
    Москва
    жесть нах
     
  12. ageent

    ageent Активный пользователь

    С нами с:
    9 ноя 2008
    Сообщения:
    32
    Симпатии:
    0
    Круто. сенкс.
     
  13. Sergey89

    Sergey89 Активный пользователь

    С нами с:
    4 янв 2007
    Сообщения:
    4.796
    Симпатии:
    0