За последние 24 часа нас посетили 16443 программиста и 1676 роботов. Сейчас ищут 868 программистов ...

html parser

Тема в разделе "PHP для новичков", создана пользователем tors, 22 мар 2010.

  1. tors

    tors Активный пользователь

    С нами с:
    22 мар 2010
    Сообщения:
    41
    Симпатии:
    0
    Есть ли в php 5 html - parser в базовой поставке?
    Если нет - посоветуйте сторонний
     
  2. Luge

    Luge Старожил

    С нами с:
    2 фев 2007
    Сообщения:
    4.680
    Симпатии:
    1
    Адрес:
    Минск
    парсер чего?
     
  3. tors

    tors Активный пользователь

    С нами с:
    22 мар 2010
    Сообщения:
    41
    Симпатии:
    0
    html - parser
    чтоб в скрипт на php можно было загрузить произвольную html - страничку и распарсить
     
  4. Luge

    Luge Старожил

    С нами с:
    2 фев 2007
    Сообщения:
    4.680
    Симпатии:
    1
    Адрес:
    Минск
    Не, такого нет. Зависит от конкретного случая. Серебряной пули тут тоже не существует
     
  5. Volt(220)

    Volt(220) Активный пользователь

    С нами с:
    11 июн 2009
    Сообщения:
    1.640
    Симпатии:
    1
  6. Luge

    Luge Старожил

    С нами с:
    2 фев 2007
    Сообщения:
    4.680
    Симпатии:
    1
    Адрес:
    Минск
    Volt(220)
    и такую?
    HTML:
    1. <p>текст
    2. <p>текст
    3. </html>
    4. </body>
     
  7. Simpliest

    Simpliest Активный пользователь

    С нами с:
    24 сен 2009
    Сообщения:
    4.511
    Симпатии:
    2
    Адрес:
    Донецк
    Luge
    tidy не справится?
     
  8. Luge

    Luge Старожил

    С нами с:
    2 фев 2007
    Сообщения:
    4.680
    Симпатии:
    1
    Адрес:
    Минск
    Simpliest
    хорошо, уговорил
    Вот только почему он делает из
    HTML:
    1.   <body>
    2.    <title>test</title>
    3.     <ul>
    4.     <li> test</li>
    5.    <p>error<br>another line</li>
    6.   </body>
    HTML:
    1. <!DOCTYPE html PUBLIC "-//W3C//DTD HTML 4.01//EN">
    2. <title>test</title>
    3. </head>
    4. <ul>
    5. <li>test</li>
    6. <li style="list-style: none; display: inline">
    7. <p>error<br>
    8. another line</p>
    9. </li>
    10. </ul>
    11. </body>
    12. </html>
    а не
    HTML:
    1. <!DOCTYPE html PUBLIC "-//W3C//DTD HTML 4.01//EN">
    2. <title>test</title>
    3. </head>
    4. <ul>
    5. <li>test</li>
    6. </ul>
    7. <p>error</p>
    8. <p>another line</p>
    9. </body>
    10. </html>
    это так, лирическое отступление. И всё равно, полностью готового набора парсинга страниц при дефолтной конфигурации php нет :)
     
  9. Simpliest

    Simpliest Активный пользователь

    С нами с:
    24 сен 2009
    Сообщения:
    4.511
    Симпатии:
    2
    Адрес:
    Донецк
    Я никого не уговариваю :)
    Более того, насколько я читал, в некоторых случаях он таки не справляется (правда не в тех примерах, что ты привел)