Simpliest хорошо, уговорил Вот только почему он делает из HTML: <body> <title>test</title> <ul> <li> test</li> <p>error<br>another line</li> </body> HTML: <!DOCTYPE html PUBLIC "-//W3C//DTD HTML 4.01//EN"> <html> <head> <title>test</title> </head> <body> <ul> <li>test</li> <li style="list-style: none; display: inline"> <p>error<br> another line</p> </li> </ul> </body> </html> а не HTML: <!DOCTYPE html PUBLIC "-//W3C//DTD HTML 4.01//EN"> <html> <head> <title>test</title> </head> <body> <ul> <li>test</li> </ul> <p>error</p> <p>another line</p> </body> </html> это так, лирическое отступление. И всё равно, полностью готового набора парсинга страниц при дефолтной конфигурации php нет
Я никого не уговариваю Более того, насколько я читал, в некоторых случаях он таки не справляется (правда не в тех примерах, что ты привел)