Привет! Проблема такая, я парсю html документ, есть таблица и мне нужно из td вытащить содержимое, и не просто вытащить а вместе с html, то есть что бы все теги остались "в живых". Я сейчас делаю так, и у меня из td берется только текст, теги умирают... Код (Text): <?php $html = ' <!DOCTYPE html PUBLIC "-//W3C//DTD XHTML 1.0 Strict//EN" "http://www.w3.org/TR/xhtml1/DTD/xhtml1-strict.dtd"> <head> <title>Parsing-and-i.blogspot.com Map</title> </head> <body> <h2>Последние темы блога</h2> <!-- на 09.08.2009 --> <table border="0"> <tbody> <tr> <td><a href="http://parsing-and-i.blogspot.com/2009/08/blog-post_06.html" title="Базы">http://parsing-and-i.blogspot.com/2009/08/blog-post_06.html</a></td> <td>Базы</td> </tr> <tr> <td><a href="http://parsing-and-i.blogspot.com/2009/08/mysql-delphi-express.html" title="MySQL и Delphi. Express-метод">http://parsing-and-i.blogspot.com/2009/08/mysql-delphi-express.html</a></td> <td>MySQL и Delphi. Express-метод</td> </tr> <tr> <td><a href="http://parsing-and-i.blogspot.com/2009/08/blog-post.html" title="Пост о том, что лучше сто раз проверить">http://parsing-and-i.blogspot.com/2009/08/blog-post.html</a></td> <td>Пост о том, что лучше сто раз проверить</td> </tr> </tbody> </table> </body> </html> '; /** создаем новый dom-объект **/ $dom = new domDocument; /** загружаем html в объект **/ $dom->loadHTML($html); $dom->preserveWhiteSpace = false; /** элемент по тэгу **/ $tables = $dom->getElementsByTagName('table'); /** получаем все строки таблицы **/ $rows = $tables->item(0)->getElementsByTagName('tr'); /** цикл по строкам **/ foreach ($rows as $row) { /** все ячейки по тэгу **/ $cols = $row->getElementsByTagName('td'); /** выводим значения **/ echo $cols->item(0)->nodeValue.'<br>'; echo $cols->item(1)->nodeValue.'<br>'; echo '<hr>'; } ?> Хелп ми
Ну, коль авторша сайта сама не прочь тырить. Почему бы не регулярками? PHP: <? preg_match_all('/<td>(.*?)<\/td>\s+<td>(.*?)<\/td>/i', $html, $match, PREG_SET_ORDER); print_r($match);