HTML DOM NODE VALUE

mr.Gasparyan · 22 апр 2010

Привет!

Проблема такая, я парсю html документ, есть таблица и мне нужно из td вытащить
содержимое, и не просто вытащить а вместе с html, то есть что бы все теги остались
"в живых".

Я сейчас делаю так, и у меня из td берется только текст, теги умирают...

Код (Text):

<?php

$html = '

<!DOCTYPE html PUBLIC "-//W3C//DTD XHTML 1.0 Strict//EN"

"http://www.w3.org/TR/xhtml1/DTD/xhtml1-strict.dtd">

<head>

<title>Parsing-and-i.blogspot.com Map</title>

</head>

<body>

<h2>Последние темы блога</h2>



<table border="0">

<tbody>

<tr>

<td><a href="http://parsing-and-i.blogspot.com/2009/08/blog-post_06.html" title="Базы">http://parsing-and-i.blogspot.com/2009/08/blog-post_06.html</a></td>

<td>Базы</td>

</tr>

<tr>

<td><a href="http://parsing-and-i.blogspot.com/2009/08/mysql-delphi-express.html" title="MySQL и Delphi. Express-метод">http://parsing-and-i.blogspot.com/2009/08/mysql-delphi-express.html</a></td>

<td>MySQL и Delphi. Express-метод</td>

</tr>

<tr>

<td><a href="http://parsing-and-i.blogspot.com/2009/08/blog-post.html" title="Пост о том, что лучше сто раз проверить">http://parsing-and-i.blogspot.com/2009/08/blog-post.html</a></td>

<td>Пост о том, что лучше сто раз проверить</td>

</tr>

</tbody>

</table>

</body>

</html>

';

/** создаем новый dom-объект **/

$dom = new domDocument;

/** загружаем html в объект **/

$dom->loadHTML($html);

$dom->preserveWhiteSpace = false;

/** элемент по тэгу **/

$tables = $dom->getElementsByTagName('table');

/** получаем все строки таблицы **/

$rows = $tables->item(0)->getElementsByTagName('tr');

/** цикл по строкам **/

foreach ($rows as $row)

{

/** все ячейки по тэгу **/

$cols = $row->getElementsByTagName('td');

/** выводим значения **/

echo $cols->item(0)->nodeValue.'<br>';

echo $cols->item(1)->nodeValue.'<br>';

echo '<hr>';

}

?>

Хелп ми

lexa · 22 апр 2010

Ну, коль авторша сайта сама не прочь тырить.

Почему бы не регулярками?

PHP:

<?

preg_match_all('/<td>(.*?)<\/td>\s+<td>(.*?)<\/td>/i', $html, $match, PREG_SET_ORDER);

print_r($match);

mr.Gasparyan · 22 апр 2010

Регулярики это хорошо, но не в этом случает.

http://stackoverflow.com/questions/8552 ... -html-tags

HTML DOM NODE VALUE

mr.Gasparyan Активный пользователь

lexa Активный пользователь

mr.Gasparyan Активный пользователь

Быстрый поиск

HTML DOM NODE VALUE

mr.Gasparyan Активный пользователь

lexa Активный пользователь

mr.Gasparyan Активный пользователь