Регулярка

event · 10 фев 2015

Помогите пожалуйста с регуляркой, нужно спарсить ссылки на новости из этой страницы: _http://edu.ru/index.php?page_id=5&topic_id=19

Пробую так:

Код (PHP):

$site = file_get_contents("http://www.edu.ru/index.php?page_id=5&topic_id=19");

preg_match_all('#<td class="content">[url="(.*)"](.*)[/url]</td>#', $site, $v);

foreach($v[1] as $val) {

echo $val . "<br />";

}

Работает, парсит, но как-то плохо. Нужно только ссылки.

Заранее спасибо.

Добавлено спустя 23 минуты 9 секунд:
Все, сделал сам.

rognorog · 10 фев 2015

Принято делиться решениями! Возможно ты сможешь этим помочь другому! Хотя с такой регуляркой далеко не уедишь! Если вдруг будут оступы и одинарные ковычки, ВДРУГ!

Но в твоем случае хватит и DOMDocument.

event · 10 фев 2015

rognorog сказал(а):

Принято делиться решениями! Возможно ты сможешь этим помочь другому! Хотя с такой регуляркой далеко не уедишь! Если вдруг будут оступы и одинарные ковычки, ВДРУГ!

Но в твоем случае хватит и DOMDocument.
Нажмите, чтобы раскрыть...

Вот так сделал:

Код (PHP):

$site = file_get_contents("http://www.edu.ru/index.php?page_id=5&topic_id=19");

preg_match_all('#<td class="content">[url="(.*?)"](.*?)[/url]#', $site, $v);

Добавлено спустя 54 секунды:
Помогите еще написать регулярку, которая будет парсить текст новости (без картинок и т.д., т.е. сам текст) от сюда: http://ria.ru/education/20150210/1046879553.html

rognorog · 10 фев 2015

Там много где текст, тебе что прям в кучу весь нужен? Прям весь? Или только определенный блок?

event · 10 фев 2015

Все с этим разобрался.

Подскажи регулярку чтобы вытягнуть текст новости отсюда - http://fulledu.ru/news/vuzi/news/1812_v-sevastopole-na-baze ... -sozd.html

rognorog · 11 фев 2015

Смысл тебе помогать если ты не умеешь составлять вопросы.

Регулярка

event Новичок

rognorog Новичок

event Новичок

rognorog Новичок

event Новичок

rognorog Новичок

Быстрый поиск

Регулярка

event Новичок

rognorog Новичок

event Новичок

rognorog Новичок

event Новичок

rognorog Новичок