Помогите пожалуйста с регуляркой, нужно спарсить ссылки на новости из этой страницы: _http://edu.ru/index.php?page_id=5&topic_id=19 Пробую так: Код (PHP): $site = file_get_contents("http://www.edu.ru/index.php?page_id=5&topic_id=19"); preg_match_all('#<td class="content">[url="(.*)"](.*)[/url]</td>#', $site, $v); foreach($v[1] as $val) { echo $val . "<br />"; } Работает, парсит, но как-то плохо. Нужно только ссылки. Заранее спасибо. Добавлено спустя 23 минуты 9 секунд: Все, сделал сам.
Принято делиться решениями! Возможно ты сможешь этим помочь другому! Хотя с такой регуляркой далеко не уедишь! Если вдруг будут оступы и одинарные ковычки, ВДРУГ! Но в твоем случае хватит и DOMDocument.
Вот так сделал: Код (PHP): $site = file_get_contents("http://www.edu.ru/index.php?page_id=5&topic_id=19"); preg_match_all('#<td class="content">[url="(.*?)"](.*?)[/url]#', $site, $v); Добавлено спустя 54 секунды: Помогите еще написать регулярку, которая будет парсить текст новости (без картинок и т.д., т.е. сам текст) от сюда: http://ria.ru/education/20150210/1046879553.html
Все с этим разобрался. Подскажи регулярку чтобы вытягнуть текст новости отсюда - http://fulledu.ru/news/vuzi/news/1812_v-sevastopole-na-baze ... -sozd.html