Вот делаю так PHP: preg_match_all("/<a .* href=http:\/\//$_SERVER['SERVER_NAME']/(.*) .*>isU", $page,$url) Может проще как-то можно? И как учесть www (может быть, а может нет) ?
а как обозначить "site.com или ничего" пробую так "site\.com|("ничего" не понятно как обозначить)" (site\.com)? не подходит ибо может быть site\.ru, а єто не "ничего" "ничего" - значит пусто
а как отобрать все которые без http:// тоесть надо прописать "нет http://". как обозначить в регулярке ?
помогите сделать универсальную регулярку для поиска всех внутрених страниц сайта я делаю так preg_match_all(/<a.*href=\"?(?:http:\/\/)?(?:site.com)?(.*)\"?.*>/isU,$page,$urls); вроде все правильно, но работает регулярка не совсем коректно. что и где подправить?
пробовал еще так /<a.*href=[\'|\"]{0,1}(.*)[\'|\"]{0,1}.*>/ тоже не коректно работает подскажите как правильно сделать