Здравствуйте. Я хочу спарсить страничку Яндекса - http://yandex.ru/yandsearch?text=url:stihi.in.ua/proizved.p ... php&lr=213 Юзаю такой код: Код (Text): echo '<fieldset class="nice"><legend>Индексация</legend>'; $url = str_ireplace(array('http://www.','http://'),'','http://www.stihi.in.ua/proizved.php'); $ch = curl_init($url); curl_setopt($ch, CURLOPT_RETURNTRANSFER, true); curl_setopt($ch, CURLOPT_USERAGENT, 'Mozilla/5.0 (X11; Ubuntu; Linux i686; rv:16.0) Gecko/20120815 Firefox/16.0 bot'); curl_setopt($ch, CURLOPT_SSL_VERIFYPEER, false); curl_setopt($ch, CURLOPT_TIMEOUT, 30); curl_setopt($ch, CURLOPT_HEADER, false); $html = curl_exec($ch); curl_close($ch); preg_match('|<strong class="b-head-logo__text">(.*?)</strong>|is',$ret,$index); preg_match('|<br>(\d*?)\ |Uis',$index[1],$index); $index = $index[1]>0?1:2; if($index==1)echo'Проиндексировано'; else echo'Не проиндексировано'; echo '</fieldset>'; Но переменная $html пустая... Парсю другие сайт - все нормально. Помогите пожалуйста решить эту проблему. Заранее спасибо!
Переменная $html пуста эти линии работают нормально Добавлено спустя 1 минуту 22 секунды: А ну я тут забыл поменять в теме, по идеи так: Код (Text): preg_match('|<strong class="b-head-logo__text">(.*?)</strong>|is',$html,$index); Но трабл не в этом, а в том, что $html пустая Добавлено спустя 27 секунд: Выкидывает как бота
Снифер заюзай, если пых на своей машине стоит. Я хз че там, я не знаком с курлом, просто привык по олдскульному отправлять запросы сокетом, формировать их тупо конкатенацией строк%).
А блин вот я затупил, надо вот такой код заставить работать, парсить не сайт а яндекс с запросом этого сайта: Код (Text): $url = 'http://yandex.ru/yandsearch?text=url:stihi.in.ua/proizved.php+|+url:www.stihi.in.ua/proizved.php&lr=213'; Добавлено спустя 2 минуты 7 секунд: Заработало! Ура!!!! Странно из-за этого не работало.. Спасибо GANZAL!!! И всем спасибо за помощь. Ура! Добавлено спустя 12 минут 22 секунды: Блин заработал и перестал работать... Че за фигня... Вот код: Код (Text): echo '<fieldset class="nice"><legend>Индексация</legend>'; $url = str_ireplace(array('http://www.','http://'),'','http://www.stihi.in.ua/proizved.php'); $url = 'http://yandex.ru/yandsearch?text=url:stihi.in.ua/proizved.php+|+url:www.stihi.in.ua/proizved.php&lr=213'; $ch = curl_init($url); curl_setopt($ch, CURLOPT_RETURNTRANSFER, true); curl_setopt($ch, CURLOPT_USERAGENT, 'Mozilla/5.0 (X11; Ubuntu; Linux i686; rv:16.0) Gecko/20120815 Firefox/16.0 bot'); curl_setopt($ch, CURLOPT_SSL_VERIFYPEER, false); curl_setopt($ch, CURLOPT_TIMEOUT, 30); curl_setopt($ch, CURLOPT_HEADER, false); $html = curl_exec($ch); curl_close($ch); preg_match('|<strong class="b-head-logo__text">(.*?)</strong>|is',$ret,$index); preg_match('|<br>(\d*?)\ |Uis',$index[1],$index); $index = $index[1]>0?1:2; if($index==1)echo'Проиндексировано'; else echo'Не проиндексировано'; echo '</fieldset>'; Проверьте пожалуйста кто-нибудь, это у меня он может быть только гонит