За последние 24 часа нас посетили 18652 программиста и 1604 робота. Сейчас ищут 997 программистов ...

разные значения исходного кода при парсинге (cURL)

Тема в разделе "Прочие вопросы по PHP", создана пользователем ubivator, 17 окт 2013.

  1. ubivator

    ubivator Новичок

    С нами с:
    17 окт 2013
    Сообщения:
    2
    Симпатии:
    0
    Здравствуйте. Проблема вот в чем: тяну исходный код страницы, например http://bebebe.net/komedii/5702-kopy-v-yubkah-2013.html

    код РHP вот такой:
    Код (Text):
    1. $ch = curl_init("http://bebebe.net/komedii/5702-kopy-v-yubkah-2013.html");
    2. curl_setopt($ch, CURLOPT_USERAGENT, 'Mozilla/5.0 (Windows NT 6.1; WOW64) AppleWebKit/537.17 (KHTML, like Gecko) Chrome/24.0.1312.57 Safari/537.17');
    3. curl_setopt($ch, CURLOPT_HEADER, 0);
    4. curl_setopt($ch, CURLOPT_RETURNTRANSFER, '1');
    5. $text = curl_exec($ch);
    6. curl_close($ch);
    7.  
    8. preg_match( '/file=http:\/\/[0-9].{10,150}((mp4)|(flv))/' , $text , $links );
    9.  
    10. echo $links[0];
    Так вот, с помощью паттерна вытягию нужную мне ссылку, но вот в чем проблема: при работе на ДЕНВЕРЕ или в PHP Designer у меня парсит нормальную ссылку, со значением например http://IP/dd10/a792257c557d06342894c20648361805/Kopi_v_ubkah.flv
    а вот при работе на сервере начинается печаль, место нужной ссылки получается вот такая :
    http://IP/dd10/6faa13b495b9e1e4ddac673b1f4ebcc6/Kopi_v_ubkah.flv
    Парсит как бы нужную ссылку, но вот значение 6faa13b495b9e1e4ddac673b1f4ebcc6 отличается от исходного, а хотя оно статичекое всегда: если открыть исходный код через браузер то ссылка такая же как и при работе скрипта на денвере.
    Подскажите, пожалуйста, в каком направлении хоть искать решение этой проблемы?
     
  2. Slavka

    Slavka Активный пользователь

    С нами с:
    1 окт 2013
    Сообщения:
    722
    Симпатии:
    41
    минутку это че - a792257c557d06342894c20648361805 уж не сид ли сессии ? ^_^
    или хеш вашего айпишника .. и соответственно с другого сервера он уже будет другой.
    никто не знает какие приколы придумали на сайте bebebe =)
     
  3. ubivator

    ubivator Новичок

    С нами с:
    17 окт 2013
    Сообщения:
    2
    Симпатии:
    0
    так вот в чем сам прикол : эта ссылка не меняется никогда. Заходил с другим ип. с других компов, даже через другую сети инета - ссылка огстаётся все таже, но вот только я парсю исходный код через сервер она меняется на другое значение, и не работает - например при переходе по ней - тупо никаких действий не происходит - а при переходе по ссылке которую получаем через браузер - начинается скачна файла и все просто отлично .
     
  4. Yadfewm

    Yadfewm Активный пользователь

    С нами с:
    20 июл 2009
    Сообщения:
    223
    Симпатии:
    0
    Как вариант:
    подозрение что на сервере не срабатывает curl_setopt, вернее срабатывает но вместо 'Mozilla/5.0 ... пишет что то своё
    А там где вы парсите стоит защита от парсинга: если браузер клиента неизвестен - послан.
    Попробуйте спарсить со своего сервера и посмотреть какие заголовки к вам прийдут.