За последние 24 часа нас посетили 18328 программистов и 1634 робота. Сейчас ищет 1671 программист ...

Проблемы с выкачиванием страницы

Тема в разделе "Прочие вопросы по PHP", создана пользователем kayuga, 12 дек 2010.

  1. kayuga

    kayuga Активный пользователь

    С нами с:
    12 дек 2010
    Сообщения:
    5
    Симпатии:
    0
    Приветствую!

    При попытке выкачать страницу с одного форума средствами php обнаружил странность: ничего не отдается ни при помощи curl, ни при помощи просто file().
    при этом пробовал различных страниц с других сайтов выкачать множество, везде всё ок.
    с этого же хоста при помощи банального wget даже без ключей всяких всё качается.
    страница например:
    http://forum.bel-net.ru/index.php?showtopic=12470
    можете сами убедиться, print_r(file('http://forum.bel-net.ru/index.php?showtopic=12470'));

    может кто-нибудь подсказать с чем связано такое поведение? 1й раз подобное вижу...

    P.S. стоит error_reporting(E_ALL);
     
  2. Костян

    Костян Активный пользователь

    С нами с:
    12 ноя 2009
    Сообщения:
    1.724
    Симпатии:
    1
    Адрес:
    адуктО
    kayuga
    может сайт не хочет чтобы ты это делал?
     
  3. kayuga

    kayuga Активный пользователь

    С нами с:
    12 дек 2010
    Сообщения:
    5
    Симпатии:
    0
    о_О ну дык я то хочу )))
    просто вряд ли это какое то программное решение, ибо они бы хоть юзер агент проверяли тогда... а wget без проблем работает... не знаю как быть.
     
  4. Ensiferum

    Ensiferum Активный пользователь

    С нами с:
    11 июл 2010
    Сообщения:
    1.292
    Симпатии:
    0
    Адрес:
    из секты поклонников Нео
    Код (Text):
    1. echo file_get_contents('http://forum.bel-net.ru/index.php?showtopic=12470');
    всё в ажуре
     
  5. Kreker

    Kreker Старожил

    С нами с:
    8 апр 2007
    Сообщения:
    5.433
    Симпатии:
    0
    Нужно написать сначала письмо автору сайта: "А можно ваш сайт выкачать?"

    Ну а если серьезно, посмотрите, какие заголовки присылает сервер.
     
  6. kayuga

    kayuga Активный пользователь

    С нами с:
    12 дек 2010
    Сообщения:
    5
    Симпатии:
    0
    kayuga

    в ответ на get_headers приходит вот что:

    Array
    (
    [0] => HTTP/1.0 200 OK
    [1] => Date: Tue, 14 Dec 2010 23:07:13 GMT
    [2] => Server: Apache
    [3] => X-Powered-By: PHP/5.2.14-pl0-gentoo
    [4] => Set-Cookie: forum_session_id=adbfd37b5975a76e38822e4fb3270dbf; path=/; domain=forum.bel-net.ru; httponly
    [5] => Set-Cookie: forum_topicsread=a%3A1%3A%7Bi%3A12470%3Bi%3A1292368033%3B%7D; path=/; domain=forum.bel-net.ru
    [6] => Set-Cookie: forum_modpids=deleted; expires=Mon, 14-Dec-2009 23:07:12 GMT; path=/; domain=forum.bel-net.ru
    [7] => Cache-Control: no-cache, must-revalidate, max-age=0
    [8] => Expires: 0
    [9] => Pragma: no-cache
    [10] => Transfer-Encoding: chunked
    [11] => Content-Type: text/html;charset=windows-1251
    [12] => X-Cache: MISS from squid.int.shamrockgames.ru
    [13] => X-Cache-Lookup: MISS from squid.int.shamrockgames.ru:3128
    [14] => Via: 1.0 squid.int.shamrockgames.ru (squid/3.0.STABLE19)
    [15] => Proxy-Connection: close
    )