Еще раз добрый день. Я занимался разработкой парсера и натолкнулся на такую проблему. Не могу получить доступ к ресурсу https://panteon-finance.com/pammView.php?pamm=5000106&broker=panteon ни через курл, ни через file_get_contents. Может быть Вы тоже сталкивались с подобной проблемой? Замена https на http не помогла, и в таких случаях при выводе полученных данных он мне выводил error-ошибку денвера что-то типа _Incapsula_Resource was not found on this server. Вот... Кто может что подсказать? Пробовал отключение проверки сертификатов - тоже не помогло
А причем тут он, если сам я на сайт могу заходить? Я думаю, проблема в сертификате, и может кому-то удавалось ее обходить Добавлено спустя 21 минуту 12 секунд: Перепробовал всё, что можно.. Постоянно
Пытался разные коды.. Код (Text): <?php $url = "https://panteon-finance.com/pammView.php?pamm=5000106&broker=panteon"; function curl_get_contents($url) { $curl = curl_init($url); curl_setopt($curl, CURLOPT_RETURNTRANSFER, 1); curl_setopt($curl, CURLOPT_FOLLOWLOCATION, 1); curl_setopt($curl, CURLOPT_SSL_VERIFYPEER, 0); curl_setopt($curl, CURLOPT_SSL_VERIFYHOST, 0); $data = curl_exec($curl); curl_close($curl); return $data; } echo curl_get_contents($url); ?> Попробуйте... Добавлено спустя 1 минуту 16 секунд: Даже если доступа к самому ресурсу нет, в любом случае, должен же быть способ получить HTML-код о спарсенной страницы
По идее всё и так выводится... Ведь когда я захожу через браузер на страницу, меня же не требует авторизовать. Я даже не зареган там
Странно, а от меня требует авторизации =( При этом со страницы https://panteon-finance.com/pammView.php?pamm=5000106&broker=panteon меня редиректит на страницу авторизации... Опять странность, сейчас никуда не редиректит... Как так? Хотел пример адреса страницы авторизации предоставить и код, но теперь страничка открылась со статусом 200... Добавлено спустя 13 минут 54 секунды: Видимо когда я заходил на эту страничку, какие то из механизмов не работали, сейчас же в куки начали, извиняюсь, какаться какие-то записи. Соответственно, тогда я был не залогинен, теперь залогинен постоянно (как гость, по всей видимости).
там какая-то магия с раскодированием тела через javascript. не получишь ты в PHP того, что видишь в браузере! ну или задача усложняется на порядок.
Вот сейчас я захожу - нет редиректа... 200 код Добавлено спустя 2 минуты 47 секунд: Можно получить. В ответ пишется контент.
Ты смотри внимательнее. Естественно, что после редиректа там будет 200. Если ты не авторизован, то там вообще два редиректа.
через консольный wget или curl получи контент — это будет то, что получает скрипт. браузер же намного "умнее", он без твоего ведома много чего делает ))) ты видишь готовый результат, а не сырье, которое надо разбирать.
Код (Text): wget --max-redirect 0 --no-check-certificate "https://адрес_из_первого_поста" результат в файле Код (PHP): <html> <head> <META NAME="robots" CONTENT="noindex,nofollow"> <script> блаблабла eval(eval('String.fromCharCode('+z+')'));})(); </script></head> <body> <iframe style="display:none;visibility:hidden;" src="блаблабла" id="gaIframe"></iframe> </body></html>
А, все я понял, что ты имеешь ввиду... Сорьки Добавлено спустя 3 минуты 27 секунд: Но, блин, все равно не понимаю, как после редиректа может быть статус 200, хоть убей
Редирект - это редирект, как он может подразумевать не редирект? =) Добавлено спустя 15 секунд: Да, так.