Здравствуйте! Есть страницы: http://worldoftanks.ru/clanwars/maps/globalmap/ http://worldoftanks.ru/clanwars/maps/globalmap/?province=MR_10 На ней много скриптов, фреймов и т.д. Как получать полный код страницы, что бы при выводе кода получилась копия страницы. Перепробовал известные мне варианты, почти все не дали ни какого результата. Пробовал curl_init и file_get_contents других способов на php я не знаю. Заранее спасибо за вашу помощь.
Истинный путь один: запускать на сервере браузер и сниферить трафик с помощью самописного расширения. В хроме это сравнительно легко. + нужно учесть, что некоторые скрипты и данные могут подгружаться после загрузки страницы.
но ведь должен же быть способ сделать полную имитацию работы браузера перед загрузкой страницы. к тому же когда смотришь исходный код страницы через браузер он так же не полный, но при это в хроме если смотреть код фрейма то он полный. К тому же есть сайты которые получают такие данные, сомневаюсь что они это делают через браузер, иначе у них на обновление всех данных уходило бы очень много времени а там данные обновляться раз в 2-3 минуты (не реально открыть все провинции, снять данные о всех кланах за 3 минуты).
Через браузер - это универсально. Чтобы быстро, нужно заточить скрипт под конкретную страницу. То есть не один вызов cURL, а множество, чтобы повторить все запросы, которые делает браузер. Возможно, все и не надо. Информация может подгружаться ajax'ом в формате JSON. В такой ситуации, надо повторить именно этот запрос и не придется мучиться с HTML. А еще можно парсить сайты, которые уже =)
вот тока иногда они глючат, а из-за них и мой сайт начинает глючить. Спасибо за дельные советы решил все свои проблемы, помогла прога Wireshark. Вытащил все нужные мне ссылки на необходимые файлы.
Высказывание не к месту, пополняешь так количество сообщений на форуме? официальный API не предоставляет нужной (мне) информации, поэтому пришлось пойти таким путем.