За последние 24 часа нас посетили 19595 программистов и 1720 роботов. Сейчас ищут 1768 программистов ...

Парсинг данных со страниц

Тема в разделе "Регулярные выражения", создана пользователем swodniw, 13 янв 2011.

  1. swodniw

    swodniw Активный пользователь

    С нами с:
    4 дек 2010
    Сообщения:
    15
    Симпатии:
    0
    Доброго времени суток.

    Только приступаю к парсингу и посему очень много ошибок
    Подскажите ошибку(хотя может неправильно и все), ну или хотя бы подскажите приблизительный алгоритм решения задачи. В общем проблема такова:

    Есть сайт "https://bets.fonbet.info/bets/?locale=ru"
    Пытаюсь парсить футбол, данные ставок.
    для простого просмотра (ручками) нужно выбрать два пункта:
    1 - время события
    2 - вид спорта (футбол)
    Из исходника вижу:
    время события без ограничений value=0
    футбол id=gwt-uid-4

    Пытался написать так:
    Код (Text):
    1.  $url = 'https://bets.fonbet.info/bets/?locale=ru'; //УРЛ, которому будут передаваться post данные
    2.  
    3.  $ch = curl_init($url);
    4.  curl_setopt($ch, CURLOPT_URL,$url);
    5.  curl_setopt($ch, CURLOPT_RETURNTRANSFER,1);
    6.  curl_setopt($ch, CURLOPT_USERAGENT, "Mozilla/4.0 (compatible; MSIE 6.0; Windows NT 5.1; SV1; .NET CLR 1.1.4322)");
    7.  curl_setopt($ch, CURLOPT_POST,1);
    8.  
    9.  curl_setopt($ch, CURLOPT_POSTFIELDS,"gwt-ListBox=0&gwt-Checkbox=gwt-uid-4");
    10.  $html = curl_exec($ch); //В этой переменной будет содержаться ответ сервера
    11.  curl_close($ch);
    12.  print($html);
    но результат
    Код (Text):
    1. Идет загрузка... Подождите пожалуйста.
    Помогите выбраться из дремучего леса, или укажите в нужном направлении
    (направление на хрен или подобное прошу не указывать - все когда-то начинали)