За последние 24 часа нас посетили 18569 программистов и 1599 роботов. Сейчас ищут 945 программистов ...

парсинг сайта

Тема в разделе "Прочие вопросы по PHP", создана пользователем shurik330, 5 дек 2011.

  1. shurik330

    shurik330 Активный пользователь

    С нами с:
    16 ноя 2011
    Сообщения:
    18
    Симпатии:
    0
    Здравствуйте.
    Подскажите, можно ли каким-либо образом спарсить с сайта видео и карту?
    На сайте расположено видео (выложено с помощью тега <object>). Пользуясь библиотекой simpleHtmlDom, необходимо достать адрес видео, хранящееся в "value" (<param value="http://www.site.ru/yh3&hl=ru_RU&rel=0" name="movie">). Обращаюсь к блоку <object> и его потомку <param> на странице ничего не выводится. Такая же проблема с yandex картой (при обращении к блоку с картой ничего не выводится). Как можно решить данную проблему?
    Спасибо.
     
  2. Михаил

    Михаил Активный пользователь

    С нами с:
    12 июл 2009
    Сообщения:
    545
    Симпатии:
    0
    Адрес:
    Bielarus
    код покажите.
     
  3. shurik330

    shurik330 Активный пользователь

    С нами с:
    16 ноя 2011
    Сообщения:
    18
    Симпатии:
    0
    PHP:
    1.  
    2. $sait = file_get_contents('http://www.sait.ru/line-81/');                                  
    3.     $html = new simple_html_dom(); // создаем объект
    4.     $html->load($sait); //загружаем HTML-код
    5.     $elements = $html->find("div[class=links]"); // находим все элементы с классом «books»
    6.     $i = 0; // создаём итератор
    7.     $DiscriptionAdmin = array(); // создаём массив для хранения результатов
    8.     foreach($elements as $element) {
    9.     $DiscriptionAdmin[$i]['test'] = $element->children(1)->href;
    10.        // $DiscriptionAdmin[$i]['href'] = $element->children(1)->innerHTML;
    11.        
    12.         $i++; //увеличиваем значение итератора
    13.     }          
    14.    
    15.     for($i=0; $i<sizeof($DiscriptionAdmin); $i++){  
    16.         echo '<p>'.$DiscriptionAdmin[$i]['test'].'</p>';
    17.        
    18.        // echo $DiscriptionAdmin[$i]['href'];    
    19.        
    20.     }    
    21.  
     
  4. Михаил

    Михаил Активный пользователь

    С нами с:
    12 июл 2009
    Сообщения:
    545
    Симпатии:
    0
    Адрес:
    Bielarus
    структуру дайте которую выдаёт file_get_contents ну всмысле
    <html><bodu>bla bla bla</body></html>