За последние 24 часа нас посетили 17760 программистов и 1286 роботов. Сейчас ищет 1401 программист ...

Как регулярными выражениями сделать парсинг хтмл?

Тема в разделе "Регулярные выражения", создана пользователем DAN SEA, 8 окт 2007.

  1. DAN SEA

    DAN SEA Активный пользователь

    С нами с:
    8 окт 2007
    Сообщения:
    5
    Симпатии:
    0
    Люди-если повторяюсь - сильно не пиннайте...;-)...надо сделать парсинг хтмл...а собственно вот сама задача: есть сайты №1(основной), и сайт №2. пользователь вводит поисковый запрос в поисковую форму сайта №1(основного)-этот запрос передается поисковой форме сайта №2-и тот выдает результаты поиска в виде ссылок с кусками текста(это уже там есть)- типа как яндекс или рамблер...нужно чтобы после того как сайт №2 выдал результаты поиска -сайт №1 их отпарсил и вывел у себя в том же виде-но без оболочки того сайта(№2)-но при нажатии на ссылки - выданные поиском- запрос уходил опять на сайт №2 - и возвращался в виде результатов- опять без оболочки и т.д. мишуры сайта №2.. задача состоит в том -чтобы пользователь не знал-откуда берется инфа...всю голову изломал не придумаю никак как это провернуть...знаю только что регулярными выражениями можно вроде...
     
  2. AlexGousev

    AlexGousev Активный пользователь

    С нами с:
    25 мар 2006
    Сообщения:
    1.505
    Симпатии:
    0
    Адрес:
    Москва
    Варианта два:

    1. Сайт №1 принадлежит вам.
    Тогда не надо мучаться с разбором HTML, а просто организовать RPC (удаленный запрос функции) в данном случае поиска. Т.е. делается запрос по некоторому адресу с некоторыми параметрами, в ответ на что получается ответ в определенном формате, приспособленном для легкого разбора. Сейчас наиболее популярным форматом обмена данными является XML.

    2. Сайт №2 вам не принадлежит.
    На этот вопрос на этом форуме отвечать не принято. Почему? Воровать нехорошо!
     
  3. DAN SEA

    DAN SEA Активный пользователь

    С нами с:
    8 окт 2007
    Сообщения:
    5
    Симпатии:
    0
    а я и не собираюсь воровать а использовать контент с разрешения авторов-у них это не запрещено-и даже отдельно оговорено...просто с точки зрения маркетинга не должен знать конечный потребитель откуда это все "великолепие" берется....мало того-если кто то напишет мне такой парсер-готов заплатить...денег у меня немного-и если устроит-можем сойтись...или еще как отплатить(по асе можно обговорить)
     
  4. DAN SEA

    DAN SEA Активный пользователь

    С нами с:
    8 окт 2007
    Сообщения:
    5
    Симпатии:
    0
    вобщем народ-клич тем-кто умеет!:) - ПЕШИте в асию: 331 526 128
     
  5. DAN SEA

    DAN SEA Активный пользователь

    С нами с:
    8 окт 2007
    Сообщения:
    5
    Симпатии:
    0
    а возможен еще такой вариант-я сам аэрографист профессиональный...и если кто мне решит пару задач связанный с тем что я писал выше-могу бахнуть аэрографию на тачку бесплатно...если кмоу интересно-глядите наш сайт www.ultradesign.ru ....в этом году мы на автоэкзотике принимали участие- в первый день фестиваля рисовали машину на сцене -на время при большом стечении народа:))...так что -сами понимаете...если до росписи дойдет-будет некисло сделано(7 лет стажа все таки)....вопщем- жду ответа как соловей лета...
     
  6. AlexGousev

    AlexGousev Активный пользователь

    С нами с:
    25 мар 2006
    Сообщения:
    1.505
    Симпатии:
    0
    Адрес:
    Москва
    Ну тогда вариант номер раз :)
     
  7. ustas

    ustas Активный пользователь

    С нами с:
    17 сен 2007
    Сообщения:
    59
    Симпатии:
    0
    вот и оговори просто организовать RPC
     
  8. DAN SEA

    DAN SEA Активный пользователь

    С нами с:
    8 окт 2007
    Сообщения:
    5
    Симпатии:
    0
    угу спасибки-помогли люди ДОБРЫЯ....:) ладно хоть один нашелся- кто взялся мне это кодить...:)!
     
  9. ustas

    ustas Активный пользователь

    С нами с:
    17 сен 2007
    Сообщения:
    59
    Симпатии:
    0
    всегда пожалуйста, заходите, спрашивайте
     
  10. +Sten+

    +Sten+ Активный пользователь

    С нами с:
    27 авг 2007
    Сообщения:
    978
    Симпатии:
    0
    В продолжение темы:

    Хочу организовать поиск по нескольким сайтам (2-3).

    Нуждаюсь в совете по поводу способа парсинга: регулярками, строковыми или, мб, XML функциями? Ниразу ничего подобного не делал. Очень жду помощи.

    Спасибо.
     
  11. ustas

    ustas Активный пользователь

    С нами с:
    17 сен 2007
    Сообщения:
    59
    Симпатии:
    0
    str_google - парсит почти все сайты мира, имеется возможность парсить 2-3 сайта