За последние 24 часа нас посетили 18268 программистов и 1637 роботов. Сейчас ищут 1596 программистов ...

Помогите спарсить простенький текст с веб-странички)

Тема в разделе "Решения, алгоритмы", создана пользователем p0wer, 16 фев 2012.

  1. p0wer

    p0wer Активный пользователь

    С нами с:
    16 фев 2012
    Сообщения:
    5
    Симпатии:
    0
    Есть веб-страничка. На ней текст такого вида:

    XX
    http://site1.ru
    http://site2.ru
    http://site2.ru
    UIN1;pass1
    UIN2;pass2
    UIN3;pass3
    ...
    UIN50;pass50

    Нужно сохранить в текстовый файл в столбик эти юины.
    Где XX -- двухзначное или трёхзначное число.

    Правда, в таком виде в исходном коде, а в браузере всё слитно через пробел.

    Буду очень благодарен!
     
  2. Ganzal

    Ganzal Суперстар
    Команда форума Модератор

    С нами с:
    15 мар 2007
    Сообщения:
    9.893
    Симпатии:
    965
    preg_match_all
    ЗЫ потому что видел кросспост в регекс форуме ))
     
  3. p0wer

    p0wer Активный пользователь

    С нами с:
    16 фев 2012
    Сообщения:
    5
    Симпатии:
    0
    Ну я написал туда, не подумав.
    preg_match_all — ну уж очень мне это помогло :)

    Что, нет добрых людишек? :(
     
  4. Ganzal

    Ganzal Суперстар
    Команда форума Модератор

    С нами с:
    15 мар 2007
    Сообщения:
    9.893
    Симпатии:
    965
    задача же понятна - взять список уинов и сохранить их в файл
    при чем тут ХХ в два или три знака вы сами не знаете. задача ведь уины дергать
    значит дергать надо по шаблону "(что-то)семиколонпофиг" и будет у вас массив с уинами
    исходные данные дайте чтоб понятно было какая регулярка нужна
    а то ведь закончим на чем-то типа ^([^;]*);.*$
     
  5. p0wer

    p0wer Активный пользователь

    С нами с:
    16 фев 2012
    Сообщения:
    5
    Симпатии:
    0
  6. Ganzal

    Ganzal Суперстар
    Команда форума Модератор

    С нами с:
    15 мар 2007
    Сообщения:
    9.893
    Симпатии:
    965
    ну допустим взять уины вообще не проблема. а рандомное число зачем? пароли нужно в текстовый файл или только уины?
     
  7. p0wer

    p0wer Активный пользователь

    С нами с:
    16 фев 2012
    Сообщения:
    5
    Симпатии:
    0
    Нужно взять юины и пароли, сохранив в *.txt файлик в таком виде:
    UIN1;pass1
    UIN2;pass2
    UIN3;pass3
    ...
    UIN50;pass50

    А рандомное число просто присутствует на странице. Я просто описал полностью, из чего состоит веб-страничка.
     
  8. Ganzal

    Ganzal Суперстар
    Команда форума Модератор

    С нами с:
    15 мар 2007
    Сообщения:
    9.893
    Симпатии:
    965
  9. p0wer

    p0wer Активный пользователь

    С нами с:
    16 фев 2012
    Сообщения:
    5
    Симпатии:
    0
    Спасибо тебе огромное! Чуток подправил и получилось то, что надо! :)

    <?php
    preg_match_all("/\s(\d+;\w+)/",file_get_contents('test.html'),$m);
    file_put_contents('test.txt', implode("\r",$m[1]) ."\n", FILE_APPEND);
    ?>