За последние 24 часа нас посетил 18571 программист и 1632 робота. Сейчас ищут 1060 программистов ...

Вопрос по регулярке.

Тема в разделе "Регулярные выражения", создана пользователем Alex_ST, 8 май 2014.

  1. Alex_ST

    Alex_ST Активный пользователь

    С нами с:
    5 дек 2011
    Сообщения:
    23
    Симпатии:
    0
    Регулярка
    Код (Text):
    1. preg_match_all('|<a href="(.*.jpg)"><img src="(.*.jpg)" [A-Za-z="0-9\s]+><\/a>|iU', $resultPage, $arrResult);
    При обработке регуляркой выдает такое
    Код (Text):
    1. <a href="00.jpg"><img src="th_00.jpg" width="160" height="106" border="0" alt="text"></a></td><td width=174><a href="00.jpg"><img src="th_00.jpg" width="160" height="106" border="0" alt="text"></a></td><td width=174><a href="00.jpg"><img src="th_00.jpg" width="160" height="106" border="0" alt="text"></a>
    Т.е. попадают и такие куски
    Код (Text):
    1. </td><td width=174>
    Не могу понять, как этого избежать.
    Спасибо!
     
  2. Ke1eth

    Ke1eth Активный пользователь

    С нами с:
    16 мар 2012
    Сообщения:
    1.073
    Симпатии:
    11
    Адрес:
    заблудилса
    Не парсить html регулярками.
     
  3. Your

    Your Старожил

    С нами с:
    2 июл 2011
    Сообщения:
    4.074
    Симпатии:
    7
    А что хотите сделать, то?
     
  4. Alex_ST

    Alex_ST Активный пользователь

    С нами с:
    5 дек 2011
    Сообщения:
    23
    Симпатии:
    0
    Нужно со страницы спарсить вот такой контент:
    <a href="00.jpg"><img src="th_00.jpg" width="160" height="106" border="0" alt="text"></a>
    вернее ссылки на 00.jpg и th_00.jpg
     
  5. Your

    Your Старожил

    С нами с:
    2 июл 2011
    Сообщения:
    4.074
    Симпатии:
    7
    DOMDocument.