Здравствуйте. Давно пользуюсь библиотекой Simple Html Dom. Но вот только сейчас понял, что в нем нет такой функции, которая исключала бы тег из массива при наличии в его атрибуте некого значения. Типа, attribute*=value, но только наоборот. Подскажете, как это можно воплотить, обойдясь малой кровью. Для чего нужно: на сайте две ссылки стоят рядом, никак не отличаясь атрибутами. Единственное, в чем они различны, так это в том, что в атрибуте href одной половины ссылок есть значение "mondaj", а у другой нет. Мне вот как раз необходимо получить именно те ссылки, где этого слова нет. Заранее, спасибо за помощь!
Спойлер: Страдай Спойлер: Страдай Спойлер: Страдай Спойлер: Страдай Спойлер: Страдай Спойлер: Страдай Спойлер: Страдай Спойлер: Страдай Спойлер: Страдай Спойлер: Страдай Спойлер: И ты Спойлер: Тоже Спойлер: Страдай Спойлер: Страдай Спойлер: Страдай Спойлер: Страдай PHP: strpos ( $url, 'mondaj' ) === FALSE
Ну, тоже важные люди. Например, когда один человек хочет объединить несколько сайтов поставщиков) Почти)) Там ссылки товаров с монтажем и без монтажа.. Видимо, наполнители сего магазина решили подшутить над заказчиками, написав в ссылке именно mondaj, а не montaj Я за*бся их открывать)))) Блин, про strpos я знал, но тут проблема немного глубже. Думал, будет что-то типа но как я понял этого не будет. А проблема глубже тем, что я хочу оперировать только селекторами, а не кодом. Тем самым, создав некую универсальность в парсинге. Еще проще - разрабатываю софт с веб-интерфейсом, который позволит парсинг на крон ставить.. А прелесть селекторов в том, что их можно будет просто хранить в базе, тем самым, просто подключая в нужное место кода. Или у Вас есть идеи, как решить эту проблему? UPD1. В голову пришли регулярные выражения. Но я в них не смыслю... Поможете? Вот код первой ссылки: HTML: <td style="border-top: 0; padding-top: 0;"> <a class="btn btn-info btn-block" href="/cat/chastnaya-kanalizaciya/rostok_431.html" style="margin-top: 5px">Подробнее</a> </td> Вот вторая. HTML: <td style="border-top: 0; padding-top: 0;"> <a class="btn btn-info btn-block" href="/cat/chastnaya-kanalizaciya/rostok-mondaj_432.html" style="margin-top: 5px">Подробнее</a> </td> Как видите - одинаковые. Отличаются наличием слова mondaj. Как через регулярку можно вытащить ссылку БЕЗ слова mondaj?
Мне нужна такая хуета, которую можно будет сохранить в качестве ебучего параметра в базу. Чтобы потом, по сути, редактировать этот параметр мог юзер. UPD1. И эта хуета должна делать так, чтобы парсились hrefы ссылок без mondы UPD2. Вот что я имею в виду.
Нее... Если говорить об универсальности, то этот способ вообще не будет универсальным. Он будет только для ДАННОГО сайта.. Но видимо, придется много думать, как это воплотить... --- Добавлено --- Хотя пришла идея в голову... Типа, также добавить таблицу фильтров... А в ней указывать тип фильтрации (должно/не должно содержать, точное/неточное совпадение) и само слово-фильтр..