последовательность букв и цифр (регулярка)

joost · 9 июл 2008

Надо вынять урл из такой строки

PHP:

$page="<TD class=micro title=Canon i-SENSYS MF4018 align=left><A href=http://www.site.com/Canon-i-SENSYS-MF4018.htm>";

учитывая

HTML:

<TD class=micro title

PHP:

print $kilk_data=preg_match_all("/<TD class=micro title=\w+><A href=(.*)>/isU",$page,$data);

дает 0 совпадений.
В чем проблема?

Sergey89 · 9 июл 2008

\w+ - это слово. пробел не часть слова.

joost · 9 июл 2008

Sergey89
а как обозначить любую последовательность слов, пробелов, цифр?

Sergey89 · 9 июл 2008

Код (Text):

.*

joost · 9 июл 2008

Sergey89
а что делает модификатор U? В нете всюду про "жадность пишет". Но что делает не понятно.

Sergey89 · 9 июл 2008

Код (Text):

.*

Будет соответствовать минимально возможному совпадению.

joost · 9 июл 2008

вот еще вопросик

HTML:

<strong>289$</strong>

как выдернуть 289 понятно, но $ мешает.

делаю /<strong>(.*)\$</strong>/

не помагает

DarkElf · 9 июл 2008

joost

регулярку в апострофы попробуй взять вместо двойных кавычек

joost · 9 июл 2008

как упростить регулярку ?

PHP:

/http:\/\/site.com|http:\/\/www.site.com/

Kreker · 9 июл 2008

joost
http://ru2.php.net/manual/ru/function.parse-url.php

Sergey89 · 9 июл 2008

joost сказал(а):

как упростить регулярку ?

PHP:

/http:\/\/site.com|http:\/\/www.site.com/

Нажмите, чтобы раскрыть...

Код (Text):

/http:\/\/(www\.)?site\.com/

joost · 9 июл 2008

Sergey89
а как записать /.*?/

.* надо же в () брать

joost · 10 июл 2008

вот еще такая проблема

PHP:

preg_match_all("/<A href=\"(http:\/\/www\.site\.ua\/)?(.*)\"(.*)?\">/isU",$page,$url);

не находит ничего.

а если

PHP:

preg_match_all("/<A href=\"(.*)\"(.*)?\">/isU",$page,$url);

выдает все урлы, что есть на странице

почему не реагирует на

PHP:

(http:\/\/www\.site\.ua\/)?

?

Kreker · 10 июл 2008

(http:\/\/www\.site\.ua\/)?
Нажмите, чтобы раскрыть...

Может так:
preg_match_all("/<A href=\"(http:\/\/www\.site\.ua\/)(.*)?>/isU", '<a href="http://www.site.ua/url=1" >',$url);

анти-пожиральщика после (.*) первого забыли. А нужны ли доп. параметры из ссылки?

joost · 10 июл 2008

Kreker сказал(а):

А нужны ли доп. параметры из ссылки?
Нажмите, чтобы раскрыть...

title, alt и т.д. не нужны

joost · 10 июл 2008

предложите кто может универсальное выражение для "выдергивания" урлов любого формата

joost · 11 июл 2008

Kreker сказал(а):

Может так:

preg_match_all("/<A href="(http:\/\/www\.site\.ua\/)(.*)?>/isU", '<a href="http://www.site.ua/url=1" >',$url);
Нажмите, чтобы раскрыть...

кроме

HTML:

<a href="http://www.site.ua/url=1

есть и страници вида

HTML:

<a href="ur.htm

PHP:

preg_match_all("/<A href="(http:\/\/www\.site\.ua\/)?(.*)"(.*)?">/isU",$page,$url);

должен выдергивать и те и другие так и делает, но выводит урлы
http://www.site.ua/url=1
ur.htm

хотя должен
url=1
ur.htm

или я не прав?

joost · 14 июл 2008

в

PHP:

/<A href=\"(http:\/\/(www\.)?site\.com\/)?[^http](.*)\"(.*)?\">/isU

седает первый символ в

PHP:

$url[[b]3[/b]][$i]

почему? что не правильно?

Sergey89 · 14 июл 2008

потому что первый символ h, t или p.

joost · 14 июл 2008

Sergey89
а как правильно сделать?
надо выбрать урлы в которых есть или нет site.com и если нет site.com, то и не должно быть http

joost · 14 июл 2008

Sergey89 сказал(а):

потому что первый символ h, t или p
Нажмите, чтобы раскрыть...

первый символ есть и с, а - не в этом дело

Sergey89 · 14 июл 2008

Просто выбери все адреса на странице и пробегись по ним циклом, а не мучайся с универсальной регуляркой

joost · 14 июл 2008

PHP:

[^http]

совпадает со всеми строками, в которых нет http или со строками, где нет символа h, но есть ttp?

обясните! запутался уже.

joost · 14 июл 2008

Sergey89
нужна имено универсальная регулярка.
почему

PHP:

/<A href=\"(http:\/\/(www\.)?site\.com\/)?[^http](.*)\"(.*)?\">/isU

не правильно пашет?
"Жрет" первый символ. Вроде все правильно

Sergey89 · 14 июл 2008

joost сказал(а):

PHP:

[^http]

совпадает со всеми строками, в которых нет http или со строками, где нет символа h, но есть ttp?

обясните! запутался уже.
Нажмите, чтобы раскрыть...

Нет символа h, t или p.

последовательность букв и цифр (регулярка)

joost Guest

Sergey89 Активный пользователь

joost Guest

Sergey89 Активный пользователь

joost Guest

Sergey89 Активный пользователь

joost Guest

DarkElf Активный пользователь

joost Guest

Kreker Старожил

Sergey89 Активный пользователь

joost Guest

joost Guest

Kreker Старожил

joost Guest

joost Guest

joost Guest

joost Guest

Sergey89 Активный пользователь

joost Guest

joost Guest

Sergey89 Активный пользователь

joost Guest

joost Guest

Sergey89 Активный пользователь

Быстрый поиск

последовательность букв и цифр (регулярка)

joost Guest

Sergey89 Активный пользователь

joost Guest

Sergey89 Активный пользователь

joost Guest

Sergey89 Активный пользователь

joost Guest

DarkElf Активный пользователь

joost Guest

Kreker Старожил

Sergey89 Активный пользователь

joost Guest

joost Guest

Kreker Старожил

joost Guest

joost Guest

joost Guest

joost Guest

Sergey89 Активный пользователь

joost Guest

joost Guest

Sergey89 Активный пользователь

joost Guest

joost Guest

Sergey89 Активный пользователь