Всем привет. Имеется куча html файлов. Нужен парсер такого смысла. В тексте часто встречаются квадратные скобки с цифрой. типа [45] [1] [23] [11] и т.п возможно даже будет просто [] без цифры. Задача. Нужно удалить это ххховно. Чтоб остался только текст без этих скобок с цифрами или просто скобок Не стоит забывать, что просто цифры без скобок удалять не надо...т.к они несут смысл..типа даты рожения ..события и т.п Все это встречается в таком диве. И весь парсер надо применить именно к этому блоку ( диву) <div class="block4"> текст с хххоооовном</div> Т.к большими средствами не располагую---могу предложить на данный момент 200 р. Либо webmoney либо на телефон !! Очень прошу помочь!!!
Не проверял PHP: <?php $dirname = dirname(__FILE__); $dir = scandir($dirname); for ($i = 2; $i < sizeof($dir); $i++) { if (is_file($dir[$i])) { $content = file_get_contents($dirname.$dir[$i]); $content = preg_replace('~\[[0-9]*\]~is', '', $content); file_put_contents($dirname.$dir[$i], $content); } } Кинуть в папку с файлами
Привет Крекер. Не работает...скрипт проходит загрузку в опере без проблем..но с html ками ничего не происходит.
и у тебя вроде как данный код применяется ко всему html, а не к <div class="block4"> текст с хххоооовном</div> Это не есть хорошо..надо ужесточить поиск именно в этой области.
Жеесть =) PHP: <? set_time_limit(0); $dir=dirname(__FILE__); $fp=scandir($dir); if($fp[3]){ for($i=2,$c=count($fp);$i<$c;$i++){ if($fp[$i]==ltrim($_SERVER['PHP_SELF'],"/")) continue; $file=$dir.'/'.$fp[$i]; if(is_file($file)){ if(is_writable($file) && is_readable($file)){ $fc=file_get_contents($file); $fc=preg_replace_callback("#<div\s+class=\"block4\">(.+?)<\/div>#is", create_function('$m','return preg_replace("#\[\d*\]#","",$m[0]);'), $fc); file_put_contents($file,$fc); }else print "Can't open file $file<br>"; } } print "The End<br>"; }else print "Dir is empty<br>"; ?>
Походу счастливый обладатель приза снова талантливый Mr.M.I.T. Mr.M.I.T. Все хорошо, только я тут обнаружил , что в квадратных скобках в моем тексте бывают и слова..что тоже является ересью..и даже многоточие. Доработай пожалуйста код так ...чтоб он удалял все квадратные скобки как с цифрами так и с любыми символами т.е удалял [12390] [adfgGH] [...] --любой символ [,,,]--любой символ [ ] вот все такое борохло мне и надо выкинуть. Вообщем выкинуть все что заключено в эти квадртыные скобки вместе с ними же применительно именно к блоку 4.
PHP: <? set_time_limit(0); $dir=dirname(__FILE__); $fp=scandir($dir); if($fp[3]){ for($i=2,$c=count($fp);$i<$c;$i++){ if($fp[$i]==ltrim($_SERVER['PHP_SELF'],"/")) continue; $file=$dir.'/'.$fp[$i]; if(is_file($file)){ if(is_writable($file) && is_readable($file)){ $fc=file_get_contents($file); $fc=preg_replace_callback("#<div\s+class=\"block4\">(.+?)<\/div>#is", create_function('$m','return preg_replace("#\[.*?\]#","",$m[0]);'), $fc); file_put_contents($file,$fc); }else print "Can't open file $file<br>"; } } print "The End<br>"; }else print "Dir is empty<br>"; ?>