Вообщем вот такой вопрос, в базе весит около 10000 активных сайтов :shock: нужно написать скрипт скажем из базы берет по одному сайту, коннектится берет данные из title, рефреш и следующий... есть варианты?)
Ок попробую понятнее. Допустим есть сайт: site.ru, он висит в БД, необходимо соединиться и "парсить данные" из тега <title>текст</title> и в бд записать. Структура примерно такая: --url-----title----- --site.ru--заколовок №1----- --site2.ru--заколовок другой---- итд
Вообщем вывожу: $page_content = file_get_contents ('http://test.ru'); preg_match_all( "|<title>(.*)</title>|", $page_content, $titles); print_r ($titles[0][0]); и выводится вместе с тегом <title>титл</title> ... а без него как =(
Вообщем есть проблема с кодировкой, если страница в cp1251 то просто вопросы появляются.. можно ведь как то определить кодировку и выводить в нужной?!(
Перекодирую: preg_match("/\<meta[^<>]+charset\s*\=\s*([\w\-]+)/i",$site,$res); $codingconvert=mb_convert_encoding($matches[1],'UTF-8','$res[1]'); Уже менял местами значения итд итп. То кракозябры то вообще нет текста русского... блин что не так делаю(