Здравствуйте. У меня проблемы с кодировкой при парса html кода с интернета. Мой скрипт в кодировке utf-8 и в случае если сайт который я парсю в кодировке windows-1251 или др., то у меня 'ИХ' текст отображается как иероглифы. Как решить эту проблему? Помогите пожалуйста. Заранее спасибо. Вот код того, как я качаю страницу. Код (Text): $sock = @fopen ($site, 'r');//Загружаем страничку //Если загрузка не удалась, то выводим сообщение об ошибке if (!$sock){ exit("Попытка подключения к адресу $site не удалась..."); } //Если загрузка удалась, радуемся и начинаем анализировать DOM дерево полученной странички else{ $html = '';//Переменная исходного кода страницы //Цикл, который построчно заносит исходный код загруженной странички в переменную $html while (!feof($sock)){ $html .= fgets($sock); }
artoodetoo, неа, какие только я кодировки ставил все равно фигня. Надо что бы скрипт нормально поддерживал любые кодировки
Мож файл не конвертнули в UTF-8 (без BOM) и <meta charset="utf-8"> не написали? Ну и заголовки тоже желательно header и .htaccess. Вообщем все желательно весь сервак переведите по умолчанию в utf-8 =)
Всем спасибо все заработало, оказывается я кое что не так делал) Особая благодарность YSandro за своевременную помощь.
Да какая там помощь, написал Разве что на будущее задумал кое о чем напомнить, и эти мысли дошли телепатически Тогда они могли дойти хоть от кого