Добрый день, написал скрипт, который мне выводит 10 текстов, только они разной кодировки, как их в одну преобразовать, или подскажите функцию которая может определить кодировку заданного текста)
вот отрывок, текст1 и текст2 разделяются "=======" , вот один отображается нормально, второй, как видите плохо Код (Text): пользователям со статусом . Подробности на форуме. . . С сегодняшнего дня вступили в силу изменения связанные с системой поинтов. . . Открыт раздел Складчина. Теперь можно скинуться на желаемый софт с другими членами клуба. . . Для членов клуба добавлена возможность публикации контента. . . По адресу . . доступен форум клуба. . . До марта действует скидка на инвайты. . . Введена новая система инвайтов. Подробнее о приобретении инвайтов здесь. . . Подводим итоги конкурса. Архив новостей Архив Июль Июнь Май Апрель Март Февраль Январь Декабрь Ноябрь Октябрь Сентябрь Август Июль Июнь Май Апрель Март Февраль Январь Декабрь Ноябрь Октябрь Сентябрь Август Июнь Май Показать скрыть весь архив - . поисковая оптимизация сайта раскрутка сайта продвижение сайта. Закрытый клуб любителей качественного вареза. . . . =================================================== Серверные парсеры парсим РІСЃС‘ РЅР° Главная Разрешите представить вам настраиваемый СЃРєСЂРёРїС‚ для парсинга поисковых систем Р° также РґСЂСѓРіРёС… сайтов имеющих СЃС…РѕР¶СѓСЋ СЃ РџРЎ многостраничную структуру. Р’С‹ легко можете настроить парсер РЅР° работу СЃ любым сайтом создав для
причем сдесь регулярка?) есть цикл, по которому вытягиваютс 10 статей, по одной с каждого сайта, только на сайтах разная кодировка может быть, какие еще функции мне посоветуете попробывать)
Функции определения кодировки работают не на 100%, они как бы "экспериментальные". Пишите правила кодировки для каждого сайта.
Ну вот куда я попал ? Это детский сад ? При том что при выдёргивании текстов с сайтов надо использовать нормальные инструменты. (которые сами определят кодировку и сделают всё что надо) А заголовки и meta-тэги уже успели отменить ? Вышел какой-то HTML6 в котором этого нету ?
ну впринципе я тоже думал об этом, но я пробывал задавать такуюже кодировку тексту, и он всеравно неправильно отображался((( Код (Text): echo $str; как мне сдесь вот кодировку вставить? PHP: echo' <html> <meta http-equiv="Content-Type" content="text/html; charset='.$code.'"> <body> '; echo $str; echo ' </body> </html>'; вот так вот я сделал, наверно будет работать, щас напишу чтоб парсило кодировку, и буду вставлять в переменную $code. правильно мыслю?)
все просто - регуляркой вытаскиваешь в массив charset[] кодировку из html сайта и в массив text свои статьи после чего применяешь такой код PHP: <? #перекодировка всего в utf-8 foreach($text as $k => $v) { $out[] = iconv($charset[$k],'utf-8',$v); } #теперь выводим статьи foreach($out as $v) { echo $v . '<br/>============<br/>'; } ?>
Человек просит помочь в написании скрипта, а не в выборе инструментала. Не на всех страницах есть meta-теги, если Вы не знали.
nislova, на всех нормальных страницах есть. Там где нет элементарно meta тега с кодировкой выставлять utf-8.
Там где нет, есть заголовки, если и их нет, то это исключение и для этого случая можно уже ковырять костыли в виде списка сайтов-исключений Что я и делаю. Говорю выкинуть регулярку ибо скрипт который он просит помочь написать вовсе не должен её иметь.
Я контент-менеджером работаю, по сотне сайтов за месяц вижу - не на всех нормальных страницах оно есть.
Код (Text): Добрый день, написал скрипт, который мне выводит 10 текстов, только они разной кодировки, как их в одну преобразовать, или подскажите функцию которая может определить кодировку заданного текста) При чем тут мета и заголовки? Хорош троллить.
Так у тебя мозг ещё дальше спрятался, до него как раз гораздо важнее достучаться, автор темы хотя бы знает что он нифига не соображает и спрашивает совета, ты же нифига не знаешь но строишь из себя самого умного и ещё имеешь наглость советовать... (Есть такой сленговый термин "ламер", и это не оскорбление, это факт) Есть два вида скриптов, на коленке лишь бы работало (то что предлагаешь ты) и по уму (чтоб работало быстро, надёжно, гибко) Первые надо использовать ТОЛЬКО для промежуточного тестирования идей, а не на живых проектах
У меня не мозг спрятался, я сам весь от тебя уже прячусь - прилип как банный лист к заднице. ))) Лучший совет в этой ситуации был - брать каждый сайт в отдельности и настраивать под него скрипт, это ПРОСТО, НАДЕЖНО и РАБОТАЕТ. У вас в Эстонии, наверное, принято программировать с красивыми отступами, наследованиями классов, сеточками вида функция() { ой, мальчики, здесь мой гламурный кодик! ретюрн, мальчики } Дооо? PS: Отвали по-хорошему.
Это принято везде где делают качественно. Увы на практике редкость, чаще всего делают как ты, а потом когда всё рухнет то отмазываются что им мало платили по этому они криво делали.