За последние 24 часа нас посетили 51618 программистов и 1758 роботов. Сейчас ищут 834 программиста ...

Кодировка текста

Тема в разделе "PHP для новичков", создана пользователем smala, 4 июл 2011.

  1. smala

    smala Активный пользователь

    С нами с:
    11 янв 2011
    Сообщения:
    137
    Симпатии:
    0
    Добрый день, написал скрипт, который мне выводит 10 текстов, только они разной кодировки, как их в одну преобразовать, или подскажите функцию которая может определить кодировку заданного текста)
     
  2. smala

    smala Активный пользователь

    С нами с:
    11 янв 2011
    Сообщения:
    137
    Симпатии:
    0
    вот отрывок, текст1 и текст2 разделяются "=======" , вот один отображается нормально, второй, как видите плохо
    Код (Text):
    1. пользователям со статусом . Подробности на форуме. . . С сегодняшнего дня вступили в силу изменения связанные с системой поинтов. . . Открыт раздел Складчина. Теперь можно скинуться на желаемый софт с другими членами клуба. . . Для членов клуба добавлена возможность публикации контента. . . По адресу . . доступен форум клуба. . . До марта действует скидка на инвайты. . . Введена новая система инвайтов. Подробнее о приобретении инвайтов здесь. . . Подводим итоги конкурса. Архив новостей Архив Июль Июнь Май Апрель Март Февраль Январь Декабрь Ноябрь Октябрь Сентябрь Август Июль Июнь Май Апрель Март Февраль Январь Декабрь Ноябрь Октябрь Сентябрь Август Июнь Май Показать скрыть весь архив - . поисковая оптимизация сайта раскрутка сайта продвижение сайта. Закрытый клуб любителей качественного вареза. . . .
    2. ===================================================
    3.  РЎРµСЂРІРµСЂРЅС‹Рµ парсеры парсим РІСЃС‘ РЅР° Главная Разрешите представить вам настраиваемый СЃРєСЂРёРїС‚ для парсинга поисковых систем Р° также РґСЂСѓРіРёС… сайтов имеющих СЃС…РѕР¶СѓСЋ СЃ РџРЎ многостраничную структуру. Р’С‹ легко можете настроить парсер РЅР° работу СЃ любым сайтом создав для
     
  3. Elkaz

    Elkaz Старожил
    Команда форума Модератор

    С нами с:
    26 июн 2006
    Сообщения:
    3.373
    Симпатии:
    0
    Адрес:
    Баку, Азербайджан
    mb_detect_encoding
     
  4. smala

    smala Активный пользователь

    С нами с:
    11 янв 2011
    Сообщения:
    137
    Симпатии:
    0
    я везде начитался что она не работает (((
     
  5. Invision

    Invision Активный пользователь

    С нами с:
    26 фев 2009
    Сообщения:
    1.437
    Симпатии:
    1
    Адрес:
    Томск
    данные хранятся в разных таблицах насколько я понимаю?[/quote]
     
  6. smala

    smala Активный пользователь

    С нами с:
    11 янв 2011
    Сообщения:
    137
    Симпатии:
    0
    та нет, вытягивает текст с нескольких сайтов, и вот на сайтах та кодировка разная))))
     
  7. Vladson

    Vladson Старожил

    С нами с:
    4 фев 2006
    Сообщения:
    4.040
    Симпатии:
    26
    Адрес:
    Estonia, Tallinn
    И опять регуляркой ?

    Боже, когда уже народ научится использовать инструменты по назначению...
     
  8. smala

    smala Активный пользователь

    С нами с:
    11 янв 2011
    Сообщения:
    137
    Симпатии:
    0
    причем сдесь регулярка?) есть цикл, по которому вытягиваютс 10 статей, по одной с каждого сайта, только на сайтах разная кодировка может быть, какие еще функции мне посоветуете попробывать)
     
  9. nislova

    nislova Активный пользователь

    С нами с:
    8 май 2011
    Сообщения:
    56
    Симпатии:
    0
    Функции определения кодировки работают не на 100%, они как бы "экспериментальные". Пишите правила кодировки для каждого сайта.
     
  10. Vladson

    Vladson Старожил

    С нами с:
    4 фев 2006
    Сообщения:
    4.040
    Симпатии:
    26
    Адрес:
    Estonia, Tallinn
    Ну вот куда я попал ? Это детский сад ?

    При том что при выдёргивании текстов с сайтов надо использовать нормальные инструменты. (которые сами определят кодировку и сделают всё что надо)

    А заголовки и meta-тэги уже успели отменить ? Вышел какой-то HTML6 в котором этого нету ?
     
  11. smala

    smala Активный пользователь

    С нами с:
    11 янв 2011
    Сообщения:
    137
    Симпатии:
    0
    ну впринципе я тоже думал об этом, но я пробывал задавать такуюже кодировку тексту, и он всеравно неправильно отображался(((

    Код (Text):
    1. echo $str;
    как мне сдесь вот кодировку вставить?
    PHP:
    1. echo'
    2. <html>
    3. <meta http-equiv="Content-Type" content="text/html; charset='.$code.'">
    4. <body>
    5. ';
    6.  
    7. echo $str;
    8.  
    9. echo '
    10. </body>
    11. </html>';
    вот так вот я сделал, наверно будет работать, щас напишу чтоб парсило кодировку, и буду вставлять в переменную $code.
    правильно мыслю?)
     
  12. Vladson

    Vladson Старожил

    С нами с:
    4 фев 2006
    Сообщения:
    4.040
    Симпатии:
    26
    Адрес:
    Estonia, Tallinn
    Зачем ? лучше (узнав ту в которой текст приходит) перекодируй её в ту которая у тебя с помощью iconv
     
  13. ckjet

    ckjet Активный пользователь

    С нами с:
    6 апр 2011
    Сообщения:
    172
    Симпатии:
    2
    все просто - регуляркой вытаскиваешь в массив charset[] кодировку из html сайта и в массив text свои статьи после чего применяешь такой код

    PHP:
    1. <?
    2. #перекодировка всего в utf-8
    3. foreach($text as $k => $v)
    4. {
    5. $out[] = iconv($charset[$k],'utf-8',$v);
    6. }
    7. #теперь выводим статьи
    8. foreach($out as $v)
    9. {
    10. echo $v . '<br/>============<br/>';
    11. }
    12. ?>
     
  14. nislova

    nislova Активный пользователь

    С нами с:
    8 май 2011
    Сообщения:
    56
    Симпатии:
    0
    Человек просит помочь в написании скрипта, а не в выборе инструментала.
    Не на всех страницах есть meta-теги, если Вы не знали.
     
  15. Invision

    Invision Активный пользователь

    С нами с:
    26 фев 2009
    Сообщения:
    1.437
    Симпатии:
    1
    Адрес:
    Томск
    nislova, на всех нормальных страницах есть. Там где нет элементарно meta тега с кодировкой выставлять utf-8.
     
  16. Vladson

    Vladson Старожил

    С нами с:
    4 фев 2006
    Сообщения:
    4.040
    Симпатии:
    26
    Адрес:
    Estonia, Tallinn
    Там где нет, есть заголовки, если и их нет, то это исключение и для этого случая можно уже ковырять костыли в виде списка сайтов-исключений
    Что я и делаю. Говорю выкинуть регулярку ибо скрипт который он просит помочь написать вовсе не должен её иметь.
     
  17. nislova

    nislova Активный пользователь

    С нами с:
    8 май 2011
    Сообщения:
    56
    Симпатии:
    0
    Я контент-менеджером работаю, по сотне сайтов за месяц вижу - не на всех нормальных страницах оно есть. :)
     
  18. Vladson

    Vladson Старожил

    С нами с:
    4 фев 2006
    Сообщения:
    4.040
    Симпатии:
    26
    Адрес:
    Estonia, Tallinn
    nislova
    А ты уверен что там где нет меты, нет также и заголовков ?
     
  19. nislova

    nislova Активный пользователь

    С нами с:
    8 май 2011
    Сообщения:
    56
    Симпатии:
    0
    Код (Text):
    1. Добрый день, написал скрипт, который мне выводит 10 текстов, только они разной кодировки, как их в одну преобразовать, или подскажите функцию которая может определить кодировку заданного текста)
    При чем тут мета и заголовки? :) Хорош троллить. :)
     
  20. Vladson

    Vladson Старожил

    С нами с:
    4 фев 2006
    Сообщения:
    4.040
    Симпатии:
    26
    Адрес:
    Estonia, Tallinn
    Троллишь тут ты. Я стараюсь достучаться до ваших мозгов.
     
  21. nislova

    nislova Активный пользователь

    С нами с:
    8 май 2011
    Сообщения:
    56
    Симпатии:
    0
    Ппц. Дак и стучи в мозг автору темы.
     
  22. Vladson

    Vladson Старожил

    С нами с:
    4 фев 2006
    Сообщения:
    4.040
    Симпатии:
    26
    Адрес:
    Estonia, Tallinn
    Так у тебя мозг ещё дальше спрятался, до него как раз гораздо важнее достучаться, автор темы хотя бы знает что он нифига не соображает и спрашивает совета, ты же нифига не знаешь но строишь из себя самого умного и ещё имеешь наглость советовать... (Есть такой сленговый термин "ламер", и это не оскорбление, это факт)

    Есть два вида скриптов, на коленке лишь бы работало (то что предлагаешь ты) и по уму (чтоб работало быстро, надёжно, гибко) Первые надо использовать ТОЛЬКО для промежуточного тестирования идей, а не на живых проектах
     
  23. nislova

    nislova Активный пользователь

    С нами с:
    8 май 2011
    Сообщения:
    56
    Симпатии:
    0
    У меня не мозг спрятался, я сам весь от тебя уже прячусь - прилип как банный лист к заднице. )))

    Лучший совет в этой ситуации был - брать каждый сайт в отдельности и настраивать под него скрипт, это ПРОСТО, НАДЕЖНО и РАБОТАЕТ.

    У вас в Эстонии, наверное, принято программировать с красивыми отступами, наследованиями классов, сеточками вида
    функция()
    {
    ой, мальчики, здесь мой гламурный кодик!
    ретюрн, мальчики
    }

    Дооо? :)

    PS: Отвали по-хорошему.
     
  24. Vladson

    Vladson Старожил

    С нами с:
    4 фев 2006
    Сообщения:
    4.040
    Симпатии:
    26
    Адрес:
    Estonia, Tallinn
    Это принято везде где делают качественно. Увы на практике редкость, чаще всего делают как ты, а потом когда всё рухнет то отмазываются что им мало платили по этому они криво делали.
     
  25. nislova

    nislova Активный пользователь

    С нами с:
    8 май 2011
    Сообщения:
    56
    Симпатии:
    0
    Сдаюсь, ты меня окончательно за...л.