За последние 24 часа нас посетили 17723 программиста и 1698 роботов. Сейчас ищут 1747 программистов ...

Точное определение кодировки данных в переменной

Тема в разделе "Вопросы от блондинок", создана пользователем wtfowned, 17 дек 2007.

  1. KombaInER

    KombaInER Активный пользователь

    С нами с:
    5 апр 2007
    Сообщения:
    221
    Симпатии:
    0
    Адрес:
    Днепр+Крым=Украина
  2. host

    host Активный пользователь

    С нами с:
    20 июн 2007
    Сообщения:
    733
    Симпатии:
    3
    KombaInER
    Да, именно
     
  3. Anonymous

    Anonymous Guest

    У всего-всего-всего текста на этой странице кодировка cp1251. Независимо от того, в какой кодировке текст отобразится понятным человеку. Вот когда товарищ в Штанах это осознает, тогда глупые вопросы закончатся.
     
  4. dslychko

    dslychko Активный пользователь

    С нами с:
    14 июн 2007
    Сообщения:
    144
    Симпатии:
    0
    Разгадайте пожалуйста мой ребус .
    Вставить не могу , потому что не отображается .
    квадрат и собака каким макаром получается из Бр ?
     
  5. Anonymous

    Anonymous Guest

    а? :?
     
  6. Штаны

    Штаны Guest

    А как определил? Анализом кода? :)
     
  7. Anonymous

    Anonymous Guest

    Штаны, у этой страницы передан заголовок - cp1251. Все.
     
  8. Штаны

    Штаны Guest

    Ото ж!
    Заголовок, который живет отдельно от этой страницы...
    К тому же можно и ошибиться с заголовком... Страница например была в KOI8-R, а ей передали заголовок ср-1251 и пошли кракозябы...

    Или вот еще крайний случай. Есть три страницы: 1.txt 2.txt 3.txt
    1.txt в кодировке KOI8-R
    2.txt в кодировке ISO8859-5
    3.txt в кодировке X-CP866
    В них написан одинаковый осмысленный текс. Теперь возьмем откроем эти страницы в HEX редакторе, создадим чистый файл и скопируем в него исходные числовые коды этих трех страниц и сохраним с именем 123.txt Далее, если мы будем считать, что файл 123.txt имеет кодировку KOI8-R, то мы увидим осмысленным текстом первую часть файла 123.txt, а дальше пойдут кракозябы. Если мы будем считать, что файл 123.txt имеет кодировку ISO8859-5, то мы увидим осмысленным текстом вторую часть файла 123.txt, а первая и третья части файла будут в кракозябах. Если мы будем считать, что файл 123.txt имеет кодировку X-CP866, то мы увидим осмысленным текстом третью часть файла 123.txt, а первая и вторая часть будут в кракозябах.
    И теперь я адресую вопрос для светлых голов: какая же кодировка у файла 123.txt???
     
  9. Anonymous

    Anonymous Guest

    Текст может быть осмысленным только для человека. для компьютера это НАБОР БАЙТ.. Поэтому НИКАКОЙ автоматической перекодировки БЫТЬ НЕ МОЖЕТ. Есть эврестические алгоритмы, основанные на особеностях языка. Но это УГАДЫВАНИЕ кодировки, а не определение. ТАК ПОНЯТНО??
    Никакая. У ФАЙЛА нет кодировки. Она есть у документа открытого в редакторе, который настроен на ОТОБРАЖЕНИЕ файла как документа с ВЫБРАННОЙ КОДИРОВКОЙ. Тогда у него будет кодировка — та, которую выберет для этого редактор. Или браузер.
     
  10. Штаны

    Штаны Guest

    Ну в общем-то понятно...


    Лично меня этот ответ устривает.

    А еще можно вопросик? То, что у файла нет кодировки, это мы выяснили... А у текста файла есть кодировка?
     
  11. Anonymous

    Anonymous Guest

     
  12. Штаны

    Штаны Guest

    Никак не могу понять вашу позицию. Вы же во ходу дела очень крупно сами себе противоречите!
    Вот:
    Т.е. в начале утверждалось, что от браузера (редактора) кодировка не зависит, а во втором утверждении кодировка только от него и зависит... Интересно получается...
     
  13. Anonymous

    Anonymous Guest

    Кодировка - это иллюзия, созданная человеком. Ее нет.
    Хорошо, перефразирую:
    Браузер считает, что ЭТУ страницу он должен отобразить и отображает в кодировке cp1251, потому что ему об этом сказал веб-сервер, который владеет данной страницей. Вы можете изменить это отображение. Да, там в меню, ага.
    У документа по прежнему нет кодировки. Только есть заголовок от веб сервера, сообщающий о том, что автор обычно пользуется cp1251. И браузер пытается ее отобразить так.
    А вместо того, что бы искать несоответствия в моих словах лучше бы почитали документацию.
     
  14. Штаны

    Штаны Guest

    Вот теперь мне все понятно! Давно бы так! Спасибо!
     
  15. host

    host Активный пользователь

    С нами с:
    20 июн 2007
    Сообщения:
    733
    Симпатии:
    3
  16. KombaInER

    KombaInER Активный пользователь

    С нами с:
    5 апр 2007
    Сообщения:
    221
    Симпатии:
    0
    Адрес:
    Днепр+Крым=Украина
    да здрасвует ртфм
     
  17. ligne

    ligne Активный пользователь

    С нами с:
    19 май 2010
    Сообщения:
    2
    Симпатии:
    0

    Извините, а вы бы не могли подсказать где можно перевести вот эту странную нижнюю кодировку, которая мне приходит смс-ками вместо русской кириллицы?
     
  18. Apple

    Apple Активный пользователь

    С нами с:
    13 янв 2007
    Сообщения:
    4.984
    Симпатии:
    2
    блин, спасибо что подняли тему, ржал как псих.
     
  19. ligne

    ligne Активный пользователь

    С нами с:
    19 май 2010
    Сообщения:
    2
    Симпатии:
    0
    Да не за что. Может вы мне тогда подскажите каким образом я могу прочесть свои каракули? Пожайлуста!...
     
  20. ShamahN

    ShamahN Активный пользователь

    С нами с:
    10 апр 2007
    Сообщения:
    1.449
    Симпатии:
    0
    Адрес:
    г.Волгодонск Роствской обл.
    ...
    противоречие =) какое-то утверждение неверно

    ... у, чет я не туда) считайте, тут написано - "как интересно"...
     
  21. verdim

    verdim Активный пользователь

    С нами с:
    11 мар 2011
    Сообщения:
    15
    Симпатии:
    0
    Адрес:
    Санкт-Петербург
    Уважаемые форумчане !!!
    Мне очень понравился Ваш капустник и я понял, что все-таки хоть что-то соображаю.
    У меня другая проблема. Может быть я не туда залез ... Ну, вы меня поправите ...
    Не могу определить язык, на котором вводится символ ...
    С английским все хорошо: и регистр узнает, и тип символа ... А вот заставить оператора вводить только на русском, к примеру, не могу: все-равно распознает как английский.
    Для справки:
    язык программирования - php (хотя, скорее всего, это не важно).
    поле ввода - input.
    Помогите страждущему.
    Заранее спасибо, вечно ваш ...
     
  22. verdim

    verdim Активный пользователь

    С нами с:
    11 мар 2011
    Сообщения:
    15
    Симпатии:
    0
    Адрес:
    Санкт-Петербург
    Кстати. Инициатор переписки, скорее всего, перепутал кодировку и раскладку клавиатуры ...
    Хочется его спросить: он никогда не получал мат от системы, когда перед загрузкой забывал присоединить клавиатуру ???
    Как и на обработчиках событий типа "onload=", на прерываниях системы сидят обработчики (и только по одному на каждом, - мы их называем драйверами).
    Если у вас стоит англо-русская клавиатура (и соответствующий ей драйвер), то вы хоть извертитесь на пупе, - никогда не введете хоть символ на, к примеру, китайском. Вы, конечно, можете написать свой драйвер (если получится, конечно), который, в зависимости от комбинации клавиш (Lshift-Rshift, LCtrl-RCtrl и т.д. на сколько хватит комбинаций, кроме забитых в систему и не дай бог иначе) будет выводить вам соответствующий нажатой клавише символ. Но вы сойдете с ума пока будете искать какой клавише англо-русской клавиатуры соответствует нужный китайский иероглиф.
    Я, по своей, возможно, наивности, хочу определить: какой на англо-русской клавиатуре введен символ, - латиница или кирилица.
    Могу ли я надеяться ???
     
  23. Mark32

    Mark32 Активный пользователь

    С нами с:
    15 июн 2008
    Сообщения:
    539
    Симпатии:
    2
    хы хы, лучше и не сказать))))

    дайте линк пожалуйста почитать о готовых способах определения кодировки и декодировании её в заданную (нужную) кодировку. класс может кто хороший выложил?

    на почте яндекса к примеру крутая система распознавая и декодирования - в какой только кодировке не присылал письма - всё отображает как надо, не то что мой почтовик, который крякозябры показывает если кодировка письма не utf-8 или win-1251 (ну и ещё пару).
     
  24. Lesya

    Lesya Активный пользователь

    С нами с:
    14 авг 2006
    Сообщения:
    54
    Симпатии:
    0
    Адрес:
    Запорожье
    Файл написан в кодировке ANSI открывается в браузере в кодировке cp-1251, а оттуда передается и сохраняется на сервере средствами javascript, PHP. Полученный файл уже имеет кодировку UTF-8 (Извините, что неправильно выражаюсь). Вопрос: в какой момент могло произойти перекодирование и как этого избежать?
     
  25. [vs]

    [vs] Суперстар
    Команда форума Модератор

    С нами с:
    27 сен 2007
    Сообщения:
    10.559
    Симпатии:
    632
    Вполне может быть, что в PHP с помощью функции iconv перекодируется