У всего-всего-всего текста на этой странице кодировка cp1251. Независимо от того, в какой кодировке текст отобразится понятным человеку. Вот когда товарищ в Штанах это осознает, тогда глупые вопросы закончатся.
Разгадайте пожалуйста мой ребус . Вставить не могу , потому что не отображается . квадрат и собака каким макаром получается из Бр ?
Ото ж! Заголовок, который живет отдельно от этой страницы... К тому же можно и ошибиться с заголовком... Страница например была в KOI8-R, а ей передали заголовок ср-1251 и пошли кракозябы... Или вот еще крайний случай. Есть три страницы: 1.txt 2.txt 3.txt 1.txt в кодировке KOI8-R 2.txt в кодировке ISO8859-5 3.txt в кодировке X-CP866 В них написан одинаковый осмысленный текс. Теперь возьмем откроем эти страницы в HEX редакторе, создадим чистый файл и скопируем в него исходные числовые коды этих трех страниц и сохраним с именем 123.txt Далее, если мы будем считать, что файл 123.txt имеет кодировку KOI8-R, то мы увидим осмысленным текстом первую часть файла 123.txt, а дальше пойдут кракозябы. Если мы будем считать, что файл 123.txt имеет кодировку ISO8859-5, то мы увидим осмысленным текстом вторую часть файла 123.txt, а первая и третья части файла будут в кракозябах. Если мы будем считать, что файл 123.txt имеет кодировку X-CP866, то мы увидим осмысленным текстом третью часть файла 123.txt, а первая и вторая часть будут в кракозябах. И теперь я адресую вопрос для светлых голов: какая же кодировка у файла 123.txt???
Текст может быть осмысленным только для человека. для компьютера это НАБОР БАЙТ.. Поэтому НИКАКОЙ автоматической перекодировки БЫТЬ НЕ МОЖЕТ. Есть эврестические алгоритмы, основанные на особеностях языка. Но это УГАДЫВАНИЕ кодировки, а не определение. ТАК ПОНЯТНО?? Никакая. У ФАЙЛА нет кодировки. Она есть у документа открытого в редакторе, который настроен на ОТОБРАЖЕНИЕ файла как документа с ВЫБРАННОЙ КОДИРОВКОЙ. Тогда у него будет кодировка — та, которую выберет для этого редактор. Или браузер.
Ну в общем-то понятно... Лично меня этот ответ устривает. А еще можно вопросик? То, что у файла нет кодировки, это мы выяснили... А у текста файла есть кодировка?
Никак не могу понять вашу позицию. Вы же во ходу дела очень крупно сами себе противоречите! Вот: Т.е. в начале утверждалось, что от браузера (редактора) кодировка не зависит, а во втором утверждении кодировка только от него и зависит... Интересно получается...
Кодировка - это иллюзия, созданная человеком. Ее нет. Хорошо, перефразирую: Браузер считает, что ЭТУ страницу он должен отобразить и отображает в кодировке cp1251, потому что ему об этом сказал веб-сервер, который владеет данной страницей. Вы можете изменить это отображение. Да, там в меню, ага. У документа по прежнему нет кодировки. Только есть заголовок от веб сервера, сообщающий о том, что автор обычно пользуется cp1251. И браузер пытается ее отобразить так. А вместо того, что бы искать несоответствия в моих словах лучше бы почитали документацию.
Извините, а вы бы не могли подсказать где можно перевести вот эту странную нижнюю кодировку, которая мне приходит смс-ками вместо русской кириллицы?
Да не за что. Может вы мне тогда подскажите каким образом я могу прочесть свои каракули? Пожайлуста!...
... противоречие =) какое-то утверждение неверно ... у, чет я не туда) считайте, тут написано - "как интересно"...
Уважаемые форумчане !!! Мне очень понравился Ваш капустник и я понял, что все-таки хоть что-то соображаю. У меня другая проблема. Может быть я не туда залез ... Ну, вы меня поправите ... Не могу определить язык, на котором вводится символ ... С английским все хорошо: и регистр узнает, и тип символа ... А вот заставить оператора вводить только на русском, к примеру, не могу: все-равно распознает как английский. Для справки: язык программирования - php (хотя, скорее всего, это не важно). поле ввода - input. Помогите страждущему. Заранее спасибо, вечно ваш ...
Кстати. Инициатор переписки, скорее всего, перепутал кодировку и раскладку клавиатуры ... Хочется его спросить: он никогда не получал мат от системы, когда перед загрузкой забывал присоединить клавиатуру ??? Как и на обработчиках событий типа "onload=", на прерываниях системы сидят обработчики (и только по одному на каждом, - мы их называем драйверами). Если у вас стоит англо-русская клавиатура (и соответствующий ей драйвер), то вы хоть извертитесь на пупе, - никогда не введете хоть символ на, к примеру, китайском. Вы, конечно, можете написать свой драйвер (если получится, конечно), который, в зависимости от комбинации клавиш (Lshift-Rshift, LCtrl-RCtrl и т.д. на сколько хватит комбинаций, кроме забитых в систему и не дай бог иначе) будет выводить вам соответствующий нажатой клавише символ. Но вы сойдете с ума пока будете искать какой клавише англо-русской клавиатуры соответствует нужный китайский иероглиф. Я, по своей, возможно, наивности, хочу определить: какой на англо-русской клавиатуре введен символ, - латиница или кирилица. Могу ли я надеяться ???
хы хы, лучше и не сказать)))) дайте линк пожалуйста почитать о готовых способах определения кодировки и декодировании её в заданную (нужную) кодировку. класс может кто хороший выложил? на почте яндекса к примеру крутая система распознавая и декодирования - в какой только кодировке не присылал письма - всё отображает как надо, не то что мой почтовик, который крякозябры показывает если кодировка письма не utf-8 или win-1251 (ну и ещё пару).
Файл написан в кодировке ANSI открывается в браузере в кодировке cp-1251, а оттуда передается и сохраняется на сервере средствами javascript, PHP. Полученный файл уже имеет кодировку UTF-8 (Извините, что неправильно выражаюсь). Вопрос: в какой момент могло произойти перекодирование и как этого избежать?