кодировки файл-апач-пхп-браузер

alexey_baranov · 13 май 2009

Кто нибудь может расписать все кодировки-перекодировки на пути текста от файла на хосте до браузера? Где в какой момент он перекодируется и какие установки редактора/апача/пхп/браузера и всего остального, если что- то забыл, на это влияют?

И можно ли как- то победить, что при формировании xml, excel и ldap всегда приходится возиться с iconv('win1251', 'utf-8') и наоборот? реально заколебало.

[vs] · 13 май 2009

Никаких неявных перекодировок. Потому и приходится вручную менять их =) какие приложения какие кодировки понимают - тема отдельная. Меньше всего геморроя с UTF-8.

флоппик · 13 май 2009

[vs] сказал(а):

Никаких неявных перекодировок.
Нажмите, чтобы раскрыть...

Проблема русского Апача - как раз в этом )

alexey_baranov · 14 май 2009

[vs]
То есть от того, какую кодировку я выберу в NetBeans ничего не зависит. И если я ее даже поменяю, ничего-ничего не изменится?

на днях юзал новый NetBeans 6.7M3 со встроенной поддержкой UnitTest-ов, обратил внимание, что если файл теста сохранен в utf-8, логи непройденых тестов генерятся нормально, а если в Win-1251, то в абракадабре. Если учесть, что лог генерится из ПХПшного скрипта, запущенного консольно, получается, что кодировка даже в редакторе очень сильно влияет на выполнение кода. Вместо юнит-тестов там могла быть запись в базу. Например, если записывать в utf-8 базу из кода, сохраненного в Win-1251, получится лажа или нет? А если этот же скрипт пересохранить в utf8? Я вот эту связь никак уловить не могу.

[vs] · 14 май 2009

alexey_baranov
Символ - это порядок битов. В разных кодировках порядок битов для одного и того же символа разный. В CP1251 на каждый сивол - 2 байта, в UTF-8 - до 6, и маркируются они по-разному, поэтому когда записываешь текст, закодированый в CP1251 в БД, воспринимающую UTF-8, получаются кракозябры. ЕМНИП, латиница во всех кодировках - ASCII, поэтому с ней проблем быть вроде не должно.

alexey_baranov · 14 май 2009

[vs] сказал(а):

ЕМНИП
Нажмите, чтобы раскрыть...

ху из ит?

флоппик · 14 май 2009

alexey_baranov сказал(а):

ху из ит?
Нажмите, чтобы раскрыть...

Если Мне Не Изменяет Память

alexey_baranov сказал(а):

Например, если записывать в utf-8 базу из кода, сохраненного в win-1251
, получится лажа или нет? А если этот же скрипт пересохранить в Win-1251?
Нажмите, чтобы раскрыть...

В данном примере, пхп-скрипт является клиентом БД. Если ты хочешь записывать

alexey_baranov сказал(а):

в utf-8 базу из кода, сохраненного в win-1251
Нажмите, чтобы раскрыть...

то ты говоришь серверу мускула: "Я работаю в кодировке 1251!" (SET NAMES CP1251)
И мускул будет ЖДАТЬ от тебя данных в кодировке 1251, которые он получит, и ПЕРЕКОДИРУЕТ В КОДИРОВКУ, используемую для хранения данных. Как правило, УТФ-8.
Если клиентом у тебя выступает виндовая консоль - ты также сообщаещь: "Я консоль, моя кодировка cp866" (SET NAMES CP866). Что будет делать мускул?
будет ЖДАТЬ от тебя данных в кодировке 866, которые он получит, и ПЕРЕКОДИРУЕТ В КОДИРОВКУ, используемую для хранения данных. Как правило, УТФ-8.

Так-то.

alexey_baranov · 14 май 2009

а если скрипт сохранен в utf-8?

флоппик · 14 май 2009

alexey_baranov сказал(а):

а если скрипт сохранен в utf-8?
Нажмите, чтобы раскрыть...

то клиентская кодировка будет UTF8

alexey_baranov · 14 май 2009

а в итоге что получим? нормальные русские буквы в базе?

флоппик · 14 май 2009

Нормальные русские буквы мы получим, независимо от кодировки на клиенте. Главное, корректно эту кодировку указать для соединения, к кодировке хранения данных сервер мускула преобразует сам(ну, или если ты шлешь UTF, и в базе хранишь UTF, то данные просто пойдут напрямую без перекодировки)

kostyl · 14 май 2009

Есть еще момент, когда при загрузке файлов на сервер, FTP клиент и сервер могут не поддерживать кодировку или перекодировать файл при передаче в кодировку, какую нибудь "по умолчанию", если там есть какие либо такие настройки...

alexey_baranov · 14 май 2009

то есть если бы я с самого начала сохранял файлы в utf-8, мне не пришлось бы сейчас писать iconv(win, utf8) каждый раз, когда я обращаюсь к Ldap, excel или xml? так что-ли?

Может стоит пересохранить все исходники в utf-8?

kostyl · 14 май 2009

alexey_baranov сказал(а):

Может стоит пересохранить все исходники в utf-8?
Нажмите, чтобы раскрыть...

вообще то если ты работаешь с UTF-8 то надо это обязательно сделать, вот http://www.php.ru/forum/viewtopic.php?t=16467

флоппик · 14 май 2009

alexey_baranov сказал(а):

то есть если бы я с самого начала сохранял файлы в utf-8, мне не пришлось бы сейчас писать iconv(win, utf8) каждый раз, когда я обращаюсь к Ldap, excel или xml? так что-ли?

Нажмите, чтобы раскрыть...

сечешь тему
Вообще, про кодировки хорошо бы расписать подробно, с картинками - но как всегда, скорее всего времени не найдется )
Только учти, что с UTF-8 не работают стандартные строковые функции, нужно пользоваться их mb_* эквивалентами, или перегрузить их в php.ini

alexey_baranov · 14 май 2009

а ereg_***()?

перегружать не сложно? косяков там нет как в NTML+PHP?

kostyl · 14 май 2009

alexey_baranov сказал(а):

а ereg_***()?

перегружать не сложно? косяков там нет как в NTML+PHP?
Нажмите, чтобы раскрыть...

я дал сыль там есть косяки... ereg_ str* и mail опционально перегружается в ini

флоппик · 14 май 2009

alexey_baranov сказал(а):

перегружать не сложно?
Нажмите, чтобы раскрыть...

http://www.php.net/manual/ru/mbstring.overload.php

а ereg_* давно пора забыть как страшный сон. В пхп 5.3 их уже не будет. а preg_* работает с УТФ.

флоппик · 14 май 2009

alexey_baranov сказал(а):

косяков там нет
Нажмите, чтобы раскрыть...

Единственно, что не рекомендованно устанавливать перегрузку из .htaccess.
У нас боевой сервер с перегруженными функциями работает уже года полтора.

alexey_baranov · 14 май 2009

А это что за покемон у меня поселился с давних времен? setlocale(LC_ALL, "ru_RU.CP1251")? мануал читать умею. ничего не понял.

флоппик сказал(а):

ereg_* давно пора забыть как страшный сон. В пхп 5.3 их уже не будет.
Нажмите, чтобы раскрыть...

делать им нечего? лучше бы они soap-ом серьезно занялись. и что теперь делать честным людям? Там жешь финд-реплейсом не обойдешься. Синтаксис все- таки разный. всякой ерундой занимаются, пока самое важное простаивает.

PHP.NET сказал(а):

To use function overloading, set mbstring.func_overload in php.ini to a positive value that represents a combination of bitmasks specifying the categories of functions to be overloaded. It should be set to 1 to overload the mail() function. 2 for string functions, 4 for regular expression functions. For example, if it is set to 7, mail, strings and regular expression functions will be overloaded.
Нажмите, чтобы раскрыть...

семерку напротив мбстринга ставишь и привет. ничего сложного вроде.
mbstring.func_overload = 7

kostyl сказал(а):

я дал сыль там есть косяки...
Нажмите, чтобы раскрыть...

пальцы большие?

alexey_baranov · 14 май 2009

флоппик сказал(а):

У нас боевой сервер с перегруженными функциями работает уже года полтора.
Нажмите, чтобы раскрыть...

коды и базы в utf-8?

флоппик · 14 май 2009

alexey_baranov сказал(а):

коды и базы в utf-8?
Нажмите, чтобы раскрыть...

Да. Но у нас не мускул. У мускула с УТФ вроде как есть проблемы с REGEXP, но подробней я не знаю, т.к. регекспами в базе не пользуюсь )

kostyl · 14 май 2009

alexey_baranov сказал(а):

пальцы большие?
Нажмите, чтобы раскрыть...

я считаю невозможность перезагрузки стандартной функцией через ini косяком...

alexey_baranov · 14 май 2009

да у меня тоже не мускул давно. слабоват он. но это другая тема. посгрес у меня если что.

У меня только один вопрос приходит тогда. Почему тогда говорят, что пхп не юникод? вот выйдет 6-ой, тогда будет юникод.

флоппик · 14 май 2009

alexey_baranov сказал(а):

Почему тогда говорят, что пхп не юникод?
Нажмите, чтобы раскрыть...

Именно потому, что встроенные строковые функции не обрабатыают уникод. mbstring, хоть и стандартное, но все таки расширение.
PHP6 будет использовать для внутреннего представления и хранения UTF строки.

кодировки файл-апач-пхп-браузер

alexey_baranov Активный пользователь

[vs] Суперстар
Команда форума Модератор

флоппик Guest

alexey_baranov Активный пользователь

[vs] Суперстар
Команда форума Модератор

alexey_baranov Активный пользователь

флоппик Guest

alexey_baranov Активный пользователь

флоппик Guest

alexey_baranov Активный пользователь

флоппик Guest

kostyl Guest

alexey_baranov Активный пользователь

kostyl Guest

флоппик Guest

alexey_baranov Активный пользователь

kostyl Guest

флоппик Guest

флоппик Guest

alexey_baranov Активный пользователь

alexey_baranov Активный пользователь

флоппик Guest

kostyl Guest

alexey_baranov Активный пользователь

флоппик Guest

Быстрый поиск

кодировки файл-апач-пхп-браузер

alexey_baranov Активный пользователь

[vs] Суперстар Команда форума Модератор

флоппик Guest

alexey_baranov Активный пользователь

[vs] Суперстар Команда форума Модератор

alexey_baranov Активный пользователь

флоппик Guest

alexey_baranov Активный пользователь

флоппик Guest

alexey_baranov Активный пользователь

флоппик Guest

kostyl Guest

alexey_baranov Активный пользователь

kostyl Guest

флоппик Guest

alexey_baranov Активный пользователь

kostyl Guest

флоппик Guest

флоппик Guest

alexey_baranov Активный пользователь

alexey_baranov Активный пользователь

флоппик Guest

kostyl Guest

alexey_baranov Активный пользователь

флоппик Guest

[vs] Суперстар
Команда форума Модератор

[vs] Суперстар
Команда форума Модератор