Рекурсивный акроним словосочетания «PHP: Hypertext Preprocessor»
Добро пожаловать на форум PHP программистов!
За последние 24 часа нас посетили 19956 программистов и 1667 роботов. Сейчас ищут 1617 программистов ...
Краткий список поддерживаемых кодировок
Вернуться к: Многобайтные строки
Название в реестре кодировок IANA | Лежащий в основе набор символов | Описание | Дополнительная информация |
---|---|---|---|
ISO-10646-UCS-4 | ISO 10646 | Универсальный Набор Символов с 31 битом для кода символа, стандартизованный в ISO/IEC 10646 как UCS-4. Установлена синхронизация со стандартом Юникод. | Если это название используется в средствах преобразования кодировок, конвертер попытается определить порядок расположения байтов по BOM (метка порядка байтов). |
ISO-10646-UCS-4 | UCS-4 | См. выше. | В отличие от UCS-4, строки всегда принимаются закодированными в прямом порядке расположения байтов. |
ISO-10646-UCS-4 | UCS-4 | См. выше. | В отличие от UCS-4, строки всегда принимаются закодированными в обратном порядке расположения байтов. |
ISO-10646-UCS-2 | UCS-2 | Универсальный Набор Символов с 16 битом для кода символа, стандартизованный в ISO/IEC 10646 как UCS-2. Установлена синхронизация со стандартом Юникод. | Если это название используется в средствах преобразования кодировок, конвертер попытается определить порядок расположения байтов по BOM (метка порядка байтов). |
ISO-10646-UCS-2 | UCS-2 | См. выше. | В отличие от UCS-2, строки всегда принимаются закодированными в прямом порядке расположения байтов. |
ISO-10646-UCS-2 | UCS-2 | См. выше. | В отличие от UCS-2, строки всегда принимаются закодированными в обратном порядке расположения байтов. |
UTF-32 | Юникод | Формат преобразования Юникода с 32-битной шириной символа, кодовое пространство которого соответствует стандарту кодовой таблицы Юникода. Эта схема кодирования не идентична UCS-4, так как кодовое пространство Юникода ограничено 21-м битом. | Если это название используется в средствах преобразования кодировок, конвертер попытается определить порядок расположения байтов по BOM (метка порядка байтов). |
UTF-32BE | Юникод | См. выше | В отличие от UTF-32, строки всегда принимаются закодированными в прямом порядке расположения байтов. |
UTF-32LE | Юникод | См. выше | В отличие от UTF-32, строки всегда принимаются закодированными в обратном порядке расположения байтов. |
UTF-16 | Юникод | Формат преобразования Юникода с 32-битной шириной кода символа. Спецификация UTF-16 отличается от UCS-2 ввиду того, что начиная с Юникод 2.0 был внедрен механизм замещения символов и теперь UTF-16 ссылается на 21-битное кодовое пространство. | Если это название используется в средствах преобразования кодировок, конвертер попытается определить порядок расположения байтов по BOM (метка порядка байтов). |
UTF-16BE | Юникод | См. выше. | В отличие от UTF-16, строки всегда принимаются закодированными в прямом порядке расположения байтов. |
UTF-16LE | Юникод | См. выше. | В отличие от UTF-16, строки всегда принимаются закодированными в обратном порядке расположения байтов. |
UTF-8 | Юникод / UCS | Формат преобразования Юникода с 32-битной шириной кода символа. | нет |
UTF-7 | Юникод | Безопасный для почтовых программ и решений формат преобразования Юникода, определенный в спецификации » RFC2152. | нет |
(нет) | Юникод | Разновидность UTF-7, специально разработанная для использования в » IMAP протоколе. | нет |
US-ASCII (предпочитаемое MIME-имя) / iso-ir-6 / ANSI_X3.4-1986 / ISO_646.irv:1991 / ASCII / ISO646-US / us / IBM367 / CP367 / csASCII | ASCII / ISO 646 | Американский Стандартный Код для Обмена Информацией - широко используемая 7-битная кодировка. Также стандартизована как международный стандарт ISO 646. | (нет) |
EUC-JP (предпочитаемое MIME-имя) / Extended_UNIX_Code_Packed_Format_for_Japanese / csEUCPkdFmtJapanese | Объединение US-ASCII / JIS X0201:1997 (часть hankaku kana) / JIS X0208:1990 / JIS X0212:1990 | Как видно из названия, эта кодировка используется в основном в Unix системах или им подобных. Исходная схема кодирования Extended UNIX Code легла в основу стандарта ISO 2022. | Набор символов, на который ссылается EUC-JP отличен от набора для IBM932 / CP932, которые используются в OS/2® и Microsoft® Windows®. Для обеспечения взаимодействия между этими платформами используйте кодировку EUCJP-WIN. |
Shift_JIS (предпочитаемое MIME-имя) / MS_Kanji / csShift_JIS | Объединение JIS X0201:1997 / JIS X0208:1997 | Shift_JIS был разработан в начале 80-х, когда Японские текстовые процессоры для рядовых пользователей только выходили на рынок, чтобы сохранить совместимость со схемой кодирования JIS X 0201:1976. В соответствии с определением IANA, кодовая таблица Shift_JIS несколько отличается от IBM932 / CP932. Тем не менее, названия "SJIS" / "Shift_JIS" ошибочно используются для обращения к этим кодовым таблицам. | Для кодовой таблицы CP932, используйте кодировку SJIS-WIN. |
(none) | Объединение JIS X0201:1997 / JIS X0208:1997 / IBM расширения / NEC расширения | Несмотря на то, что эта "кодировка" использует ту же схему кодирования, что и EUC-JP, наборы символов, лежащий в их основе, различны. Таким образом, некоторые коды ссылаются на отличные от EUC-JP символы. | нет |
Windows-31J / csWindows31J | Объединение JIS X0201:1997 / JIS X0208:1997 / IBM расширения / NEC расширения | Несмотря на то, что эта "кодировка" использует ту же схему кодирования, что и Shift_JIS, наборы символов, лежащий в их основе, различны. Таким образом, некоторые коды ссылаются на отличные от Shift_JIS символы. | (нет) |
ISO-2022-JP (предпочитаемое MIME-имя) / csISO2022JP | US-ASCII / JIS X0201:1976 / JIS X0208:1978 / JIS X0208:1983 | » RFC1468 | (нет) |
JIS | |||
ISO-8859-1 | |||
ISO-8859-2 | |||
ISO-8859-3 | |||
ISO-8859-4 | |||
ISO-8859-5 | |||
ISO-8859-6 | |||
ISO-8859-7 | |||
ISO-8859-8 | |||
ISO-8859-9 | |||
ISO-8859-10 | |||
ISO-8859-13 | |||
ISO-8859-14 | |||
ISO-8859-15 | |||
byte2be | |||
byte2le | |||
byte4be | |||
byte4le | |||
BASE64 | |||
HTML-ENTITIES | |||
7bit | |||
8bit | |||
EUC-CN | |||
CP936 | |||
HZ | |||
EUC-TW | |||
CP950 | |||
BIG-5 | |||
EUC-KR | |||
UHC (CP949) | |||
ISO-2022-KR | |||
Windows-1251 (CP1251) | |||
Windows-1252 (CP1252) | |||
CP866 (IBM866) | |||
KOI8-R |
Вернуться к: Многобайтные строки