За последние 24 часа нас посетили 17764 программиста и 1698 роботов. Сейчас ищут 1696 программистов ...

Точное определение кодировки данных в переменной

Тема в разделе "Вопросы от блондинок", создана пользователем wtfowned, 17 дек 2007.

  1. antonn

    antonn Активный пользователь

    С нами с:
    10 июн 2007
    Сообщения:
    2.996
    Симпатии:
    0
    ты прикалываешься?
    прикрепи файл, блин.
     
  2. antonn

    antonn Активный пользователь

    С нами с:
    10 июн 2007
    Сообщения:
    2.996
    Симпатии:
    0
    килилица ISO DOS и KOI8-U

    у меня такое чувство, что ты просто не понимаешь, что есть кодировка :)
     
  3. Штаны

    Штаны Guest

    Я не прикалываюсь. Считай что файл, это эта форумная страничка... Ты смотри на код и говори в какой он кодировке... Спорю, что скажешь, что в windows-1251 :)
     
  4. antonn

    antonn Активный пользователь

    С нами с:
    10 июн 2007
    Сообщения:
    2.996
    Симпатии:
    0
    по сути, нет такого понятия, как "кодировка файла". Есть понятие, в какой кодировке текст отображается правильно и какая таблица была применена при сохранении этих байтов (с сохранением тоже замуты есть, т.к. в некоторых кодировках символы могут быть невалидными и сохраниться ближайшими из таблицы, но это сильно зависит от редактора).
     
  5. Штаны

    Штаны Guest

    Аж три? :)Так ты теперь сам себе противоречишь! Кто тут говорил, что в одном и том же тексте, не может быть несколько кодировок?
     
  6. antonn

    antonn Активный пользователь

    С нами с:
    10 июн 2007
    Сообщения:
    2.996
    Симпатии:
    0
    я говорил. сохрани в юникод и обломись %)
     
  7. Штаны

    Штаны Guest

    Ну вот мы и пришли к тому, что в одном и том же тексте может быть несколько кодировок! Где этому «явлению» найти применение так сразу и не придумаешь... Но может кто-то это где-то и использует :)
     
  8. Штаны

    Штаны Guest

    Сам сохраняй и сам обломись :)
     
  9. antonn

    antonn Активный пользователь

    С нами с:
    10 июн 2007
    Сообщения:
    2.996
    Симпатии:
    0
    Штаны
    ну давай по другому. Ты эти куски текста написал в редакторе, сохранил в разных кодировках. А потом отобразил их в кодировке 1251 и вставил сюда? так ведь? :)
     
  10. Штаны

    Штаны Guest

    Нет. Завтра расскажу как я сделал... А ты пока догадайся, что за тем текстом скрывается...
     
  11. antonn

    antonn Активный пользователь

    С нами с:
    10 июн 2007
    Сообщения:
    2.996
    Симпатии:
    0
    Код (Text):
    1. кодировка кодировка кодировк
    у последнего слова из-за перегона сожрался последний символ? :)
     
  12. dark-demon

    dark-demon Активный пользователь

    С нами с:
    16 фев 2007
    Сообщения:
    1.920
    Симпатии:
    1
    Адрес:
    леноград
    в utf-8 размер символа может быть от 1 до 4 байт.
     
  13. Штаны

    Штаны Guest

    Нет, не сожрался :) Просто русская буква «а» в этой кодировке обозначается вот так « » (межу кавычками пустое место :) )
    Я перекодировал скриптом. Вел слово «кодировка» и представил его в трех разных кодировках... Эти три разных представления я и написал. Вот и получилось, что в одном тексте три разных кодировки...
     
  14. Штаны

    Штаны Guest

    В высоту или ширину? :)
     
  15. Anonymous

    Anonymous Guest

    Кодировка символов

    Кодировка документа определяет соответствие между его внутренним представлением в компьютере (кодами, байтами) и символами (буквами и другими знаками), которые вы видите на экране или в распечатанном документе, а также вводите с клавиатуры. Все веб-страницы, сообщения электронной почты и групп новостей имеют определенную кодировку. Для того, чтобы правильно отобразить документ на экране или при печати, программа должна "знать" его кодировку. Кроме того, для правильного отображения необходимы шрифты, которые содержат нужные символы.

    Почитай... авось, просветлеешь разумом.
     
  16. Anonymous

    Anonymous Guest

  17. Штаны

    Штаны Guest

    Я всего лишь утверждаю, что в одном файле или блоке текста могут присутствовать несколько кодировок... Что и продемонстрировал... На ответ: для чего это нужно, я не претендую :)
     
  18. host

    host Активный пользователь

    С нами с:
    20 июн 2007
    Сообщения:
    733
    Симпатии:
    3
    не согласен :)
     
  19. Штаны

    Штаны Guest

    Сейчас согласишься :) Слышал про функцию convert_cyr_string() ? Вот что про нее пишут:
    Ключевые слова: из одной кодировки в другую
    Вот я этим скриптом:
    PHP:
    1.  
    2. <?php
    3. $str="кодировка";
    4. echo "'$str'в KOI8-R является '".convert_cyr_string($str,"w","k")."'<br>";
    5. $str="кодировка";
    6. echo "'$str'в ISO8859-5 является '".convert_cyr_string($str,"w","i")."'<br>";
    7. $str="кодировка";
    8. echo "'$str'в X-CP866 является '".convert_cyr_string($str,"w","a")."'<br>";
    9. ?>
    10.  
    Преобразовал слово «кодировка» из одной кодировки в три других и соединил вместе. Отсюда вопрос, в какой кодировке получилась строка?
    Я думаю что строка получилась в неопределенной кодировке, т.к. в ней присутствуют три кодировки...
     
  20. host

    host Активный пользователь

    С нами с:
    20 июн 2007
    Сообщения:
    733
    Симпатии:
    3
    ага :))
     
  21. Штаны

    Штаны Guest

    Ну и слава богу :)
     
  22. host

    host Активный пользователь

    С нами с:
    20 июн 2007
    Сообщения:
    733
    Симпатии:
    3
    *улыбаясь* Я не согласен :)
     
  23. Штаны

    Штаны Guest

    С кем? :)
     
  24. host

    host Активный пользователь

    С нами с:
    20 июн 2007
    Сообщения:
    733
    Симпатии:
    3
    Штаны
    Код:
    PHP:
    1. <?php
    2. $a = iconv("windows-1251", "iso8859-5", "Текст1 | ");
    3. echo $a; // ВХЪбв1 |
    4. $b = iconv("windows-1251", "utf-8", "Текст1 | ");
    5. echo $b; // Текст1 |
    6. $c = iconv("windows-1251", "koi8-r", "Текст1 | ");
    7. echo $c; // фЕЛУФ1 |
    8.  
    9. $d = "$a$b$c"; echo "<BR><BR><BR>$d<BR><BR>"; // ВХЪбв1 | Текст1 | фЕЛУФ1 |
    10.  
    11. $e = iconv("iso8859-5", "windows-1251", $d);
    12. echo $e; // Текст1 | аЂаЕаКб
    13. ?>
    Штаны, объясни, какая кодировка у выделенного полужирным текста ?
     
  25. Штаны

    Штаны Guest

    Объясню... Только ты сначала объясни, сколько будет 2х2=? Т.е. ответь на такой простой вопрос, какая кодировка у:
    Код (Text):
    1.  
    2. ВХЪбв1
    Код (Text):
    1.  
    2. Текст1
    Код (Text):
    1.  
    2. фЕЛУФ1
    из твоего кода?