Кодировка ..., как???

bogong · 22 июл 2011

Ситуация: разминаюсь в написании скриптов, задача стояла так написать аналог strlen-а только не используя его самого ...
Есть код:

Код (Text):

function MyStrLen($string){

$string_array=str_split($string);

$count=0;

foreach ($string_array as $n){

echo $n." ";

$count++;

}

echo "\t\t\tВ строке: ".$string." содержится ".$count." символов.\n";

}

MyStrLen("vasya pupkin");

MyStrLen("vyzyzyzyzyzyzyzyz");

Все работает, но!!! Как всегда но!!! Если пишу в $string по русски то он выдает белиберду, а по англицки все в порядке ... Мозгом понимаю что это связано с кодировкой.

Вопрос ..., как сделать так чтоб и по русски он считал правильно количество символов ...
На вопрос почему не использовать просто strlen предложу прочитать все сообщение с начала, и обратить на слова о том что разминаюсь в алгоритмике.

iliavlad · 22 июл 2011

bogong сказал(а):

Если пишу в $string по русски то он выдает белиберду
Нажмите, чтобы раскрыть...

а что за белиберду? если один символ, например, ц ввести, что выдаст?

bogong · 22 июл 2011

При внесении "Ц" - 2 символа вместо 1
При внесении "Вася Пупкин" вместо "vasya pupkin" - 21 вместо 12 ...

Мне это напомнило набор СМС в телефоне ..., при наборе в транслитерации латиницей разрешенное количество символов больше нежели при наборе в русском ...

Easy · 22 июл 2011

bogong сказал(а):

разминаюсь в алгоритмике.
Нажмите, чтобы раскрыть...

вот только можно было использовать count() вместо foreach.
а можно было использовать preg_match вообще.

а не правильно, видимо это ровно в 2 раза больше чем символов? потому что каждый русский симвл в кодировке utf-8 занимает 2 байта. А функция разбивает по 1. можете указать вторым параметром 2 - тогда английские по 2 станут)

Easy · 22 июл 2011

bogong сказал(а):

$string_array=str_split($string);
Нажмите, чтобы раскрыть...

PHP:

$string_array=mb_split('.', $string);

bogong · 22 июл 2011

Код (Text):

$string_array=mb_split('.', $string);

- результат такой же ... Это связано с кодировкой ..., нужно разобраться с кодировкой символов ... Но как не знаю ... Как сделать так чтоб он сплитил в нужной мне кодировке???

Easy · 22 июл 2011

а какая кодировка тебе нужная?)

Easy · 22 июл 2011

PHP:

function MyStrLen($string){

$string_array = mb_split('.', $string);

$count = count($string_array);

echo "\t\t\tВ строке: ".$string." содержится ".$count." символов.\n";

}

MyStrLen("vasya pupkin");

MyStrLen("екыпцфв ау");

HTML:

В строке: vasya pupkin содержится 13 символов.

В строке: екыпцфв ау содержится 11 символов.

хех, на 1 больше

Easy · 22 июл 2011

Тогда вот так

PHP:

function MyStrLen($string){

$count = preg_match_all('/./u', $string, $match);

echo "\t\t\tВ строке: ".$string." содержится ".$count." символов.\n";

}

MyStrLen("vasya pupkin");

MyStrLen("екыпцфв ау");

и без u - если не в utf-8

bogong · 22 июл 2011

Easy сказал(а):

Тогда вот так

PHP:

function MyStrLen($string){

$count = preg_match_all('/./u', $string, $match);

echo "\t\t\tВ строке: ".$string." содержится ".$count." символов.\n";

}

MyStrLen("vasya pupkin");

MyStrLen("екыпцфв ау");

и без u - если не в utf-8
Нажмите, чтобы раскрыть...

А как сделать так чтоб определять кодировку????

Easy · 22 июл 2011

Ну так вы пишите скрипт, он же у вас сохранён в какой то кодировке, вот и посмотрите. В любом случае если весь сайт написан в UTF то при передачи в него случайно cp1251 вы должны будите перекодировать этот текст в нужную кодировку, и так же на оборот.

Кодировка ..., как???

bogong Активный пользователь

iliavlad Активный пользователь

bogong Активный пользователь

Easy Активный пользователь

Easy Активный пользователь

bogong Активный пользователь

Easy Активный пользователь

Easy Активный пользователь

Easy Активный пользователь

bogong Активный пользователь

Easy Активный пользователь

Быстрый поиск

Кодировка ..., как???

bogong Активный пользователь

iliavlad Активный пользователь

bogong Активный пользователь

Easy Активный пользователь

Easy Активный пользователь

bogong Активный пользователь

Easy Активный пользователь

Easy Активный пользователь

Easy Активный пользователь

bogong Активный пользователь

Easy Активный пользователь