Здравствуйте! На днях в интернете наткнулся на интересный скрипт который позволяет создавать мета теги keywords на лету из содержимого контента, всё бы хорошо но наткнулся на одну проблему после обработки скриптом вместо букв у меня получаются сплошные знаки вопроса, текст я беру из базы, затем пихаю в скрипт. кодировка сайта UTF-8 Вот код. PHP: <? include('_connect.php'); $id=($_GET['page']); $id = intval($id); $id=22; $query = "select * from pages where id='$id'"; $result = mysql_query($query); while ($row = mysql_fetch_assoc($result)) { $content = $row['content']; } class Counter { var $origin_arr; var $modif_arr; var $min_word_length = 3; function explode_str_on_words($text) { $search = array ("'ё'", "'<script[^>]*?>.*?</script>'si", // Вырезается javascript "'<[\/\!]*?[^<>]*?>'si", // Вырезаются html-тэги "'([\r\n])[\s]+'", // Вырезается пустое пространство "'&(quot|#34);'i", // Замещаются html-элементы "'&(amp|#38);'i", "'&(lt|#60);'i", "'&(gt|#62);'i", "'&(nbsp|#160);'i", "'&(iexcl|#161);'i", "'&(cent|#162);'i", "'&(pound|#163);'i", "'&(copy|#169);'i", "'&#(\d+);'e"); $replace = array ("е", " ", " ", "\\1 ", "\" ", " ", " ", " ", " ", chr(161), chr(162), chr(163), chr(169), "chr(\\1)"); $text = preg_replace ($search, $replace, $text); $del_symbols = array(",", ".", ";", ":", "\"", "#", "\$", "%", "^", "!", "@", "`", "~", "*", "-", "=", "+", "\\", "|", "/", ">", "<", "(", ")", "&", "?", "№", "\t", "\r", "\n", "{","}","[","]", "'", "“", "”", "•", "как", "для", "что", "или", "это", "этих", "всех", "вас", "они", "оно", "еще", "когда", "где", "эта", "лишь", "уже", "вам", "нет", "если", "надо", "все", "так", "его", "чем", "при", "даже", "мне", "есть", "раз", "два", "0", "1", "2", "3", "4", "5", "6", "7", "8", "9" ); $text = str_replace($del_symbols, array(" "), $text); $text = ereg_replace("( +)", " ", $text); $this->origin_arr = explode(" ", trim($text)); return $this->origin_arr; } function count_words() { $tmp_arr = array(); foreach ($this->origin_arr as $val) { if (strlen($val)>=$this->min_word_length) { $val = strtolower($val); if (array_key_exists($val, $tmp_arr)) { $tmp_arr[$val]++; } else { $tmp_arr[$val] = 1; } } } arsort ($tmp_arr); $this->modif_arr = $tmp_arr; } function get_keywords($text) { $this->explode_str_on_words($text); $this->count_words(); $arr = array_slice($this->modif_arr, 0, 15); $str = ""; foreach ($arr as $key=>$val) { $str .= $key . ", "; } return trim(substr($str, 0, strlen($str)-2)); } } // создание экземпляра класса $word_counter = new Counter(); // если длинна строки больше 50000 if (strlen($content)>50000) { // подбор слов $keywords = $word_counter->get_keywords(substr($content, 0, 50000)); } else // если меньше { // подбор слов $keywords = $word_counter->get_keywords($content); } echo $keywords; //Здесь у меня все буквы в виде знака вопроса echo"<br>"; echo"<br>"; echo"<br>"; echo $content; // А сдесь всё нормально ?> может кто знает как исправить ситуацию, буду весьма признателен...
дело в том что мне надо в UTF-8, из базы текст выдаётся нормально это можно проверить через " echo $content;", что то с кодировкой проискодит после оброботки скриптом, то есть "echo $keywords;" выдаёт <?>, в файле _connect.php у меня уже прописано PHP: $link=mysql_connect("localhost", $us, $pw) OR die('Database connect error!'); $lib=mysql_select_db($db, $link) OR die('Database connect error!'); mysql_query('set character set utf8'); mysql_query('set character_set_client=utf8'); mysql_query('set character_set_connection=utf8'); mysql_query('set character_set_results=utf8'); unset($db,$pw); вот и не пойму в чём прикол.. :-(
Попробуй : $word_counter = new Counter(); $content =iconv("utf-8", "windows-1251", $myrow["descr"]); $word_counter = new Counter(); if (strlen($content)>50000) { $keywords = iconv('windows-1251','utf-8',$word_counter->get_keywords(substr($content, 0, 50000))); } else { $keywords = iconv('windows-1251','utf-8',$word_counter->get_keywords($content)); }