В тексте есть символы UTF с кодом вроде "\xB1" и "\xC2" которые видны как квадраты. В базу данных они не пишутся (cp1251), как такие символы убать с помошью регулярки - это ведь не буквы?
имхо, правильнее в конкретном соединении сказать базе, что ты ей шлешь и от нее ждешь UTF8, а как уж она их там хранит - сугубо ее личное дело.
Если нужно регуляркой то вот Код (Text): <?php $regex = '\x30\x31\x32\x33\x34\x35\x36\x37\x38\x39'; echo preg_replace('~\\\\x([a-z0-9]{2})~e', '"\x\\1"', $regex); ?> А на самом деле всё проще Код (Text): <?php echo "\x30\x31\x32\x33\x34\x35\x36\x37\x38\x39"; ?> Просто используются двойные кавычки. В двух случаях вывод: Код (Text): 0123456789