PHP 中文处理技巧
网上的PHP端escape unescape函数建议不要用,它把中英文混合时的英文过滤掉了,我是莫名其妙了N久啊,建议用unicode_urldecode这个。
<?php function unicode_urldecode($url) { preg_match_all('/%u([[:alnum:]]{4})/', $url, $a); foreach ($a[1] as $uniord) { $dec = hexdec($uniord); $utf = ''; if ($dec < 128) { $utf = chr($dec); } else if ($dec < 2048) { $utf = chr(192 + (($dec - ($dec % 64)) / 64)); $utf.= chr(128 + ($dec % 64)); } else { $utf = chr(224 + (($dec - ($dec % 4096)) / 4096)); $utf.= chr(128 + ((($dec % 4096) - ($dec % 64)) / 64)); $utf.= chr(128 + ($dec % 64)); } $url = str_replace('%u' . $uniord, $utf, $url); } return urldecode($url); }
再就是编码格式的转换,这主要涉及数据的存储和客户端返回,用iconv就搞定,这个函数似乎是从C++中借鉴来的
文章链接:http://www.phprm.com/code/391edffb28cf89863e2460db4e71c64d.html
随便收藏,请保留本文地址!