原理很简单,因为gb2312/gbk是中文两字节,这两个字节是有取值范围的,而utf-8中汉字是三字节,同样每个字节也有取值范围,而英文不管在何种编码情况下,都是小于128,只占用一个字节,全角除外.
首页 >
自动识别
php 正则判断中文(自动识别UTF-8 & GBK编码)
下面这款实例程序是一款PHP 正确匹配UTF8或gbk中文的正则表达式程序,能准确的获取不同编码情况的中文汉字的识别.
PHP实例代码如下:
原理很简单,因为gb2312/gbk是中文两字节,这两个字节是有取值范围的,而utf-8中汉字是三字节,同样每个字节也有取值范围,而英文不管在何种编码情况下,都是小于128,只占用一个字节,全角除外.
下面这款实例程序是一款PHP 正确匹配UTF8或gbk中文的正则表达式程序,能准确的获取不同编码情况的中文汉字的识别.
PHP实例代码如下: