php mb_detect_encoding判断字符串编码方法

作者: phper
时间: 2014-06-06
分类: php代码

在php中利用mb_detect_encoding可以判断给我们的字符是那个类型的编码了，从而我们就可以利用inconv进行字符转换了，下面给大家介绍几个例子。

例子，利用mb_detect_encoding()判断字符是否为uft-8编码。

<?php
$encode = mb_detect_encoding($q, array(
    'GB2312',
    'GBK',
    'UTF-8'
));
echo $encode . "<br/>";
if ($encode == "GB2312") {
    $q = iconv("GBK", "UTF-8", $q);
} else if ($encode == "GBK") {
    $q = iconv("GBK", "UTF-8", $q);
} else if ($encode == "EUC-CN") {
    $q = iconv("GBK", "UTF-8", $q);
} else
//CP936
{
    //$q = iconv("GB2312","UTF-8",$q);
    
}
?>

可是 mb_detect_encoding 存在一个硬伤，经常出现判断不准确的情况。或许这样就可以解决：

// 使用 iconv 转换并判断是否等值，效率不高

<?php
function is_utf8($str) {
    if ($str === iconv('UTF-8', 'UTF-8//IGNORE', $str)) {
        return 'UTF-8';
    }
}
// 多种编码的情况
function detect_encoding($str) {
    foreach (array(
        'GBK',
        'UTF-8'
    ) as $v) {
        if ($str === iconv($v, $v . '//IGNORE', $str)) {
            return $v;
        }
    }
}
?>

通过以上方式得到字符串编码信息后，就可以利用 iconv 或 mb_convert_encoding 来转换编码了

问题

可是当 $keytitle = '%D0%BE%C6%AC'; 时。

检测结果却是UTF-8，这其实不算是bug，我们不应当过于依赖mb_detect_encoding，当字符串较短时，检测结果产生偏差的可能性很大。

解决方法：

 
$encode = mb_detect_encoding($keytitle, array('ASCII','GB2312&prime;,'GBK&rsquo;,'UTF-8');

永久链接：http://www.phprm.com/code/62323.html

转载随意！带上文章地址吧。

标签：iconv foreach

PHP入门

php mb_detect_encoding判断字符串编码方法

相关文章

发表留言