php 字符串编码转换程序
iconv函数的一个bug。iconv在转换字符"—"到gb2312时会出错,解决方法很简单,就是在需要转成的编码后加 "//IGNORE" 也就是iconv函数第二个参数后.以下为引用的内容:
iconv("UTF-8","GB2312//IGNORE",$data)
ignore的意思是忽略转换时的错误,如果没有ignore参数,所有该字符后面的字符串都无法被保存,这个iconv()这个函数,在php5中是内置的,实例代码如下:
<?php echo $str = '你好,这里是卖咖啡!'; echo '<br />'; echo iconv('GB2312', 'UTF-8', $str); //将字符串的编码从GB2312转到UTF-8 echo '<br />'; echo iconv_substr($str, 1, 1, 'UTF-8'); //按字符个数截取而非字节 print_r(iconv_get_encoding()); //得到当前页面编码信息 echo iconv_strlen($str, 'UTF-8'); //得到设定编码的字符串长度 //也有这样用的 $content = iconv("UTF-8", "gbk//TRANSLIT", $content); ?>
但是使用iconv函数可能会碰到如notice: iconv() [function.iconv]: detected an illegal character in input string ...错误了,原因是因为这个编码范围的问题,gb2312小于gbk小于uft8哦,所以大家转换时要注意了,不过我们php还提供了一个函数mb_detect_encoding他可以比较好的解决这个问题了,现在把它写成更专业的函数
<?php function phpcharset($data, $to) { if (is_array($data)) { foreach ($data as $key => $val) { $data[$key] = phpcharset($val, $to); } } else { $encode_array = array( 'ASCII', 'UTF-8', 'GBK', 'GB2312', 'BIG5' ); $encoded = mb_detect_encoding($data, $encode_array); $to = strtoupper($to); if ($encoded != $to) { $data = mb_convert_encoding($data, $to, $encoded); } } return $data; } ?>
有时我们不知道字符的编码这时会需要先检测出编码再进行转换,代码如下:
<?php function asciitog($brand) { $cha = mb_detect_encoding($brand); if ($cha == 'utf-8') { $brand2 = iconv($cha, "gb2312", $brand); } $cha2 = mb_detect_encoding($brand2); if ($cha2 != 'ascii') { $brand = $brand2; } return $brand; } ?>
永久链接:http://www.phprm.com/develop/fs726.html
转载随意!带上文章地址吧。