之前做的一個csv格式文件導出功能,因爲要把編碼處理成gb2312格式,使用
mb_convert_encoding($str,'gb2312','utf-8')來處理,後來發現有幾個字處理後是亂碼,沒錯,就是 “珺” 這個字,網上看了很多,有說把gb2312改成gbk,還有用iconv來處理,試了半天,都不行,最後才找到解決方案,直接上代碼吧
function convert_encoding($str, $encoding = 'gbk'){ $is_utf8 = preg_match('%^(?:[\x09\x0A\x0D\x20-\x7E]| [\xC2-\xDF][\x80-\xBF]| \xE0[\xA0-\xBF][\x80-\xBF] | [\xE1-\xEC\xEE\xEF][\x80-\xBF]{2} | \xED[\x80-\x9F][\x80-\xBF] | \xF0[\x90-\xBF][\x80-\xBF]{2} | [\xF1-\xF3][\x80-\xBF]{3} | \xF4[\x80-\x8F][\x80-\xBF]{2} )*$%xs', $str); if($is_utf8 && $encoding == 'utf8'){ return $str; }elseif($is_utf8){ return mb_convert_encoding($str, $encoding, "UTF-8"); }else{ return mb_convert_encoding($str, $encoding, 'gbk,gb2312,big5'); } }
直接調用這個函數處理就行了,至於爲什麼,相信大家看了這個代碼就明白了,廢話就不說了。