utf8 轉 gbk/gb2312有些字亂碼問題,例如 珺字

之前做的一個csv格式文件導出功能,因爲要把編碼處理成gb2312格式,使用

mb_convert_encoding($str,'gb2312','utf-8')來處理,後來發現有幾個字處理後是亂碼,沒錯,就是 “珺” 這個字,網上看了很多,有說把gb2312改成gbk,還有用iconv來處理,試了半天,都不行,最後才找到解決方案,直接上代碼吧
function convert_encoding($str, $encoding = 'gbk'){
    $is_utf8 =  preg_match('%^(?:[\x09\x0A\x0D\x20-\x7E]| [\xC2-\xDF][\x80-\xBF]|  \xE0[\xA0-\xBF][\x80-\xBF] | [\xE1-\xEC\xEE\xEF][\x80-\xBF]{2}    |  \xED[\x80-\x9F][\x80-\xBF] |  \xF0[\x90-\xBF][\x80-\xBF]{2}  | [\xF1-\xF3][\x80-\xBF]{3}  |  \xF4[\x80-\x8F][\x80-\xBF]{2} )*$%xs', $str);
    if($is_utf8 && $encoding == 'utf8'){
        return $str;
    }elseif($is_utf8){
        return mb_convert_encoding($str, $encoding, "UTF-8");
    }else{
        return mb_convert_encoding($str, $encoding, 'gbk,gb2312,big5');
    }
}

直接調用這個函數處理就行了,至於爲什麼,相信大家看了這個代碼就明白了,廢話就不說了。

發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章