中文亂碼在java中URLEncoder.encode方法要調用兩次解決

因爲在jsp中對中文進行了編碼的時候用的是UTF-8的編碼方式,而在servlet中調用request.getParameter();方法的時候使用服務器指定的編碼格式自動解碼一次,所以前臺編碼一次後臺解碼一次而解碼和編碼的方式不用所以造成了亂碼的出現,

這就類似於以下代碼:

           
String name=java.net.URLEncoder.encode("測試", "UTF-8");
System.out.println(name);
System.out.println(java.net.URLDecoder.decode(name,
"ISO-8859-1"));

編碼後的是%E6%B5%8B%E8%AF%95。。
而用ISO-8859-1解碼後的是???è?。。

但是如果調用的是
System.out.println(java.net.URLDecoder.decode(name, "UTF-8"));

則結果是打印“測試”。

這就印證了 之前爲什麼我在servlet中調用java.net.URLDecoder.decode(request.getParameter("name"), "UTF-8")方法和調用java.net.URLDecoder.decode(request.getQueryString(), "UTF-8")所得到的結果是不一樣的,就是由於在request.getParameter("name")之前會自動做一次解碼的工作,而且是默認的ISO-8859-1。

所以,在使用java.net.URLEncoder.decode()和java.net.URLDecoder.decode(),的時候需要在前端頁面中使用兩次java.net.URLDecoder.decode()方法。

使用兩次編碼的過程相當於如下代碼:
複製代碼
String name=java.net.URLEncoder.encode("測試", "UTF-8");
System.out.println(name);
name
=java.net.URLEncoder.encode(name,"UTF-8");
System.out.println(name);
name
=java.net.URLDecoder.decode(name, "UTF-8");
System.out.println(name);
System.out.println(java.net.URLDecoder.decode(name,
"UTF-8"));
複製代碼

輸出爲:

            %E6%B5%8B%E8%AF%95
            %25E6%25B5%258B%25E8%25AF%2595
            %E6%B5%8B%E8%AF%95
            測試

第一次編碼後將漢字編碼爲%和字母數字的格式,而第二次編碼的時候是對%字母數字進行編碼,雖然解碼的時候使用的是ISO-8859-1,但是對於%和字母數字而言用ISO-8859-1和UTF-8解碼出來的是一樣的,此時就回到了漢字被編碼過一次的字符串了,當再次進行解碼的時候使用UTF-8就回將它轉會漢字。

發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章