中文亂碼在java中URLEncoder.encode方法要調用兩次解決

原創

2018-08-23 14:12

因爲在jsp中對中文進行了編碼的時候用的是UTF-8的編碼方式，而在servlet中調用request.getParameter();方法的時候使用服務器指定的編碼格式自動解碼一次，所以前臺編碼一次後臺解碼一次而解碼和編碼的方式不用所以造成了亂碼的出現，

這就類似於以下代碼：

String name=java.net.URLEncoder.encode("測試", "UTF-8");
System.out.println(name);
System.out.println(java.net.URLDecoder.decode(name, "ISO-8859-1"));

編碼後的是%E6%B5%8B%E8%AF%95。。
而用ISO-8859-1解碼後的是???è?。。

但是如果調用的是

System.out.println(java.net.URLDecoder.decode(name, "UTF-8"));

則結果是打印“測試”。

這就印證了之前爲什麼我在servlet中調用java.net.URLDecoder.decode(request.getParameter("name"), "UTF-8")方法和調用java.net.URLDecoder.decode(request.getQueryString(), "UTF-8")所得到的結果是不一樣的，就是由於在request.getParameter("name")之前會自動做一次解碼的工作，而且是默認的ISO-8859-1。

所以，在使用java.net.URLEncoder.decode()和java.net.URLDecoder.decode(),的時候需要在前端頁面中使用兩次java.net.URLDecoder.decode()方法。

使用兩次編碼的過程相當於如下代碼：

String name=java.net.URLEncoder.encode("測試", "UTF-8");
System.out.println(name);
name=java.net.URLEncoder.encode(name,"UTF-8");
System.out.println(name);
name=java.net.URLDecoder.decode(name, "UTF-8");
System.out.println(name);
System.out.println(java.net.URLDecoder.decode(name, "UTF-8"));

輸出爲：

            %E6%B5%8B%E8%AF%95
            %25E6%25B5%258B%25E8%25AF%2595
            %E6%B5%8B%E8%AF%95
            測試

第一次編碼後將漢字編碼爲%和字母數字的格式，而第二次編碼的時候是對%字母數字進行編碼，雖然解碼的時候使用的是ISO-8859-1，但是對於%和字母數字而言用ISO-8859-1和UTF-8解碼出來的是一樣的，此時就回到了漢字被編碼過一次的字符串了，當再次進行解碼的時候使用UTF-8就回將它轉會漢字。

原文鏈接 http://www.cnblogs.com/shitou/archive/2011/07/04/2097427.html

發表評論

所有評論

還沒有人評論，想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.

中文亂碼在java中URLEncoder.encode方法要調用兩次解決

微服務實踐k8s&dapr開發部署實驗（2）狀態管理

Win10 LTSC 2019 安裝後的一些步驟

Python 潮流週刊#52：Python 處理 Excel 的資源

歐拉計劃 Java實現

SpringBoot配置文件外置方案

記錄一次mysql導入sql文件失敗問題

springboot配置文件加密方案

docker卸載

https://yachay.unat.edu.pe/blog/index.php?comment_area=format_blog&comment_component=blog&comment_co

linux以太網驅動總結