網絡通信第二課 HTTP報文請求數據編碼 application/x-www-form-urlencoded

1編碼說明

網頁中的表單使用POST方法提交時,數據內容的類型是 application/x-www-form-urlencoded,這種類型會:

 

1.字符"a"-"z""A"-"Z""0"-"9"".""-""*",和"_"都不會被編碼;

 

2.將空格轉換爲加號 (+) ;

 

3.將非文本內容轉換成"%xy"的形式,xy是兩位16進制的數值;

 

4.在每個 name=value 對之間放置 & 符號。

 

*/

 

  諸如字符: / & ? @ # ; $ + = %也可以被使用,但是它們各有其特殊的用途,如果一個文件名包括了這些字符( / & ? @ # ; $ + = %)

這些字符和所有其他字符就應該被編碼。

 

 編碼過程非常簡單,任何字符只要不是ASCII碼數字,字母,或者前面提到的標點符,它們都將被轉換成字節形式,每個字節都寫成這種形式:

一個“%”後面跟着兩位16進制的數值。空格是一個特殊情況,因爲它們太平常了。它除了被編碼成“%20”以外,還能編碼爲一個“+”。

加號(+)本身被編碼%2B。當/ # = & ?作爲名字的一部分來使用時,而不是作爲URL部分之間的分隔符來使用時,它們都應該被編碼。

參考

http://www.cnblogs.com/jingzhishen/p/3506339.html

 

2 編碼實現

C++libcurl庫並沒有提供一個類似C#URLEncoder類,或者類似Javahttpclient的具體實現,,因此提供如下的案例代碼

unsigned char ToHex(unsigned char x)

{

         return  x > 9 ? x + 55 : x + 48;

}

 

unsigned char FromHex(unsigned char x)

{

         unsignedchar y;

         if(x >= 'A' && x <= 'Z') y = x - 'A' + 10;

         elseif (x >= 'a' && x <= 'z') y = x - 'a' + 10;

         elseif (x >= '0' && x <= '9') y = x - '0';

         elseassert(0);

         returny;

}

 

std::string UrlEncode(conststd::string& str)

{

         std::stringstrTemp = "";

         size_tlength = str.length();

         for(size_t i = 0; i < length; i++)

         {

                   if(isalnum((unsigned char)str[i]) ||

                            (str[i]== '-') ||

                            (str[i]== '_') ||

                            (str[i]== '.') ||

                            (str[i]== '~'))

                            strTemp+= str[i];

                   elseif (str[i] == ' ')

                            strTemp+= "+";

                   else

                   {

                            strTemp+= '%';

                            strTemp+= ToHex((unsigned char)str[i] >> 4);

                            strTemp+= ToHex((unsigned char)str[i] % 16);

                   }

         }

         returnstrTemp;

}

 

std::string UrlDecode(conststd::string& str)

{

         std::stringstrTemp = "";

         size_tlength = str.length();

         for(size_t i = 0; i < length; i++)

         {

                   if(str[i] == '+') strTemp += ' ';

                   elseif (str[i] == '%')

                   {

                            assert(i+ 2 < length);

                            unsignedchar high = FromHex((unsigned char)str[++i]);

                            unsignedchar low = FromHex((unsigned char)str[++i]);

                            strTemp+= high * 16 + low;

                   }

                   elsestrTemp += str[i];

         }

         returnstrTemp;

}

3 生產環境編碼

上面的代碼是對=&也進行了編碼,但是在實際的生產環境中,如果請求數據中攜帶的是Json格式,並且數據中使用了參數=的方式,這種情況下=&不應該被編碼,所以應該單獨拆分進行編碼,json內容進行編碼,參數鍵值不應該被編,代碼修改如下:

std::string UrlEncode(conststd::string& str)

{

         std::stringstrTemp = "";

         size_tlength = str.length();

         for(size_t i = 0; i < length; i++)

         {

                   if(isalnum((unsigned char)str[i]) ||

                            (str[i]== '-') ||

                            (str[i]== '_') ||

                            (str[i]== '.') ||

                            (str[i]== '~') ||

                            (str[i]== '&') ||

                            (str[i]== '='))

                            strTemp+= str[i];

                   elseif (str[i] == ' ')

                            strTemp+= "+";

                   else

                   {

                            strTemp+= '%';

                            strTemp+= ToHex((unsigned char)str[i] >> 4);

                            strTemp+= ToHex((unsigned char)str[i] % 16);

                   }

         }

         returnstrTemp;

}

 

std::string UrlDecode(conststd::string& str)

{

         std::stringstrTemp = "";

         size_tlength = str.length();

         for(size_t i = 0; i < length; i++)

         {

                   if(str[i] == '+') strTemp += ' ';

                   elseif (str[i] == '%')

                   {

                            assert(i+ 2 < length);

                            unsignedchar high = FromHex((unsigned char)str[++i]);

                            unsignedchar low = FromHex((unsigned char)str[++i]);

                            strTemp+= high * 16 + low;

                   }

                   elsestrTemp += str[i];

         }

         returnstrTemp;

}

 

4 restful接口編碼

application/x-www-form-urlencoded指定了發送的POST數據,要進行URL編碼,但是前面的&,=用在POST報文前面,作爲參數的時候,是不需要進行編碼的,可以直接跳過。例如:

loginusername=admin&loginpassword=admin&param={JSON報文}

對於前面的兩個&&都不能進行編碼,否則Java後臺無法正常解析出POST數據。目前JSON報文裏面存在一個uri:

http://192.168.0.225:8080/kms/services/rest/dataInfoService/downloadFileid=00000001/temp001/097_5848300_10488&token=7a57a5a7ffffffffc1a0316369671314

裏面存在&,如果沒有進行URL編碼的話,Java後臺無法正常解析出報文

因此對以前的url編碼函數進行了簡單的處理

std::string UrlEncode(const std::string&str)

{

         std::stringstrTemp = "";

         size_tlength = str.length();

         for(size_t i = 0; i < length; i++)

         {

                   /*

                   前面的&用來對多個參數鍵值進行區分,不能進行編碼,後面的&必須進行編碼

                   */

                   if(i < 50 && str[i] == '&')

                   {

                            strTemp+= str[i];

                            continue;

                   }

                   if(isalnum((unsigned char)str[i]) ||

                            (str[i]== '-') ||

                            (str[i]== '_') ||

                            (str[i]== '.') ||

                            (str[i]== '~') ||

                            (str[i]== '='))

                            strTemp+= str[i];

                   elseif (str[i] == ' ')

                            strTemp+= "+";

                   else

                   {

                            strTemp+= '%';

                            strTemp+= ToHex((unsigned char)str[i] >> 4);

                            strTemp+= ToHex((unsigned char)str[i] % 16);

                   }

         }

         returnstrTemp;

}

 

50是一個大致的數字,應該分別對json格式內容進行編碼,而不是對整一個發送報文進行編碼


發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章