Java使用HttpURLConnection檢索網站時403錯誤處理方式

Java使用HttpURLConnection檢索網站時403錯誤處理方式:

我們通過代碼方式訪問網站時會報錯:



此種情況分2中類型,

1.需要登錄纔可以訪問;

2.需要設置User-Agent來欺騙服務器。

  1. connection.setRequestProperty("User-Agent", "Mozilla/4.0 (compatible; MSIE 5.0; Windows NT; DigExt)");  

User Agent說明:

User Agent中文名爲用戶代理,簡稱 UA,它是一個特殊字符串頭,使得服務器能夠識別客戶使用的操作系統及版本、CPU 類型、瀏覽器及版本、瀏覽器渲染引擎、瀏覽器語言、瀏覽器插件等。  

一些網站常常通過判斷 UA 來給不同的操作系統、不同的瀏覽器發送不同的頁面,因此可能造成某些頁面無法在某個瀏覽器中正常顯示,但通過僞裝 UA 可以繞過檢測。

java訪問網站代碼:

  1. /** 
  2.  *  發起http get請求獲取網頁源代碼  
  3.  * @param requestUrl 
  4.  * @param isUserAgent 是否設置欺騙服務器 
  5.  * @return 
  6.  */  
  7.    
  8. public static String httpRequest(String requestUrl,boolean isUserAgent) {    
  9.     StringBuffer buffer = null;    
  10.   
  11.     try {    
  12.         // 建立連接    
  13.         URL url = new URL(requestUrl);    
  14.         HttpURLConnection httpUrlConn = (HttpURLConnection) url.openConnection();    
  15.         httpUrlConn.setDoInput(true);    
  16.         httpUrlConn.setRequestMethod("GET");    
  17.         if(isUserAgent){  
  18.             httpUrlConn.setRequestProperty("User-Agent""Mozilla/4.0 (compatible; MSIE 5.0; Windows NT; DigExt)");  
  19.         }  
  20.         // 獲取輸入流    
  21.         InputStream inputStream = httpUrlConn.getInputStream();    
  22.         InputStreamReader inputStreamReader = new InputStreamReader(inputStream, "utf-8");    
  23.         BufferedReader bufferedReader = new BufferedReader(inputStreamReader);    
  24.   
  25.         // 讀取返回結果    
  26.         buffer = new StringBuffer();    
  27.         String str = null;    
  28.         while ((str = bufferedReader.readLine()) != null) {    
  29.             buffer.append(str);    
  30.         }    
  31.   
  32.         // 釋放資源    
  33.         bufferedReader.close();    
  34.         inputStreamReader.close();    
  35.         inputStream.close();    
  36.         httpUrlConn.disconnect();    
  37.     } catch (Exception e) {    
  38.         e.printStackTrace();    
  39.     }    
  40.     return buffer.toString();    
  41. }    

執行結果:順利獲取到網頁代碼。

發佈了33 篇原創文章 · 獲贊 10 · 訪問量 5萬+
發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章