Java使用HttpURLConnection检索网站时403错误处理方式

Java使用HttpURLConnection检索网站时403错误处理方式:

我们通过代码方式访问网站时会报错:



此种情况分2中类型,

1.需要登录才可以访问;

2.需要设置User-Agent来欺骗服务器。

[html]  view plain copy print ?
  1. connection.setRequestProperty("User-Agent", "Mozilla/4.0 (compatible; MSIE 5.0; Windows NT; DigExt)");  

User Agent说明:

User Agent中文名为用户代理,简称 UA,它是一个特殊字符串头,使得服务器能够识别客户使用的操作系统及版本、CPU 类型、浏览器及版本、浏览器渲染引擎、浏览器语言、浏览器插件等。  

一些网站常常通过判断 UA 来给不同的操作系统、不同的浏览器发送不同的页面,因此可能造成某些页面无法在某个浏览器中正常显示,但通过伪装 UA 可以绕过检测。

java访问网站代码:

[java]  view plain copy print ?
  1. /** 
  2.  *  发起http get请求获取网页源代码  
  3.  * @param requestUrl 
  4.  * @param isUserAgent 是否设置欺骗服务器 
  5.  * @return 
  6.  */  
  7.    
  8. public static String httpRequest(String requestUrl,boolean isUserAgent) {    
  9.     StringBuffer buffer = null;    
  10.   
  11.     try {    
  12.         // 建立连接    
  13.         URL url = new URL(requestUrl);    
  14.         HttpURLConnection httpUrlConn = (HttpURLConnection) url.openConnection();    
  15.         httpUrlConn.setDoInput(true);    
  16.         httpUrlConn.setRequestMethod("GET");    
  17.         if(isUserAgent){  
  18.             httpUrlConn.setRequestProperty("User-Agent""Mozilla/4.0 (compatible; MSIE 5.0; Windows NT; DigExt)");  
  19.         }  
  20.         // 获取输入流    
  21.         InputStream inputStream = httpUrlConn.getInputStream();    
  22.         InputStreamReader inputStreamReader = new InputStreamReader(inputStream, "utf-8");    
  23.         BufferedReader bufferedReader = new BufferedReader(inputStreamReader);    
  24.   
  25.         // 读取返回结果    
  26.         buffer = new StringBuffer();    
  27.         String str = null;    
  28.         while ((str = bufferedReader.readLine()) != null) {    
  29.             buffer.append(str);    
  30.         }    
  31.   
  32.         // 释放资源    
  33.         bufferedReader.close();    
  34.         inputStreamReader.close();    
  35.         inputStream.close();    
  36.         httpUrlConn.disconnect();    
  37.     } catch (Exception e) {    
  38.         e.printStackTrace();    
  39.     }    
  40.     return buffer.toString();    
  41. }    

执行结果:顺利获取到网页代码。

你可能感兴趣的:(Java)