断点续传,HttpURLConnection ,报文抓取

 基于HTTP的协议的网络文件下载,工作原理建立在请求/响应模式(Request/Response)上:一个客户端与服务器建立连接后,客户端向 Web服务器发出一个HTTP请求行;Web服务器在收到有效的请求后,返回一个状态行或多个响应标题、一个空白行和相关文档。HTTP协议使用的端口 号,通常为80。开发基于http协议的网络文件下载必须掌握HTTP协议,包括向服务器发送请求和获取服务器响应状态的过程。HTTP1.0协议不支持 断点续传功能. 本文用java 提供了一个简单的实现.

 

1.HTTP协议工作方式
    基于HTTP协议的客户/服务器模式的信息交换过程,它分四个过程:建立连接、发送请求信息、获取服务器响应状态、关闭连接。其中较为复杂的过程是:发送请求信息、获取服务器响应状态.
1)向服务器发送请求信息 
  一个HTTP请求由一个请求行、可选数目的请求标题、一个空白行,以及在POST情况下的一些额外的数据组成。请求行的格式是:
     Method Request-URI HTTP-Vsersion CRLF
      Method表示请求方法,如GET和POST
      Request-URI标识了要请求的资源,
      HTTP-Version表示请求的HTTP协议版本,
      CRLF表示回车换行。

     HTTP请求报文格式如下:
        HTTP Command:       //方法字段(GET方法,POST方法)
        URI:                //URL字段,发送请求至保存该网站的服务器。
        HTTP Version:       //http协议版本字段
        Accept:             //指示可被接受的请求回应的介质类型范围列表。
        Accept-Language:    //限制了请求回应中首选的语言为简体中文,否则使用默认值。
        Accept-Encoding:    //限制了回应中可接受的内容编码值
        User-Agent:         //定义用户代理,即发送请求的浏览器类型
        Host:               //定义了目标所在的主机
        Connection:         //告诉服务器使用连接类型

2)获取服务器响应状态 
  在发送HTTP请求行以后,程序就可以读取服务器的响应状态了。HTTP响应状态行包括:HTTP 状态码和一些HTTP响应标题。 
  HTTP回应报文
        HTTP Version: HTTP/1.1       //服务器用的是HTTP/1.1版本
        HTTP Status: 200             //请求成功,信息可以读取,包含在响应的报文中
        Date:                        //响应报文的时间
        Server:                      //响应报文的服务器
        X-Powered-By:                //表明运行环境
        Set- cookie:                 //
        Vary:                        // 
        Content-Length:             //表明实体的长度
        Connection:                 //告诉客户机在报文发送完毕后连接的状态
        Content-Type:              //表明实体中的对象类型(html文档)
        Binary Data:              //二进制数据

状态码表示响应类型,常用的有:
1**  保留
2**  表示请求成功地接收
3**  为完成请求客户需进一步细化请求
4**  客户错误
5**  服务器错误
   在程序中间,如果读到“HTTP/1.1 200 OK”这样的字符串,表明欲下载文件存在、该服务器支持断点续传,可以使用多线程下载。如果读到“HTTP/1.0 200 OK”这样的字符串,表明欲下载文件存在、但该服务器不支持断点续传,只可以使用单线程下载。

 

2.实现代码

  1. import java.io.IOException;     
  2. import java.io.InputStream;     
  3. import java.io.RandomAccessFile;     
  4. import java.net.HttpURLConnection;     
  5. import java.net.URL;     
  6.     
  7. public   class  TestDownFile {     
  8.  public   static   void  main(String[] args){     
  9.   String sURL ="http://localhost:8080/hrproject/book.rar" ;     
  10.   int  nStartPos=0;     
  11.   int  nRead=0;     
  12.   String sName="book.rar" ;     
  13.   String sPath="e://temp" ;     
  14.   try  {     
  15.    URL url = new  URL(sURL);     
  16.   //打开连接      
  17.    HttpURLConnection httpConnection = (HttpURLConnection) url     
  18.      .openConnection();     
  19.     //获得文件长度      
  20.    long  nEndPos =getFileSize(sURL);     
  21.    RandomAccessFile oSavedFile= new  RandomAccessFile(sPath+ "//"+sName, " rw");     
  22.    httpConnection.setRequestProperty("User-Agent" "Internet Explorer" );     
  23.    String sProperty = "bytes="  + nStartPos +  "-" ;     
  24.     //告诉服务器book.rar这个文件从nStartPos字节开始传      
  25.    httpConnection.setRequestProperty("RANGE" , sProperty);     
  26.    System.out .println(sProperty);     
  27.    InputStream input = httpConnection.getInputStream();     
  28.    byte [] b =  new   byte [1024];     
  29.    //读取网络文件,写入指定的文件中      
  30.    while  ((nRead = input.read(b, 0, 1024)) > 0    
  31.      && nStartPos < nEndPos ) {     
  32.     oSavedFile.write(b, 0, nRead);     
  33.     nStartPos += nRead;     
  34.    }     
  35.    httpConnection.disconnect();     
  36.   } catch  (Exception e) {     
  37.    e.printStackTrace();     
  38.   }     
  39.  }     
  40.       
  41. //  获得文件长度      
  42.  public   static   long  getFileSize(String sURL) {     
  43.   int  nFileLength = -1;     
  44.   try  {     
  45.    URL url = new  URL(sURL);     
  46.    HttpURLConnection httpConnection = (HttpURLConnection) url     
  47.      .openConnection();     
  48.    httpConnection.setRequestProperty("User-Agent" "Internet Explorer" );     
  49.     
  50.    int  responseCode = httpConnection.getResponseCode();     
  51.    if  (responseCode >= 400) {     
  52.     System.err.println("Error Code : "  + responseCode);     
  53.     return  -2;  // -2 represent access is error      
  54.    }     
  55.    String sHeader;     
  56.    for  ( int  i = 1;; i++) {     
  57.     sHeader = httpConnection.getHeaderFieldKey(i);     
  58.     if  (sHeader !=  null ) {     
  59.      if  (sHeader.equals( "Content-Length" )) {     
  60.       nFileLength = Integer.parseInt(httpConnection     
  61.         .getHeaderField(sHeader));     
  62.       break ;     
  63.      }     
  64.     } else     
  65.      break ;     
  66.    }     
  67.   } catch  (IOException e) {     
  68.    e.printStackTrace();     
  69.   } catch  (Exception e) {     
  70.    e.printStackTrace();     
  71.   }     
  72.   System.out .println(nFileLength);     
  73.   return  nFileLength;     
  74.  }     
  75.     
  76. }   

说明:需要创建e:/temp目录

 

你可能感兴趣的:(断点续传,HttpURLConnection ,报文抓取)