大文件传输的三种方式

前言:因自己负责的项目(jetty内嵌启动的SpringMvc)中需要实现文件上传,而自己对java文件上传这一块未接触过,且对 Http 协议较模糊,故这次采用渐进的方式来学习文件上传的原理与实践。该博客重在实践。

 

一. Http协议原理简介 

    HTTP是一个属于应用层的面向对象的协议,由于其简捷、快速的方式,适用于分布式超媒体信息系统。它于1990年提出,经过几年的使用与发展,得到不断地完善和扩展。目前在WWW中使用的是HTTP/1.0的第六版,HTTP/1.1的规范化工作正在进行之中,而且HTTP-NG(Next Generation of HTTP)的建议已经提出。

    简单来说,就是一个基于应用层的通信规范:双方要进行通信,大家都要遵守一个规范,这个规范就是HTTP协议。

 1.特点:

  (1)支持客户/服务器模式。

  (2)简单快速:客户向服务器请求服务时,只需传送请求方法和路径。请求方法常用的有GET、HEAD、POST。每种方法规定了客户与服务器联系的类型不同。由于HTTP协议简单,使得HTTP服务器的程序规模小,因而通信速度很快。

  (3)灵活:HTTP允许传输任意类型的数据对象。正在传输的类型由Content-Type加以标记。

  (4)无连接:无连接的含义是限制每次连接只处理一个请求。服务器处理完客户的请求,并收到客户的应答后,即断开连接。采用这种方式可以节省传输时间。

  (5)无状态:HTTP协议是无状态协议。无状态是指协议对于事务处理没有记忆能力。缺少状态意味着如果后续处理需要前面的信息,则它必须重传,这样可能导致每次连接传送的数据量增大。另一方面,在服务器不需要先前信息时它的应答就较快。

  注意:其中(4)(5)是面试中常用的面试题。虽然HTTP协议(应用层)是无连接,无状态的,但其所依赖的TCP协议(传输层)却是常连接、有状态的,而TCP协议(传输层)又依赖于IP协议(网络层)。

 2.HTTP消息的结构

 (1)Request 消息分为3部分,第一部分叫请求行, 第二部分叫http header消息头, 第三部分是body正文,header和body之间有个空行, 结构如下图

 (2)Response消息的结构, 和Request消息的结构基本一样。 同样也分为三部分,第一部分叫request line状态行, 第二部分叫request header消息体,第三部分是body正文, header和body之间也有个空行,  结构如下图

 

下面是使用Fiddler捕捉请求baidu的Request消息机构和Response消息机构:

大文件传输的三种方式_第1张图片

大文件传输的三种方式_第2张图片

因为没有输入任何表单信息,故request的消息正文为空,大家可以找一个登录的页面试试看。

先到这里,HTTP协议的知识网上很丰富,在这里就不再熬述了。

 

二. 文件上传的三种实现

1. Jsp/servlet 实现文件上传

这是最常见也是最简单的方式

(1)实现文件上传的Jsp页面 

大文件传输的三种方式_第3张图片

(2)负责接文件的FileUploadServlet

import java.io.File;

import java.io.FileOutputStream;

import java.io.IOException;

import java.io.InputStream;

import javax.servlet.ServletException;

import javax.servlet.http.HttpServlet;

import javax.servlet.http.HttpServletRequest;

import javax.servlet.http.HttpServletResponse;

import org.apache.log4j.Logger;

// @WebServlet(name = "FileLoadServlet", urlPatterns = {"/fileload"})

publicclass FileLoadServlet extends HttpServlet {

    privatestatic Logger logger = Logger.getLogger(FileLoadServlet.class);

    privatestaticfinallong serialVersionUID = 1302377908285976972L;

    @Override

    protectedvoid service(HttpServletRequest request, HttpServletResponse response)throws ServletException, IOException {

        logger.info("------------ FileLoadServlet ------------");

        if(request.getContentLength()> 0){           

               InputStream inputStream =null;

               FileOutputStream outputStream =null;              

            try{               

                inputStream = request.getInputStream();

                // 给新文件拼上时间毫秒,防止重名

                long now = System.currentTimeMillis();

                File file =new File("c:/","file-"+ now +".txt");

                file.createNewFile();

                outputStream =new FileOutputStream(file);

                  byte temp[]=newbyte[1024];

                  int size =-1;

                  while((size = inputStream.read(temp))!=-1){// 每次读取1KB,直至读完

                      outputStream.write(temp, 0, size);

                  }               

                  logger.info("File load success.");

              }catch(IOException e){

                  logger.warn("File load fail.", e);

                  request.getRequestDispatcher("/fail.jsp").forward(request, response);

              }finally{

                  outputStream.close();

                  inputStream.close();

              }

          }       

          request.getRequestDispatcher("/succ.jsp").forward(request, response);

      }   

  }

FileUploadServlet的配置,推荐采用servlet3.0注解的方式更方便

    FileLoadServlet

    com.juxinli.servlet.FileLoadServlet

    FileLoadServlet

    /fileload

 

(3)运行效果

大文件传输的三种方式_第4张图片

点击"submit"

大文件传输的三种方式_第5张图片

页面转向文件上传成功的页面,再去C盘看看,发现多了一个文件:file-1433417127748.txt,这个就是刚上传的文件

 

我们打开看看,发现和原来的文本有些不一样

大文件传输的三种方式_第6张图片             大文件传输的三种方式_第7张图片

结合前面讲的HTTP协议的消息结构,不难发现这些文本就是去掉"请求头"后的"Request消息体"。所以,如果要得到与上传文件一致的文本,还需要一些字符串操作,这些就留给大家了。

另外,大家可以试试一个Jsp页面上传多个文件,会有不一样的精彩哦o(∩_∩)o ,不解释。

 

2. 模拟Post请求/servlet 实现文件上传

刚才我们是使用Jsp页面来上传文件,假如客户端不是webapp项目呢,显然刚才的那种方式有些捉襟见衬了。

这里我们换种思路,既然页面上通过点击可以实现文件上传,为何不能通过HttpClient来模拟浏览器发送上传文件的请求呢。关于HttpClient ,大家可以自己去了解。

 (1)还是这个项目,启动servlet服务

 (2)模拟请求的FileLoadClient

import java.io.BufferedReader;

import java.io.File;

import java.io.InputStream;

import java.io.InputStreamReader;

import org.apache.commons.httpclient.HttpClient;

import org.apache.commons.httpclient.HttpStatus;

import org.apache.commons.httpclient.methods.PostMethod;

import org.apache.commons.httpclient.methods.multipart.FilePart;

import org.apache.commons.httpclient.methods.multipart.MultipartRequestEntity;

import org.apache.commons.httpclient.methods.multipart.Part;

import org.apache.log4j.Logger;

publicclass FileLoadClient {

    privatestatic Logger logger = Logger.getLogger(FileLoadClient.class);

    publicstatic String fileload(String url, File file){

        String body ="{}";

        if(url ==null|| url.equals("")){

            return"参数不合法";

        }

        if(!file.exists()){

            return"要上传的文件名不存在";

        }

 

        PostMethod postMethod =new PostMethod(url);

        try{           

            // FilePart:用来上传文件的类,file即要上传的文件

            FilePart fp =new FilePart("file", file);

            Part[] parts ={ fp };

            // 对于MIME类型的请求,httpclient建议全用MulitPartRequestEntity进行包装

            MultipartRequestEntity mre =new MultipartRequestEntity(parts, postMethod.getParams());

            postMethod.setRequestEntity(mre);

            HttpClient client =new HttpClient();

            // 由于要上传的文件可能比较大 , 因此在此设置最大的连接超时时间

            client.getHttpConnectionManager().getParams().setConnectionTimeout(50000);

            int status = client.executeMethod(postMethod);

            if(status == HttpStatus.SC_OK){

                InputStream inputStream = postMethod.getResponseBodyAsStream();

                BufferedReader br =new BufferedReader(new InputStreamReader(inputStream));

                StringBuffer stringBuffer =new StringBuffer();

                String str ="";

                while((str = br.readLine())!=null){

                    stringBuffer.append(str);

                }               

                body = stringBuffer.toString();               

            }else{

                body ="fail";

            }

        }catch(Exception e){

            logger.warn("上传文件异常", e);

        }finally{

            // 释放连接

            postMethod.releaseConnection();

        }       

        return body;

    }   

   

    publicstaticvoid main(String[] args)throws Exception {

        String body = fileload("http://localhost:8080/jsp_upload-servlet/fileload",new File("C:/1111.txt"));

        System.out.println(body);

    }   

}

 

(3)在Eclipse中运行FileLoadClient程序来发送请求,运行结果:

  

File upload success

return

打印了:文件上传成功的succ.jsp页面

大文件传输的三种方式_第8张图片

 

有没有发现什么,是不是和前面Jsp页面上传的结果类似?对的,还是去掉"请求头"后的"Request消息体"。 

这种方式也很简单,负责接收文件的FileUploadServlet没有变,只要在客户端把文件读取到流中,然后模拟请求servlet就行了。

 3.模拟Post请求/Controller(SpringMvc)实现文件上传

 终于到第三种方式了,主要难点在于搭建maven+jetty+springmvc环境,接收文件的service和模拟请求的客户端 和上面相似。

 (1)模拟请求的FileLoadClient未变

import java.io.BufferedReader;

import java.io.File;

import java.io.InputStream;

import java.io.InputStreamReader;

import org.apache.commons.httpclient.HttpClient;

import org.apache.commons.httpclient.HttpStatus;

import org.apache.commons.httpclient.methods.PostMethod;

import org.apache.commons.httpclient.methods.multipart.FilePart;

import org.apache.commons.httpclient.methods.multipart.MultipartRequestEntity;

import org.apache.commons.httpclient.methods.multipart.Part;

import org.apache.log4j.Logger;

publicclass FileLoadClient {   

    privatestatic Logger logger = Logger.getLogger(FileLoadClient.class);

    publicstatic String fileload(String url, File file){

        String body ="{}";       

        if(url ==null|| url.equals("")){

            return"参数不合法";

        }

        if(!file.exists()){

            return"要上传的文件名不存在";

        }

        PostMethod postMethod =new PostMethod(url);       

        try{           

            // FilePart:用来上传文件的类,file即要上传的文件

            FilePart fp =new FilePart("file", file);

            Part[] parts ={ fp };

            // 对于MIME类型的请求,httpclient建议全用MulitPartRequestEntity进行包装

            MultipartRequestEntity mre =new MultipartRequestEntity(parts, postMethod.getParams());

            postMethod.setRequestEntity(mre);

            HttpClient client =new HttpClient();

            // 由于要上传的文件可能比较大 , 因此在此设置最大的连接超时时间

            client.getHttpConnectionManager().getParams().setConnectionTimeout(50000);

            int status = client.executeMethod(postMethod);

            if(status == HttpStatus.SC_OK){

                InputStream inputStream = postMethod.getResponseBodyAsStream();

                BufferedReader br =new BufferedReader(new InputStreamReader(inputStream));

                StringBuffer stringBuffer =new StringBuffer();

                String str ="";

                while((str = br.readLine())!=null){

                    stringBuffer.append(str);

                }               

                body = stringBuffer.toString();                

            }else{

                body ="fail";

            }

        }catch(Exception e){

            logger.warn("上传文件异常", e);

        }finally{

            // 释放连接

            postMethod.releaseConnection();

        }       

        return body;

    }   

    publicstaticvoid main(String[] args)throws Exception {

        String body = fileload("http://localhost:8080/fileupload/upload",new File("C:/1111.txt"));

        System.out.println(body);

    }

}

 

(2)servlet换为springMvc中的Controller

import java.io.File;

import java.io.FileOutputStream;

import java.io.IOException;

import java.io.InputStream;

import javax.servlet.http.HttpServletRequest;

import javax.servlet.http.HttpServletResponse;

import org.apache.log4j.Logger;

import org.springframework.stereotype.Controller;

import org.springframework.web.bind.annotation.RequestMapping;

import org.springframework.web.bind.annotation.RequestMethod;

 

@Controller

@RequestMapping("/fileupload")

publicclass FileUploadService {

    private Logger logger = Logger.getLogger(FileUploadService.class);

    @RequestMapping(consumes ="multipart/form-data", value ="/hello", method = RequestMethod.GET)

    publicvoid hello(HttpServletRequest request, HttpServletResponse response)throws IOException {        

        response.getWriter().write("Hello, jetty server start ok.");

    }

    @RequestMapping(consumes ="multipart/form-data", value ="/upload", method = RequestMethod.POST)

    publicvoid uploadFile(HttpServletRequest request, HttpServletResponse response)throws IOException {

        String result ="";

        if(request.getContentLength()> 0){           

               InputStream inputStream =null;

               FileOutputStream outputStream =null;              

            try{

                inputStream = request.getInputStream();

                // 给新文件拼上时间毫秒,防止重名

                long now = System.currentTimeMillis();

                File file =new File("c:/","file-"+ now +".txt");

                file.createNewFile();

                outputStream =new FileOutputStream(file);               

                byte temp[]=newbyte[1024];

                int size =-1;

                while((size = inputStream.read(temp))!=-1){// 每次读取1KB,直至读完

                    outputStream.write(temp, 0, size);

                }

                logger.info("File load success.");

                result ="File load success.";

            }catch(IOException e){

                logger.warn("File load fail.", e);

                result ="File load fail.";

            }finally{

                outputStream.close();

                inputStream.close();

            }

        }       

        response.getWriter().write(result);

    }

}

 

 (3)启动jetty的核心代码,在Eclipse里面右键可以启动,也可以把项目打成jar报启动

import org.apache.log4j.Logger;

import org.eclipse.jetty.server.Connector;

import org.eclipse.jetty.server.Server;

import org.eclipse.jetty.server.ServerConnector;

import org.eclipse.jetty.webapp.WebAppContext;

publicclass Launcher

{   

    privatestatic Logger logger = Logger.getLogger(Launcher.class);

    privatestaticfinalint PORT = 8080;

    privatestaticfinal String WEBAPP ="src/main/webapp";

    privatestaticfinal String CONTEXTPATH ="/";

    privatestaticfinal String DESCRIPTOR ="src/main/webapp/WEB-INF/web.xml";

    /*

     * 创建 Jetty Server,指定其端口、web目录、根目录、web路径

     * @param port

     * @param webApp

     * @param contextPath

     * @param descriptor

     * @return Server

     */

    publicstatic Server createServer(int port, String webApp, String contextPath, String descriptor){

        Server server =new Server();

        //设置在JVM退出时关闭Jetty的钩子

        //这样就可以在整个功能测试时启动一次Jetty,然后让它在JVM退出时自动关闭

        server.setStopAtShutdown(true);

        ServerConnector connector =new ServerConnector(server);

        connector.setPort(port);

        //解决Windows下重复启动Jetty不报告端口冲突的问题

        //在Windows下有个Windows + Sun的connector实现的问题,reuseAddress=true时重复启动同一个端口的Jetty不会报错

        //所以必须设为false,代价是若上次退出不干净(比如有TIME_WAIT),会导致新的Jetty不能启动,但权衡之下还是应该设为False

        connector.setReuseAddress(false);

        server.setConnectors(new Connector[]{connector});

        WebAppContext webContext =new WebAppContext(webApp, contextPath);

        webContext.setDescriptor(descriptor);

        // 设置webapp的位置

        webContext.setResourceBase(webApp);

        webContext.setClassLoader(Thread.currentThread().getContextClassLoader());

        server.setHandler(webContext);       

        return server;

    }

    /**

     * 启动jetty服务

     */

    publicvoid startJetty(){

        final Server server = Launcher.createServer(PORT, WEBAPP, CONTEXTPATH, DESCRIPTOR);

        try{

            server.start();

            server.join();           

        }catch(Exception e){

            logger.warn("启动 jetty server 失败", e);

            System.exit(-1);

        }

    }

 

    publicstaticvoid main(String[] args){       

        (new Launcher()).startJetty();

        // jetty 启动后的测试url

        // http://localhost:8080/fileupload/hello

    }   

}

springMvc的配置不贴了,大家可以下载源码下来看。

 

(4)运行效果

上传包含1W个文件的文件夹,正常

大文件传输的三种方式_第9张图片

 

大型文件续传功能正常 。

 

文件批量上传正常

 

服务器中已经根据日期+GUID生成了目录

大文件传输的三种方式_第10张图片

数据库中也有记录

后端代码逻辑大部分是相同的,目前能够支持MySQL,Oracle,SQL。在使用前需要配置一下数据库,可以参考我写的这篇文章:http://blog.ncmem.com/wordpress/2019/08/12/java-http%E5%A4%A7%E6%96%87%E4%BB%B6%E6%96%AD%E7%82%B9%E7%BB%AD%E4%BC%A0%E4%B8%8A%E4%BC%A0/

你可能感兴趣的:(WEB上传大文件,大文件传输,java+web+超大文件上传,php上传大文件)