Servlet多文件上传

各位大侠可能会对263电子邮箱中的"上传附件"功能有印象,就是:在浏览 器中点击"浏览",弹出一个对话框,选中文件后,单击"确定",文件就被上传到了服务器端。 因为需要,就到网上找了几个控件,如SmartUpload等,但都觉得不好用,或者 说是不合用,决定自己做一个。近日看到网上也有人提问怎么上载文件,于是把编制过程整理一遍,希望对大家有所帮助,不足之处,请多多指教。 准备 侦听工具,如SpyNet(包括CaptureNetPeepNet),目的是用于分析数据包格式;

Java环境:至少要包括一个Servlet引擎,一套JDK;如果没有,可以访问

"http://www.jsp001.com/article/Application_Server_Comparison_Matrix_20010226.html"

从这36款中随便找出一种来,安装运行即可。JSP服务器都会支持SERVLET,因为JSP本身就是先被编译成SERVLET再执行的。 过程

1、制作HTML页面,用于上传文件。需要注意:要指定enctype属性为"multipart/form-data",因为数据流的格式是不一样的。

<form action="/java/servlet/powerise.nms.web.UploadFile"

method=post enctype="multipart/form-data"> <p>

<input type=radio name=type value=0>model

<input type=radio name=type value=1>report <input name=id >

<input type=file name=file value="test"> </p>

<input type=submit> </form>

2、HTML页面做好后,就可以开始分析数据流了。先打开侦听器,然后在浏览

器(IE, Netscape)中打开本页面,随意选择一个文件,单击"确定",看看侦听器听到了什么。在跳过前面几个包后,可以得到下面这两个相关的包。

第一个包的很容易明白,在Servlet中,用getHeader(String)能得到的内容

就在这里面。不过这个包,用HttpServletRequest的getInputStream是得不到的。

关于HTTP协议的更多信息,可以访问www.w3c.org。

0000: 00 E0 4C DD 2F 4F 00 50 BA A6 C3 CF 08 00 45 00 ..L./O.P......E.

0010: 02 3E 01 46 40 00 80 06 0E F5 AC 12 C8 01 AC 12 .>.F@...........

0020: C8 58 04 12 00 50 48 82 2A 39 FA 97 28 31 50 18 .X...PH.*9..(1P.

0030: 44 70 A4 76 00 00 50 4F 53 54 20 2F 6A 61 76 61 Dp.v..POST /java

0040: 2F 73 65 72 76 6C 65 74 2F 69 6D 63 2E 55 70 6C /servlet/imc.Upl

0050: 6F 61 64 20 48 54 54 50 2F 31 2E 31 0D 0A 41 63 oad HTTP/1.1..Ac

0060: 63 65 70 74 3A 20 69 6D 61 67 65 2F 67 69 66 2C cept: image/gif,

0070: 20 69 6D 61 67 65 2F 78 2D 78 62 69 74 6D 61 70 image/x-xbitmap

0080: 2C 20 69 6D 61 67 65 2F 6A 70 65 67 2C 20 69 6D , image/jpeg, im

0090: 61 67 65 2F 70 6A 70 65 67 2C 20 61 70 70 6C 69 age/pjpeg, appli

00A0: 63 61 74 69 6F 6E 2F 76 6E 64 2E 6D 73 2D 70 6F cation/vnd.ms-po

00B0: 77 65 72 70 6F 69 6E 74 2C 20 61 70 70 6C 69 63 werpoint, applic

00C0: 61 74 69 6F 6E 2F 76 6E 64 2E 6D 73 2D 65 78 63 ation/vnd.ms-exc

00D0: 65 6C 2C 20 61 70 70 6C 69 63 61 74 69 6F 6E 2F el, application/

00E0: 6D 73 77 6F 72 64 2C 20 2A 2F 2A 0D 0A 52 65 66 msword, */*..Ref

00F0: 65 72 65 72 3A 20 68 74 74 70 3A 2F 2F 31 37 32 erer: http://172

0100: 2E 31 38 2E 32 30 30 2E 38 38 2F 64 65 6D 6F 2F .18.200.88/demo/

0110: 74 65 73 74 2E 68 74 6D 6C 0D 0A 41 63 63 65 70 test.html..Accep

0120: 74 2D 4C 61 6E 67 75 61 67 65 3A 20 7A 68 2D 63 t-Language: zh-c

0130: 6E 0D 0A 43 6F 6E 74 65 6E 74 2D 54 79 70 65 3A n..Content-Type:

0140: 20 6D 75 6C 74 69 70 61 72 74 2F 66 6F 72 6D 2D multipart/form-

0150: 64 61 74 61 3B 20 62 6F 75 6E 64 61 72 79 3D 2D data; boundary=-

0160: 2D 2D 2D 2D 2D 2D 2D 2D 2D 2D 2D 2D 2D 2D 2D 2D ----------------

0170: 2D 2D 2D 2D 2D 2D 2D 2D 2D 2D 37 64 31 33 35 32 ----------7d1352

0180: 61 32 30 31 36 63 0D 0A 41 63 63 65 70 74 2D 45 a2016c..Accept-E

0190: 6E 63 6F 64 69 6E 67 3A 20 67 7A 69 70 2C 20 64 ncoding: gzip, d

01A0: 65 66 6C 61 74 65 0D 0A 55 73 65 72 2D 41 67 65 eflate..User-Age

01B0: 6E 74 3A 20 4D 6F 7A 69 6C 6C 61 2F 34 2E 30 20 nt: Mozilla/4.0

01C0: 28 63 6F 6D 70 61 74 69 62 6C 65 3B 20 4D 53 49 (compatible; MSI

01D0: 45 20 35 2E 30 31 3B 20 57 69 6E 64 6F 77 73 20 E 5.01; Windows

01E0: 4E 54 20 35 2E 30 29 0D 0A 48 6F 73 74 3A 20 31 NT 5.0)..Host: 1

01F0: 37 32 2E 31 38 2E 32 30 30 2E 38 38 0D 0A 43 6F 72.18.200.88..Co

0200: 6E 74 65 6E 74 2D 4C 65 6E 67 74 68 3A 20 34 30 ntent-Length: 40

0210: 39 0D 0A 43 6F 6E 6E 65 63 74 69 6F 6E 3A 20 4B 9..Connection: K

0220: 65 65 70 2D 41 6C 69 76 65 0D 0A 43 6F 6F 6B 69 eep-Alive..Cooki

0230: 65 3A 20 4A 53 45 53 53 49 4F 4E 49 44 3D 63 74 e: JSESSIONID=ct

0240: 71 62 76 65 38 73 35 31 0D 0A 0D 0A qbve8s51....

再看第二个包,可以看到,所要传的参数都在。下文只分析这个包。

0000: 00 E0 4C DD 2F 4F 00 50 BA A6 C3 CF 08 00 45 00 ..L./O.P......E.

0010: 01 C1 01 47 40 00 80 06 0F 71 AC 12 C8 01 AC 12 [email protected]......

0020: C8 58 04 12 00 50 48 82 2C 4F FA 97 28 31 50 18 .X...PH.,O..(1P.

0030: 44 70 3D AE 00 00 2D 2D 2D 2D 2D 2D 2D 2D 2D 2D Dp=...----------

↑(1)开始

0040: 2D 2D 2D 2D 2D 2D 2D 2D 2D 2D 2D 2D 2D 2D 2D 2D ----------------

0050: 2D 2D 2D 37 64 31 33 35 32 61 32 30 31 36 63 0D ---7d1352a2016c.

0060: 0A 43 6F 6E 74 65 6E 74 2D 44 69 73 70 6F 73 69 .Content-Disposi

0070: 74 69 6F 6E 3A 20 66 6F 72 6D 2D 64 61 74 61 3B tion: form-data;

0080: 20 6E 61 6D 65 3D 22 74 79 70 65 22 0D 0A 0D 0A name="type"....

0090: 30 0D 0A 2D 2D 2D 2D 2D 2D 2D 2D 2D 2D 2D 2D 2D 0..-------------

↑(2)第1段结束

00A0: 2D 2D 2D 2D 2D 2D 2D 2D 2D 2D 2D 2D 2D 2D 2D 2D ----------------

00B0: 37 64 31 33 35 32 61 32 30 31 36 63 0D 0A 43 6F 7d1352a2016c..Co

00C0: 6E 74 65 6E 74 2D 44 69 73 70 6F 73 69 74 69 6F ntent-Dispositio

00D0: 6E 3A 20 66 6F 72 6D 2D 64 61 74 61 3B 20 6E 61 n: form-data; na

00E0: 6D 65 3D 22 69 64 22 0D 0A 0D 0A 36 37 38 0D 0A me="id"....678..

00F0: 2D 2D 2D 2D 2D 2D 2D 2D 2D 2D 2D 2D 2D 2D 2D 2D ----------------

↑(3)第2段结束

0100: 2D 2D 2D 2D 2D 2D 2D 2D 2D 2D 2D 2D 2D 37 64 31 -------------7d1

0110: 33 35 32 61 32 30 31 36 63 0D 0A 43 6F 6E 74 65 352a2016c..Conte

0120: 6E 74 2D 44 69 73 70 6F 73 69 74 69 6F 6E 3A 20 nt-Disposition:

0130: 66 6F 72 6D 2D 64 61 74 61 3B 20 6E 61 6D 65 3D form-data; name=

0140: 22 66 69 6C 65 22 3B 20 66 69 6C 65 6E 61 6D 65 "file"; filename

0150: 3D 22 43 3A 5C 43 4F 4E 46 49 47 2E 53 59 53 22 ="C:CONFIG.SYS"

0160: 0D 0A 43 6F 6E 74 65 6E 74 2D 54 79 70 65 3A 20 ..Content-Type:

0170: 74 65 78 74 2F 70 6C 61 69 6E 0D 0A 0D 0A 73 68 text/plain....sh

0180: 65 6C 6C 3D 63 3A 5C 63 6F 6D 6D 61 6E 64 2E 63 ell=c:command.c

0190: 6F 6D 20 2F 70 20 2F 65 3A 33 32 30 30 30 0D 0A om /p /e:32000..

01A0: 0D 0A 2D 2D 2D 2D 2D 2D 2D 2D 2D 2D 2D 2D 2D 2D ..--------------

↑(4)第3段结束

01B0: 2D 2D 2D 2D 2D 2D 2D 2D 2D 2D 2D 2D 2D 2D 2D 37 ---------------7

01C0: 64 31 33 35 32 61 32 30 31 36 63 2D 2D 0D 0A d1352a2016c--..

(5)结束 ↑

以下对各标号作出说明: (1)开始,这是整个能得到的输入流的开端;

(2)第1段结束。每一段包含一个参数的信息,这些信息包括类型、名称、内容等。 (3)和(4)与(2)是一样的。

(4)以后就是输入流的结束标志:boundary。 (5)为从输入流中能读到的最后一个字符。

注意了第一个包中,有一项叫做"boundary"。顾名思义,这个boundary是

"分界"标志了。每一段的开头都会有一个boundary,然后是 0D 0A,然后是一些

相关信息,接着是 0D 0A 0D 0A,紧跟着参数的实际值,然后是下一个boundary,

标志着下一段的开始。而整个输入流呢,以一个boundary结束。如果只有一个参数,那输入流的结构应该是下面这样的:

boundary 0D 0A ... 0D 0A 0D 0A ... boundary 0D 0A

↑ ↑ ↑ ↑

开始 参数的信息 参数的内容 结束

明白了数据流的结构,编程就简单了,以下给出一段源程序。该程序易于使用,(当然,也不必交版权费啦……)。先给出如下的调用示例,而把源程序附于末尾。

public void doPost(HttpServletRequest req, HttpServletResponse resp)

throws ServletException, java.io.IOException {

//新建一个对象,其实,若写成static的,连这一步都可省了

DecodeRequestStream decode = new DecodeRequestStream();

//调用Decode方法,返回一个哈希表 Hashtable hashtable = decode.Decode(req, 2); ......

//获取type的值 String type = (String)hashtable.get("type"); //获取id的值

String id = (String)hashtable.get("id"); //以字节数据的方式获得文件的内容

byte[] filecontent = (byte[])hashtable.get("file"); ...... }

Decode函数的声明如下: 入参: (1)HttpServletRequest: 从这个参数中可以得到输入流;

(2)int ParamsCount: 这个参数表示输入流中除文件外,普通参数的个数

提供这个参数是从性能的角度出发的,下文中会有说明; 出参:

一个哈希表。如果是普通参数,则以(string name, string value)的方式

保存,如果是文件,则以(string name, byte[] value)的方式保存;

对DecodeRequestStream类,作如下说明: 1、本类一次只能处理一个文件的上载。如果有多个文件,将会保存在一个字

节数组里面。实际上,可以很容易地把本程序改写成支持多文件的。我这 么做也是从性能方面考虑;个人认为,已经够用了;

2、文件必须是作为最后一个参数。此前有多少个参数必须在调用时通过Param

sCount参数指定。细心的大侠会发现这个参数也是为了性能。因为确定边

界boundary的位置是一个很费时的操作,需要先拷贝某个位置起与boundary

相同长度的字节数组,然后再与boundary比较。在确定文件内容的结束位置

时,要从文件流的开始处一直搜索到文件的结束处,对于大的文件,这是

很费时的。所以本程序中做了一点小动作,那就是,对于第ParamsCount+1

的那个参数(也就是文件参数),不用常规方法搜索,而是直接跳到输入流的

末尾(末尾是boundary 0D 0A),再往前倒数boundary的长度外加4个字节。

然后从这个位置开始定位boundary(一找一个准)。程序中,用了5个字节, 是"留有余地"的想法,其实不用。

3、本程序在 Tomcat 3.2.1 + Sun JDK 1.3.0_02 下运行通过,客户端浏览器

为Internet Exploere 5.0、Netscape Communacator 4.77 和Netscape 6。以下是源程序:

DecodeRequestStream.java

---------------------------------------------------------------------------

import javax.servlet.*;import javax.servlet.http.*;import java.io.*;

import java.util.*;public class DecodeRequestStream{

public Hashtable Decode(HttpServletRequest req, int paramcount)

throws java.io.IOException { byte[] body = null; int bodyLen = 0;

byte[] bound = null; int boundLen = 0; int index = 0; int count = 0;

bodyLen = req.getContentLength(); body = new byte[bodyLen];

BufferedInputStream dataIn= new BufferedInputStream( req.getInputStream());

int readed = 0; int cur_read = 0; while (readed < bodyLen)

{ cur_read = dataIn.read(body, readed, bodyLen-readed);

if (cur_read <0) { break; }

readed = readed + cur_read; } int i = 0;

while (i <= bodyLen) {

if (body[i] == 13 && body[i+1] == 10) break; else

i ++; } if (i > bodyLen) return null;

boundLen = i; bound = new byte[boundLen];

for (int j=0; j<boundLen; j++) {

bound[j] = body[j + index]; //decode bound }

i = i+2; //plus 2 to skip the following bytes "0D 0A"

index = i; //point to the beginning of first parameter

Hashtable hashtable = new Hashtable(); boolean moved = false;

while (i < bodyLen) { if (!moved && count == paramcount)

{

i = bodyLen-boundLen-5; //subst more than 4, but little than 10

moved = true; }

if (!compareByteArray(copybyte(body, i, boundLen), bound)) {

i++; } else { count ++;

int j = index;

while ((j < i) && (body[j] != 13 || body[j+1] != 10 ||

body[j+2]!=13 || body[j+3] != 10)) { j ++;

} if (j >= i) break;

String paramHeader = new String(body, index, j-index+2);

index = j; int m = paramHeader.indexOf("name="");

if (m < 0) break; m = m+6; //point to name value

int n = paramHeader.indexOf(""", m); if (n <= m) break;

String name = paramHeader.substring(m, n); //get name

boolean isFile = false; String filename = "";

String filetype = "";

m = paramHeader.indexOf("filename="", n+1); if (m > n)

{ isFile = true; m = m+10; //skip (filename=")

n = paramHeader.indexOf(""", m);

if (n > m) filename = paramHeader.substring(m, n);

m = paramHeader.indexOf("Content-Type: ", n+1); if (m > n)

{ m = m+14; n = m;

while ((n < paramHeader.length())

&& (paramHeader.charAt(n) != 13

|| paramHeader.charAt(n+1) != 10)) { n++;

} if (n <= paramHeader.length())

filetype=paramHeader.substring(m, n); } }/*

status: j point to the start of end flag (0D 0A 0D 0A) of current parameter´s

header after j + 0D 0A 0D 0A, is the start of current parameter´s value

(byte format) i point to the start of next boundary, that is,

"(current header) 0D 0A 0D 0A (current value) 0D 0A (next boundary)"

↑ ↑ ↑

index j i

the following code gets current value*/

j = j+4; //skip 0D 0A 0D 0A, point to parameter value;

byte[] value = copybyte(body, j, i-j-2); if (!isFile)

{ String tmpstr = new String(value);

hashtable.put(name, tmpstr); } else {

hashtable.put(name, value); break; }

i = i + boundLen + 2; index = i; } //end else

} //end while dataIn.close(); return hashtable; }

public boolean compareByteArray(byte[] a, byte[] b) {

if (a.length != b.length) return false; for (int i=0; i<a.length; i++)

if (a[i] != b[i]) return false; return true; }

public byte[] copybyte(byte[] a, int from, int len) { int copylen = len;

if ((a.length-from) < copylen) copylen = a.length-from;

byte[] b = new byte[copylen]; for (int i=0; i<copylen; i++) b[i] = a[from+i];

return b; }}----------------------------------------------------------- 
-----------------------------------------------------------------------------------------------------------------------------

你可能感兴趣的:(servlet)