深入解析form表单的enctype属性&从form的enctype属性到Content-Type再到request.getInputStream()

文一:

form的enctype属性:客户端博览器对form的编码措施。

客户端博览器把form编码后,再发送给服务器处理。常见的设置有application/x-www-form-urlencoded和multipart/form-data两种,默感受前者。

application/x-www-form-urlencoded措施:不波及文件传输时,等闲设置为这种措施。依据w3c规范,这种编码措施如下编码:

空格被轮换成“+”,非字母数字字符轮换了`%HH',一个百分号和两个代表的ASCII码十六进制数字字符,换行表示为“CR LF”对。names/values对最后以“=”连接内部ie.ieltsuk.org,以“&”分隔表面。

multipart/form-data措施:万一必需传输许多的二进制数据可能传输非ASCII文本时,必需批准这种编码措施。这种编码措施如下编码:

把form的内容瓜分成段,每段代表一个input属性,每个段落间用分隔符隔开。其中每个段落登记这个段落的消息,例如Content-Disposition,name,Content-Type等等,还有这个段落与下个段落的分隔符boundary,以及这个段落的value数据。

例如,这个form:

enctype="multipart/form-data"

method="post">

姓名:

文件:

万一填入姓名为“user”,上传一个名目为imagemom.imomc.com.jpg的文件后提交,这个form将被编码成如下(切实中未曾行号):

1 Content-Type: multipart/form-data; boundary=AaB03x
2
3 --AaB03x
4 Content-Disposition: form-data; name="name"
5
6 user
7 --AaB03x
8 Content-Disposition: form-data; name="files"
9 Content-Type: image/pjpeg; boundary=BbC04y
10
11 ... image.jpg的内容...
12 --BbC04y--
13 --AaB03x--

各行解析如下:

1. 设置form的编码种类和分隔符。

2. 无

3. 一个form段(form切身的设置)的告终符号

4. “姓名”段的大约设置

5. 无

6. “姓名”段的值

7. 一个form段(姓名段)的告终符号

8. “文件”段的大约设置

9. “文件”段的高级设置 Content-Type设置这一段的”值”(image.jpg的byte[]数据)的解析措施。即服务器端接收到这段byte[]后,解析为文件时抉择的mime种类。boundary设置文件段的分隔符,这个分隔符用在有多个文件上传时,文件之间的分隔符号。

10. 无

11. image.jpg的内容

12. 一个文件段(image.jpg)的告终符号

13. 一个form段(文件段)的告终符号。

关于第9步的Content-Type:

在Struts开发中,文件上传等闲在前台利用html:file标签,在ActionForm的org.apache.struts.upload.FormFile接口来接收,FormFile接口供给的一个措施:getContentType()。这个措施的作用即便获得这里的Content-Type。String s = new String ("Text here");

 

===========================================================

今天再作程序时,我需要既要上传文件。又要获取HIDDEN 数据。
可是本页面总是 无法 获取的HIDDEN数据
最后发现是 :
ENCTYPE="multipart/form-data" 引起。

转自:http://yanghongliang8888.blog.163.com/blog/static/18434087201216348385/


文二:

还是一个异常引发的故事:

需要实现一个手机客户端行为分析的需求,手机客户端需要上传一些数据文件。手机客户端通过http协议post方式上传数据文件的时候,我们发现在服务器端无法通过request.getInputStream()获取到相应的数据,调用request.getInputStream()读取数据里头啥都木有。


经过各种尝试我们注意到如下的情况:

1.在不做任何修改的情况下,调用request.getParameter()可以获取到部分数据,即url拼接参数的数据。

2.在不做任何修改的情况下,如果在之前任何地方都不调用request.getParameter(),而是直接调用request.getInputStream()是可以获取到数据的。

3.原来客户端使用默认的请求头Content-Type:application/x-www-form-urlencoded,修改此值为multipart/form-data或者application/octet-stream之后,通过request.getInputStream()可以获取到数据,即使之前调用过request.getParameter()。


最后的解决方法当然是客户端修改Content-Type,因为服务器端request.getInputStream()的方法不方便修改。今天具体分析下里头的原理。


一.从form的enctype属性到Content-Type

写html的时候我们都知道form有个属性enctype,默认值是application/x-www-form-urlencoded,这个值表示会将表单数据用&符号做一个简单的拼接。例如:

[plain] view plaincopyprint?
  1. POST /post_test.php HTTP/1.1
  2. Accept-Language: zh-CN
  3. User-Agent: Mozilla/4.0
  4. Content-Type: application/x-www-form-urlencoded
  5. Host: 192.168.12.102
  6. Content-Length: 42
  7. Connection: Keep-Alive
  8. Cache-Control: no-cache
  9. title=test&content=%B3%AC%BC%B6%C5%AE%C9%FA&submit=post+article
POST /post_test.php HTTP/1.1 
Accept-Language: zh-CN
User-Agent: Mozilla/4.0 
Content-Type: application/x-www-form-urlencoded 
Host: 192.168.12.102
Content-Length: 42
Connection: Keep-Alive
Cache-Control: no-cache
 
title=test&content=%B3%AC%BC%B6%C5%AE%C9%FA&submit=post+article

我们注意到这个时候Content-Type为application/x-www-form-urlencoded。

如果enctype的值为multipart/form-data,这个值一般用于表单中包含文件上传的情况,它会将表单中的数据使用一个boundary作为分隔上传。例如:

[plain] view plaincopyprint?
  1. POST /post_test.php?t=1 HTTP/1.1
  2. Accept-Language: zh-CN
  3. User-Agent: Mozilla/4.0
  4. Content-Type: multipart/form-data; boundary=---------------------------7dbf514701e8
  5. Accept-Encoding: gzip, deflate
  6. Host: 192.168.12.102
  7. Content-Length: 345
  8. Connection: Keep-Alive
  9. Cache-Control: no-cache
  10. -----------------------------7dbf514701e8
  11. Content-Disposition: form-data; name="title"
  12. test
  13. -----------------------------7dbf514701e8
  14. Content-Disposition: form-data; name="content"
  15. ....
  16. -----------------------------7dbf514701e8
  17. Content-Disposition: form-data; name="submit"
  18. post article
  19. -----------------------------7dbf514701e8--
POST /post_test.php?t=1 HTTP/1.1
Accept-Language: zh-CN
User-Agent: Mozilla/4.0  
Content-Type: multipart/form-data; boundary=---------------------------7dbf514701e8
Accept-Encoding: gzip, deflate
Host: 192.168.12.102
Content-Length: 345
Connection: Keep-Alive
Cache-Control: no-cache
 
-----------------------------7dbf514701e8
Content-Disposition: form-data; name="title"
test
-----------------------------7dbf514701e8
Content-Disposition: form-data; name="content"
....
-----------------------------7dbf514701e8
Content-Disposition: form-data; name="submit"
post article
-----------------------------7dbf514701e8--

我们注意到这个时候Content-Type也相应的变为multipart/form-data,同时后面还加上了分隔符boundary的描述。

所以,其实form的enctype属性某种程度上决定了Content-Type值和请求body里头的数据格式。

详细的可以参考:http://imzc.net/archives/131


二.从Content-Type到request.getInputStream()


上面说到了form的处理情况,但是其实如果我们不是使用浏览器,而是自己实现的客户端来传递数据的话,这些头信息就得都由自己处理。

所以上面就出现了,上传文件的时候仍然使用了application/x-www-form-urlencoded的不标准用法。

但是为啥Content-Type会影响request的处理呢?这得从request的一些实现说起。

request.getParameter()、 request.getInputStream()、request.getReader()这三种方法是有冲突的,因为流只能被读一次。

比如: 当form表单内容采用 enctype=application/x-www-form-urlencoded编码时,先通过调用request.getParameter() 方法得到参数后,再调用 request.getInputStream()或request.getReader()已经得不到流中的内容,因为在调用 request.getParameter()时系统可能对表单中提交的数 据以流的形式读了一次,反之亦然。

当form表单内容采用 enctype=multipart/form-data编码时,即使先调用request.getParameter()也得不到数据,但是这时调用 request.getParameter()方法对 request.getInputStream()或request.getReader()没有冲突,即使已经调用了 request.getParameter()方法也 可以通过调用request.getInputStream()或request.getReader()得 到表单中的数据,而request.getInputStream()和request.getReader()在同 一个响应中是不能混合使用的,如果混合使用就会抛异常。


更多也可以参考:http://robert-liu.iteye.com/blog/713568



你可能感兴趣的:(java,web,android)