HTTP协议是我们最常使用到的协议,我们通过浏览器上网,下载文件,上传数据很多都是使用的它,但是我以前对它还是懵懵懂懂的,逐渐地,我有些感悟了,所以就记载到这里。本文将尽量使用诙谐的笔法介绍HTTP中的那些mime header field 头域。
场景一:使用wget来下载一个源码包,比如ATS 5.3版本,使用下面的命令:
wget -d "http://mirror.bit.edu.cn/apache/trafficserver/trafficserver-5.3.0.tar.bz2"
我们重点看response header部分:
HTTP/1.1 告诉我们使用的是HTTP协议的1.1版本,现在HTTP/2已经出来了,但是我们见到的还不多;
200 OK 告诉我们响应的状态码是200,就是正常返回数据了,其它还有很多响应码,比如2xx,3xx,4xx,5xx等等,不细说了;
Server告诉我们服务器软件是Nginx,版本是1.1.9,现在最新版的已经到1.8.x了;
Content-Type告诉我们响应的数据类型,这里是C++源码,当然是application/octet-stream了,其它还有图片,视频,json,html,xml之类的;
Content-Length告诉我们response body的长度,也就是源码包的字节大小;
Date 告诉我们从服务器获取该源码包的时间,和我目前的时间差8小时,估计是时区设置的问题;
Last-Modified 告诉我们,这个ATS 5.3的源码包放到服务器上的时间,刚好是其对外发布时间;
Connection:告诉我们,C/S直接的连接保持方式,这里的keep-alive表示是保活的,没有立即断开,如果还有其它请求,可以重用这里TCP连接;
Accept-Ranges告诉我们从需要的字节开始接收;
由此可见,这些response header都是很有参考意义的,能给我们提供丰富的信息。
场景二:使用curl通过ATS 5.3下载一个普通的网页文件,使用下面的命令:
curl -o /dev/null -vx 127.0.0.1:8081 -H "Accept-Encoding: gzip,deflate,sdch" "http://news.sohu.com"
相同的头在这里不再重复了。
Vary告诉我们,对Accept-Encoding头的不同值要区分,来得到不同的document副本,比如gzip压缩的,deflate压缩的,没有压缩的,这些都是不同的副本;
Cache-Control告诉我们缓存规则,这里是不要对document做变换,document的最大存活期是120秒,从缓存获得该文件开始计算,超过120s要向服务器再次验证;
Expires告诉我们,到那个指定的时刻,这个document就是过期的,必须向源站重新请求;
Content-Encoding告诉我们,该document是使用gzip压缩的;
Age告诉我们,文档的存活期,刚获取的文档,存活期是0;
Proxy-Connection告诉我们,curl和Proxy的网络连接是保活的;
Via告诉我们,请求从源站到达客户端所经过的代理情况,这里只经过了一个代理ATS 5.3,注意后面的缓存情况[cMsSfW]表明是回源获取的;
X-RS,FSS-Cache是源站自定义头,不做表述。
将上述请求再重复几次,我们得到
我们看到了几点差异:
Age值有变化,原来是0,现在是8,表明该document在ATS的缓存中存活了8秒,它最大存活期是120秒,对一个新闻门户网站来说,这是合理的,120秒后必须刷新网页内容;
Via头中缓存状态有变化,现在是[cRs f ],表示是从ATS中的RAM中获取的热点内容;
场景三:range请求和检查服务器是否支持断点续传功能
curl命令行中的-r/--range选项支持向服务器发送Range请求,-i选项指定显示响应头信息
注意返回状态码是206,
Accept-Ranges告诉我们服务器是否支持指定范围请求及哪种类型的分段请求,这里是byte
Content-Range告诉我们在整个返回体中本部分的字节位置,因为我们请求的是图片的前10个字节,所以Content-Range的值是bytes 0-9/1575,后面的1575是图片总的字节数。
上面是curl获取到的响应头信息,其中如果能够找到Content-Range则表明服务器支持断点续传,有些服务器还会返回Accept-Ranges。Nginx服务器默认支持断点续传的,无须做任何额外配置。