断点续传-http协议里Header参数Range

原理

将文件数据按照请求要求,分成一段一段的下载。类似于我们常见的分页显示。
断点续传的好处,防止大文件下载过程出现网络异常,而前功尽弃。缺点是要发起多次请求,资源占用大,相对复杂

参数说明

请求头

Range:告知服务端,客户端下载该文件想要从指定的位置开始下载,至于 Range 字段属性值的格式有以下几种:

Range:bytes=0-500   
表示下载从0到500字节的文件,即头500个字节  ,[0-500]前闭后闭。0<=range<=500 
    
Range:bytes=501-1000
表示下载从500到1000这部分的文件,单位字节       

Range:bytes=-500
表示下载最后的500个字节      
     
Range:bytes=500-
表示下载从500开始到文件结束这部分的内容   
 
Range:bytes=500-600,700-1000
表示下载这两个区间的内容

If-Range:用于判断实体是否发生改变,如果实体未改变,服务器发送客户端丢失的部分,否则发送整个实体.
If-Range 可以使用 Etag 或者Last-Modified 返回的值。当没有 ETag 却有 Last-modified 时,可以把 Last-modified 作为 If-Range 字段的值。
如果请求报文中的 Etag与服务器目标内容的 Etag相等,即没有发生变化,那么应答报文的状态码为 206。如果服务器目标内容发生了变化,那么应答报文的状态码为 200

if-range是etag的值

响应头

Content-Length:只表示此链接中下载的文件大小
Content-Range:用于告知客户端此链接下载的文件是哪个部分的,以及文件的总大小。

Content-Range:bytes 501-1000/2000
#501-100 请求头里range的值
#2000 文件总大小
#bytes 字节方式

Last-Modified:表示资源最近修改的时间(分段下载时要注意这个东西,因为如果修改了,分段下载可能就要重新下载了)
ETag:这个响应头表示资源版本的标识符,通常是消息摘要(类似MD5一样)(分段下载时要注意这个东西,或者缓存控制也要注意这个东西)
注意,每种服务器对生成ETag的算法不同,这个要特别注意 如果使用分布式缓存,要特别要保证每台服务器生成的ETag算法是一致的.
缓存的过期,要同时结合(ETag + Last-Modified)这两个响应头来判断.
ETag
只要实体发生任何改变,都会改变ETag值.如:
ETag: "1234234234"
ETag
它在前面会有个W/,如:
ETag: W/"12342423";

测试

第一次请求Range:bytes=0-12000

image.png

从请求信息可以看出我们请求的资源大小是0-12000的字节。
从响应头信息可以看出EtagLast-Modified信息。
Content-Range:bytes 0-12000/119319
文件大小是119319字节大小
打开下载的文件。
image.png

文件只显示0-12000的部分

第二次请求Range:bytes=12001-3600

image.png

EtagModified的值是没有变。
打开下载的图片
image.png

第三次次请求Range:bytes=5000-66000

这次请求range范围和前面的有交集,下载内容也是交集。


image.png

第四次请求Range:bytes=66001-

下载66001及剩下所有数据。

image.png

你可能感兴趣的:(断点续传-http协议里Header参数Range)