2019-01-28/HTTP与网络

这篇文章对http的重点内容进行一个总结摘录

1. HTTP报文

HTTP报文是在HTTP应用程序之间发送的数据块。这些数据块以一些文本形式的元信息开头,描述报文的内容及含义,后面跟着可选的数据部分。每个报文都包含一条来自客户端的请求或者一条来自服务器的响应,由3个部分组成:

对报文进行描述的起始行 —— start line
包含属性的首部块 —— header
可选的包含数据的主体部分 —— body

报文分为请求报文和响应报文,请求报文向服务器请求一个动作;响应报文把响应返回给客户端。
客户端向服务器发送请求的方式有:get/put/post/trace/head/delete/options.

2. 用js构建一个简单的服务器

var http = require('http')

http.createServer(function(req, res){
    console.log(req.headers)
    res.setHeader('Content-Type','text/html') //服务器使用html解析内容
    res.setHeader('Set-Cookie',['id=1234', 'name=yss'])
    res.statusCode = 200
    res.statusMessage = 'OK'
    res.end('

hello world

') //服务器响应的内容 }).listen(8080) //监听8080端口

3. 常见状态码

  • 200 OK
    一切正常,对GET和POST请求的应答文档跟在后面。
  • 202 Accepted
    已经接受请求,但处理尚未完成。
  • 301 Moved Permanently
    客户请求的文档在其他地方,新的URL在Location头中给出,浏览器应该自动地访问新的URL。
  • 304 Not Modified
    客户端有缓冲的文档并发出了一个条件性的请求(一般是提供If-Modified-Since头表示客户只想比指定日期更新的文档)。服务器告 诉客户,原来缓冲的文档还可以继续使用。
  • 403 Forbidden
    资源不可用。服务器理解客户的请求,但拒绝处理它。通常由于服务器上文件或目录的权限设置导致。
  • 404 Not Found
    无法找到指定位置的资源。这也是一个常用的应答。
  • 500 Internal Server Error
    服务器遇到了意料不到的情况,不能完成客户的请求。

4. 缓存机制

当缓存过期后, 浏览器不会直接去服务器上拿缓存, 而是判断缓存是否有更新, 能否继续使用, 判断的方法有两种:

(1) Etag和If-None-Match

Cache-Control: max-age=300;
ETag:W/"e-cbxLFQW5zapn79tQwb/g6Q"

浏览器第一次请求a.jpg 时,服务器会发送完整的文件并附带额外信息,其中Etag 是 对a.jpg文件的编码,如果a.jpg在服务端未被修改,这个值就不会变 。
浏览器把a.jpg和额外信息保存到本地。假如浏览器在300秒以内再次需要获取a.jpg时,浏览器直接从缓存读取a.jpg(200, from xx cache)。假如浏览器在300秒之后再次需要获取a.jpg时,浏览器发现该缓存的文件已经不新鲜了,于是就向服务器发送请求 重新获取a.jpg, 在发送请求的时候附带刚刚保存的a.jpg的ETag ( If-None-Match:W/"e-cbxLFQW5zapn79tQwb/g6Q")。 服务器在接收到请求后拿浏览器请求的 Etag 和当前文件重新计算后端 Etag 做个比较,如果二者相等表示文件在未修改则发送个短消息(响应头,不包含图片内容, 304),如果二者不等则发送新文件和新的 ETag,浏览器获取新文件并更新该文件的 Etag。
服务器会响应一个Etag字段, 一个表示文件唯一的字符串, 一旦文件更新, Etag也会跟着更改, 当缓存过期后, 浏览器会把这个字符串放在If-None-Match去请求服务器, 判断是否有更新。

(2)Last-Modified 和 If-Modified-Since

浏览器发送求情后,服务器会响应一个Last-Modified字段, 表示最近一次修改缓存的时间, 当缓存过期后, 浏览器就会把这个时间放在If-Modified-Since去请求服务器, 判断缓存是否有更新。

(3)两种方法的对比

Etag的优先级比Last-Modified的更高, Etag的出现, 是为了解决一个缓存文件在短时间内被多次修改的问题, 因为Last-Modified只能精确到秒。

5. cookie和session

(1)cookie

cookie是存储在浏览器上的一小段数据,用来记录某些当页面关闭或者刷新后仍然需要记录的信息。在控制台用「document.cookie」查看你当前正在浏览的网站的cookie。cookie可以使用 js 在浏览器直接设置(用于记录不敏感信息,如用户名), 也可以在服务端通使用 HTTP 协议规定的 set-cookie 来让浏览器种下cookie,这是最常见的做法。每次网络请求 Request headers 中都会带上cookie。所以如果 cookie 太多太大对传输效率会有影响。一般浏览器存储cookie 最大容量为4k,所以大量数据不要存到cookie。

问题:很多网站的静态资源使用CDN地址而是使用当前网站域名,从cookie的角度说说这对性能有何影响?
答案:

避免域名污染。 当浏览器向服务器请求一个静态资源时,会先发送同域名下的 cookie,服务器对于这些 cookie 不会做任何处理。因此它们只是在毫无意义的消耗带宽。所以你应该确保对于静态内容的请求是无coockie的请求。
如果给 http://126.com设置了cookie,那么会感染所有子域名, 请求 http://www.126.com/logo.gif或者image.126.com/logo.gif 时便会带上讨厌的cookie。
所以要用单独的域名,以减少请求,提高网页性能。

作者:雷霆
链接:https://www.zhihu.com/question/20534662/answer/15408245
来源:知乎
著作权归作者所有。商业转载请联系作者获得授权,非商业转载请注明出处。

(2)session

当一个用户打开淘宝登录后,刷新浏览器仍然展示登录状态。服务器如何分辨这次发起请求的用户是刚才登录过的用户呢?这里就使用了session保存状态。用户在输入用户名密码提交给服务端,服务端验证通过后会创建一个session用于记录用户的相关信息,这个 session 可保存在服务器内存中,也可保存在数据库中。

创建session后,服务端会把关联的session_id 通过setCookie 添加到http响应头部中。
浏览器在加载页面时发现响应头部有 set-cookie字段,就把这个cookie 种到浏览器指定域名下。
当下次刷新页面时,发送的请求会带上这条cookie, 服务端在接收到后根据这个session_id来识别用户。

(3)cookie和session对比

cookie 是存储在浏览器里的一小段「数据」,而session是一种让服务器能识别某个用户的「机制」,session 在实现的过程中需要使用cookie。 二者不是同一维度的东西。

你可能感兴趣的:(2019-01-28/HTTP与网络)