这篇文章对http的重点内容进行一个总结摘录

1. HTTP报文

HTTP报文是在HTTP应用程序之间发送的数据块。这些数据块以一些文本形式的元信息开头，描述报文的内容及含义，后面跟着可选的数据部分。每个报文都包含一条来自客户端的请求或者一条来自服务器的响应，由3个部分组成：

对报文进行描述的起始行 —— start line
包含属性的首部块 —— header
可选的包含数据的主体部分 —— body

报文分为请求报文和响应报文，请求报文向服务器请求一个动作；响应报文把响应返回给客户端。
客户端向服务器发送请求的方式有：get/put/post/trace/head/delete/options.

2. 用js构建一个简单的服务器

var http = require('http')

http.createServer(function(req, res){
    console.log(req.headers)
    res.setHeader('Content-Type','text/html') //服务器使用html解析内容
    res.setHeader('Set-Cookie',['id=1234', 'name=yss'])
    res.statusCode = 200
    res.statusMessage = 'OK'
    res.end('hello world') //服务器响应的内容
    
}).listen(8080) //监听8080端口

3. 常见状态码

200 OK
一切正常，对GET和POST请求的应答文档跟在后面。
202 Accepted
已经接受请求，但处理尚未完成。
301 Moved Permanently
客户请求的文档在其他地方，新的URL在Location头中给出，浏览器应该自动地访问新的URL。
304 Not Modified
客户端有缓冲的文档并发出了一个条件性的请求（一般是提供If-Modified-Since头表示客户只想比指定日期更新的文档）。服务器告诉客户，原来缓冲的文档还可以继续使用。
403 Forbidden
资源不可用。服务器理解客户的请求，但拒绝处理它。通常由于服务器上文件或目录的权限设置导致。
404 Not Found
无法找到指定位置的资源。这也是一个常用的应答。
500 Internal Server Error
服务器遇到了意料不到的情况，不能完成客户的请求。

4. 缓存机制

当缓存过期后, 浏览器不会直接去服务器上拿缓存, 而是判断缓存是否有更新, 能否继续使用, 判断的方法有两种:

（1） Etag和If-None-Match

Cache-Control: max-age=300；
ETag:W/"e-cbxLFQW5zapn79tQwb/g6Q"

浏览器第一次请求a.jpg 时，服务器会发送完整的文件并附带额外信息，其中Etag 是对a.jpg文件的编码，如果a.jpg在服务端未被修改，这个值就不会变。
浏览器把a.jpg和额外信息保存到本地。假如浏览器在300秒以内再次需要获取a.jpg时，浏览器直接从缓存读取a.jpg(200, from xx cache)。假如浏览器在300秒之后再次需要获取a.jpg时，浏览器发现该缓存的文件已经不新鲜了，于是就向服务器发送请求重新获取a.jpg, 在发送请求的时候附带刚刚保存的a.jpg的ETag ( If-None-Match：W/"e-cbxLFQW5zapn79tQwb/g6Q")。服务器在接收到请求后拿浏览器请求的 Etag 和当前文件重新计算后端 Etag 做个比较，如果二者相等表示文件在未修改则发送个短消息（响应头，不包含图片内容, 304），如果二者不等则发送新文件和新的 ETag，浏览器获取新文件并更新该文件的 Etag。
服务器会响应一个Etag字段, 一个表示文件唯一的字符串, 一旦文件更新, Etag也会跟着更改, 当缓存过期后, 浏览器会把这个字符串放在If-None-Match去请求服务器, 判断是否有更新。

（2）Last-Modified 和 If-Modified-Since

浏览器发送求情后，服务器会响应一个Last-Modified字段, 表示最近一次修改缓存的时间, 当缓存过期后, 浏览器就会把这个时间放在If-Modified-Since去请求服务器, 判断缓存是否有更新。

（3）两种方法的对比

Etag的优先级比Last-Modified的更高, Etag的出现, 是为了解决一个缓存文件在短时间内被多次修改的问题, 因为Last-Modified只能精确到秒。

5. cookie和session

（1）cookie

cookie是存储在浏览器上的一小段数据，用来记录某些当页面关闭或者刷新后仍然需要记录的信息。在控制台用「document.cookie」查看你当前正在浏览的网站的cookie。cookie可以使用 js 在浏览器直接设置（用于记录不敏感信息，如用户名）, 也可以在服务端通使用 HTTP 协议规定的 set-cookie 来让浏览器种下cookie，这是最常见的做法。每次网络请求 Request headers 中都会带上cookie。所以如果 cookie 太多太大对传输效率会有影响。一般浏览器存储cookie 最大容量为4k，所以大量数据不要存到cookie。

问题：很多网站的静态资源使用CDN地址而是使用当前网站域名，从cookie的角度说说这对性能有何影响?
答案：

避免域名污染。当浏览器向服务器请求一个静态资源时,会先发送同域名下的 cookie，服务器对于这些 cookie 不会做任何处理。因此它们只是在毫无意义的消耗带宽。所以你应该确保对于静态内容的请求是无coockie的请求。
如果给 http://126.com设置了cookie,那么会感染所有子域名, 请求 http://www.126.com/logo.gif或者image.126.com/logo.gif 时便会带上讨厌的cookie。
所以要用单独的域名，以减少请求，提高网页性能。

作者：雷霆
链接：https://www.zhihu.com/question/20534662/answer/15408245
来源：知乎
著作权归作者所有。商业转载请联系作者获得授权，非商业转载请注明出处。

（2）session

当一个用户打开淘宝登录后，刷新浏览器仍然展示登录状态。服务器如何分辨这次发起请求的用户是刚才登录过的用户呢？这里就使用了session保存状态。用户在输入用户名密码提交给服务端，服务端验证通过后会创建一个session用于记录用户的相关信息，这个 session 可保存在服务器内存中，也可保存在数据库中。

创建session后，服务端会把关联的session_id 通过setCookie 添加到http响应头部中。
浏览器在加载页面时发现响应头部有 set-cookie字段，就把这个cookie 种到浏览器指定域名下。
当下次刷新页面时，发送的请求会带上这条cookie，服务端在接收到后根据这个session_id来识别用户。

（3）cookie和session对比

cookie 是存储在浏览器里的一小段「数据」，而session是一种让服务器能识别某个用户的「机制」，session 在实现的过程中需要使用cookie。二者不是同一维度的东西。

2019-01-28/HTTP与网络