HTTP 不安全？

HTTP报文在客户端与服务器之间传输的形式是明文，在传输的过程中，HTTP报文会经过很多网络节点，首先是局域网的路由器（例如家庭的路由器），然后是运营商的交换机或路由器，接着到目标服务器所在局域网的路由器，最终到达目标服务器，被它接收。

之所以说HTTP不安全，是因为传输的数据是明文，在客户端与服务器之间传输的过程中，也就是明文经过中间的网络节点时，存在被嗅探的风险。

攻击方式：

（1）在运营商的交换机或路由器上嗅探流量。

（2）WiFi劫持，假WiFi中间人。

HTTPS比HTTP安全？

HTTPS的 "S" 是 "SSL"，在HTTP的基础上再增加一个协议，这个协议用于协商加密算法，位于传输层与应用层之间，在应用层的数据（例如 HTTP 报文）往下传给传输层之前，SSL对数据进行加密，然后再把密文封装到传输层协议中。

HTTP报文被加密后，即使攻击者在传输过程中捕获到报文，也无法解密成明文。攻击者无法理解报文的内容，也就无法窃取或篡改数据。这就保证了数据的保密性和完整性。

HTTP & 口令MD5

假设网站的前端与后端的通信协议是 HTTP ，在传输用户的登录口令时，可以在传输之前，前端计算口令的 MD5 值，然后再发送给服务器，这样可以尽可能地保证口令被窃取后不被破解。

重放攻击

攻击者可以截获报文，例如一个登录的请求报文，然后再发送一次给服务器，从而成功登录受害者的账号。

要防御这种攻击，可以在请求报文中加一个随机值（或者 salt），这个随机值可以和口令一起计算 MD5 值，也可以用一个独立的参数存储，被请求报文携带，发送到服务器上。在服务器上，也存储相同的随机值，用于验证从客户端发送过来的随机值。

最重要的一点是，这个随机值最好是一次性的，即使用一次就失效。这样的一次性正好挫败了重放攻击的重复性，也就防御了攻击。

HTTPS能防止重放攻击吗？

协议流程

我们先来回忆一下HTTPS的通信流程，HTTPS协议 = HTTP协议 + SSL/TLS协议，摘取一下网上一些八股文的回答(以RSA密钥交换的为例)！

(1)客户端生成一个随机数client_random,TLS版本号，发送到服务端
(2)服务端发送自己的随机数server_random，服务器使用的证书，发送到客户端
(3)客户端利用CA公钥对证书进行验证，取出服务器公钥
(4)客户端生成随机数pre_master_secret,利用服务器公钥进行加密，传送到服务端
(5)服务端利用服务器私钥进行解密取出pre_master_secret
(6)服务端和客户端此时利用随机数client_random,server_random,pre_master_secret算出对称密钥(master_secret)，利用对称密钥进行对称加密通信

画外音:是不是贼熟悉，有背过网络八股文的，一看就懂！

关键问题就在步骤(6)，怎么进行加密的？很多文章都没有说明，甚至有的人以为，拿client_random+server_random+pre_master_secret直接拼成一个字符串，然后就是对称加密密钥，客户端和服务端拿这个密钥对数据进行加密通信！！

对此，我只能说:"Too young too simple!离谱啊！！"

那正确的过程是怎么样的呢，我们继续往下看！

协议分析

我先给本文提到的英文单词，给上我的中文翻译，以防大家混淆:

client_random 客户端随机数
server_random 服务端随机数
pre_master_secret 预备主密钥
master_secret 主密钥
key_block 密钥块(有的文章把这个东西称为会话密钥)

先大致有个印象，继续往下阅读

现在我们已经有三个参数client_random，pre_master_secret，server_random，服务端和客户端分别会根据这三个参数，推导出master_secret，一旦master_secret被推导出来，会立刻删除pre_master_secret。(摘自rfc2246,section8.1）

当master_secret计算出以后，立刻计算key_block(摘自rfc2246,section6.3)，这个密钥块，有的文章里又说他是会话密钥！计算公式如下，

 key_block = PRF(master_secret,
         "key expansion",
         server_random +
         client_random)

如公式所示，PRF是一个Hash算法，如SHA256这些，具体用哪一个取决于TLS协议的版本！我们得到key_block后，可以基于到key_block继续推导出6个密钥值，分别是

client_write_MAC_key 客户端消息认证码密钥
server_write_MAC_key 服务端消息认证码密钥
client_write_key 客户端对称加密密钥
server_write_key 服务端对称加密密钥
client_write_IV 客户端初始化向量
server_write_IV 服务端初始化向量

整个过程用一张图来说明，注意了这六把密钥是根据key_block推导而出，也就是意味着这六把密钥是服务端和客户端共同持有的！

[图片上传失败...(image-dd960a-1651718824022)]

大家一定也发现了，你的密钥前都带有client或者server前缀，这代表密钥是服务端使用还是客户端使用！例如，客户端用client_write_key进行数据加密，发送数据，服务端收到消息后利用client_write_key进行解密。而后服务端使用server_write_key进行数据加密回复信息，客户端收到消息后用server_write_key解密服务端发来的信息！

OK，我们继续往下看！
现在我们已经有了6把密钥了，已经需要发送的消息data，那么加密流程具体怎么样的呢？
TLS一共有三种加密模式，流加密模式、分组模式、 AEAD 模式，我以流加密模式来进行说明，如下图所示

[图片上传失败...(image-2ae534-1651718824022)]

我们现在来看上面的第二步，利用write_mac_key对数据加密，加上MAC验证码，利用MAC码来保证完整性。

那么，这个MAC验证码的生成公式又是怎么样的呢？

MAC验证码

在流加密模式下，MAC验证码公式为(摘自rfc2246,section6.2.3.1)

[图片上传失败...(image-f2482f-1651718824022)]

看到入参中的seq_num了么？这就是数据的序列号，这个序号就是用来防止重放攻击的！那这个序列号怎么用的呢？
假设，此时服务端和客户端连接成功后 (1)客户端会在内存中记录 client_send 和 client_recv，默认值为0.客户端每发送一条消息，client_send 会加1，每接收一条服务端发来的消息，client_recv 会加1。 (2)服务端也会在内存中记录 server_send 和 server_recv，作用和客户端的作用一样。服务端每发送一条消息，server_send 会加1，每接收一条客户端发来的消息，server_recv 会加1。 (3)客户端发送数据时，以当前client_send作为seq_num,计算mac值，发送给服务端，然后client_send加1。 (4)服务端收到消息后，先以当前server_recv值，进行完整校验，校验成功后server_recv加1。然后以server_send为作为seq_num,计算mac值，发送给客户端，然后server_send加1。 (5)也就是说，如果发送和接收都正常，那么 client_send = server_recv、client_recv = server_send

假设，客户端和服务端相互通信了4次，client_send = server_recv=3(从0开始，所以是3)，服务端检验完第4次消息后，server_recv加1，此时server_recv=4。攻击者如果想重放第4次消息，第4次消息中的client_send值是3，就会出现校验失败的情况！从而能够抵挡住重放攻击！

OK，讲到这里，基本上能回答最开始提出的问题了！

当然，TLS协议本身的内容比较多，我在这里放上TLS协议的地址，大家有兴趣可以自己去查看:
https://www.rfc-editor.org/rfc/rfc2246.html

思考

假设，我们用符号[]表示一次TCP连接，0,1,2,...代表数据包序号，根据上面的分析，对于这种形式的重放攻击，[0,0,0,1,1,2,2,3,3,3….]，HTTPS协议是能够拦截的！
那如果不是一次请求里的重放攻击呢？例如形式是[0,1,2,3….],[0,1,2,3….]，这种形式的重放攻击，HTTPS协议能够拦截么？有答案，可以在留言区进行回复！

提示:想一想看，最开始的客户端随机数和服务端随机数的作用!

http与重放攻击