HTTPS通信原理

作用

不使用 SSL/TLS 的 HTTP 通信,就是不加密的通信。所有信息明文传播,带来了三大风险。

  • 窃听风险(eavesdropping):第三方可以获知通信内容。
  • 篡改风险(tampering):第三方可以修改通信内容。
  • 冒充风险(pretending):第三方可以冒充他人身份参与通信。

SSL/TLS 协议是为了解决这三大风险而设计的,希望达到:

  • 所有信息都是加密传播,第三方无法窃听。
  • 具有校验机制,一旦被篡改,通信双方会立刻发现。
  • 配备身份证书,防止身份被冒充。

基本的运行过程

SSL/TLS 协议的基本思路是采用公钥加密法,也就是说,客户端先向服务器端索要公钥,然后用公钥加密信息,服务器收到密文后,用自己的私钥解密。

但是,这里有两个问题。

  • 如何保证公钥不被篡改
    解决方法:将公钥放在数字证书中。只要证书是可信的,公钥就是可信的。

  • 公钥加密计算量太大,如何减少耗用的时间
    解决方法:每一次对话(session),客户端和服务器端都生成一个对话密钥(session key),用它来加密信息。由于对话密钥是对称加密,所以运算速度非常快,而服务器公钥只用于加密对话密钥本身,这样就减少了加密运算的消耗时间。

因此,SSL/TLS 协议的基本过程是这样的:

  • 客户端向服务器端索要并验证公钥。
  • 双方协商生成"对话密钥"。
  • 双方采用"对话密钥"进行加密通信。

上面过程的前两步,又称为握手阶段(handshake)。

握手阶段的详细过程

HTTPS通信原理_第1张图片

"握手阶段"涉及四次通信,我们一个个来看。需要注意的是,"握手阶段"的所有通信都是明文的。

客户端发出请求(ClientHello)

首先,客户端(通常是浏览器)先向服务器发出加密通信的请求,这被叫做 ClientHello 请求。

在这一步,客户端主要向服务器提供以下信息:

  • 支持的协议版本,比如 TLS 1.0 版。
  • 一个客户端生成的随机数,稍后用于生成"对话密钥"。
  • 支持的加密方法,比如 RSA 公钥加密。
  • 支持的压缩方法。

这里需要注意的是,客户端发送的信息之中不包括服务器的域名。也就是说,理论上服务器只能包含一个网站,否则会分不清应该向客户端提供哪一个网站的数字证书。这就是为什么通常一台服务器只能有一张数字证书的原因。

对于虚拟主机的用户来说,这当然很不方便。2006年,TLS 协议加入了一个 Server Name Indication 扩展,允许客户端向服务器提供它所请求的域名。

服务器回应(SeverHello)

服务器收到客户端请求后,向客户端发出回应,这叫做 SeverHello。服务器的回应包含以下内容。

  • 确认使用的加密通信协议版本,比如 TLS 1.0 版本。如果浏览器与服务器支持的版本不一致,服务器关闭加密通信。
  • 一个服务器生成的随机数,稍后用于生成"对话密钥"。
  • 确认使用的加密方法,比如 RSA 公钥加密。
  • 服务器证书。

除了上面这些信息,如果服务器需要确认客户端的身份,就会再包含一项请求,要求客户端提供"客户端证书"。比如,金融机构往往只允许认证客户连入自己的网络,就会向正式客户提供 USB 密钥,里面就包含了一张客户端证书。

客户端回应

客户端收到服务器回应以后,首先验证服务器证书。如果证书不是可信机构颁布、或者证书中的域名与实际域名不一致、或者证书已经过期,就会向访问者显示一个警告,由其选择是否还要继续通信。

如果证书没有问题,客户端就会从证书中取出服务器的公钥。然后,向服务器发送下面三项信息。

  • 一个随机数。该随机数用服务器公钥加密,防止被窃听。
  • 编码改变通知,表示随后的信息都将用双方商定的加密方法和密钥发送。
  • 客户端握手结束通知,表示客户端的握手阶段已经结束。这一项同时也是前面发送的所有内容的hash值,用来供服务器校验。

上面第一项的随机数,是整个握手阶段出现的第三个随机数,又称"pre-master key"。有了它以后,客户端和服务器就同时有了三个随机数,接着双方就用事先商定的加密方法,各自生成本次会话所用的同一把"会话密钥"。

为什么一定要用三个随机数,来生成"会话密钥":

不管是客户端还是服务器,都需要随机数,这样生成的密钥才不会每次都一样。由于 SSL 协议中证书是静态的,因此十分有必要引入一种随机因素来保证协商出来的密钥的随机性。

对于 RSA 密钥交换算法来说,pre-master-key 本身就是一个随机数,再加上 hello 消息中的随机,三个随机数通过一个密钥导出器最终导出一个对称密钥。

pre master secret 的存在在于 SSL 协议不信任每个主机都能产生完全随机的随机数,如果随机数不随机,那么 pre master secret 就有可能被猜出来,那么仅适用 pre master secret 作为密钥就不合适了,因此必须引入新的随机因素,那么客户端和服务器加上 pre master secret 三个随机数一同生成的密钥就不容易被猜出了,一个伪随机可能完全不随机,可是是三个伪随机就十分接近随机了,每增加一个自由度,随机性增加的可不是一。

同时需要注意前两个随机数都是明文传输的,窃听者是可以轻易获取到的,只有最后一个 pre master secret 是加密传输的,只有拥有服务器私钥才能解密,一旦 pre master secret 泄露,那么本次通信就就完全可被破解了。

此外,如果前一步,服务器要求客户端证书,客户端会在这一步发送证书及相关信息。

服务器的最后回应

服务器收到客户端的第三个随机数 pre-master key 之后,计算生成本次会话所用的"会话密钥"。然后,向客户端最后发送下面信息:

  • 编码改变通知,表示随后的信息都将用双方商定的加密方法和密钥发送。
  • 服务器握手结束通知,表示服务器的握手阶段已经结束。这一项同时也是前面发送的所有内容的 hash 值,用来供客户端校验。

至此,整个握手阶段全部结束。接下来,客户端与服务器进入加密通信,就完全是使用普通的 HTTP 协议,只不过用"会话密钥"加密内容。

简易过程

  • 客户端向服务端发送请求
  • 服务端返回数字证书
  • 客户端用自己的CA(主流的CA机构证书一般都内置在各个主流浏览器中)公钥去解密证书,如果证书有问题会提示风险
  • 如果证书没问题,客户端会生成一个对称加密的随机秘钥然后再和刚刚解密的服务器端的公钥对数据进行加密,然后发送给服务器端
  • 服务器端收到以后会用自己的私钥对客户端发来的对称秘钥进行解密
  • 之后双方就拿着这个对称加密秘钥来进行正常的通信


    HTTPS通信原理_第2张图片

签名

  1. 对对称加密的通俗理解:
    即通信的双方都使用同一个秘钥进行加解密

  2. 对非对称加密算法的通俗理解:

  • 私钥 + 公钥 = 密钥对
  • 即用私钥加密的数据,只有对应的公钥才能解密,用公钥加密的数据,只有对应的私钥才能解密
  • 其实这个很容易理解,因为通信双方的手里都有一套自己的密钥对,通信之前双方会先把自己的公钥都先发给对方。然后对方再拿着这个公钥来加密数据响应给对方,等到到了对方那里,对方再用自己的私钥进行解密,就这么简单
  • 公钥和私钥都可以进行加密和解密
  1. 非对称加密所造成的速度慢的问题解决办法:
  • 先生成一个对称加密算法的密钥,用 RSA 的方式先安全的发给对方
  • 随后就不再用 RSA 了,只用这个对称加密的密钥来互相通信
  1. 不过,以上方式存在明显的中间人问题:
    假设,此时在客户端和服务器之间存在一个中间人,这个中间人只需要把原本双方通信互发的公钥,换成自己的公钥,这样中间人就可以轻松解密通信双方所发送的所有数据

  2. 为解决上述中间人问题,于是后来就出现了证书,简单来讲就是找了一个大家公认的中介,来证明我就是我,你就是你的问题,防止中间被篡改:
    证书中就包括个人的基本信息和最重要的公钥

  3. 乍一眼看去,上面的方案貌似还不错,但证书在传输的过程中如果被篡改了呢,所以后来就又出现了数字签名:

  • 简单来讲,就是将公钥和个人信息用一个 Hash 算法生成一个消息摘要
  • 这个过程是不可逆的,也就是说无法通过 Hash 值得出原来的信息内容;并且只要输入数据有一点点变化,那生成的消息摘要就会有巨变,能有效防止别人篡改数据
  • 在把信息发送出去时,把这个 Hash 值(消息摘要)和信息一起发出去。 接收方在收到信息后,会重新计算信息的 Hash 值,并和信息所附带的 Hash 值(解密后)进行对比,如果一致,就说明信息的内容没有被修改过,因为这里 Hash 计算可以保证不同的内容一定会得到不同的 Hash 值,所以只要内容一被修改,根据信息内容计算的 Hash 值就会变化
  • 但这还是有个问题,如果中间人修改信息内容的同时也修改 Hash 值(也就是消息摘要),从而让它们可以相匹配?为了防止这种情况,Hash 值一般都会加密后(也就是签名)再和信息一起发送,以保证这个 Hash 值不被修改。但是客户端如何解密呢?这就涉及到数字证书了
  • CA 用它的私钥对消息摘要加密,形成签名,并把原始信息数据签名进行合并,即所谓的数字证书
  • 这样,当别人把他的证书发过来的时候,我再用同样的 Hash 算法,再次生成消息摘要
  • 然后用 CA 的公钥对数字签名解密,得到 CA 创建的消息摘要,两者一比,就知道中间有没有被人篡改了
HTTPS通信原理_第3张图片

你可能感兴趣的:(HTTPS通信原理)