计算机网络相关知识体系详解
HTTPS(HyperText Transfer Protocol over Secure Socket Layer)超文本传输安全协议, 近两年Google、Baidu、Facebook 等这样的互联网巨头,不 而合地开始大力推行 HTTPS, 国内外的大型互联网公司很多也都已经启用了全站 HTTPS,这也是未来互联网发展的趋势。
为鼓励全球网站的 HTTPS 实现,一些互联网公司都提出了自己的要求:
HTTPS的好处与作用在于:
作用
使用特征
我们经常会在Web的登录页面和购物结算界面等使用HTTPS通信。
HTTPS并非是应用层一个新的协议,通常 HTTP 直接和 TCP 通信,HTTPS则先 和安全层(SSL/TLS)通信,然后安全层再和 TCP 层通信。
SSL/TLS协议就是为了解决上面提到的HTTP存在的问题而生的,下面我们来看 一下它是怎么解决的:
TLS全称传输层安全协议Transport Layer Security Protocol,TLS/SSL是一种加密通道的规范。
TLS协议是由TLS记录协议(TLS record Protocol)和TLS握手协议(TLS handshake Protocol)这两层协议叠加而成的。
HTTPS和HTTP协议相比提供了
其中,数据完整性和隐私性由TLS Record Protocol保证,身份认证由TLS Handshaking Protocols实现。
理解HTTPS前需要理解这些概念:对称加密、非对称加密、摘要算法、数字签 名、证书、认证中心(CA - Certificate Authority)
定义
采用单钥密码系统的加密方法,同一个密钥可以同时用作信息的加密和解密,这种加密方法称为对称加密,也称为单密钥加密。
要素
原文、密钥、算法
密钥:在密码学中是一个定长的字符串、需要根据加密算法确定其长度
工作过程
对称加密通常使用的是相对较小的密钥,一般小于256 bit。因为密钥越大,加密越强,但加密与解密的过程越慢。如果你只用1 bit来做这个密钥,那黑客们 可以先试着用0来解密,不行的话就再用1解;但如果你的密钥有1 MB大,黑客 们可能永远也无法破解,但加密和解密的过程要花费很长的时间。密钥的大小既要照顾到安全性,也要照顾到效率。
加密:明文 + 密钥 -> 密文
解密:密文 + 密钥 -> 明文
算法
AES128和AES256主要区别是密钥长度不同(分别是128bits,256bits)、加密处理轮数不同(分别是10轮,14轮),后者强度高于前者。
特点
优点:算法公开、计算量小、加密速度快、加密效率高。
缺点:相对来说不算特别安全,只有一把钥匙,密文如果被拦截,且密钥也 被劫持,那么,信息很容易被破译。
推演
为了防止上述现象的发生,人们想到一个办法:
对传输的信息加密(即使黑 客截获,也无法破解)
加密公式: f1 ( key(密钥),data ) = X(密文)
解密公式: f2 ( key(密钥),X(密文) ) = data
简介
非对称加密是计算机通信安全的基石,保证了加密数据不会被破解。
非对称加密算法需要两个密钥:公开密钥(public key) 和私有密(private key)
公开密钥和私有密钥是一对
特点
如果用公开密钥对数据进行加密,只有用对应的私有密钥才能解密。
如果用私有密钥对数据进行加密,只有用对应的公开密钥才能解密。
由于其算法复杂,而使得加密、解密速度没有对称加密解密的速度快。有两种密钥,其中一个是公开的,这样就可以不需要像对称密码那样传输对方的密钥了,这样安全性就大了很多。
常用算法
RSA、DSA、ECDSA
推演 - 非对称加密
公钥加密:f1 ( publicKey,data ) = X
私钥解密:f2 ( privateKey,X ) = data
私钥加密:f3 ( privateKey,data) = X
公钥解密:f1 ( publicKey,X) = data
缺陷:
公钥是公开的(也就是黑客也会有公钥),所以第 ④ 步私钥加密的信息,如果被黑客截获,其可以使用公钥进行解密,获取其中的内容。
推演 - 对称加密和非对称加密
非对称加密既然也有缺陷,那我们就将对称加密,非对称加密两者结合起来, 取其精华、去其糟粕,发挥两者的各自的优势
解决问题
这里实际上是通过对称加密和非对称加密的组合使用,解决上面缺陷中提到的在第4步中,黑客可能会利用获取的公钥对响应密文进行解密,导致内容可能被窃听的问题。
解决的办法就是对暴露在外部的公钥进行改造,首先客户端利用公钥加密一串字符串,比如随机数,相当于一个新的密钥。将这个密码保存在本地,并发送给服务端。服务端在接收到这个新的密钥后,用自己的私钥进行解密,同样保存在本地。此时,客户端和服务器分别保存了一个相同的新的密钥。这样的好处是,在第一次客户端和服务器交换这个新的密钥后,之后的所有数据传输都可以通过这个新的密钥来进行加解密了,也就是利用了对称加密的优势,提升了加解密速度。
同时也保证了安全性。因为在第一次客户端利用公钥对新的密钥进行加密再传输到服务器的过程中,由于公钥加密的密文只能通过私钥解密,而私钥只有服务器有,因此这个过程中不会发生被窃取的风险。这里也就利用了非对称加密的优势。而之前缺陷中第4步,由于现在响应的密文是由一个新的密钥进行加密的,无法再用暴露在外部的公钥进行解密,也就解决了第四步中被窃取的风险。
因此,通过上述分析可以发现,这种对称加密+非对称加密的加密算法,充分利用了对称加密和非对称加密算法的优势。其中非对称加密算法的优势利用在于第一次客户端和服务端在彼此交换一个新的密码时使用,保证了这个新的密钥不会被窃取。同时,在之后的数据传输中,客户端和服务端都利用这个新的密钥进行加解密,加快了加解密速度,利用了对称加密的优势。
存在缺陷
报文可能遭篡改问题
通信方身份可能被伪装的问题
解决方案
解决报文可能遭篡改问题——数字签名
解决通信方身份可能被伪装的问题——数字证书
在上面讲解非对称加密算法时,由于公钥是暴露在外部的,任何人都可以获取。因此,第三方也能用公钥进行加密,那么如何保证服务端得到的数据是对应客户端发出的呢?
这需要配合数字签名技术。数字签名主要是利用哈希函数对要传递的数据进行运算后得到一个运算结果,将该结果也加密发送给服务端,服务端获取后进行解密,得到运算结果,然后将收到的数据进行相同的哈希运算后的结果进行比较。 由于哈希函数的单向性(不可逆),第三方无法根据公钥解密后的数据(明文的哈希运算结果)反推哈希运算之前的原数据。因此可以保证数据无法被篡改,解决上面缺陷中提到的报文可能遭篡改的问题。
在信息安全中,文件的安全性有两方面的含义:一是不可抵赖性,即文件一定来自于发送者,也就是身份正确;二是不可篡改性,即确信文件并没有中途被篡改,也就是数据完好。
考虑以下的场景:
假设有一天,Jermery收到了一份署名为 Tom 的文件。Jermery 希望能够确认这份文件一定是来自 Tom;另外 Jermery 希望能够确信,这份文件在传输过程中并没有被它人篡改。那么基于非对称密钥算法我们应该怎么做?
在非对称密钥算法中提到,公钥加密的内容使用私钥可以解密。同样的,私钥加密的内容使用公钥也可以解密。因此我们可以很容易想到。如果Tom利用自己手里的私钥对文件进行加密后,传输给 Jermery。Jermery 再通过公钥库中 Tom 的公钥进行解密,则可以证明文件一定是由 Tom 发出(由于只有Tom持有私钥)。另外,因为传输的是密文,如果能够使用公钥解密,同时也证明了文件并没有中途被篡改。这样的做法其实已经同时满足了不可抵赖性和不可篡改性。
然而,由于传输的文件可能很大, 为了证明文件的不可抵赖性和不可篡改性,需要对整个文件进行加密,由于非对称算法效率较低,这样做的代价太大。 因此常规的做法是用到信息摘要和数字签名的方式。
所谓信息摘要,其实就是某种 Hash 算法,将信息明文转化为固定长度的字符, 它具有如下特点:
一般的,我们将信息的摘要也称作信息的指纹。 如同指纹的含义,相同的信息一定会得相同的指纹,而仅通过指纹又无法还原出原始信息。目前主要的摘要算法有 MD5(Message Digest-5)和 SHA1(Secure Hash Algorithm)。
数字签名有两种功能
将要发送的数据先用Hash算法(摘要算法、散列算法)生成消息摘要,然后用发送者的私钥加密生成数字签名,与原文一起传送给接收者。
接下来就是接收者校验数字签名的流程了
接收者只有用发送者的公钥才能解密被加密的摘要信息,然后用HASH函数对收到的原文产生一个摘要信息,与上一步得到的摘要信息对比。如果相同,则说明收到的信息是完整的,在传输过程中没有被修改,否则说明信息被修改过,因此数字签名能够验证信息的完整性。
类似md5算法用来判断两个文本是否一样,是否被经过修改。
假设消息传递在客户端、服务器之间发生。
服务器将消息连同数字签名一起发送给客户端
客户端接收到消息后,通过校验数字签名,就可以验证接收到的消息就是服务器发送的。
这个过程的前提是客户端知道服务器的公钥。问题的关键的是,和消息本身一样,公钥不能在不安全的网络中直接发送给客户端,或者说拿到的公钥如何证明是服务器的。 此时就需要引入了证书颁发机构(Certificate Authority,简称CA) ,CA数量并不多,客户端内置了所有受信任CA的证书。
消息摘要算法分为三类:
数字证书:是一个经证书认证结构数字签名的包含公开密钥、拥有者信息的文件,有点像生活中的身份证、护照等,是由一个官方的证书颁发机构签发的一组数据。这种证书很难伪造,用于使用者的身份证明
实际上,我们使用的证书分很多种类型,SSL证书只是其中的一种,SSL证书负责传输公钥。
我们常见的证书根据用途不同大致有以下几种:
1、SSL证书,用于加密HTTP协议,也就是HTTPS,TLS。如果一个web应用想要升级为https,需要购买证书。
2、代码签名证书,用于签名二进制文件,比如Windows内核驱动,Firefox插件,Java代码签名等等
3、客户端证书,用于加密邮件
4、双因素证书,网银专业版使用的USB Key里面用的就是这种类型的证书
证书中包含:组织信息、域名信息、公钥、证书有效期等信息
数字证书的基本架构是公开密钥PKI,即利用一对密钥实施加密和解密。其中密钥包括私钥和公钥,私钥主要用于签名和解密,由用户自定义,只有用户自己知道;公钥用于签名验证和加密,可被多个用户共享。
数字证书的基本工作原理主要体现在:
第一,发送方在发送信息前,需先与接收方联系,同时利用公钥加密信息,信息在进行传输的过程当中一直是处于密文状态,包括接收方接收后也是加密的,确保了信息传输的单一性,若信息被窃取或截取,也必须利用接收方的私钥才可解读数据,而无法更改数据,这也有利保障信息的完整性和安全性。
第二,数字证书的数据签名类似于加密过程,数据在实施加密后,只有接收方才可打开或更改数据信息,并加上自己的签名后再传输至发送方,而接收方的私钥具唯一性和私密性,这也保证了签名的真实性和可靠性,进而保障信息的安全性。
还是根据上面的场景:
基于数字证书通信时,Tom生成了一对公私钥。Tom将公钥发布在公开的密钥库中。而Jeremy在向 Tom发送加密文件或者验证 Tom签名的文件时,均要从公钥库取到 Tom 的公钥。我们已经知道,一般来说公钥就是一段固定长度的字符串,并没有特定的含义。
这里的Tom的公钥,实际上就表示所属Tom的数字证书。
同时,为了让 Jeremy能够方便的辨别公钥,我们可以考虑对给公钥附加一些信息,例如该公钥使用的算法,该公钥的所有者(主题),该公钥的有效期等一系列属性。这样的数据结构我们称作 PKCS#10 数据包。即:
PKCS#10 数据包 = 公钥 + 算法(RSA) + 有效期 + 主题(持有者信息、公司、版本号等)
例如有一天一个叫做 James的人想冒充 Tom,也生成一对公私钥,并且使用了相同的公钥主题封装为 PKCS#10 数据结构。Jeremy其实并没有办法分辨哪个是真实 Tom的公钥。
为了解决这个问题,就需要一个权威的第三方机构,对公钥信息进行认证。就如同对公钥信息文件盖上一个权威的章,防止仿照。这样的权威机构,我们称作 CA (Certificate Authority),数字证书认证中心。CA 会通过一些手段对公钥持有者以及公钥附加信息进行验证,确保身份无误。
比如上图给出了一个数字证书的实例。从图中可以看出,证书中包含申请者公钥、申请者的组织信息和个人信息、签发机构的信息、有效时间、证书序列号等信息的明文,同时包含一个CA机构的数字签名。 其中签名的产生算法:首先,使用散列函数计算公开的明文信息的信息摘要,然后,采用CA的私钥对信息摘要进行加密,密文即签名;
那么CA 如何为公钥信息盖章呢?非常简单,就是前文已经提到的数字签名技术。公钥及其附加信息作为证书的内容,CA 为此内容添加一个数字签名,就构成了一个数字证书。步骤如下:
当有了数字证书后,网络间的通信方式变更为:
用户向web服务器发起一个安全连接的请求服务器返回经过CA认证的数字证书,证书里面包含了服务器的public key。
用户拿到数字证书,怎么确保CA证书不被劫持,黑客完全可以把一个假的CA证书发给Client,进而欺骗Client,用户如何编写证书真伪?
CA的大杀器就是,CA把自己的CA证书集成在了浏览器和操作系统里面。 Client拿到浏览器或者操作系统的时候,已经有了CA证书,没有必要通过网络获取,那自然也不存在劫持的问题。
查看浏览器CA证书:设置–>安全检查–>安全–>管理证书
查看操作系统CA证书:certmgr.msc
Client 读取证书中的相关的明文信息,采用相同的散列函数计算得到信息摘要,然后利用对应 CA的公钥解密签名数据,对比证书的信息摘要,如果一致,则可以确认证书的合法性,即服务器的公开密钥是值得信赖的。
客户端还会验证证书相关的域名信息、有效时间等信息; 客户端会内置信任CA的证书信息(包含公钥),如果CA不被信任,则找不到对应 CA的证书,证书也会被判定非法。
SSL证书分类:
有了数字签名,为什么还需要数字证书呢?数字签名的验证是在收到的文件中进行的,可以用来验证收到的文件是来源于密钥对(公钥+私钥)的持有者。 但是,如何确保此密钥对的持有者就是真实的持有者呢?收到的文件可能来源于第三者。也就是说,如果密钥对被顶替,信息接收方获取的是被掉包的公钥,第三者使用此公钥对应的私钥对文件进行签名,加入冒充的信息发给接收者,那么接收者也能正常解密和验证签名,这就是一个漏洞。即,如何保证公钥是真正的公钥?这就需要数字证书了。
获取数字证书,就是把真正的公钥放到 CA 中,CA 会对公钥持有者进行验证。这样,只要 CA 的权威性得到保障,公钥的真实性也就得到了保障。
明文----->非对称加密----->对称加密
第一步,浏览器给出TLS协议版本号、一个客户端生成的随机数1(Clientrandom),以及客户端支持的加密方法。(明文通讯)
第二步,服务器确认双方使用的加密方法,并给出数字证书、以及一个服务器生成的随机数2(Server random)。(明文通讯)
第三步,浏览器确认数字证书有效,然后生成一个新的随机数3(Pre-mastersecret),并使用数字证书中的公钥加密这个随机数,发给服务器。(使用非对称加密算法)
浏览器确认数字证书有效:浏览器和操作系统内部内置了很多CA机构的证书,是否篡改、是否在有效期内、域名和访问的网站是否匹配。
第四步,服务端使用自己的私钥,获取客户端发来的随机数(即Premastersecret)。
双方就都有三个一模一样的随机数,前两个是明文发送的,最后客户端生成的这个是使用证书中的公钥密文发送的。
第五步,客户端和服务器根据约定的加密方法,使用前面的三个随机数经过特定的算法,生成"对话密钥"(session key)(相当于生成了一个新的密钥),用来加密接下来的整个对话过程。
对话密钥,又叫做会话密钥,其实就是讲之前通讯中的三个随机数生成一个密钥(对称加密)
三个随机数----->第三个是使用非对称加密---->相同的算法------->会话密钥
第六步:客户端和服务器都会第一次使用会话密钥加密一个消息发送给对方。 (使用对称加密算法来提升通信过程中的加解密性能)
备注:客户端收到服务端发送的Certificate 报文后首先会校验证书的合法性:
握手阶段用来建立SSL连接。如果出于某种原因,对话中断,就需要重新握手。
这时有两种方法可以恢复原来的session:一种叫做session ID,另一种叫做session ticket。
session ID的思想很简单,就是每一次对话都有一个编号(session ID)。如果对话中断,下次重连的时候,只要客户端给出这个编号,且服务器有这个编号的记录,双方就可以重新使用已有的"对话密钥",而不必重新生成一把。
上图中,客户端给出session ID,服务器确认该编号存在,双方就不再进行握手阶段剩余的步骤,而直接用已有的对话密钥进行加密通信。
session ID是目前所有浏览器都支持的方法,但是它的缺点在于session ID往往只保留在一台服务器上。所以,如果客户端的请求发到另一台服务器,就无法恢复对话。session ticket就是为了解决这个问题而诞生的,目前只有Firefox和Chrome浏览器支持。
上图中,客户端不再发送session ID,而是发送一个服务器在上一次对话中发送过来的session ticket。这个session ticket是加密的,只有服务器才能解密,其中包括本次对话的主要信息,比如对话密钥和加密方法。当服务器收到sessionticket以后,解密后就不必重新生成对话密钥了。