在HTTP协议中有可能存在信息窃听或身份伪装等安全问题。使用HTTPS通信机制可以有效地防止这些问题。
一、HTTP的缺点
到现在为止,我们已了解到HTTP具有相当优秀和方面的一面,然而HTTP并非只有好的一面,事物皆具有两面性,它也是有不足支出的。
HTTP主要有这些不足,举例如下。
1.通信使用明文(不加密),内容可能会被窃听
2.不验证通信方的身份,因此有可能遭遇伪装
3.无法证明报文的完整性,所以有可能已遭篡改
这些问题不仅在HTTP上出现,其他未加密的协议中也会存在这类问题。
除此以外,HTTP本身还有很多缺点。而且,还有像某些特定的Web服务器和特定的Web浏览器在实际应用中存在的不足(也可以说成是脆弱性或安全漏洞),另外,用Java和PHP等编程语言开发的web应用也可能存在安全漏洞。
1)通信使用明文可能会被窃听
由于HTTP本身不具备加密的功能,所以也无法做到对通信整体(使用HTTP协议通信的请求和响应的内容)进行加密。即HTTP报文使用明文(指未经过加密的报文)方式发送。
1.TCP/IP是可能被窃听的网络
如果要问为什么通信时不加密是一个缺点,这是因为,按TCP/IP协议族的工作机制,通信内容在所有的通信线路上都有可能遭遇到窥视。
所谓互联网,是由能连通道全世界的网络组成的。无论世界哪个角落的服务器在和客户通信时,在此通信线路上的某些网络设备、光缆、计算机等都不可能时个人的私有物,所以不排除某个环节中会遭遇到恶意窥视行为。
即使已经过加密处理的通信,也会被窥视到通信内容,这点和未加密的通信是相同的。只是说如果通信经过加密,就有可能让人无法破解报文信息的含义,但是加密处理后的报文信息本身还是会被看到。
窃听相同段上的通信并非难事。只需要收集在互联网上流动的数据包(帧)就行了。对于手机来的数据包进行解析工作,可交给那些抓包(Packet Capture)或嗅探器(Sniffer)工具.
下面的图片示例就是被广泛使用的抓包工具Wireshark.它可以获取HTTP协议额请求和响应的内容,并对其进行解析。
像使用GET方法发送请求、响应返回了200OK,查看HTTP响应报文的全部内容等一系列的事情都可以做到。
2.加密处理防止被窃听
在目前大家正在研究的如何防止窃听保护信息的几种对策中,最为普及的就是加密技术。加密的对象可以有那么几个。
1》.通信的加密
一种方式就是讲通信加密。HTTP协议中没有加密机制,但可以通过和SSL(Secure Socket Layer ,安全套接层)或TLS(Transport Layer Security,安全层传输协议)的组合使用,加密HTTP的通信内容。
用SSL建立安全通信线路之后,就可以在这条线路上进行HTTP通信了。与SSL组合使用的http被称为HTTPS(HTTP Secure , 超文本传输协议)或HTTP over SSL。
2.》内容的加密
还有一种将参与通信的内容本身加密的方式。由于HTTP协议中没有加密机制,那么就对HTTP传输协议的内容本身加密。即把HTTP报文里所含的内容进行加密处理。
在这种情况下,客户端需要对HTTP报文进行加密处理后再发送请求。
诚然,为了做到有效的内容加密,前提是要求客户端和服务端同时具备加密和解密机制。主要应用在web服务中。有一点必须引起注意,由于该方式不同于SSL或TLS将整个通信线路加密处理,所以内容仍有被篡改的风险,
2)不验证通信方的身份就可能遭遇伪装
HTTP协议中的请求和响应不会对通信方进行确认。也就是说存在“服务器是否就是发送请求中URI真正指定的主机,返回的响应是否真的返回到实际提出请求的客户端”等类似问题。
1.任何人都可以发送请求
在HTTP协议通信时,由于不存在确认通信方的处理步骤,任何人都可以发起请求。另外,服务器只要接收到请求,不管对方是谁都会返回一个相应(但也仅限于发送端的IP地址和端口号没有被web服务器设定限制访问的前提下)。
HTTP协议的实现本身非常简单,不论是谁发送过来的请求都会返回响应,因此不确定通信方,会存在一下各种隐患。
1》无法确定请求发送至目标的web服务器是否是按真实意图返回响应的那台服务器。有可能是已经伪装的web服务器。
2》无法确定响应返回到的客户端是否是按真实意图接收响应的那个客户端。有可能是已伪装的客户端。
3》无法确认正在通信的对方是否具备访问权限。因为某些web服务器上保存这重要的信息,只想发送给特定用户的通信权限。
4》无法判断请求是来自何方,出自谁手。
5》即使是无意义的请求也会照单全收,无法阻止海量请求下的DOS攻击(Denial of Service , 拒绝服务攻击)。
2)查明对手的证书
虽然使用HTTP协议无法确定通信方,但如果使用SSL则可以。SSL不仅提供加密处理,而且还使用了一种被称为证书的手段,可用以确定方。
证书是由值得信赖的第三方机构颁发,用以证明服务器和客户端是实际存在的。另外,伪造证书从技术角度来说是异常困难的一件事。所以只要能够确认通信方(服务器或客户端)持有的证书,即可判断通信方的真实意图。
通过使用证书,以证明通信方就是意料中的服务器。这对使用者个人来讲,也减少了个人信息泄露的危险性。
另外,客户端持有证书即可完成个人身份的确认,也可用于对web网站的认证环节。
3)无法证明报文完整性,可能已遭篡改
所谓完整性是指信息的准确度。若无法证明其完整性,通常也就意味着无法判断信息是否准确。
1》接收到的内容可能有误
由于HTTP协议无法证明通信的报文完整性,因此,在请求或响应送出之后直到对方接收之前的这段时间内,即使请求或响应的内容遭到篡改,也没有办法获悉。
换句话说,没有任何办法确认,发出去的请求/响应he接收到的请求/响应时前后相同的。
比如,从某个web网站上下载内容,是无法确定客户端下载的文件和服务器上存放的文件是否前后一致的。文件内容在传输途中可能已经被篡改为其他的内容。即使内容真的已改变,作为接收方的客户端也是察觉不到的,
像这样,请求或响应的传输途中,遭攻击者拦截并篡改内容的攻击称为中间人攻击(Man-in-the-Middleattack, MITM).
1》如何防止篡改
虽然有使用HTTP协议确保报文完整性的方法,但事实上并不便捷、可靠。其中常用的是MD5和SHA-1等散列检验的方法,以及用来确认文件的数字签名方法。
提供文件下载服务的web网站也是提供相应的已PGP(Pretty Good Privacy,完美隐私)创建的数字签名及MD5算法生成的散列值。PGP是用来证明创建文件的数字签名,MD5是由单向函数生成的散列值。不论使用哪一种方法,都需要操作客户端的用户本人亲自检查验证下载的文件是否就是原来服务器上的文件。柳林爱情无法自动帮用户检查。
可惜的是,用这些方法也依然无法百分百的保证确认结果正确。因为PGP和MD5本身被改写的话,用户是没有办法意识到的。
为了有效防止这些弊端,有必要使用HTTPS .SSL提供认证和加密处理及摘要功能,仅靠HTTP确保完整性是非常困难的,因此通过和其他协议组合使用来实现这个目标。
二、HTTP + 加密 + 认证 + 完整性保护 = HTTPS
1)HTTP加上加密处理和认证以及完整性保护后即是HTTPS
如果在HTTP协议通信过程中使用未经加密的明文,比如在web页面中输入了信用卡号,如果这条通信线路遭到窃听,那么信用卡号就暴露了。
另外,对于HTTP说,服务器也好,客户端也好,都是没有办法确认通信方的。因为很有可能并不是和原本预想的通信方在实际通信,并且还需要考虑到接收到报文在通信途中已经遭到篡改这一可能性。
为了统一解决上述这些问题,需要在HTTP上在加入加密处理和认证等机制。我们把添加了加密机认证机制的http称为HTTPS。
经常会在web的登录页面和购物结算界面等使用HTTPS通信。使用HTTPS通信时,不在用http://,而是改用https://。另外,当浏览器访问https通信有效的web网站时,浏览器的地址栏内会出现一个带锁的标记。对https的显示方式会因浏览器的不同而有所改变。
2)HTTPS是身披SSL外壳的HTTP
HTTPS并非是应用层的一种新协议。只是HTTP通信接口部分用SSL(Secure Socker LaYER)和TLS(Transport Layer Security)协议代替而已。
通常,HTTP直接和TCP通信,当使用SSL时,则演变成先和SSL通信,再由SSL和TCP通信了。简言之,所谓HTTPS,其实就是身披SSL协议这层外壳的HTTP.
在采用SSL后,HTTP就拥有了HTTPS的加密、证书和完整性保护这些功能。
SSL是独立于HTTP的协议,所以不光是HTTP协议,其他运行在应用层的SMTP和Telnet 等下协议均可配合SSL协议使用。可以说SSL是当今世界上应用最为广泛的网络安全技术。
3)相互交换秘钥的公开密钥加密技术
在对SSL进行讲解之前,我们先来了解一下加密方式。SSL采用一种叫做公开密钥加密(Public-key-cryptography)的加密处理方式。
近代的加密方法中加密算法是公开的,而密钥却四保密的。通过这种方式得以保持加密方法的安全性。
加密和解密都会用到密钥。没有密钥就无法对密码解密,反过来说,任何人只要持有密钥就能解密了。如果密钥被攻击者获得,那加密也就失去了意义。
1.共享密钥加密的困境
共享和解密同用一个密钥的方式称为共享密钥加密(Common Key Crypto system),也被叫做对称密钥加密。
以共享密钥方式加密时必须将密钥也发给对方。可究竟怎样才能安全地转手?在互联网上转发密钥时,如果通信被监听那么密钥就可会落入攻击者之手,同时也就失去了加密的意义。另外还得设法安全地保管接收到的密钥。
2.使用两把密钥的公开密钥加密
公开密钥加密方式很好滴解决了共享密钥加密的困难。
公开密钥加密使用一对非对称的密钥,一把叫做私有密钥(private key ),另一把叫做公开密钥(public key).顾名思义,私有密钥不能让其他任何人知道,而公开密钥则可以随意发布,任何人都可以获得。
使用公开密钥加密方式,发送密文的一方使用对方的公开密钥进行加密处理,对方收到被加密的信息后,再使用自己的私有密钥进行解密。利用这种方式,不需要发送用来解密的私有密钥,也不必担心密钥被攻击者窃听而盗走。
另外,要根据密文和公开密文,恢复到信息原文是异常困难的,因为解密过程就是在对离散对数进行求值,这并非轻而易举就能办到的,退一步将,如果能对一个非常大的整数做到快速的因式分解,那么密码破解还是存在希望的。但就目前的技术看来是不太现实的。
3.HTTPS采用混合加密机制
HTTPS采用共享密钥加密和公开密钥加密两者并用的混合加密机制。若密钥能够实现安全交换,那么有可能会考虑仅使用公开密钥加密来通信。但是公开密钥加密与贡献密钥加密相比,其处理速度要慢。
所以应充分利用两者各自的优势,将多种方法组合起来用于通信。在交换密钥环节使用公开密钥加密方式,之后的建立通信交换报文阶段则使用共享密钥加密方式。
四、证明公开密钥正确性的证书
遗憾的是,公开密钥加密方式还是存在一些问题的,那就是无法证明公开密钥本身就是货真价实的公开密钥,比如,正准备和某台服务器建立公开密钥加密方式下的通信时,如何证明收到的公开密钥就是原本预想的那台服务器发型的公开密钥。获取在公开密钥的传输途中,真正的公开密钥已经被攻击者替换掉了。
为了解决上述问题,可以使用由数字证书认证机构(CA , Certificate Authority)和其相关机关颁发的公开密钥证书。
数字证书认证机构处于客户端与服务器双方都可信赖的第三发机构的立场上。威瑞信(VeriSign)就是其中一家非常有名的数字证书认证机构。我们来介绍一下数字证书认证机构的业务流程。首先,服务器的运营人员向数字证书认证机构日出公开密钥的申请。数字证书认证机构在潘明提出申请者的身份之后,会对已审核的公开密钥做数字签名,然后分配这个已签名的公开密钥,并将该公开密钥放入公钥证书后绑定在一起。
服务器会将这份有数字证书认证机构办法的公钥证书发送给客户端,已进行公开密钥加密方式通信。公钥证书也可叫做数字证书或直接称为证书。
接到证书的客户端可使用数字认证机构的公开密钥,对那张证书上的数字签名进行验证,一旦验证通过,客户端便可以明确两件事;1认证服务器的公开密钥的是真实有效的数字证书认证机构。2服务器的公开密钥是值得信赖的。
此处认证机关的公开密钥必须安全地转交给客户端。使用通信方式时,如何安全转交是一件很困难的事,因此,多数浏览器开发商发布版本时,会事先在内部植入常用认证机关的公开密钥。
1.可证明组织真实性的EV SSL证书
证书的一个作用是用来证明作为通信一方的服务器是否规范,另外一个作用是可确认对方服务器背后运营的企业是否真是存在。拥有该特性的证书就是 EV SSL证书(Extended Validation SSL Certificate)。
EV SSL 证书是基于国际标准的认证指导方针颁布的证书。其严格规定了对运营组织是否真是的确认方针,因此,通过认证的web网站能够获取更高的认可度。
持有EV SSL 证书的web 网站的浏览器地址栏处的北京色是绿色的,从视觉上就能一眼辨别出。而且在地址栏的左侧显示了SSL证书中记录的组织名称以及颁发证书的认证机构的名称。
上述机制的愿意图是为了防止用户被钓鱼攻击(Phishing),但就效果上来讲,还得打一个问号。很多用户可能不了解EV SSL证书相关的知识,因此也不太会留意它。
2.用以确认客户端的客户端证书
HTTPS中换可以使用客户端证书,一客户端证书进行客户端认证,证明服务器正在通信的对方始终是预料之内的客户端,其作用跟服务器证书如出一辙。
但客户端证书仍存在几处问题点,其中的一个问题点是证书的获取及发布。
想获取证书时,用户得自行安装客户端证书。由于客户端正式是要付费购买的,且每张证书对应到每位用户也就意味着需要支付和用户数对等的费用。另外,要让知识层次不同的用户们自行安装证书,这件事本身也充满了各种挑战。
现状是,安全性极高的认证机构可颁发客户端证书但仅用于特殊用途的业务。比如那些可支撑客户端证书支出费用的业务。
例如,银行的网上银行就是才用了客户端证书。在登录网银时不仅要求用户确认输入ID和密码,还会要求用户的客户端证书,以确认用户是否从特定的终端访问网银。
客户端证书存在的另一个问题是,客户端证书毕竟只能用来证明客户端实际存在,而不能来证明用户本人的正式有效性,也就是说,只要获得了安装有客户端证书的计算机的使用权限,也就意味着同时拥有了客户端证书的使用权限。
3.认证机构信誉第一
SSL机制中介入认证机构之所以可行,是因为建立在其信用绝对可靠这一大前提下的。然而,2011年7月,荷兰的一家名叫DigiNotar的认证机构曾遭黑客不法入侵,颁布了google.com和twitter.com等网站的伪造证书事件。这一事件从根本上撼动了SSL的可信度。
因为伪造证书上有正规认证机构的数字签名,所以浏览器会判定该证书是正当的。当伪造的证书被用做服务器伪装之时,用户根本无法察觉到。
虽然存在可将证书无效化的证书吊销列表(Certificate Revocation List, CRL)机制,以及从客户端删除根证书颁发机构(Root Certificate Authority,RCA)的对策,但是距离生效还需要一段时间,而这段时间内,到底会有多少用户的利益蒙受损失就不得而知了。
4.由自认证机构颁发的证书称为自签名证书
如果使用OpenSSL这套开源程序,每个人都可以构建一套属于自己的认证机构,从而自己给自己颁发服务器证书。但该服务器证书在互联网上不可作为证书使用,似乎没什么帮助。
独立构建的认证机构叫做自认证机构,有自认证机构颁发的“无用”证书也被戏称为自签名证书。
浏览器访问该服务器时,会显示“无法确认连接安全性”或“该网站的安全证书存在问题”等警告消息。
由自认证机构颁发的服务器证书之所以不起作用,是因为它无法消除伪装的可能性。自认证机构能够产生的作用顶多也就是自己对外宣称“我是xx”的这种程度。即使采用自签名证书,通过SSL加密之后,可能偶尔还会看见通信处在安全状态的提示,可那也是有问题的,因为就算加密通信,也不能排除正在和已经伪装过的假服务器保持通信。
值得信赖的第三方机构介入认证,才能让已植入在浏览器内的认证机构颁布的公开密钥发挥作用,并借此证明服务器的真实性。
中级认证机构的证书可能会变成自认证证书。
多数会浏览器内预先已植入备受信赖的认证机构的证书,但也有一小部分浏览器会植入中级认证机构的证书。
5)HTTPS的安全通信机制
为了更好地理解HTTPS,我们来观察一下HTTPS 的通信步骤。
步骤一:客户端通过发送CLient Hello 报文开始SSL通信。报文中包含客户端支持的SSL的指定版本、加密组件(Cipher Suite)列表(所使用的加密算法及密钥长度等)。
步骤二:服务器可进行SSL通信时,会以Server Hello 报文作为应答。和客户端一样,在报文中包含SSL版本以及加密组件。服务器的加密组件内容是从接收到的客户端加密组件内筛选出来的。
步骤三:之后服务器发送Certificate 报文。报文中包含公开密钥证书。
步骤四:最后服务器发送Server Hello Done 报文通知客户端吗,最初阶段的SSL握手协商部分结束,
步骤五:SSL第一次握手结束之后,客户端以Client Key Exchange 报文作为回应。报文中包含通信加密中使用的一种被称为Pre-master-secret 的随机密码串。该报文已用步骤3中的公开密钥进行加密。
步骤六:接着客户端继续发送Change Cipher Spec 报文。该报文会提示服务器,在此报文之后的通信会采用Pre-master secret 密钥加密。
步骤七:客户端发送Finished报文。该报文包含连接至今全部报文的整体校验值。这次握手协商是否能够成功,要以服务器是否能够正确解密该报文作为判定标准。
步骤八:服务器同样发送Change Cipher Spec 报文。
步骤九:服务同样发送Finished报文。
步骤十:服务器和客户端的FInished报文交换完毕之后,SSL 连接就算建立完成。当然,通信会受到SSL的保护。从此处开始进行应用层协议的通信,即发送HTTP请求。
步骤十一:应用层协议通信,即发送HTTP响应。
步骤十二:最后由客户端断开连接。断开连接时,发送close_notify 报文。上图做了一些省略,这步之后再发送TCP FIN 报文来关闭与TCP的通信。
在以上流程中,应用层发送数据时会附加一种叫做MAC(Message Authentication Code)的报文摘要。MAC能够查知报文是否遭到篡改,从而保护报文的完整性。
下面是对整个流程的图解。图中说明了从仅使用服务器端的公开密钥证书(服务器证书)建立HTTPS通信的整个过程。
CBC模式(Cipher Block Chaining)又名密码分组链接模式。在此模式下,将前一个明文块加密处理后和下一个明文块做XOR运算,使之重叠,然后在对运算结果做加密处理。对第一个明文块做加密时,要么使用前一段密文的最后一块,那么利用外部生成的初始向量(initial vector ,IV)
1.SSL和TLS
HTTPS使用SSL(Secure Socket Layer)和TLS(Transport Layer Security)这两个协议。
SSL技术最初是由浏览器开发商网景通信公司率先倡导的,开发过SSL3.0之前的版本。目前主导权已转移到IETF(Internet Engineering Rask Force ,Internet 工程任务组)的手中。
IETF以SSL3.0为基准,后又制定了TLS1.0、TLS1.1和TLS1.2.TLS是以SSL为原型开发的协议,有时会统一称该协议为SSL。当前主流的版本是SSL3.0和TLS1.0。
由于SSL1.0协议在设计之初被发现出了问题,就没有实际投入使用,SSL2.0也被发现存在问题,所有很多浏览器直接废除了该协议版本。
2.SSL速度慢吗
HTTPS也存在着一些问题,那就是当使用SSL时,它的处理速度会变慢。
SSL的慢分两种。一种是指通信慢。另一种是指由于大量消耗CPU及内存等资源,导致处理速度变慢。
和使用HTTP相比,网络负载可能会变慢2到100倍。除去和TCP连接,发送HTTP请求响应以外,还必须进行SSL通信,因此整体上处理通信量不可避免会增加。
另一点是SSL必须进行加密处理。在服务器和客户端都需要进行加密和解密的运算处理。因此从结果上讲,比起HTTP会更多地消耗服务器和客户端的硬件资源,导致负载增强。
针对速度变慢这一问题,并没有根本性的解决方案,我们会使用SSL加速器这种(专用服务器)硬件来改善该问题。该硬件为SSL通信专用硬件,相对软件来讲,能够提高数倍SSL的计算速度。仅在SSL处理时发挥SSL加速器的功效,以分担负载。
为什么不一直使用HTTPS
* 既然HTTPS那么完全可靠,那为何所有的web网站不一直使用HTTPS?
其中一个原因是,因为与纯文本通信相比,加密通信会消耗更过的CPU及内存资源,如果每次通信都加密,会消耗相当多的资源,平摊到一台计算机上时,能够处理的请求数量必定也会随之减少。
因此,如果是非敏感信息则使用HTTP通信,只有在包含个人信息等敏感数据时,才利用HTTPS加密通信。
特别是每当那些访问量较多的web网站在进行加密处理时,它们所承担着的负载不容小觑,在进行加密处理时,并非对所有内容都进行加密处理,而是仅在那些需要信息隐藏时才会加密,以节约资源。
除此以外,要想节约购买证书的开销也是原因之一。
要进行HTTPS通信,证书是必不可少的。而是用的证书必须向认证机构(CA)购买。证书价格可能会根据不同的认证机构略有不同。
那些购买证书并不合算的服务以及一些个人网站,可能只会选择采用HTTP的通信方式。