SHA算法系列介绍

个人博客请访问 http://www.x0100.top  

小明:老师,有个问题不懂。

老师:什么问题,说吧。

小明:我最近在研究微信支付接口,发现它不仅支持MD5摘要的验签,还支持SHA-256摘要。这个SHA是什么鬼?

老师:和MD5算法类似,SHA(Secure Hash Algorithm)也是一种生成信息摘要的算法。

小明:可是我看到网上以SHA命名的算法五花八门,什么SHA-1,SHA2,SHA-256等等,为什么会有这么多名字呢?

老师:这是因为SHA算法分为很多版本。最大的版本分类是SHA-1和SHA-2,SHA-2又包含了很多子版本。

老师:SHA-2的子版本包括SHA-224,SHA-256,SHA-384,SHA-512。这些版本共同构成了SHA的大家族。

小明:SHA算法和MD5算法有什么区别呢?SHA的这么多版本之间又有什么不同?

老师:要回答这个问题,我们先从SHA-1说起吧。

SHA-1

SHA-1算法可以从明文生成160bit的信息摘要,示例如下:

给定明文:abcd

SHA-1摘要:81FE8BFE87576C3ECB22426F8E57847382917ACF

SHA-1 与 MD5的主要区别是什么呢?

1.摘要长度不同。

MD5的摘要的长度尽128bit,SHA-1摘要长度160bit。多出32bit意味着什么呢?不同明文的碰撞几率降低了2^32 = 324294967296倍。

2.性能略有差别

SHA-1生成摘要的性能比MD5略低。

小明:SHA-1这么强大,应该没人能破解吧?

老师:很遗憾,早在2005年,人们就研究出了破解SHA-1的方法。近期谷歌的Chrome小组也宣城要淘汰SHA-1。

小明:连SHA-1都不安全了,这可怎么办?

老师:别担心,我们还有更安全的算法SHA-2。

SHA-2

SHA-2是一系列SHA算法变体的总称,其中包含如下子版本:

SHA-256:可以生成长度256bit的信息摘要。

SHA-224:SHA-256的“阉割版”,可以生成长度224bit的信息摘要。

SHA-512:可以生成长度512bit的信息摘要。

SHA-384:SHA-512的“阉割版”,可以生成长度384bit的信息摘要。

显然,信息摘要越长,发生碰撞的几率就越低,破解的难度就越大。但同时,耗费的性能和占用的空间也就越高。

小明:为什么SHA-2要有这么多的版本呢?只使用最长的一种不就行了吗?

老师:这是为了适应不同的应用场景,从而对安全、性能、空间等因素做出权衡。比如说过我的需求仅仅是验证数据完整性,使用SHA-512显然是浪费了。另外,如果想要追求安全性,也可以考虑把多种摘要算法结合使用。比如下面这样:

明文: abcd

MD5摘要:e2fc714c4727ee9395f324cd2e7f331f

SHA-256摘要:

88d4266fd4e6338d13b845fcf289579d209c897823b9217da3e161936f031589

合成摘要:e2fc714c4727ee93209c897823b9217da3e161936f031589

取MD摘要的前16和SHA-256摘要的后32位,拼成一个长度48位的合成摘要。这样除非知道拼接规则,否则外人是无从破解的。

小明:还真是个好办法。最后一个问题,SHA-1和SHA-2系列算法生成摘要的底层原理是什么样呢?

老师:SHA算法的底层原理和MD5很相似,只是在摘要分段和处理细节上有少许差别。

我们先来回顾一下MD5算法的核心过程,简而言之,MD5把128bit的信息摘要分成A,B,C,D四段(Words),每段32bit,在循环过程中交替运算A,B,C,D,最终组成128bit的摘要结果。

再看一下SHA-1算法,核心过程大同小异,主要的不同点是把160bit的信息摘要分成了A,B,C,D,E五段。

再看一下SHA-2系列算法,核心过程更复杂一些,把信息摘要分成了A,B,C,D,E,F,G,H八段。

其中SHA-256的每一段摘要长度是32bit,SHA-512的每一段摘要长度是64bit。SHA-224和SHA-384则是在前两者生成结果的基础上做出裁剪。

几点补充:

SHA家族的最新成员SHA-3已经于2015年问世。关于SHA-3的细节,有兴趣的小伙伴们可以查询资料进一步学习。

关注微信公众号和今日头条,精彩文章持续更新中。。。。。

 

你可能感兴趣的:(架构,排序算法)