关于web开发安全算法之数字摘要

常用的安全算法

常用的安全算法主要包括摘要算法、对称加密算法、非对称加密算法、信息编码等。将着重介绍各种算法的使用场景与使用方法，避免涉及密码学相关理论的枯燥无味的叙述。

1.数字摘要

数字摘要” 也称为消息摘要，它是一个唯一对应一个消息或文本的固定长度的值，它由一个单向Hash函数对消息进行计算而产生。如果消息在传递的途中改变了，接收者通过对收到的消息采用相同的Hash重新计算，新产生的摘要与原摘要进行比较，就可知道消息是否被篡改 J ' 因此消息摘要能够验证消息的完整性。消息摘要采用单向Hash函数，将需要计算的内容“摘要“ 成固定长度的串，这个串也称为数字指纹。这个串有固定的长度，且不同的明文摘要成密文，其结果总是不同的（相对的，这个后面会介绍），而同样的明文其摘要必定一致。这样这串摘要便可成为验证明文是否是 “真身” 的 ”指纹” 了。

Hash碰撞

如果待摘要的关键字为k, Hash函数为 f(x), 则关键字k的摘要为 f (k), 若关键字kl不等于k2, 而f(kl) =f (k2), 这种现象称为Hash碰撞。

一个 Hash 函数的好坏是由发生碰撞的概率决定的，如果攻击者能够轻易地构造出两个具有相同Hash值的消息，那么这样的Hash函数是很危险的。可以认为，摘要的长度越长，算法也就越安全。由于数字摘要并不包含原一的完整信息，因此，要从摘要信息逆向得出待摘要的明文串，原则上几乎是不可能完成的任务。

消息摘要的特点总结如下：

(1)无论输入的消息有多长，计算出来的消息摘要的长度总是固定的。
(2) 一般只要输入的消息不同，对其进行摘要以后产生的摘要消息也不相同，但相同的输入必会产生相同的输出。
(3)由于消息摘要并不包含原文的完整信息，因此只能进行正向的信息摘要，而无法从摘要中恢复出原来的消息，甚至根本就找不到任何与原信息相关的信息。

1.MD5

是数字摘要算法的一种实现。确保信息传输完整性和一致性，摘要长度为 128 位。M D5 巾M D4、M D3、M D2 改进而来，主要增强了算法复杂度和不可逆性。该算法因其普遍、稳定、快速的特点，在产业界得到了极为广泛的使用，目前主流的编程语言普遍都已有MD5算法的实现。
java提供的实现如下:

public static  byte[] testMDS(String content)throws Exception{
    MessageDigest md = MessageDigest.getinstance("MDS"); 
    byte [] bytes=md.digest(content.getBytes("utf8")); 
    return bytes; 

//通过MessageDigest取得MD5摘要算法的实例，然后通过digest方法进行MD5摘要。
//待摘要串：
hello,i am chenkangxian,good night! 
//MDS算法生成的摘要串（十六进制编码后）：
22bd33d4 c72dl 98 6ccb4 227 f f7 fle72 6

2.SHA

即安全散列算法。1993年，安全散列算法(SHA)山天国国家标汛和技术协会(NIST)提出.SHA-I是基于MD4算法的，现在已成为公认的最安全的散列算法之一，并被广泛使用。

SHA-l算法生成的摘要信息的长度为160位，由于生成的摘要信息更长，运算的过程更加复朵，在相同的硬件上，SHA-I的运行速度比MD5更慢，但是也更为安全。

//基于Java的SHA-I算法的使用：
public static byte[] testSHAl(String content)throws Exception{
      MessageDigest  md= MessageDigest.getlnstance("SHA-1");    
       byte[] bytes= md.digest(content.ge七Bytes("utf8")); 
      return bytes; 

//deb945d3e6fe72dbla290bcfcf53057clcaafdel

同MOS符法的使用类似，SHA-I算法也是通过MessageDigest取得具摘要算法的实例，然后通过digest方法进行SHA-I摘要。

由于计算出的摘要转换成字符串，可能会生成一些无法显示和网络传输的控制字符，因此，需要对生成的摘要字符串进行编码，常用的编码方式包括十六进制编码与Base64编码。

3.十六进制编码

我们都知道，计算机的计算采用的是二进制的数据表示方法，而十六进制也是数据的一种表示方法，并且可以与二进制数据进行相互转化，每4位二进制数据对应一位十六进制数据。同我们日常使用的十进制表示法不同的是，十六进制由0 9和A F来进行表示，与十进制的对应关系是：0 9对应0 9,A F对应10 15。

基于Java的十六进制编码与解码的实现

每一个byt e包含8位二进制数据，由于Java中没有无符号整型，因此8位中有一位为符号位，需要将符号位转换为对应的数值，然后再转换为对应的十六进制。8位二进制可以转换为2位十六进制，不足2位的进行补O,而解码时，需要先将符号位进行还原，再对数值进行转换，使用了lnteger.parselnt(subStr,16)这个方法来对十六进制进行解析，将其转换为整型的数值，然们判断止负，计算出符号位，并将剩余的位还原为byte的数值。

4.Base64编码

Base6416是一种基千64个可打印字符来表示二进制数据的方法，由于2的6次方等于64,所以每6位为一个单元，对应某个可打印字符，三个字节有24位，对应于4个Base64单元，即3个字节需要用4个可打印字符来表示。在Base64中的可打印字符包括字母A z、a z、数字0-9, 这样共有62个字符，此外两个可打印符号在不同的系统中而不同。

JDK 中提供了sun.m isc.BASE64Encoder和sun.misc.BASE64Decoder两个很好的工具类，用它们可以非常方便地完成基于 Base64 的编码和解码。

彩虹表破解 Hash 算法

彩虹表 (Rainbow Table) 法”是一种破解哈希算法的技术，从原理上来说能够对任何一种Hash 算法进行攻击。简单地说，彩虹表就是一张采用各种 Hash 算法生成的明文和密文的对照表，在彩虹表中，表内的每一条记录都是一串明文对应一种 Hash 算法生成的一串密文。我们得到一串加密字符，以及它采用的加密算法后，通过使用相关软件工具对彩虹表进行查找、比较、运算，能够迅速得出此加密字符串对应的明文，从而实现了对密文的破解

彩虹表法破解 Hash算法原理

正因为彩虹表采用这种笨拙的方式，一一穷举存储明文和密文的所有组合，所以彩虹表非常庞大，根据密文所对应明文的长度和复杂度（包含的字符类型：数字、字母、特殊字符等），常用到的彩虹表大小从几百MB到几十GB不等，当然，理论上彩虹的大小是可以无穷大的。
近年来，随着一些大型网站的用户数据库的沦陷，所暴露出来的用户名及明文密码的组在各种黑客圈子里边流传，使得彩虹表的数据积累越来越丰富、越来越准确，并且随着计算机硬件技术的发展，也使得彩虹表法破解 Hash 算法的效率越来越高，对于Hash 算法来说，彩虾表法成为了一种不可忽视的威胁。

摘自:
《大型分布式网站架构设计与实践》阅读笔记

关于web开发安全算法之数字摘要

你可能感兴趣的:(关于web开发安全算法之数字摘要)