Python的hashlib提供了常见的摘要算法,主要提供 SHA1, SHA224, SHA256, SHA384, SHA512 ,MD5 算法。
摘要算法又称哈希算法、散列算法。它通过一个函数,把任意长度的数据转换为一个长度固定的数据串(通常用16进制的字符串表示)。
以常见的摘要算法MD5为例,计算出一个字符串的MD5值:
import hashlib MD5 = hashlib.md5() MD5.update(bytes('how to use md5 in python hashlib?',encoding='utf-8')) print(MD5.hexdigest()) d26a53750bc40b38b65a520292f69306
如果数据量很大,可以分块多次调用update(),最后计算的结果是一样的:
import hashlib MD5 = hashlib.md5() MD5.update(bytes('how to use md5 in ',encoding='utf-8')) MD5.update(bytes('python hashlib?',encoding'utf-8')) print(MD5.hexdigest())
改动一个字母,看看计算的结果是否完全不同。
MD5是最常见的摘要算法,速度很快,生成结果是固定的128 bit字节,通常用一个32位的16进制字符串表示。另一种常见的摘要算法是SHA1,调用SHA1和调用MD5完全类似:
import hashlib SHA1 = hashlib.sha1() SHA1.update(bytes('how to use sha1 in ',encoding='utf-8')) SHA1.update(bytes('python hashlib?',encoding='utf-8')) print(SHA1.hexdigest())
SHA1的结果是160 bit字节,通常用一个40位的16进制字符串表示。
比SHA1更安全的算法是SHA256和SHA512,不过越安全的算法不仅越慢,而且摘要长度更长。
以上加密算法虽然依然非常厉害,但时候存在缺陷,即:通过撞库可以反解。所以,有必要对加密算法中添加自定义key再来做加密。
import hashlib hash = hashlib.md5(bytes('898oaFs09f',encoding="utf-8")) hash.update(bytes('admin',encoding="utf-8")) print(hash.hexdigest())
摘要算法应用
任何允许用户登录的网站都会存储用户登录的用户名和口令。如何存储用户名和口令呢?方法是存到数据库表中:
name | password --------+---------- michael | asddasda lzj | ddecewad erics | se232cw3
以明文保存用户口令,如果数据库泄露,所有用户的口令就落入***的手里;正确的保存口令的方式是不存储用户的明文口令,而是存储用户口令的摘要,比如MD5:
username | password ---------+--------------------------------- michael | e10adc3949ba59abbe56e057f20f883e lzj | 878ef96e86145580c38c87f0410ad153 erics | 99b1c2188db85afee403b1536010c2c9
当用户登录时,首先计算用户输入的明文口令的MD5,然后和数据库存储的MD5对比,如果一致,说明口令输入正确,如果不一致,口令肯定错误。