简单理解“哈希算法”

【本文由赞我(zaneds.com)独家冠名】

 计算机密码学对区块链技术来说可谓是重中之重,我们在阅读各种区块链项目的白皮书或者区块链相关书籍中,也多少会提及XX算法,如哈希算法和非对称算法,但是算法到底是怎样一种存在?在区块链技术中又解决了哪些问题呢?今天就带来一次计算机密码学的算法之旅--哈希算法

 01

哈希算法一般指SHA家族。SHA是什么?英文全称是Secure Hash Algorithm,即安全散列算法。能计算出一个数字消息所能对应的固定长度字符串的算法。且如果输入的数据不同,他们能对应的不同字符串的机率很高。注意,这里并不是绝对不同。

通过这个定义可以看出哈希算法的特性。第一,输入是可以任意长的字符;第二,输出是固定长度的字符串;第三,函数的计算过程是有效率的。简单的说,就是通过一种方法,可以将任意输入的字符串计算出一段固定长度的字符串。根据这种方法,哪怕数据发生微小的变化,重新计算后的哈希值也会和之前的不一样。而且计算出的来的结算,是无法再通过一个算法还原出原始数据的,即是单向的。故这种算法适合于身份验证的场合,由于哈希值能起到一个类似身份证号的作用,因此可以用于判断数据的完整性。

由于哈希算法的输出值是固定的,而原始数据是多种多样的,所以理论是会存在不同的原始输出输入同一种哈希值的可能。但是这种情况只有在原始数据的数量极其庞大的时候才会出现。例如邮件系统的坑垃圾邮件算法,为了解决这种问题,对邮件地址进行多种哈希计算,将计算出来的值联合起来判断是否存在某个邮件地址,即布隆过滤器的原理。此原理在比特币中有应用。

02

那么在区块链中哈希算法有哪些呢?主要是区块哈希和梅克尔树

区块链是链的结构,而且无法篡改,那是怎么实现的呢?在区块链技术中,对区块头进行了哈希计算,得出某个区块的哈希值,用这个哈希值唯一确定某一个区块,即给这区块确定了一个身份证ID,区块之间通过这个身份ID串联,即区块生成的区块哈希值将成为下一个区块的重要标记,这样每一个新生成的区块的区块头都包含了前一个区块的哈希值,这就使得从创世块到当前区块链接在一起,形成了一条长链。由此这样的区块链结构也使得区块链数据难以篡改,这只是其一。

 03

区块链是如何证明数据完整性,如何保证交易不被篡改呢?这就要说到哈希的另一应用,交易哈希-梅克尔树。区块中的交易记录被一个成为梅克尔树的数据结构来进行哈希值计算和存储,但是只有哈希值记录在区块的哈希值中。

举个例子,一个合同有N页,当我们签订合同的时候,会在每一页都盖章,但是盖的章都是一样的,如果其中一页被替换被修改样式无法防止的。但是如果我们盖章数字章,即给每一个的数字印章是前一页加本页内容加一起使用哈希算法生成哈希值,即N页的数字章=HASH(N—1的数字章+N页内容),这样的话,如果对第一页的内容篡改,那本页的哈希值肯定和本页的数字章不再相符,且之后的也是如此。这就是默克尔树的优势。第一我们可以知道信息是否被篡改,第二我们还能知道第几块信息被篡改。

比特币是分布式的网络结构,它支持一个叫做“简化支付协议(spv)”的协议,一个没有下载完整区块链数据的节点,也能通过向其他节点索要包括从交易哈希沿默克尔树上溯至链头处的跟哈希的哈希序列,以此来快速确认交易输出的正确性。

04

简单总结下,哈希算法即通过一定的函数计算过程,将任意长度的字符转换成固定长度的字符串,而且此种算法是不可逆的,即单向的。区块链中的哈希算法应用主要是区块哈希和梅克尔树;区块哈希即对区块头部进行了哈希算法,确定上一个哈希块的地址。区块链的交易记录通过哈希计算后存储为树状的数据结构,即梅克尔树。区块链的不可篡改和数据的完整性基本是通过以上两种计算机技术方法实现的。由此可见计算机密码算法在区块链中的应用是非常重要的。

好了,今天带大家了解了下什么是哈希算法以及哈希算法在区块链技术中的应用,大家也了解了哈希算法在区块链中解决了哪些问题。关于非对称算法,敬请期待后续文章。

你可能感兴趣的:(简单理解“哈希算法”)