区块链是如何保持数据一致性的

区块链是如何保持数据一致性的

http://www.jianshu.com/p/39be41dfb5fa

1、什么是哈希

如果你懂一些编程,相信对这个概念非常熟悉。但是对于一些没有编程基础的人而言,对其却相当陌生,陌生到买了一本区块链的书籍却完全看不下去。哈希函数在区块链里使用得太普遍,以至于它所有对用户展示的内容,比如地址,公钥,私钥等,都是通过哈希函数生成的,所以在这里有必要重点对这个概念阐述一下,即便懂得编程,听过这个概念,希望你也能再看一遍,就当是回顾了。

哈希,英文对应为Hash,一般说的都是哈希函数,百度百科的解释是:

Hash,一般翻译做“散列”,也有直接音译为“哈希”的,就是把任意长度的输入(又叫做预映射, pre-image),通过散列算法,变换成固定长度的输出,该输出就是散列值。这种转换是一种压缩映射,也就是,散列值的空间通常远小于输入的空间,不同的输入可能会散列成相同的输出,所以不可能从散列值来唯一的确定输入值。简单的说就是一种将任意长度的消息压缩到某一固定长度的消息摘要的函数。

简单来讲,就是将一个较长的字符串a转换为一个固定长度的字符串b,然后用b这个串去代表之前的a,比如一个比特币地址1DQe9F3agsDcr4qoTZ3Sush4e88Nv9tNxa,就是一个哈希值。经过哈希转换后,无法通过b还原出原来的a。

哈希算法在文件校验、数字签名及鉴权协议都有很好的应用。在Java编程里,可直接通过hashCode函数获取一个字符串的哈希值,哈希算法是一个非常高效的算法,所以使用非常频繁。

2、简单的判断一致性方法

你应该经常下载过东西,可能对一个文件重复下载了两次,甚至现在还会不小心在一些钓鱼网站下载了一些恶意程序,那么你是如何判断文件的一致性以及识别程序是否有问题呢?

你可能想到的方法有:1)比较文件大小,如果不一致,则说明是不同的文件;2)查看文件内容,但是并不是所有的程序都是文本可读的;3)查看文件的一些标注信息是否一致,等等。但是这些方法都相当初级,对于一些高级的作弊手段无法识别,正因如此,一些良心网站都会提示比较文件的MD5值,很多细心的朋友应该能发现这个提示,但是基本也很少按照这个提示去做,毕竟我们大部分人都习惯了在网上“裸奔”。

上面提到的MD5,就是一种被广泛使用的哈希函数。现在越来越多的网站都会公布文件的MD5值,用户在下载文件后可自己进行运算并进行比对,如果一致则说明所下载文件没被篡改过。

由于工作需要,这两天我准备下载一个mangodb,这是下载页面的截图,通过截图大家应该能有一个直观的认识:

区块链是如何保持数据一致性的_第1张图片
下载页面截图

当然MD5只是哈希算法的一种,上面的截图还显示了其他支持的方法,不过这些都是使用哈希算法的特性用于校验文件的一致性的。

3、区块链如何保持数据的一致性——默克树

下面这个图是比特币的区块结构图,它相当重要以至于每一本区块链书籍都会介绍,也希望每一个研习社的朋友能掌握:

区块链是如何保持数据一致性的_第2张图片
区块结构

在上表的第三行“Merkle树的根值”正是一个哈希值,和上面提到的一样,区块链技术正是利用这个哈希值来判断区块的数据是否被篡改过的。

但是,事情可能还没想的那么简单。因为一个区块可能包含几百个甚至更多的交易,其内容会非常多,对整体进行哈希运算效率是非常低下的,因此,才会出现上图大家可能还相对陌生的词“Merkle树”,翻译为默克树,这才是保持一致性的关键。

默克树,全称“默克尔哈希树”,是一种二叉或多叉的数据结构,通过对每一个叶子节点进行哈希计算,并不断往上递归,最后构建成一个树形结构。因此默克树是一种被广泛用于快速归纳和对大规模数据进行完整性校验的数据结构。

在比特币的实现中,不用保存每一个交易的哈希值,而是将所有交易构建成这样一个默克树,并以树的根节点的哈希值作为所有交易内容的一个映射,存放于区块的头部结构中,从而在保证数据完整性,防止被恶意篡改的同时,极大减少了运算量,提高了运算效率,而且,如果一旦被篡改,还能进行快速定位。简直是妙不可言!

下面是一张默克树的图,大家姑且看之,不懂也无所谓,全当欣赏:


区块链是如何保持数据一致性的_第3张图片
默克树

好了,看完这篇文章你是否懂了区块链如何保持数据一致性的呢?有需要直接给我留言吧。

你可能感兴趣的:(bitcoin)