本系列内容包含:基本概念及原理、密码学、共识算法、钱包及节点原理、挖矿原理及实现。
每个区块主要包括区块头(下图灰色的部分)和交易主体(下图橙色的部分)两部分。
整个区块头中内容包含:
第一个是前序区块的哈希,这样区块才能跟前面区块链起来,形成一个链;
第二个是时间戳,表明区块是在什么时间被挖出来的;
第三个是难度的目标值,矿工挖矿的过程,其实就是在不断的计算挖出来的区块是否和难度值相匹配;
第四个Nonce 是一个随机数;
最后 Merkle root ,记录的是整个包含在当前区块中所有交易的交易哈希,Merkle root是通过交易哈希计算出来的。
我们通过下图比特币的一个区块结构来具体分析一些。
1、Magic Number(魔数)占4个字节,一般是固定值;
2、Block Size(区块大小)占4个字节,可变值;
3、Version(版本)占4个字节,标明当前版本,固定值;
4、Previous Block Hash(前序区块哈希)占32个字节,可变值;
5、Merkle Root(默克尔根)占32个字节,可变值;
6、Timestamp(时间戳)占4个字节,可变值;
7、Difficulty(难度值)占4个字节,可变值;
8、Nonce(随机数)占4个字节,可变值;
9、Transaction Counter(交易的数量)占1-9个字节,可变值;
10、总共的Transaction List(交易列表)加在一起总共是1MB。
每个区块都有其唯一标识,这就是区块的哈希,区块哈希是由区块头中的几部分来构成。
从上图可以看出
区块0对区块头中的中间标红部分进行哈希计算,得到当前区块0的哈希,然后区块0的哈希会填入下一个区块(区块1)中,作为下一个区块头的一部分。
以此类推,所有的区块都会按照这个顺序不断的加下去,所以通过前序区块的哈希就可以找到唯一的前一个区块,从而达到所有区块可追溯的目的,这样也保证了区块链是完整的,唯一的。
上图中大家可以看到左侧有五句话,中间是哈希算法,经过运算之后得到对左侧话语的哈希运算结果。
图中的第一句话只有三个字,第二、三、四句话的区别只有一个字,第五句话完全不同。
我们可以看出,不管字数多少,哪怕只改一个字,最终结果却是完全不同的,并且完全没有任何规律。
哈希运算的这种特性,保证了数据的不可变更。因为一旦变更之后,整个结果就变了。所以在很多场合中,我们可以通过验证哈希来保证被加密文本有没有被改变。
哈希运算的这个特点保证了,即使区块中有即使两个区块只有一个字节不一样,这两个区块的哈希也是完全不一样的,从而保证区块链中所有的区块哈希都是完全唯一的。
Merkle root 涉及一个区块头中非常重要的一个部分,但是它却和区块头中其它几个部分是没有任何关系的。
与 Merkle root 最大关系的就是整个区块头区块中的所有交易,这些交易决定了 Merkle root 的值,然后通过Merkle root 的值来影响整个区块的哈希。
Merkle root 是如何计算的呢?
从上图中我们看到是由16个交易组成了 Merkle root,也称之为默克尔根。
所有的这16个交易,都排布在交易的最底层,AB是一对,CD是一对,一直到OP。其中HA呢表示交易A的哈希,以此类推。
计算的过程中,是将HA和HB拼成一个字符串,然后对这个字符串进行哈运算,得到了HAB。以此类推,分别计算后面的哈希。
第一层算完以后,所有的哈希由16个缩短为8个,继续按照同样的方式经过第二层计算以后,哈希缩短为4个……以此类推,最终得到Merkle root,这种结构也称之为默克尔树。
这种结构不单单标记了所有交易的顺序,也标记了所有交易的关系,并且通过这种非常巧妙的方式,也降低了Merkle root的计算次数。因为整个的计算层次是2的幂指数的情况,即使交易呈指数的增加,其计算次数也不会增加很多。
有一种情况是假如默克尔根不正好是2的幂指数怎么办?比如说只有3个或者5个交易,这种情况该如何计算呢?
上图图中我们看到只有3个交易,由于HC是单独的,它的旁边没有另外一个交易和它拼成一个字符串,这种情况下就会选择将HC复制,也就是两个HC拼一个完整字符串,从而得到HCC。最后,将HAB和HCC拼成一个字符串HABCC进行计算。以此完成这个只有3个交易的Merkle root计算。
总结:计算Merkle root的时候,首先将所有的交易有序的平铺在一层,然后两两一组,逐步获得上一层的哈希;
当某个交易哈希,为单数的时候,这时将这个哈希复制一份来进行补足,然后继续进行上层计算,直到最终完成 Merkle root 计算;
通过这种方式,可以将区块中所有的交易绑定在一起,并且交易的内容和顺序都是确定的;
最后将Merkle root填到区块头中,既保证了所有的交易摘要在区块头中有一个记录,又保证了区块中所有交易的不可篡改。
时间戳 记录当前区块是在什么时间被挖出来的,它会在浏览器中把时间轴转换成当地时间的格式,也就是我们在区块链浏览器中看到的区块时间。
挖矿难度 其实是一个目标值,只有矿工挖出来的区块,满足这个难度值的时候,这个区块才会被全网的其它节点来确认。
Nonce 是一个随机数,矿工挖矿的过程中,就是不断的在尝试修改这个随机数。