Python数据结构与算法54:排序与查找:区块链技术

:本文如涉及到代码,均经过Python 3.7实际运行检验,保证其严谨性。

本文阅读时间约为5分钟

区块链技术是散列函数最酷的应用。近些年比特币(BitCoin)的大红大紫使得区块链技术名声大噪。

区块链是什么

区块链是一种分布式数据库。通过网络连接的节点,每个节点都保存着整个数据库的所有数据。任何地点存入的数据都会完成同步。

Pic-510-1 区块链的示意图

区块链的最本质特征是去中心化。所谓去中心化,就是指不存在任何控制中心,协调中心的节点;所有节点都是平等的,无法被控制。

那么,区块链是如何做到不需要互相信任和权威,即可防止被篡改和破坏?
这要从区块链的数据结构说起。

区块链的数据结构

区块链由一个个区块(block)组成,区块分为头(head)和体(body)。

  • 区块头记录了一些元数据和链接到前一个区块的信息——包括生成时间、前一个区块(head+body)的散列值。
  • 区块体记录了实际数据。

区块链的数据结构如下图所示:


Pic-510-2 区块链的数据结构
区块链的不可修改性

由于散列值具有抗修改性,任何对某个区块数据的改动必然引起散列值的变化。为了不导致这个区块脱离链条,就需要修改后续的所有区块。

而由于有“工作量证明”的机制,这种大规模修改不可能实现,除非掌握了全网51%的计算力。

工作量证明(Proof of Work, POW)

由于区块链是大规模的分布式数据库,同步较慢,新区块的添加速度需要得到控制。

目前最大规模区块链BitCoin采用的速度是平均每10分钟生成一个区块。

大家不惜付出海量的计算,去抢着算出一个区块的有效散列值。最先算出有效散列值的人(我们称之为“矿工”),才有资格把区块挂到区块链当中。

为什么计算出有效散列值很困难?

因为只有很难计算,这才能控制新区块的生成速度,便于在整个分布式网络中进行同步。

每个区块设置了一个难度系数Difficulty,用常数targetmax除以它,得到一个target,难度系数越高,target越小。

target = targetmax / difficulty

旷工的工作是,找到一个数值Nonce,把它跟整个区块数据一起计算散列。这个散列值必须小于target,才是有效的散列值。

由于散列值无法回推原值,要找到Nonce,只能靠暴力穷举,计算工作量+运气是唯一的方法。

为什么矿工们抢着生成区块?

因为利益。在加密货币BitCoin中,区块内包含的数据是“交易记录”,也就是账本。这对货币体系至关重要。

BitCoin规定,每个区块中包含了一定数量的比特币作为“记账奖励”,这样就鼓励了更多人加入到抢先记账的行列。

虽然计算出有效散列值会越来越困难,但是,由于硬件摩尔定律的存在,计算力同样会持续递增,于是,这就能维持每10分钟生成一个区块的速度。

挖矿计算力一直持续升级:CPU(20MHash/s) → GPU(400MHash/s) → FPGA(25GHash/s) → ASIC(3.5THash/s) → 大规模集群挖矿(3.5THash/s * X)。

另外,BitCoin的总数量是一定的,不会无限增加,每4年奖励的BitCoin数量减半。

To be continued.

你可能感兴趣的:(Python数据结构与算法54:排序与查找:区块链技术)