本文作者杨毅 著有《HyperLedger Fabric开发实战——快速掌握区块链技术》一书。
HyperLedger Fabric最初是由Digital Asset和IBM公司贡献的、由Linux基金会主办的一个超级账本项目,它是一个目前非常流行并广为人知的区块链网络框架的实现方案。作为一种基于模块化架构开发应用程序或解决方案的基础,HyperLedger Fabric支持如共识和会员服务等即插即用的组件,它的设计初衷是支持不同组件的可插拔实现,并适应整个经济生态系统的复杂性和高精度性。HyperLedger Fabric利用容器技术运行称为“Chaincode”的智能合约,该合约包含了系统的应用程序逻辑。
HyperLedger Fabric是一个区块链解决方案,更倾向于联盟链或私有链方向。区块链由于去中心化、开放性、自治性、信息不可篡改及匿名性等特征而受到广泛关注,且目前正处在上升势态。抛开炒作的代币项目,应用于行业联盟链或直接搭建私链的项目,采用HyperLedger Fabric作为底层平台无疑是最好的选择之一。
项目无须刻意围绕区块链开展,不能因为当前区块链火爆就强迫业务进行转型,否则对企业发展和项目升级可能不会起到积极作用。
对于联盟链,其应该被打造成一个独立于企业内部核心业务的外围应用。换一种说法,一家企业加盟某一个区块链平台的目的是提升自身的业务健壮度和抗风险能力,而不能因为加盟了某一个区块链平台就有针对性地修改自身原有业务。
企业对区块链联盟平台的姿态应该是最大程度自由的,即上链有一定好处,但依然可以根据自身的实际情况选择随时下链而不影响原有业务。
这里的学习内容是指HyperLedger Fabric学习过程中会遇到的一些应用,通常包括以下几部分。
Docker 是一个开源的应用容器引擎,基于 Go 语言并遵从Apache2.0协议开源。 Docker 可以让开发者将应用和依赖包打包到一个轻量级、可移植的容器中,然后发布到任何流行的 Linux 机器上,也可以实现虚拟化。 容器完全使用沙箱机制,相互之间不会有任何接口(类似 iPhone 的 App),更重要的是容器性能开销极低。
在学习HyperLedger Fabric的过程中,开发人员需要掌握Docker的基本操作命令,以便可以更快上手,这其中包括打包、拆包、tag、容器管理、镜像管理等。同时,也需要学习Docker Compose和YAML的编排方案,了解如何挂载文件路径、设置端口绑定、确定Network以及掌握环境变量的用法等。
Go是一种并发的、带垃圾回收的、快速编译的语言。它可以在一台计算机上用几秒钟的时间编译一个大型的Go程序,结合了解释型语言的游刃有余、动态类型语言的开发效率以及静态类型的安全性。
HyperLedger Fabric是一个基于Go开发的开源项目,学习Go不仅仅是为了更深入地阅读源码需求,也因为智能合约编写方案需要Go来实现。对于Go的学习,至少能够在参考API文档的情况下编写出一套符合需求的智能合约。然而,对于有一定面向对象基础的开发人员来说,这并不难。
gRPC 是一个高性能、通用的开源RPC框架,由 Google公司 主要面向移动应用开发并基于HTTP/2 协议标准而设计的,基于 ProtoBuf(Protocol Buffers) 序列化协议开发,且支持众多开发语言。
在学习HyperLedger Fabric的过程中,对gRPC的感知并不深,但SDK的相关项目都需要用到它。建议还是需要了解一下诸如此类的传输协议,与之类似的还有Thrift、Dubbo等。
CA是PKI系统中通信双方信任的实体,被称为可信第三方(Trusted Third Party, TTP)。作为可信第三方的行为具有非否认性。
在HyperLedger Fabric体系中,CA被广泛运用于每一个具体的对象,如orderer、peer以及最小单位的user等。后端开发的工程师应该比较了解,在HyperLedger Fabric中CA被用于各种对象的登记、登出、注册、撤销等操作。
Peer-to-Peer,对等网络,即对等计算机网络,是一种在对等者(Peer)之间分配任务和工作负载的分布式应用架构。
关于P2P的学习并非必须,但也算是入门区块链底层的必修课,对期望今后有机会进行底层开发的工程师来说,目前多少需要了解一些。
Kafka是一个分布式消息系统,由LinkedIn使用Scala编写,用作LinkedIn的活动流(Activity Stream)和运营数据处理管道(Pipeline)的基础。具有高水平扩展和高吞吐量。
在Fabric网络中,数据是由Peer节点提交到Orderer排序服务,而Orderer相对于Kafka来说相当于上游模块,且Orderer还兼具提供对数据进行排序及生成符合配置规范及要求的区块。当使用上游模块的数据计算、统计、分析时,可以使用Kafka这样的分布式消息系统来协助业务流程。
Kafka是一种共识模式,也就是平等信任(同步复制),所有的HyperLedger Fabric网络加盟方都是可信方,因为消息总是均匀地分布在各处。但具体生产使用的时候会依赖于背书来做到确权,相对而言,Kafka应该是一种启动Fabric网络的模式或类型。
Zookeeper是一种在分布式系统中被广泛用于分布式状态管理、分布式协调管理、分布式配置管理和分布式锁服务的集群。
Kafka增加和减少服务器都会在Zookeeper节点上触发相应的事件,Kafka系统会捕获这些事件,进行新一轮的负载均衡,客户端也会捕获这些事件进行新一轮的处理。
HyperLedger Fabric最终需要落地于实际应用,相对于HyperLedger Fabric的应用层则会直接提供接口给其他各客户端并对区块链网络进行操作。目前,基于HyperLedger Fabric的SDK方案有很多,但相对较成熟的主要还是Java和Node.js的。所以,这两门语言应当是学习HyperLedger Fabric平台工程师的主力语言,建议熟练使用两者其中之一。
如果这两门语言都不是目前学习Hyperledger Fabric工程师的主力语言,可以考虑用其他被gRPC所支持的编程语言自行实现,或者使用Fabric-SDK-Container提供的解决方案。
Hyperledger Fabric的入门其实不能说难,只是很麻烦,很多知识点并不需要开发人员熟练掌握,但必须有所了解。当只想基于Hyperledger Fabric平台上线落地一个区块链项目,却不清楚哪些知识点是必须深入学习的时候,就需要一个简单明确的引导来帮助完成这件事。
本人从接触HyperLedger Fabric项目以来,经历了其0.6版本到1.1版本的数次迭代。因为早期中文资料稀缺,并且0.6版本到1.0版本是一个跨度非常大的迭代,导致早期的大部分部署和应用经验失去作用,不得已再次从1.0版本开始从头学习。当时中文资料极为有限,且大多数都是单篇翻译或纯粹的概念讲解,导致我一直没有找到入门的头绪,只能不断地从官方文档中汲取知识。
现在网上已经有了大量的HyperLedger Fabric教学博客和视频资料,也有很多书籍辅助开发人员学习,国内的HyperLedger Fabric项目实操氛围也不错,大部分关于区块链的招聘都要求应聘人员对HyperLedger Fabric的架构和具体应用有一定的经验。
本人根据自己的实践经验,并撰写了Hyperledger Fabric 1.0 从零开始系列博文。后来在宋亚东老师的建议下,再次从头梳理了所有内容,并结合自己实际学习和开发的过程整理了一条学习线路,如下图所示。开发人员可以按照图中序号顺序进行学习。
当然,每个人都有各自的学习方案和思路,上图中的路线并非适合所有人,有一定基础的读者可以跳过其中的部分节点选择性阅读。所以,它适合正在寻求HyperLedger Fabric入门的新人,也适合这方面的中、高级开发人员选择性学习。
这本名为《HyperLedger Fabric开发实战——快速掌握区块链技术》的书没有花费篇章讲述区块链的编年史,也没有横向对比各大区块链平台的优缺点,也不是纯粹的翻译注解。更多的是对初学HyperLedger Fabric的指南,书中有大量的代码介绍和讲解,并且也提供了源码下载地址,减少手动敲代码及调试的烦恼。同时,以HyperLedger Fabric案例为引,层层深入,从单机单节点到Solo多机部署再到Kafka集群部署,其中结合穿插文档讲解加深理解。特别是对于一些常犯错误,本书均一一进行了提醒并给出了解决方案,希望能通过本书帮助开发人员少走弯路,尽快实现基于HyperLedger Fabric的区块链实践落地。
最后,介绍下本书的架构组成:
第1章是基本环境部署,包括内网和外网的不同方案,以及内核处理等。
第2章是HyperLedger Fabric及环境部署,先是用文档讲述了Fabric相关的介绍和主要功能点,接着分析了源码部署和镜像处理方面的问题。
第3章带着读者一步步跑通官方的e2e_cli案例,并在随后对该案例进行了分析。
第4章开始,手动部署一次单机多节点网络。
第5章跟随前章的脚步,手动部署一次Solo多机网络环境。
第6章继续深入,搭建基于Kafka的集群网络。
第7章以文档为主,着重讲解如何编写智能合约及有关智能合约的用法。
第8章详细介绍CouchDB的使用,并推荐使用CouchDB。
第9章讲解在Fabric发布1.0版之后的对外客户端调用方式、客户端对SDK的使用和相关源码。
第10章以一个简单的案例做演练,在数据链上用到了智能合约,对数据提取则提供了另一种思路。
本书已经上市销售,点击了解更多。