脚本是一种简单的脚本语言,也是比特币交易处理的核心。如果你曾经写过汇编代码,你会发现这篇文章很容易理解,而且可能是有趣的;否则它可能是特别具挑战性的。所以请保持专注!
遇上机器码
脚本是计算机程序,作为程序员,你当然知道程序是什么。程序接受输入,执行一段时间,然后返回输出。编程语言是我们编写计算机能理解的程序的工具,因为大多数语言都带有编译器,可以将人性化的代码映射到CPU来操作,所以也称为操作码。
操作码
操作码包括内存操作,数学,循环,函数调用以及在程序编程语言(如C)中找到的所有内容。它们构成CPU的口语,即所谓的机器码。由于字节是计算机的首选习惯用法,因此操作码也是字节。结果就是,机器码表示要在CPU上执行的操作的字节串。
在像C这样的高级编程语言中考虑这段代码:
x = 0x23;
x += 0x4b;
x *= 0x1e;
现在假设你要在假设的小尾数的CPU上编译和运行此代码,该CPU具有16位内存(寄存器)的单个单元和以下操作码集:
opcode | encoding | V |
---|---|---|
SET(V) | ab V | 16-bit |
ADD(V) | ac V | 16-bit |
MUL(V) | ad V | 16-bit |
操作码解释如下:
- SET使用值V加载寄存器。
- ADD将V添加到寄存器中。
- MUL将寄存器乘以V。
这种CPU的编译器将生成这9个字节的机器代码:
ab 23 00 ac 4b 00 ad 1e 00
以下是它的解释方式:
- 1.使用值23加载寄存器。
- 2.将4b添加到寄存器,现在是23 + 4b = 6e。
- 3.将寄存器乘以1e,得到6e * 1e = ce4。
寄存器保存最终结果,即ce4。
堆栈内存
大多数情况下,我们需要使用变量跟踪复杂的程序状态。在C中,根据变量是静态分配还是使用malloc分配,它存储在不同排列的内存中。虽然malloc-ed数据像一个非常大的数组中的元素一样被访问,但静态变量被推送到一堆名为stack的项目中并从中弹出。堆栈以LIFO方式运行(后进先出),这意味着你推送的最后一个项目将是第一个弹出的项目。
考虑这个虚函数:
int foo() {
/* 1 */
/* 2 */
uint8_t a = 0x12;
uint16_t b = 0xa4;
uint32_t c = 0x2a5e7;
/* 3 */
uint32_t d = a + b + c;
return d;
/* 4 */
}
堆栈最初是空的(1):
[]
然后,推送三个变量(2):
[12]
[12, a4 00]
[12, a4 00, e7 a5 02 00]
第四个变量被赋予其他变量的总和并被推入堆栈(3):
[12, a4 00, e7 a5 02 00, 9d a6 02 00]
堆栈的尖端是返回值,并通过其他方式发送回函数调用者。每个临时堆栈变量都会在块(4)的末尾弹出,因为必须平衡推push/弹pop操作,以便堆栈始终返回其初始状态:
[12, a4 00, e7 a5 02 00]
[12, a4 00]
[12]
[]
脚本机器码
同样,比特币核心有自己的“虚拟处理器”来解释脚本机器码。脚本具有丰富的操作码,但与英特尔等完全成熟的CPU相比却非常有限。关于脚本的一些关键事实:
- 1.脚本不循环。
- 2.脚本总是终止。
- 3.脚本内存访问是基于堆栈的。
实际上,第1点也意味着第2点。第3点意味着在Script中没有像命名变量这样的东西,你只需在堆栈上进行计算。通常,你推送的堆栈项成为后续操作码的操作数。在脚本的末尾,顶部堆栈项是返回值。
在介绍现实世界的脚本之前,让我们先列举一些操作码。如需全套,请查看比特官方维基页面。
常量
以下操作码将数字0-16推入堆栈:
opcode | encoding |
---|---|
OP_0 | 00 |
OP_1-OP_16 | 51-60 |
按照惯例,OP_0
和OP_1
也表示布尔值OP_FALSE
(零)和OP_TRUE
(非零)。
例:
54 57 00 60
或者:
OP_4 OP_7 OP_0 OP_16
这是堆栈如何发展:
[]
[4]
[4, 7]
[4, 7, 0]
[4, 7, 0, 16]
返回值是最高项,因此脚本返回16。我知道,这是毫无意义的,但这是一个开始。
推送数据
提供了几个操作码来推送自定义数据。它们的操作数大小不同:
opcode | encoding | L (length) | D (data) |
---|---|---|---|
OP_PUSHDATA1 | 4c L D | 8-bit | L bytes |
OP_PUSHDATA2 | 4d L D | 16-bit | L bytes |
OP_PUSHDATA4 | 4e L D | 32-bit | L bytes |
例如,如果你的数据长度可以存储为8位数字,那么OP_PUSHDATA1
是你的最佳选择。看这个:
4c 14 11 06 03 55 04 8a
0c 70 3e 63 2e 31 26 30
24 06 6c 95 20 30
第一个字节显然是OP_PUSHDATA1
操作码,后面是1字节长度14,即十进制20.因此,接下来会有20个字节的数据。这条指令的作用是将这些数据压入堆栈:
[11 06 03 55 04 8a 0c 70
3e 63 2e 31 26 30 24 06
6c 95 20 30]
实际上,与varints一样,对于非常短的数据有一种特殊的编码。如果操作码位于01和4b(包括)之间,则它是一个推送数据操作,其中操作码本身是以字节为单位的长度:
opcode | encoding | L (length) | D (data) |
---|---|---|---|
L | L D | 01-4b | L bytes |
例如,在字符串中:
07 8f 49 b2 e2 ec 7c 44
操作码07意味着要推送7个字节的数据:
[8f 49 b2 e2 ec 7c 44]
区块链中的下一个块呢?
你学到了一些关于机器代码和操作码的知识。脚本是矿工软件理解的简单低级语言。使用堆栈内存跟踪脚本状态。
在下一篇文章中,我将向你展示操作代码,它不仅仅是推送数据。 如果你喜欢它,请分享这篇文章!
======================================================================
分享一些以太坊、EOS、比特币等区块链相关的交互式在线编程实战教程:
- java以太坊开发教程,主要是针对java和android程序员进行区块链以太坊开发的web3j详解。
- python以太坊,主要是针对python工程师使用web3.py进行区块链以太坊开发的详解。
- php以太坊,主要是介绍使用php进行智能合约开发交互,进行账号创建、交易、转账、代币开发以及过滤器和交易等内容。
- 以太坊入门教程,主要介绍智能合约与dapp应用开发,适合入门。
- 以太坊开发进阶教程,主要是介绍使用node.js、mongodb、区块链、ipfs实现去中心化电商DApp实战,适合进阶。
- C#以太坊,主要讲解如何使用C#开发基于.Net的以太坊应用,包括账户管理、状态与交易、智能合约开发与交互、过滤器和交易等。
- EOS教程,本课程帮助你快速入门EOS区块链去中心化应用的开发,内容涵盖EOS工具链、账户与钱包、发行代币、智能合约开发与部署、使用代码与智能合约交互等核心知识点,最后综合运用各知识点完成一个便签DApp的开发。
- java比特币开发教程,本课程面向初学者,内容即涵盖比特币的核心概念,例如区块链存储、去中心化共识机制、密钥与脚本、交易与UTXO等,同时也详细讲解如何在Java代码中集成比特币支持功能,例如创建地址、管理钱包、构造裸交易等,是Java工程师不可多得的比特币开发学习课程。
- php比特币开发教程,本课程面向初学者,内容即涵盖比特币的核心概念,例如区块链存储、去中心化共识机制、密钥与脚本、交易与UTXO等,同时也详细讲解如何在Php代码中集成比特币支持功能,例如创建地址、管理钱包、构造裸交易等,是Php工程师不可多得的比特币开发学习课程。
- tendermint区块链开发详解,本课程适合希望使用tendermint进行区块链开发的工程师,课程内容即包括tendermint应用开发模型中的核心概念,例如ABCI接口、默克尔树、多版本状态库等,也包括代币发行等丰富的实操代码,是go语言工程师快速入门区块链开发的最佳选择。
汇智网原创翻译,转载请标明出处。这里是原文比特币脚本语言