#前言
以太坊是一个运行智能合约的平台,被称作可编程的区块链,允许用户将编写的智能合约部署在区块链上运行。而运行合约的主体便是以太坊虚拟机(EVM)
#####区块 交易 合约
区块链由区块(Block)组成,而区块中打包一定数量的交易(Transaction),交易可能是一个单纯的转账操作,也可能是调用一个智能合约,无论是哪一种,EVM在运行(excute)交易时都会创建合约(Contract)
#####外部账户 合约账户
以太坊中的账户有两类
#交易执行
以太坊是一个基于交易的状态机,一笔交易可以使以太坊从一个状态(state)切换到另一个状态,即交易的执行伴随着状态的改变。
交易执行的入口在 core/state_processor.go 的 **Process()**方法,下面是该方法的轮廓
func (p *StateProcessor) Process(block *types.Block, statedb *state.StateDB, cfg vm.Config) (types.Receipts,[]*types.Log,uint64,error) {
......
var (
usedGas = new(uint)
header = block.Header()
gp = new(GasPool).AddGas(block.GasLimit())
)
for i, tx := range block.Transactions() {
receipt, _, _ := ApplyTransaction(p.config, p.bc, nil, gp, statedb, header, tx, usedGas, cfg)
receipts = append(receipts, receipt)
allLogs = append(allLogs, receipt.Logs...)
}
p.engine.Finalize(p.bc. header, statedb, block.Transactions(), block.Uncles(), receipts)
......
}
Process()方法对block中的每个交易tx
调用ApplyTransaction()来执行交易,入参state存储了各个账户的信息,如账户余额、合约代码(仅对合约账户而言),我们姑且将其理解为一个内存中的数据库。其中每个账户以state object表示
**ApplyTransaction()**方法完成以下功能
core.Message
其实现就是将tx
中的一些字段存入Message
以及从tx
的数字签名中反解出tx
的sender,重点关注其中的data 字段:对普通转账交易,该字段为空,对创建一个新的合约,该字段为新的合约的代码,对执行一个已经在区块链上存在的合约,该参数为合约代码的输入参数vm.Context
。注意其中的Coinbase字段填入的矿工的地址,Transfer
是具体的转账方法,其实就是操作sender和recipient的账户余额EVM
,它主要作用是汇集之前的信息以及创建一个代码解释器(Interpreter),这个解释器之后会用来解释并执行合约代码**ApplyMessage()的顶层比较简单,它创建一个StateTransition
结构并调用其TransitionDb()**方法,StateTransition
表示一次以太访的状态转移 其定义如下:
type StateTransition struct {
gp *GasPool
msg Message
gas uint64
gasPrice *big,Int
initialGas uint64
value *big.Int
data []byte
state vm.StateDB
evm *vm.EVM
}
其中的字段都是之前**ApplyTransaction()**方法中创建的结构得到。一次状态转移包括以下流程
ETH
(反映在stateDB),扣除的数量却决于交易设定的gasPrice和gasLimit的乘积,单位是gwei
。ETH
从sender账户发送到receipt账户,如果创建了合约,还要执行合约代码**TransitionDB()**完成这样的状态转换,其实现流程如下:
最终由交易的receipt是否为空决定是使用evm.Create()还是evm.Call(),无论是哪种,最终都是创建一个Contract
结构,然后调用run()方法运行之。注意,即使是外部账户之间普通的转账也会调用Call() 和 run(),只是由于receipt上没有代码,运行会很快结束而已。**run()最终调用Interpreter
的Run()**方法。
前面提到过,在调用**NewEVM()**时创建了一个解释器(Interpreter)
func NewInterpreter(evm *EVM,cfg Config) *Interpreter {
switch {
case evm.ChainConfig().IsConstantinople(evm.BlockNumber):
cfg.JumpTable = constantinopleInstructionSet
case evm.ChainConfig().IsByzantium(evm.BlockNumber):
cfg.JumpTable = byzantiumInstructionSet
case evm.ChainConfig().IsHomestead(evm.BlockNumber):
cfg.JumpTable = homesteadInstructionSet
default:
cfg.JumpTable = fromtierInstructionSet
}
return &Interpreter{
evm: evm,
cfg: cfg,
......
}
}
根据当前Block的高度,计算出它处于以太坊演进的阶段,得到该阶段支持的指令集(InstructionSet),新的阶段在兼容老的阶段的所有指令前提下,再增加了独特的新指令。最终存储在Interpreter
的cfg字段
合约代码本质上上是由Solidity
语言编译后形成的EVM字节码,字节码中的操作也正是指令集中定义的指令
再回到**Run()**方法,其大概流程如下
EVM
逐字节的解析合约代码并调用excute()方法运行,直到运行完成或者gas提前耗尽。
关于具体的EVM
指令解释方式和虚拟机内部栈和内存等内部实现,参考本系列文章
#小结