以太坊最大的优势就是,每一笔用来转账、部署合约或者和合约交互的交易(事务)都被存在一个叫做区块链的公共账本上。一旦交易发生,就再也无法隐藏或者改变。这带来一个巨大的好处,就是在以太坊中的每一个节点都可以去验证任意一笔交易的合法性和当前状态。这使得以太坊成为一个非常健壮的去中心化系统。
但是随之而来的是,它还有一个最大的缺点,就是智能合约一旦部署之后,就再也无法改变源码。开发中心化应用(比如facebook或者Airbnb)的开发者,都已经习惯了,为了修复bug或者引入新的特性而频繁更新产品。但这种方式却不适用以太坊。
还记得当面Parity多签名钱包被黑导致150000以太币被偷的恶劣事件吗?在整个攻击中,就因为钱包中的一个bug导致很多巨额钱包的资金被清空。而唯一的解决方案就是尝试以比黑客更快的速度,利用相同的漏洞攻击剩余的钱包,来把以太币重新分配给它们合法的所有者。
要是有一种方法可以在智能合约部署之后,还能对它们进行升级,那该多好…
尽管想升级已经部署的智能合约中的代码是不可能的,但是可以通过设计一个代理合约结构,这个结构可以让你可以通过新部署一个合约的方式,来实现升级主要的处理逻辑的目的。
代理结构模式就像下面这张图一样:所有消息通过一个代理合约来间接调用最新部署的逻辑合约。如果想要升级的话,只需要部署一个新的合约,然后在代理合约中更新引用新的合约地址就可以了。
作为实现zeppelin_os的一部分,zeppelin正致力于实现集中代理模式。目前已经探索出来的有下面三个:
Inherited Storage
Eternal Storage
Unstructured Storage
所有三种模式都依赖低阶的delegatecall。尽管solidity提供了一个delegatecall方法,但它只能返回true或者false来显示调用是否成功,而不是允许你操作返回的数据。
在我们深入了解之前,理解两个关键的概念很重要:
msg.value
和msg.sender
的值会被保留。并且对存储的修改将会作用在合约A的存储上。zeppelin的代理合约,为了可以返回调用逻辑合约后的结果,实现了自己的delegatecall方法,所有模式都是这样。如果你想要使用zeppelin的代理合约代码,你就要理解代码的每一个细节。让我们先来看看它是如何发挥作用的,以及理解为了达到目的它所使用的assembly操作码。
assembly {
let ptr := mload(0x40)
calldatacopy(ptr, 0, calldatasize)
let result := delegatecall(gas, _impl, ptr, calldatasize, 0, 0)
let size := returndatasize
returndatacopy(ptr, 0, size)
switch result
case 0 { revert(ptr, size) }
default { return(ptr, size) }
}
为了授权对另一个合约中方法的调用,我们需要把它赋值给proxy合约接收的msg.data
。因为msg.data
是bytes
类型的,是一个动态的数据结构,所以它在msg.data
的第一个字(word
,也就是32个字节)中的存储长度会不一样。如果我们想要只取出真正的数据,我们需要跳过第一个字(word
),从msg.data
的0x20
(32个字节)开始。然而,我们会用到两个操作码来实现此目的。我们会使用calldatasize
来获取msg.data
的大小,以及calldatacopy
来把它复制到ptr
所指向的位置。
注意到我们是如何初始化ptr
变量的。在solidity中,内存槽中的0x40
位置是和特殊的,因为它存储了指向下一个可用自由内存的指针。每次当你想往内存里存储一个变量时,你都要检查存储在0x40
的值。这就是你变量即将存放的位置。现在我们知道了我们要在哪儿存变量,我们就可以使用calldatacopy
,把大小为calldatasize
的calldata从0开始啊复制到ptr
指向的那个位置了。
let ptr := mload(0x40)
calldatacopy(ptr, 0, calldatasize)
我们再看看下面的assembly代码(使用delegatecall
操作码)
let result := delegatecall(gas, _impl, ptr, calldatasize, 0, 0)
解释一下上面的参数:
gas
:函数执行所需的gas_impl
:我们调用的逻辑合约的地址ptr
:内存指针(指向数据开始存储的地方)calldatasize
:传入的数据大小0
:调用逻辑合约后的返回值。我们没有使用这个参数因为我们还不知道返回值的大小,所以不能把它赋值给一个变量。我们可以后面可以进一步使用returndata
操作码来获取这些信息。0
:返回值的大小。这个参数也没有被使用因为我们没有机会创造一个临时变量用来存储返回值。鉴于我们在调用其他合约之前无法知道它的大小(所以就无法创造临时变量呀)。我们稍后可以用returndatasize
操作码来得到这个值。下面一行代码就是用returndatasize
操作码得到了返回数据的大小:
let size := returndatasize
我们使用这个返回值的大小,来把返回值复制到ptr
指向的内存,使用returndatacopy
来达到这个目的:
returndatacopy(ptr, 0, size)
最后,switch
语句要么返回 【返回值】,要么抛出错误,如果发生错误的话。
很好,我们现在有了一个从逻辑合约中获取正确结果的方法。
现在,我们理解了代理合约是如何工作的。下面就让我们正式学习三种模式:继承存储模式、永久存储模式和非结构化存储模式。
这三种方法用不同的方法来解决同一个难点:怎样确保逻辑合约不会重写/覆盖代理中的状态变量。
任何代理结构模式的主要问题就是如何分配存储。记住,既然我们使用一个合约来存储,另一个合约来实现逻辑,它们中的任何一个都有可能重写一个已经使用的存储槽。这意味着如果代理合约有一个状态变量在某个存储槽中存储着最新的逻辑合约地址,但是逻辑合约却不知道的话,那么逻辑合约可能就会在那个槽中存一些其他数据,这样就把代理合约中的重要信息覆盖了。zeppelin的这三种方法代表了架构合约系统的三种途径,实现通过代理模式升级合约的目的。
继承存储方法要求逻辑合约内部也实现代理合约内的存储结构。代理合约和逻辑合约都要继承完全一样的存储结构,来确保二者都支持存储必要的代理合约的状态变量。
当探索这种模式时,我们有这样一个想法,我们想要有一个Registry
合约来追踪不同版本的逻辑合约。 为了升级成新的逻辑合约,你需要为它在Registry
里注册一个新的版本,并且要求代理合约中也升级成这个最新版本的逻辑合约。注意到有一个Registry
合约并不影响存储机制,实际上,它可以应用到这篇文章中提到的任意一种存储模式中。
Registry
合约Upgradeable
合约Registry
合约中注册这个最初版本(V1)的地址Registry
合约创建一个UpgradeabilityProxy
实例UpgrageabilityProxy
实例来升级到你最初版本(V1)Registry
中注册合约的新版本UpgradeabilityProxy
实例来升级到最新注册的版本我们可以在未来部署的逻辑合约中升级现有方法、创造新的方法以及新的状态变量,但仍然调用同一个UpgradeabilityProxy
合约。
在永久存储模式中,存储模式用一个独立的合约(代理和逻辑合约都要继承这个合约)来定义。这个存储合约保留了所有逻辑合约需要的状态变量,因为代理合约也会知道这些变量的存在(因为继承),它就可以为升级定义自己的状态变量,不用考虑覆盖变量这些问题。注意到所有的版本的逻辑合约都不可以再定义任何额外的状态变量。所有版本的逻辑合约都必须一直使用一开始就定义好的永久存储架构。
这种应用在zeppelin labs项目中提供了实现,并且同时引入了代理所有权的概念。一个代理的所有者是唯一一个可以升级代理并指定一个新的逻辑合约的地址,也是唯一一个可以转移所有权的地址。
EternalStorageProxy
实例EternalStorageProxy
实例来升级到这个最初版本合约的地址EternalStorageProxy
有一个叫upgradeToAndCall
的函数专门来调用一些逻辑合约中的方法,一旦代理合约升级到最新版本时,就把连接到的那个逻辑合约里的初始设置重新设置一遍。EternalStorageProxy
实例来升级到最新版本。这是没有增加太多开销同时很直观的逻辑合约。 以后的逻辑合约可以升级现有的方法或者创造新的方法,但是不能引入新的状态变量。
非结构化存储模式和继承存储类似,但是不要求逻辑合约继承任何和升级相关的状态变量。这个模式使用代理合约中定义的非结构化的存储槽来保存升级所需的数据。
在代理合约中,我们定义了一个常量,每当哈希的时候,就给出一个足够随机的存储位置来存储代理合约需要调用的逻辑合约的地址。
bytes32 private constant implementationPosition =
keccak256("org.zeppelinos.proxy.implementation");
因为常量(恒定)状态变量并不占用存储槽,所以并不用担心implementationPosition
会不小心被逻辑合约占用。鉴于solidity在存储中放置状态变量的方法,依然有非常非常非常小的概率可能发生要存储新变量的存储槽已经被占用了。
通过使用这种模式,任何版本的逻辑合约都不需要知道代理合约的存储结构,但是所有后一个版本的逻辑合约都必须继承上一个版本的存储变量。就像在继承存储模式中一样,未来的逻辑合约可以更新现有的方法,也可以创建新的方法和新的状态变量。
这个模式也使用了代理合约所有权的概念。只有代理合约的所有者可以更新逻辑合约的地址,也是唯一可以转移所有权的地址。
OwnedUpgradeabilityProxy
实例OwnedUpgradeabilityProxy
实例来更新到初始版本的逻辑合约OwnedUpgradeabilityProxy
有一个upgradeToAndCall
方法专门来调用一些逻辑合约中的方法,一旦代理合约升级到最新版本时,就把连接到的那个逻辑合约里的初始设置重新设置一遍。ownedUpgradeabilityProxy
实例来升级到新版本合约的地址。这个方法很棒,因为它不需要逻辑合约知道它是整个代理系统的一部分。
重要:如果你的逻辑合约依赖自己的构造器来设置一些初始状态的话,这个过程在新版本的逻辑合约注册到代理中时需要重新做一遍。举个例子,逻辑合约继承Zeppelin中的Ownable
合约,这很常见。当你的逻辑合约继承Ownable
,它也就继承了Ownable
的构造器,构造器会在合约创建的时候就设置合约的所有者是谁。当你让代理合约来使用你的逻辑合约的时候,代理合约是不知道逻辑合约的所有者是谁的。
升级代理合约的一种常见的模式就代理立即对逻辑合约调用一个初始化方法。这个初始化方法应该去模仿在构造器中做的一些事情。同时你也想要一个标识,用来确保你不可以再次对同一个逻辑合约调用初始化方法。(只能调用一次)
你的逻辑合约看上去可能像下面这样:
contract Token is Ownable {
...
bool internal _initialized;
function initialize(address owner) public {
require(!_initialized);
setOwner(owner);
_initialized = true;
}
...
}
当然这取决于你的部署策略,你可以写一个帮助部署的合约,或者你可以可以单独部署代理合约和逻辑合约。如果你单独部署的话,你需要使用upgradeToAndCall
把代理合约链接到逻辑合约上,这看上去就会像下面这样:
const initializeData = encodeCall('initialize', ['address'], [tokenOwner])
await proxy.upgradeToAndCall(logicContract.address, initializeData, { from: proxyOwner })
代理模式的概念已经出来有一段时间了,但是由于太复杂了、害怕引入安全漏洞以及绕过了区块链不可变的特性,它还没有被广泛接受。过去的解决方法在关于未来版本的逻辑合约可以添加和修改的东西上有严格的限制,这很不灵活。但是很显然,开发者对于可升级合约的需求很迫切。zeppelin提供并且测试了三种模式,他们致力于帮助开发者架构自己的项目,引入可升级特性。
尽管代理模式的概念出来也有段时间了,但是它的应用依然处在非常早期。很开心看到越来越多的高级DApp架构通过这种方式得以实现。