原创:市后诸葛
区块链如果获得大范围应用后,存储是刚需,这一点毋庸置疑。如果从透明、公开、可查询这个特性看,区块链上面的信息明文存储即可达到要求。但如果就隐私保护、防泄露等方面,区块链上面的信息是需要加密的。
区块链技术之所以能被人们从BTC网络中抽离出来,是因为区块链技术在某种程度上可以取代第三方,成为了真正的信任机器。而这种信任机器的运转前提,就是一切数据透明、可查询、无法篡改。
从这个角度来说,区块链上数据的存储,公开透明可查询是第一位的。如果某一条链上的数据是不可查询的,那这条链会被遗弃。所以,在这个地方区块链存储采用明文存储是必须的,也是必然的。
由于要保留这条链上的所有信息,带来的直接后果就是:这条链上沉淀的数据越来越大,直到让这个链臃肿不堪。此外由于链上只能存储少量数据,这就极大的限制了区块链与实际场景的应用结合。
对于链上数据的臃肿,有人提出可以对那些过往无意义的信息(如2年前的转账记录),通过压缩裁剪的方法减少数据量;也有人提出,可以直接将这些链上的数据转移至链下存储,来减少链上的存储负担。
即便将链上数据转移至链下存储,也是需要这些数据为明文可查,最重要的是这些数据需要永久保留、无法篡改。可是任何存储都是需要成本的,更何况永久存储呢?而且对于某些信息,一旦写入就无法删除,如果是反社会反人类的信息,这种不可篡改的特性也未必是什么好事。
但仅就从存储的角度来说,对信息的保密又何尝不是刚需?哪个机构会将自己的所有数据大白于天下?所以,一旦涉及到区块链的实际应用,对数据存储的加密也就成了基础需求。
如果说传统存储(如谷歌、亚马逊、阿里云、腾讯云等),用户可以依靠这些存储方的品牌信用,来相信他们不会故意泄露数据,那么在去中心化分布式存储里面,谁又能提供这种信用保护呢?
有人说,可以通过抵押、罚没机制,来对存储节点“泄露数据”进行惩罚。这种情况就要看惩罚的成本与存储的价值了。如果存储的信息价值1000元,而你罚没只有1元,又有什么用呢?而且在分布式存储里面,你的罚没机制不可能太重。因为如果你抵押的门槛太高,就没有人接入这个系统了。
所以有人说,区块链存储=分布式存储+分布式加密+区块链激励。只有这三位一体,才是真正的区块链存储。大道理谁都会讲,但真正将其落地应用,并被现实生活所接受,是完全两码事。
区块链(分布式)存储,之所以比中心化存储更可靠,是因为分布式存储的冗余数据更多。但冗余数据太多,最直接的结果就是:区块链存储的成本要比中心化存储成本高的多。如果是数据线下存储,没有支付费用的话,是没人有义务永久存储这个数据的。
也就是说,线下存储的数据是可以被删除的。如果不想被删除也可以,有人支付存储的成本就行。那种希望将个人存储器(个人电脑、手机等)纳入到区块链存储中,依靠所谓的闲置资源,利用共享经济来不断堆砌闲置存储资源,降低存储成本的做法,其实并不可行。
因为,任何数据的大规模是商用,对存储设备都是有专业要求的。如果你作为一个公司的领导,如果你的IT主管告诉你,公司的信息都存在各种个人电脑、个人手机上,即便告诉你这些存储是免费的,你大概率也不会用。
存储设备的可靠性不够,即便你接入了1000万台闲置的手机、个人电脑内存又能如何?除了发个币,炒炒概念,割割韭菜之外,终究结果还是一地鸡毛。更何况,在你的手机、个人电脑上存储这些乱七八糟(有可能带木马病毒)的东西,你也未必会愿意?
所以真正可以为商用数据提供存储资源的提供方,注定是那些生产专业存储设备的传统厂商,以及传统提供存储服务的服务商。如果只是吸纳这些专业的存储资源提供方,一条联盟链就可以解决这个问题了,何需什么公链,何需什么共识机制呢?
对于分布式存储冗余成本过高的问题,有人提到可以通过信息分段,即将一个完整信息切分成n个片段,当使用的时候对N个片段再转译成完整文件。从而让整个系统只保留一个账本,而非一个账本多副本的方式,来降低存储成本。
简单说,如果信息分片之后,BTC的每个节点不需要再备份整个账本了,只需要备份其中的某些片段,然后整个网络的节点在使用的时候,可以拼接成完整账本即可。这也是目前Filecoin以及其他区块链存储项目想干的事情——为整个区块链网络提供存储层。
这里面有个最基本的悖论,谁来为存储付钱。如果是BTC这种POW机制的网络,由于无法做到信息最终性(6个区块确认后才能敲定),这种动态信息切割是非常困难的。如果是Eos这种POS网络机制,可以即时确认,那么最终承担存储成本的只能是那些节点。
也就是说,虽然同样是存储,但由于各自存储的信息不同,价值不同,区块链存储最终的解决方案很有可能还是谁的孩子谁抱走,谁的数据谁存储,谁来存储谁花钱。如此一来,那些希望成为所有区块链存储层的项目来说,终究是黄粱一梦。
即便上述问题解决了,依旧无法解决区块链大规模商用的问题。因为一旦涉及商用,数据量会激增,仅仅靠十几二十个节点来存储是不现实的。而且,数据一旦涉及商用,隐私性要求就随之而来。
在中心化存储中,用户可以相信亚马逊、阿里云这些服务商,他们不会对用户数据进行泄密,但如果放到无人看管,随时可接入可退出的分布式网络中,明文存储的结果就是让信息更容易暴露。
这也是很多区块链存储项目,不看好IPFS这种明文存储的原因之一。而如果对这些分段信息加密,如果配合不上加密后去重(删除重复片段),那也只能增加存储成本。当然,现在有人宣传可以实现“加密后去重”,但那个项目的项目方,以及代币分配机制,注定那不是一个靠社区推动的项目。而单凭一个加密后去重技术,也无法支撑那个项目(公司)如此高的估值。
即便有了加密去重技术,区块链存储就可以降低存储成本了吗?这个思路似乎给了区块链存储项目超越阿里云、腾讯云这种中心化存储服务商的机会。但是你可以联合小舢板,攒鸡毛凑掸子,这些巨头不会吗?他们如果发起联盟链,其影响力要比小舢板的力量大的多。
对于商用企业来说,想让他们将中心化存储数据迁移到区块链存储中,不仅需要存储成本比中心化更低,性能更加稳定可靠,而且还需要存储成本的持续可控。毕竟没有哪个商用企业,愿意看到今天存个文件要1块钱,下个月存个文件要100块钱这种事情的发生。
反言之,区块链存储的服务费用,对商用企业来说,他们更愿意通过稳定的法币(稳定币)来结算,而不是各种币种飘忽不定的代币来结算。如果区块链存储项目的代币,未来是和稳定币合流,那这样的公链还真未必会有联盟链做的更好。
对于区块链经济激励来说,难道只能发币才能激励吗?对于存储服务,谁存储谁付钱,直接用现实生活中的法币结算,难道不可以吗?能用联盟链解决的问题,为何非要发币来割韭菜呢?在人类历史上,还没有什么信息是需要永久存储,且有人愿意为永久存储永久付费的信息。