计算与存储重新合体?三统理论?真正的统一存储?且看冬瓜头给你大话合体!

存储和计算结合之后,是什么样的产品形态啊?计算,存储,都很牛叉的机器?
JIM GRAY,有一篇论文谈到,真正成本最高的地方在网络…我们也确实可以感觉到,在同步数据,或者做灾备的时候,最头疼的还是两个节点之间的通道有多大
       这里有个观点,叫做三统,哪三统呢?首先是集群的统一,大家知道目前有各种各样的集群,比如计算集群 、存储集群,存储集群中又分为汲取SAN、集群NAS、分布式文件系统、集群文件系统等,那么如此多样的集群,其本质无非就是一堆x86的节点,用某种网络连接起来,后面挂了大量磁盘的,他就是存储集群中的节点,拥有大量CPU和内存的,它就是计算节点,如果两者皆有,那就是统一集群了。为何计算与存储以前要分开呢?因为以前的DAS直连存储性能和容量均跟不上,而且是属于孤岛形态,必须要将其与计算分开独立发展,先发展为双控制器传统网络存储,此时计算与存储无法合体,但当外置存储发展到集群化形态之后,虽然其表像仍然是分的,但是其里面却是合的,对外合为一体的。此时,计算与存储集群经历了长久分开之后,也必将会重新合体,寻回其本源。大家可以看到这是一个轮回。如今,存储系统正在向集群化发展,而计算也是集群化,那么计算集群与存储集群就可以完美的被融合起来了,形分神合。这种形态也属于之前提过的“自助型存储集群”。除了主机集群与存储集群的合体之外,集群SAN与集群NAS其实也可以统一,目前很多厂商都推出了块虚拟化产品,它们的Lun在后端其实就是一个文件,可以被打散存放在底层磁盘各处。既然SAN设备底层都使用类文件系统来管理了,那么SAN与NAS的后端其实就已经被统一了,剩下的,就是前端访问协议的统一了(见下)。此外,集群硬件也将变为一个平台,其上的各种协议、应用,则变成了一种服务,比如SAN服务、NAS服务,而分布式文件系统则是集群NAS的支撑层,其本身与集群NAS属于一种本质上的东西。至此,集群硬件形态与上层软件充分解耦。
       其次是访问协议的统一。既然集群已经变为一个通用集群,那么访问这个集群的方式也应该被融合。上文中曾经提到过,文件与块的本质其实是一样的,只是组织与访问方式不同罢了。如今块虚拟化的存储系统比比皆是,它们无一例外都将Lun像一个文件一样来对待,恨不得直接在纯种文件系统中用文件虚拟出一个Lun来岂不快哉?既然这样,底层其实是被文件系统给统一了,那么外围的访问方式上,也应该被统一。本质上讲,不管是块还是文件,其实它们都用同一种协议访问:操作码、目标、起始偏移、长度。对于块访问,目标就是Lun ID,而对于文件,目标就是某路径,比如/a/b/c.txt,那么是否有一种东西来屏蔽目标的不同呢?其实早就有这种协议,说到这里大家可能就悟到了,这就是对象存储系统,对象存储协议就是将文件与块访问大统一的最佳候选协议了,只要时机成熟,文件、块大统一的访问方式必将席卷存储技术领域。块与文件这两种访问协议分开太久了,有合的趋势与欲望,底层技术也很给力。其实对象存储协议早在上世纪80年代就被提出了,时隔30年,如今终于有了用武之地,就是利用对象协议,可以将文件与块的访问完美的融合统一起来。如果真的可以用对象存储做到统一,那么主机端会出现一种新的HBA,即OSD HBA,其将OSD Initiator集成到硬件中,存储对象既可以表现为一个目录,又可以表现为一个卷。
       最后,就是网络的统一。不管第一网第二网还是第三网(分别指代前端业务LAN,中间的存储SAN以及后面的集群通信网),如果有一种网络可以同时满足需求,那么为何不统一呢?比如以太网。
       做到这三统,这才是真正的统一存储,而不是同一个机头同时出块和文件协议,这就叫统一存储?噱头而已,看似统一,实则意义不是很大。
       再说回来,这种统一之后到底是个什么牛x机器?答案是不是单独的机器,就是一群机器,通过软件模块联系起来,对于计算机来讲,硬件属于物质本源,属于阴,属于形;软件则属于精神本源,属于阳,属于神。用软件模块将计算和存储颗粒汇总起来发挥作用,并且将原本的以计算为中心的计算方法变为以存储为中心的计算方法,把计算颗粒分配到存储了计算所需要的数据的节点上,在哪存储就在哪计算,大幅提高效率和速度,避免了频繁大量数据传输,这也回答了你的另外一个问题“成本最高的是在网络上”,其实这句话暗指,数据移动起来成本太高了。网络本身成本不高。但是如果要容灾,依然可以使用这个思想,即在哪存储就在哪计算,可以在业务层面进行双份,而不是数据层面,比如一笔交易,可以在业务层面将其同步到远端,远端针对这笔交易生成自己的数据然后下盘,一个实际例子比如数据库日志同步方式的容灾,同步量相比直接底层数据同步来的少很多。
       你说的那种“计算与存储都很牛x的机器”,也不是没有,但是还不到时候,到了量子计算和分子存储时代,那时候计算机形态又会轮回到初始原点状态,单台机器,确实很牛x,大家都拿高速网络来连接到这台超级计算机上获取资源
       最后,预知详情,请阅将在明年3月出版的逼人专著《大话存储2》

你可能感兴趣的:(职场,计算,存储,休闲,合体,三统)