横向,还是纵向?
 
两个月前,EMC公司存储部门总裁唐纳特利(David A. Donatelli)访华的时候,笔者问了这样一个问题:中高端存储市场上,已经出现了以IBM XIV和3PAR InServ T系列为代表的横向扩展(scale out)系统,而Symmetrix DMX-4仍属于纵向扩展(scale-up)系统,(不可分割的)单一系统能支持的驱动器数量多达2400个。传说中的DMX-5,还会向这个方向发展吗?将单一系统越做越大?
 
唐纳特利没有正面回答,而是说,Symmetrix DMX起初支持288个驱动器,现在已经达到2400个,而CLARiiON CX4也有960个,可以看到还是在持续不断越做越大的趋势。
 
更大,还是更小?
如果按照上面的逻辑,那么,EMC今天发布的新一代旗舰存储系统 ——Symmetrix V-Max,之前似乎就不宜有“Tigon”(虎狮兽)这样的代号,而是“Liger”(狮虎兽)更为合适些——因为虎狮兽的体型比双亲都要小,狮虎兽的体型则比双亲都要大。
EMC Symmetrix V-Max:革命者?集大成者?_第1张图片
Symmetrix V-Max不仅内部架构脱胎换骨,外部包装(前面板)也改头换面
Symmetrix V-Max能够提供2PB以上的容量,号称三倍于DMX-4。但是,这应该归功于采用的硬盘驱动器容量更大,支持的驱动器总数仍然是2400个,并没有增加。
 
不过,没有变大,可也没有变小啊?在某种程度上,V-Max还真的是变小了。
 
杂交:合“纵”连“横”
 
V-Max的最小驱动器配置是48个,对于DMX-4来说,这近乎于扯淡。三大高端存储系统家族——Symmetrix DMX、日立USP和IBM DS8000,虽然具体的设计不同,但都属于传统的单体式(Monolithic)架构,只能纵向扩展(scale-up)。企业级纵向扩展存储系统也可以提供大规模并行,但是需要用户采购一个大系统,在保证更多的在线容量前,要逐步添加磁盘驱动器,又涉及到电力、冷却及占地空间的成本问题。这意味着采用纵向扩展系统,企业一开始就需要大量的资金投入,并规划好未来三到五年的需求。花百万美金买回具有上千个槽位的高端存储系统,却只配48个驱动器,意味着巨大的浪费。
当然,笔者并不是说,购买48个驱动器配置的存储系统,就不是高端用户了。Web 2.0等新兴应用的用户,起点可能不高,但数据量增长极快,同时对存储性能也有很高的要求,他们不希望初始投资太大,可以按需购买的横向扩展(scale out)存储系统更符合条件。云计算和虚拟数据中心对存储系统的扩展能力也提出了更高的要求,而经济危机的环境亦将迫使一些传统的大型客户转而考虑不需要一次性大量投资的横向扩展系统。
 
EMC Symmetrix V-Max:革命者?集大成者?_第2张图片
Symmetrix DMX的直连矩阵架构,看着就眼晕
Symmetrix DMX以其每个部件之间都有直接连接的Direct Matrix(直连矩阵)架构而得名,该架构的物理限制意味着扩展背板的尝试昂贵而复杂,难以实现横向扩展。因此,新一代的Symmetrix放弃了直连矩阵架构,自然也就不能叫“DMX-5”了。
EMC Symmetrix V-Max:革命者?集大成者?_第3张图片
Symmetrix V-Max的虚拟矩阵架构
V-Max代表Virtual Matrix(虚拟矩阵)架构,其构成元素是V-Max引擎。每个V-Max引擎有自己的CPU、全局内存(128GB)、前端(主机)和后端(驱动器)I/O接口,通过基于RapidIO的虚拟矩阵连接和共享资源,其中任何一个引擎都可以24GB/s的虚拟矩阵带宽与其他引擎通信。用户起初可以采用1个引擎,之后最多能增加至8个,灵活性比DMX-4有明显的提高。如果说直连矩阵架构的矩阵存在于(单体式)存储系统内部,那么虚拟矩阵架构的矩阵就位于存储子系统(V-Max引擎)之间,将整个系统的复杂度交给了RapidIO。
EMC Symmetrix V-Max:革命者?集大成者?_第4张图片
左上方是传统高端存储系统的单体式架构(DMX更为复杂,如上一幅图),左下方是中端存储系统的模块式架构,右侧是3PAR的InSpire架构,Symmetrix V-Max的虚拟矩阵架构与之类似
虚拟矩阵架构看起来很像3PAR以具备横向扩展能力著称的InSpire架构——2-8个控制器节点形成网状拓扑,节点数目可以在这个范围里自由增减,达成容量和性能的伸缩。很难说EMC是否受到了InSpire架构的启发,至少在具体实现上,两者肯定是不同的。作为RapidIO商业协会的成员,RapidIO是EMC的一大法宝,即使多个V-Max引擎间距离100米远也同样可以高速低延迟地互相通信。EMC还宣称,在之后发布的产品版本中,V-Max引擎将有更高的扩展性——最高可支持上百个的互联。
EMC Symmetrix V-Max:革命者?集大成者?_第5张图片
EMC公司存储部门总裁David A. Donatelli表示,虚拟矩阵架构未来可支持多达240个V-Max引擎互联,组成跨数据中心的“联邦系统”(Federate Systems
Symmetrix V-Max的另一优势是还保留了一定的纵向扩展能力。同样是8个控制器节点或V-Max引擎的配置,3PAR InServ T800最多支持1280个驱动器,刚刚超过Symmetrix V-Max的一半,这应归功于单个V-Max引擎比InServ T系列控制器节点更强的纵向扩展能力。难怪EMC自豪地宣称,这是首个将纵向扩展架构的性能和效率与横向扩展架构的成本效率和灵活性结合起来的存储架构。
 
绝对八卦:如果我们将Tigon这个代号的重点放在“杂交”上,那么,Symmetrix V-Max便可以看作是纵向扩展与横向扩展的“杂交”——独自生活的虎代表纵向扩展,群居的狮代表横向扩展……虎在狮之前,而非狮在虎之前
 
至强与V-Max的双赢
 
作为各自领域内的老大,EMC与英特尔(Intel)的合作由来已久。但正如英特尔公司总裁兼首席执行官保罗•欧德宁(Paul Otellini)所说,“今天的发布将我们的合作带到一个新的高度”——因为EMC转向了英特尔至强(Xeon)处理器。
 
我们知道,Symmetrix DMX-3采用了130个1.3GHz的PowerPC处理器,而Symmetrix V-Max则具有128个处理器内核。看起来数字基本相当,但V-Max的128个处理器内核来自于32个2.3GHz四核至强处理器,极大地简化了系统的设计——分散到每个V-Max引擎上,只有4个处理器,设计难度比一台四路四核的工业标准服务器高不了太多,与在一个直连矩阵架构里面容纳130个PowerPC处理器不可同日而语。
 
看来,经过多年的努力之后,IA架构已逐渐在中高端存储系统中开花结果——3PAR上周发布的InServ F系列也采用了2.3GHz四核至强处理器。
 
从ILM到FAST
 
众所周知,正是在EMC的力捧之下,ILM(信息生命周期管理)成为被广为接受的理念。但是,在自动分层存储的技术上,却是3PAR和Compellent等厂商走在了前面。尤其是Compellent,不仅能够自动分层存储,而且粒度达到了块级,可以根据策略将访问频度较低的数据块自动迁移到廉价的SATA硬盘驱动器上,而将频繁访问的数据块保留或迁移到高速的SAS硬盘驱动器乃至固态盘(SSD)上。
 
为了充分发挥Symmetrix V-Max的效能,EMC今天也发布了简称为FAST(Fully Automated Storage Tiering)的全自动存储分层技术,可以根据业务策略、预测模型和实时访问情况跨越多个存储层自动移动数据,从而充分发挥企业级闪存驱动器(EFD)的性能,并利用SATA硬盘驱动器在容量和成本上的优势。
 
不过,FAST技术要到今年晚些时候才能在Symmetrix V-Max中证明自己的能力。
 
集大成的革命者
 
从横向扩展的外部架构,到以IA为代表的工业标准组件为主体的内部架构,乃至自动分层存储的软件功能,都不是Symmetrix V-Max最先导入市场的技术,从各个局部的角度来看,它是个集大成者。但是,与高端存储市场上之前的产品相比,Symmetrix V-Max作为一个整体,确实取得了革命性的突破,也为HDS和IBM树立了需要努力超越的标杆。