缘起VNXe
存储巨头EMC最近发布了Clariion和Celerra联合整容之后的VNX以及里程碑VNXe产品,对这两个系列的产品的规格细节功能等就不再做过多介绍了。VNX系列基本上就是新瓶装旧酒,虽然号称“下一代统一存储”,实则奉行不独不统的原则,前端NAS机头与后端SAN机头仍然保持暧昧关系,而这之前,NAS机头被统称为Celerra系列,SAN机头则被统称为Clariion系列。
EMC虽然弄出了个VNX名称把大家忽悠了一下,而且也取得了SPEC SFS2008的顶级成绩,对于其使用了数SSD加上8个独立机头来拼搭出这种惊人成绩,请保持淡定,“Just For Fun”。如果查看用总成绩除以8之后得出的数字,你会发现确实也不怎么惊人,单台NAS头跑6万的IO这个成绩在当今用Intel CPU+DDR3内存+SAS2.0的普遍时代已经是家常便饭。
这次实际要引出的,则是VNXe系列。用“fire in the hole”来形容是恰到好处。EMC往IBM、HP、Dell的坑里扔了一颗雷,不到一万美金就能买个便宜实惠好用的一体化存储回来,囊括了基本的软件功能比如Thin、Dedup、Compression、Snapshot、iSCSI、CIFS、NFS等,还带了硬盘。这种形态的一体化存储对于SMB来讲是很受欢迎的。
SMB的需求
在此我们提出两个问题发散思考:
1、SMB除了SAN/NAS统一存储之外还有其他迫切需求么?
2、EMC的VNXe的下一代形态会是什么样?
第一个问题。SMB一般是又想用像样的东西但是又没钱,尤其是占大部分的对IT重视度不足的小企业,由于IT部门不是直接创造价值的,所以预算极度有限。这种压力之下,用最少的钱做最多的事情是一个迫切需求,比如能否少买服务器,以更低的价格购买Exchange Server和SQL Server软件或各种OA软件等。
第二个问题。首先看一下VNXe现在是什么形态。外部形态:双控互备。内部形态(推测):每控制器跑了5个虚拟机(据可靠消息透露),鉴于EMC与VMware的关系,以及VMware在HA方面的强悍表现,推测Hypervisor使用的就是VMware构建。如图所示,每个控制器运行了2个Flare操作系统的虚拟机,其中一个用于处理本控制器的IO,另外一个则作为对对方控制器上主Flare虚拟机的备份机,一旦对方控制器硬件故障、掉电等,那么本地控制器的备份Flare虚拟机就会挂起对方控制器原来的后端资源从而继续提供服务。同样,对于DART虚拟机也是这种工作模式。还有一个Control Station虚拟机。DART会从内部使用虚拟的HBA来挂载经由Flare提供的Lun,从而提供NAS服务,Block服务则直接从Flare中提供。
可怕的虚拟机
可以看到EMC这次大肆将虚拟机技术用于低端存储,不能不说算是一次变革。VMware在VM可靠性方面主要有两种技术:HA和(FT)Fault Tolerance。前者本质上就是两个VM的冷备,当受监控的主VM宕机或者宿主服务器故障宕机后,位于另一个宿主机的Hypervisor从共享存储上将故障的VM冷启动起来继续提供服务;而Fault Tolerance则是更加高级的功能,他能实现位于两台不同宿主机上的两个VM之间的CPU指令级别的同步,采用CPU厂商提供的vLockstep技术从而可以做到源VM所作的任何操作都被同步到目标VM上执行,由于两台VM都处于启动状态并且任何操作的实时同步,所以FT能够实现最高级别的切换速度,当然,仅限硬件故障切换,如果遇到软件故障,则双方会同时故障。而FT对资源消耗也是很大的,由于入方向的网络IO、读入内存的磁盘IO数据以及指令等均需要主VM通过高速网络传输到备VM上,所以在遇到大网络或者磁盘吞吐量时,这种同步会导致主VM操作延迟大增,对于磁盘IO,VMware提供了另外一种机制,即可以让备VM与主VM共享存储并且允许备VM对目标存储进行只读操作,从而可以节省一部分带宽消耗,FT本身是极其耗费资源的,成本也非常高。
HA太慢,FT又成本太高,所以VNXe采用一种类似传统服务器所使用的双机HA方式,主备VM上都是启动状态,但是备VM中的Flare/DART核心代码并不会挂载底层资源,仅当检测到主VM中的Flare/DART核心代码发生故障或者主VM自身发生故障,亦或者主VM所在的控制器硬件发生故障时,备VM中的Flare/DART核心代码会立即挂载后端资源继续提供服务。这样相比先冷启动VM,再运行Flare/DART核心代码,再挂载资源的步骤迅速了很多。
应用感知
再来看看VNXe针对应用所作的集成。如图所示,VNXe可以直接在存储配置界面中创建Exchange Server的mailbox文件、HyperV和VMware的datastor。对于直接创建Exchange Server的mailbox,我感觉意义还是比较大的,如遇到大规模邮箱创建,确实可以简化工作量;但是对于在存储端创建HyperV和VMware的datastor,这里EMC又把大家给忽悠了一次。VMware中对于一个Datastor的定义,无非就是一个Lun或者一个NFS协议挂载的目录,也就是说,任何一台普通存储设备,只要你能提供一个Lun出来,那么ESX Server上能够认到,那么Vcenter中就可以将其定义为一个datastor,而看一下图示也可以看出,VNXe在VMware感知方面,无非就是可以感知到VMware所使用的VMFS的格式,可以直接从存储配置界面中看到对应的Lun里都有哪些虚拟机罢了,而这好像真的没有什么太大意义,只能作为一个亮点存在,对于HyperV,如图所示,则更是根本没有去感知对应的Lun中到底有多少虚拟机,完全和一个普通Lun一摸一样对待,所以EMC在HyperV这里,没有任何感知,完全就一大忽悠!
EMC的Unisphere是一个面向对象的GUI,目前各存储厂商似乎越来越务虚了,表面文章做的很花哨,吸引不少眼球,比如IBM的XIV和Storwize V7000的配置界面,具有MAC界面的元素。不得不佩服其美工人员。
应用存储--颠覆传统存储系统
下面该说正事了。应用感知+虚拟机,这意味着什么呢?这次EMC只是去感知应用底层的存储,那么下一步,是不是干脆可以直接把Exchange Server装到VNXe中的Hypervisor上的一个VM里?甚至直接提供裸VM供用户自行安装部署自己的应用系统?之前提到的SMB的迫切需求,如果能用一台设备把存储和应用都解决了,那岂不是很划算么?承载应用的VM和承载存储处理的VM之间的通信使用内存中的虚拟HBA,而不是外部网络了,效率灵活性和速度均会提高,最重要的是,根本不需要购买服务器+HBA卡+交换机硬件了,大幅降低了成本。SMB确实会受到采购成本困扰,但是却又不可能投入部署大规模虚拟化基础架构,因为一两台虚拟机可能就足够他们使用,此时这种一体机就极大了满足了这部分市场的需求。
在远看一步,集成了VM、集成了应用,这不就是一种IAAS和SAAS服务模式了么?那么VNXe将来会不会直接就作为云存储节点而存在了呢?多台VNXe组成一个大云,从SMB开始逐渐向上渗透?如果说这一代VNXe只是fire in the hole,那么EMC的Marketing对下一代VNXe如果真的打算这么搞下去的话,可能会是一场存储领域的核爆。
然而这只是个推测,具体还要静观其变。不过,现在VNXe中所出现的技术基本上在一两年之后估计也不会有大的本质变化,比如Thin、Dedup/Compression、Snapshot、Replication等等,除非再有全新的概念被炒作出来,所以其下一代产品可能会结合主机虚拟化方面的技术来在人们根深蒂固的传统概念上做变革。
从趋势来看,存储想要发展,就必须绑住应用,只做一个傻盒子,在这个时代已经逐渐丧失了其价值,尤其是云的概念被炒起来之后,传统存储系统将永远被云海所埋没的无影无踪。而如果抱紧了云中的两个最主要元素—虚拟化、应用的大腿,那么也就可以继续站稳云巅。
IBM、HP、Dell、Oracle、Cisco,这些厂商相比EMC来讲最大的区别是什么呢?很显然,就是EMC没有服务器,前者依靠服务器大量出货配套存储,EMC岂能不眼红?怎么办呢?EMC有VMware,这就是关键所在。潮流可能将被EMC所引导,但是是否真的成为潮流,恐怕困难重重,IBM、HP等有大量服务器出货的厂商,不可能任凭EMC抢走其饭碗,他们一定会有动作。
也许有一天,我们做了个APPSTORE,上面放满了企业应用软件,买了我们存储的人,只要使用WEB登陆到存储上,就可以在里面选择企业想使用的软件(HR、CMS、ERP、项目管理、财务软件、会议室预定、请假流程、出差管理、报销系统、在线文档、邮件系统...),然后就自动安装使用了,并且备份、容灾等都在后台可以自动做好。此时,存储系统将会变成一个百变金刚,在上面安装NAS模块,他就变成了NAS设备;装了VTL软件,他就是一款VTL,装了备份软件,那他就是一款备份设备。
应用存储领域可能会有一波大行情,Oracle推出数据库一体机,之前是和HP合作,现在有了Sun。HP也推出了Exchange2010一体机。EMC在VNXe上大肆使用虚拟机来架设,后续可以猜想其可能推出集成Exchange、SQL Server、OA、ERP等的一体机产品,甚至可以提供给用户一个裸VM,供用户自己安装应用软件,很可怕,潮流似乎要接着被EMC引导。
国内应用存储厂商动态
这种概念在国内早已有人试水了,国内有两家存储厂商,一个是UIT,另一个是爱数。UIT直接在其Linux系统中安装软件,比如最多被使用的是第三方的备份软件以及一些视频方面的软件,没有使用虚拟机技术来隔离资源,所有模块(包括存储、应用、管理)都安装在同一个Linux操作系统之上,这样任何一个模块不稳定都可导致整体宕机,而且实现QoS也很难。爱数是一家比较激进和创新以及以技术为导向的公司,同时在市场宣传、形象品牌、渠道方面也都非常强。曾经和其总经理贺鸿富聊过一次,纯技术出身,能做出如此有市场竞争力的产品,确实让人钦佩。他们集成了VM到存储阵列中(基于VMware Server免费版本),将自己研发的备份软件集成进去了(但不清楚是否也像UIT一样直接部署在宿主OS中,推测是的)。而且做了虚拟机容灾,也就是物理机down了虚拟机直接接管服务(使用Agent来同步IO给备份VM),应用存储这个概念也是爱数一直推崇的,因为他们是做软件出身的,他们出发的角度就是从上至下。
有没有技术能力把东西整出来、有没有市场能力把东西推出去、有没有整合能力搞个产业小圈子与国内或者国外ISV联合,这是三个需要考虑的问题。另外,想拿这个来弯道超越的话,需要底盘稳,否则恐怕得做好翻车的准备了。
(以上仅代表个人观点,对VNXe架构和作用原理及预测部分属于推测,严禁对号入座!)