如大家所知,虚拟化技术已经比较普及,甚至一些用户的数据中心里所有的PC服务器都已经虚拟化,只剩下那些孤傲的小机还扛着,不过受到虚拟化和Linux厂商的U2L(去小机化,Unix to Linux)攻势的影响,小机的日子只会越来越惨,被替代只是时间问题。

        早期的虚拟化技术采纳者,受益于虚拟化带来的各种收益,逐渐已经将虚拟化变成了自家企业数据中心的标准,我甚至见过一些企业,每个服务器上只运行单个虚拟机,虽然说1:1的整合比让人觉得很难理解,没有利用上虚拟化高整合比带来的电力、空间、成本等优势,但是虚拟化带来的管理、可用性等方面带来的提升对于企业IT来说,已经是明显的提高了。

        回到今天的主题,如果数据中心里的X86服务器已经虚拟化了,是否还需要使用超融合技术呢?我的答案自然是肯定的。

  首先,从技术上来讲,虚拟化是超融合的基础,但是服务器虚拟化其实只是实现了计算虚拟化(简单来讲,虚拟化实现了计算可在多个服务器之间移动)的问题,而存储、网络这些方面的虚拟化技术普及率还非常低。而这些已经大量应用虚拟化的数据中心里,因为虚拟化的引入,存储管理、网络管理相关的工作要比非虚拟化环境里更复杂。举例来说,大部分引入了虚拟化的企业,都会使用如高可用、在线迁移等功能,而这些高级功能都需要使用到共享存储。共享存储的网络(FC SAN网络、IP网络)、存储管理因为虚拟化的规模壮大和集中化,存储和网络管理的工作变得更加复杂。而在非虚拟化的环境里,因为使用单机模式(自然没有高可用、在线迁移等功能),也自然就没有给存储和网络架构带来额外的负担(牺牲了数据丢失、业务连续性差)。

        其次,虚拟化环境上运行的应用、业务也会随着时间推移对性能要求越来越高,早年采购的服务器、存储、网络早晚有一天不能满足当前及未来的发展需求。所以、继续走采购服务器、存储、网络设备这条老路,还是走向“超融合”这条和平演进的新道路?

        再次,容器化、无状态服务、大数据等新技术、新概念的出现,依赖现有的虚拟化平台+共享存储架构来应对这些新事物时,在成本、性能上并没有任何优势,共享存储对于这些应用本身没有太大的价值(或者说这些新事物开发时就不打算用共享存储)。比如无状态服务因为将应用层进行了细致地拆分,只是用来提供一个运行环境(也就是说,只会占用CPU和内存),数据都存放在中心的数据库里。大数据Hadoop应用里,数据量的确大,但是因为使用了如HDFS、MapReduce这样的分布式架构(通过副本来实现数据的冗余、分布式读写等等),共享存储架构变得略显多余。

        此外,在性能方面,共享存储依靠的是高缓存、高带宽、多磁盘、多SSD、多控制器这些方式的组合来实现高性能的,但是组合的层级越多,成本也就变得越高(IT界盛传:不讲成本的IT建设都是耍流氓)。贵也就罢了,因为虚拟化层和存储层是由不同厂商提供的,很多的功能都是由这两个层分开来完成的,比如我们之前的文章提到过的快照、备份、虚拟机克隆等等,虽然像VMware这样的虚拟化厂商也有提供VAAI(存储阵列集成)这样的存储API来让虚拟化和存储之间更好的协作,但是事实上我们也不得不承认,VMware并不是虚拟化的全部(VMware虚拟化的蛋糕被越来多的开源、商业化产品瓜分是不争事实),同时也并不是所有的存储都可以支持VAAI这样的存储接口。因此,虚拟化+存储层在管理上的复杂度、性能上的瓶颈变得越发突出。而超融合则是把虚拟化和存储之间的界限弄得越来越模糊。而且,在超融合的环境里,在虚拟化层进行存储相关操作都会自动将任务发给存储层来实现,实现了虚拟化系统的offload(以Nutanix为例,如果Hypervisor层是VMware时,则通过VAAI来实现对系统的offload,如果是使用Nutanix自有的虚拟化平台AHV(Acropolis Hypervisor)时,则使用自有的技术来实现类似功能)。

        最后,无论是提供Software-only的还是软硬一体的超融合厂商,都可以结合现在市场上已经逐渐通用的PC服务器(不过,因为用来做存储系统,存储相关的组件兼容性要考虑好),来构建服务器+虚拟化+存储为一体的超融合方案。可以满足企业对计算性能、存储容量、存储性能等的各种复杂性组合。比如,有些用户有跑VGPU 虚拟桌面的需求,因为服务器需要插PCI-E的GPU卡,所以要求服务器有足够的空间和插槽等。而有些用户需要超大的容量来存储如监控视频文件、归档的需求,而可以选择低计算性能,但是高存储容量的节点来构建超融合系统。

        企业在虚拟化系统上面的经验越多,就能够越明显的发现虚拟化技术带来的新困难和新问题,而这些困难和问题,就是超融合的机会。事实上,超融合已经成为下一代企业数据中心建设的新方向。