天下武功,唯快不破
这句话放眼各个领域,仍然都很适用
就拿出行来说
如今,高铁时速已超过350公里
北京到上海只需四个多小时
不坐飞机也能轻松实现当天往返
我们早已习惯在网上购物
而送货速度快成为大大的加分项
上午下单下午送达的便捷
让很多消费者欲罢不能
从某种程度上而言
快,就是效率,就是业绩,就是竞争力
同样,这句话放在存储领域也是如此
“存储”对企业的重要性不言而喻。目前,“存储”已历经了四代。第一代存储DAS开放系统直连存储,第二代SAN共享网络存储,第三代统一存储,第四代全闪存储。目前广泛采用的就是第四代存储。
长江后浪推前浪,一代更比一代强。如今,存储已经开始朝向第五代进化。
“第五代存储”
“第五代存储”这个概念是近日戴尔科技集团在联合IDC发布的《第五代存储主力企业数字化转型》报告中正式提出的。
第五代智能存储,将成为未来企业级智联存储的首选。它将采用“NVMe架构+SCM”这一“黄金搭档”,大大降低延时,提供前所未有的高性能。
那么,第五代存储的“黄金搭档”是如何发力的呢?第五代存储与现有的第四代存储有什么区别呢?
我们先来看看第四代存储的主要特点有哪些:
控制器A/A架构:全闪关注在高IOPS场景,传统的A/P架构在控制器发生故障时,LUN的归属需发生切换动作,I/O无响应现象。
重删压缩:重删是闪存最基本特性之一,分为Inline和Postline,但对闪存Inline才能体现真正价值。重删一般分为HASH指纹算法(以SHA-1为例说明,存在碰撞问题)和按字节对比法两种,逐字节对比可靠性高,但会严重影响闪存性能,所以很少使用,只在数据一致性要求非常严格的场景下使用。
SSD接口:由于SSD优异的高随机IOPS性能、SSD单盘容量变大加上存储软件特性加持单TB成本性价比越高,使得近几年全闪替换混合阵列越来越多。基于硬盘的发展,SSD的接口沿用了部分HDD技术,包含接口技术,现在绝大多数SSD都是采用SATA/SAS接口。
FLASH分类:NAND Flash可根据Cell储存bit数据位的不同分为SLC,MLC,TLC,其中MLC还分为eMLC,MLC和cMLC。由于不同类型颗粒结构不同,所有导致了不同颗粒间数据储存能力,性能和可靠性存在差异。现主流全闪存储使用eMLC和TLC为主。
如上所述,现有大部分主流全闪存储继续使用着SCSI+SAS接口的组合,但是,这个组合在闪存中已经逐渐出现疲态,已经不能满足一些新的需求。
而与第四代存储不同的是,第五代存储采用的是NVMe架构。
那么,NVMe架构有何优势?
这个问题,我们得从SSD说起。
从SSD到NVMe
SSD存储介质和接口技术一直处于不断向前发展和演进的过程。SSD分为几个阶段,第一个阶段是SATA SSD或者SATA/SAS SSD为主导,这个阶段介质以SLC和eMLC为主。第二个阶段是PCIe SSD,PCIeSSD最大的问题是不标准,很多私有化协议各自为政,基于FTL位置不同主要分为Hostbased SSD和DevicebaseSSD。直到NVMe时代才统一了接口和协议标准,在NVMe标准中,和传统的SATA/SAS相比,一个重大的差别是引入了多队列机制。
▲戴尔易安信PowerMax NVMe架构图
何为多队列技术?
在原有的AHCI规范中,只定义了一个交互队列,那么主机与HDD之间的数据交互只能通过一个队列通信,多核处理器也只能通过一个队列与HDD进行数据交互。在磁盘存储时代,由于磁盘是慢速设备,所以一个队列也就够用了。
多个处理器核通过一个共享队列与磁盘进行数据交互,虽然处理器之间会存在资源竞争,但是相比磁盘的性能,处理器之间竞争所引入的开销实在是微乎其微,可以忽略。在磁盘存储时代,单队列有其他的好处,一个队列存在一个IO调度器,可以很好的保证提交请求的IO顺序最优化。
和磁盘相比,半导体存储介质具有很高的性能,AHCI原有的规范不再适用,原有的假设也已经不复存在,在此背景下NVMe规范诞生了。
NVMe规范替代了原有的AHCI规范,并且软件层面的处理命令也进行了重新定义,不再采用SCSI/ATA命令规范集。
在NVMe时代,外设和处理器之间的距离更近了,不再需要像SAS一样的面向连接的存储通信网络。相比于以前的AHCI、SAS等协议规范,NVMe规范是一种非常简化,面向新型存储介质的协议规范。
该规范的推出,将存储外设一下子拉到了处理器局部总线上,性能大为提升。并且主机和SSD处理器之间采用多队列的设计,适应了多核的发展趋势,每个处理器核与SSD之间可以采用独立的硬件Queue Pair进行数据交互。
但实际上,只是有NVMe架构还不够。纵观SSD发展,NVMe的出现虽然对接口标准和数据传输效率上得到了跨越式的提升,但是存储介质目前主流还是基于NANDFlash实现。那再往前发展,存储介质应该怎么发展呢?
答案是SCM(Storage Class Memory)。
SCM+NVMe
第五代存储的黄金搭档
SCM具备Persistent Memory介质和NVM(Non-Volatile Memory)介质特性。更重要的是SCM没有NAND Flash顺序写入和写前擦除的约束,操作过程更简单。
SCM介质的在寿命和数据保持能力方面的表现也远超NAND Flash。基于这些特点,业界普遍认为SCM会成为颠覆存储系统设计的新一代介质,并优先应用于性能和可靠性要求较高的场景。
Intel/Micron发布3DX(PRAM)之后,各大厂家都加大了SCM介质的投入,从上图可见,SCM目前的主要应用都是聚焦于填充SRAM和Storage之间的容量和性能GAP。
在写性能上,NVMe+SCM始终能保持高带宽低延时的优势,相较于NVMe Flash其延时能始终低于30us,远远低于Flash介质的100us,优势显而易见。相对于延时敏感性应用,SCM加持NVMe特性能稳定的保持高IO低延时的性能。
Intel Optane(傲腾)系列硬盘通过实践证明NVMe和SCM配对时才会显现更大的存储优势,那时数据存储将会迎来重大飞跃,NVMe的未来属于SCM。
在这里,就不能不提到戴尔易安信PowerMax。PowerMax重新定义了全闪存储,完美结合了“NVMe+SCM”这一“黄金搭档”,助力戴尔易安信引领第五代存储。
PowerMax凭什么是
第五代存储的实力担当
下面我们就来看看PowerMax的四大顶级实力:
1 PowerMax是存储阵列中的标杆
针对混合工作负载,PowerMax可提供最高1000万次IOPS(RRH8K)、150GB/s的带宽和290微秒的可预测的相应时间,从而实现了前所未有的性能级别。
它是为当前和未来的任务关键型应用程序而设计的真正的第0层存储,这些应用程序包括数据库和应用程序,以及实时分析,它们要求不折不扣的稳定运行时间和极低的IO响应延迟。
凭借每机架500万次IOPS和每单元(机架单元)12.5万次IOPS的读写速度,PowerMax 8000在企业阵列性能密度方面保持领先。它还支持开放系统与大型机的混合环境;PowerMax 2000作为新一代高端企业存储的入门级产品,以中端市场的经济性提供了丰富的数据服务和高可用性。
2 后端完全采用NVMe并将最终实现端到端NVMe
PowerMax凭借一种未来无忧的端到端NVMe多控制器体系结构提供了前所未有的高性能。推动实现更高级别性能的关键在于NVMe,相比SAS协议,它是为新闪存介质而设计的一种高性能协议。
NVMe的架构设计目标是利用现代多核CPU和固态硬盘的平行处理这一理念,以突破为普通硬盘驱动器设计的存储协议(基于SCSI的协议,如SAS)存在的限制。换言之,采用同样的NAND SSD闪盘介质,底层采用NVMe协议比采用SAS协议,在性能上有质的差别。
NVMe更大限度地提高了多控制器全闪存阵列的处理能力,而且更重要的是,它通过对存储类内存(SCM:Storage ClassMemory)的支持,为新一代介质技术的颠覆性创新敞开了大门。SCM将带来性能的数量级提升,以弥补闪存驱动器与易失性内存(DRAM)之间的性能差距。
PowerMax在技术上已完全支持基于NVMe的闪存,且SCM介质已在戴尔易安信的Roadmap上;当前,PowerMax的后端已完全采用NVMe协议及技术,下一个阶段将全面升级至NVMe over Fabric(NVMeoF)提供主机连接,相应的主机与SAN交换机只要配置支持NVMeoF的HBA卡与端口即可最终达到全面的端到端的NVMe架构。
3 内置机器学习引擎自动优化数据,远超传统存储分层技术
PowerMax OS是针对新一代介质而优化的存储操作系统,它借助一个内置的具备机器学习能力的引擎而真正实现了自主存储。
与传统存储的分层功能相比,前者只是间隔一个时间段后对忙闲数据块进行不同性能存储层级的迁移;而内置的机器学习引擎可自动优化数据,可以基于IO特征自动将数据放置在正确的介质类型(闪存或SCM)上,同时基于IO特征判断是否需要进行压缩去重。
为实现此目的,它每天平均分析并预测4000万个数据集,并基于此作出超过60亿个决策。该引擎使用预测性分析和模式识别来更大限度地提高性能,而又不会产生管理开销。
戴尔易安信是一家能够提供这一智能化级别的公司,当前我们可以跨整个客户群实时分析超过4250亿个数据集,而没有任何管理开销。
PowerMax阵列为简便性而打造,并基于应用装置打包提供了Essentials与Pro软件包,其中Pro软件包添加了增强的安全性、远程复制、eNAS、优化以及管理功能。
4 更高效的线内重复数据消除和压缩
PowerMax借助最高可实现5:1数据缩减率(平均为3:1)的线内重复数据消除和压缩、节省空间的快照和精简资源调配,而提供了极高的效率。
其线内重复数据消除和压缩功能采用专门的硬件模块来实现,对性能几乎没有任何影响,可与所有数据服务搭配使用,而且是由应用程序打开/关闭的。
不过,需要注意的是,在目前互联网应用冲击下,仅仅存储后端支持NVMe还远远不够,如何保证低延时已不仅仅是存储的瓶颈,前端主机也必须加持NVMe的特性,这样才能始终保持IO的稳定性。