昨天看到新闻,Intel发布了面向数据中心的SSD DC P4500和P4600 系列PCIe/NVMe固态盘,回想上一代产品P3500、P3600、P3700的推出已经是3年前。由于Intel在企业级SSD市场和NVMe规范中的地位,我们有理由关注新产品的变化,由此应该也能看出一些行业发展的趋势。
上图是一块半高半长的Intel SSD DC P4500 PCIe扩展卡,而这一代产品已经可以看出侧重2.5英寸的U.2(SFF-8639连接器)外形。其实去年更新的SSD P3520已经开始采用3D NAND,但这次应该说是全面引入,因为还有P4600。关于NAND闪存我在下文中还会继续讨论。
顺序写寿命、NVMe-MI管理与Redfish
Intel SSD DC P4600技术规格
我的习惯是先看性能好的:)Intel P4600 NVMe SSD共有四个容量点,其中1.6TB、2TB和3.2TB和提供U.2外形,而AIC扩展卡只有2TB和4TB。最大顺序读写带宽分别为3280、2100MB/s,4K读IOPS 702,500基本已达PCIe Gen3x4的上限,随机写IOPS 257,000也是目前领先的水平。下文中我还会做与上一代产品的详细规格对比。
关于闪存技术,Intel标明了3D NAND, TLC,也就是来自与Micron合作的工厂(IMFT)。之前我看到DWPD(5年每天擦写次数)=1左右的3D TLC闪存SSD居多,而IntelP4600的随机写寿命则达到了DWPD=2.9,与上一代P3600的3基本持平。我们知道顺序写对闪存产生的写放大较低,所以Intel又给出了一个4 DWPD的数值,这一点在后面在列出的P4500 SSD上提高更加明显。
上面还有一条管理特性NVM Express Management Interface (NVMe-MI),Intel资料里写它是一个带外(out-of-band)管理SSD的行业标准,在nvmexpress.org网站上看到与DistributedManagement Task Force (DMTF)有关。这让我想起了之前写过的《Redfish:下一代数据中心管理标准》,在网上我还搜到了一个2014年的文档《NVMe(NVM Express) Management Messages over MCTP Binding Specification》,截图如下:
我以前曾经说过,Redfish标准背后的组织是DMTF下面的SPMF(Scalable Platforms Management Forum)工作组,联席主席是来自Dell和 HPE。上面的文档是另一个工作组PMCI,当时的贡献者来自Intel、Dell、IBM、HP、Mellanox和Broadcom,以主导NVMe标准的和服务器厂商为主。大家知道后来IBM卖掉了x86 Server,近日传闻Power小机也要卖了…
我还听说Intel即将发布的下一代Skylake Xeon(Purley平台,参见《下一代Xeon E5服务器抢先看:NVMe、FPGA爆发》)将会增强NVMe设备管理方面的特性,估计P4500、P4600 SSD的NVMe-MI也与此有关。
Intel SSD DC P4500技术规格(注意这里的DWPD没有写几年)
Intel P4500本次公布的容量点为1TB、2TB和4TB,定位于读密集型企业级SSD,最高随机写IOPS 68,000自然没有P4600那样高,不过却超出了P3520,后面我会列出详细对比表格。
P4500也采用了3D NAND, TLC闪存,标称随机写寿命DWPD=0.7,按照4.6 PBW写入量和4 TB容量点严格计算似乎是4.5年。而4.62 DWPD的顺序写寿命,按照19.8 PBW计算大致是3年左右的水平。如果严格按照5年保修来计算,P4500SSD的顺序写DWPD应该是2.71?
无论如何,对比前面的数字,P4500与P4600在顺序写DWPD上的差距明显比随机写要小。这个道理也不复杂,因为顺序写时大家的写放大都不明显,P4600较大的OP(超量配置)优化不会带来那么多改善,很大程度上是看闪存的物理容量了。
3D NAND/新主控提高性能、延时疑问
我看到国内有消息灵通的朋友说“(P4500/P4600)是新主控,不再是传家宝18通道,而是新的12通道订制主控”(https://www.chiphell.com/thread-1731464-1-1.html),这一点我不做判断,但Intel资料里确实写了全新的NVMe控制器。一方面支持最大128队列更好地利用多核,另一方面支持“绑核”以便在平台上扩展更多数量的SSD。
之前老看到国外网站有做SSD的规格表,整理起来不算复杂,但国内似乎没什么人搞。下面表格中不包含Intel网站上的全部参数,主要是为了自己对比起来方便,
表格如有疏漏还望指正。这两款SSD在Intel网站Technical Specifications的数值比ProductBrief文档普遍略低一些不知为何。
还是先看性能高的P4600,参照物是P3600和P3700。首先,4TB的P4600 SSD只有AIC扩展卡而没有2.5英寸盘形态的。随机写IOPS性能上P4600甚至超出上一代旗舰级的P3700,而写寿命却不是如此,P3700还有继续存在的价值。
关于IO延时,我在《再谈3D XPoint:延时、QoS与队列深度》中曾提到Intel上一代SSD标注的20µs读延时是顺序读(有预读缓存命中),如果随机读的话P3700是115µs。
单从数字上来看,P4600标的79µs应该是“厚道”一些的随机读延时,比P3600和P3700改进比较多;而34µs的随机写延时比上一代P3600稍差了点,考虑到这个有写缓存的效果也不用太在意了。
以上应该都是QD=1时的典型(平均)读写延时,对应用体验影响可能更大的QoS延时在Intel SSD的Product Specification文档中有,现在不公开了,签NDA的客户应该可以看到。
再来看看P4500。目前公布的只有4TB容量提供AIC扩展卡,另外两个容量点只有U.2。我们看到去年发布的P3520已经开始用第一代3D NAND MLC闪存,而它与P4500都是随机写DWPD在0.7左右(P4500 2TB约为5年0.5),Intel也没把它们归类到H.E.T.闪存。
随机写前面讨论过了,而4TB大容量的P4500随机读接近P4600,比P3600和P3700要高了。延时方面,我看不到P3520的随机I/O水平,与前面的P4600相比,P4500的写入延时29µs要短一些。我觉得可能是Intel为了提高P4600的寿命,略微加长了一点3D NAND TLC闪存的编程时间?
另外像端到端数据保护、掉电数据保护这些特性,P4500和P4600与上一代产品都是一致的,包括我在《Intel Optane P4800X评测(序):不用缓存和电容保护的SSD?》一文中写过的Power Loss Imminent(PLI)技术。本文开头的照片上也可隐约看到3颗大电容。
8TB、16TB大容量和U.2前景展望
按道理读密集型SSD可以做更大容量的习惯,P4500为何没有4TB以上呢?我们来看看下图:
首先声明一下不是我“泄密”,大家也不必追究这个比较早的资料来源了:)我们看到计划中还有8TB和16TB的容量,包括2.5英寸和AIC扩展卡。至于具体啥时候推出我也不确定,另外480GB小容量盘的定位被P3320取代了吧?
除了左边这4个,Dell PowerEdgeR930还能在右边对称位置选配4个(共支持8个)2.5英寸PCIe/NVMe SSD。
上图引用自《服务器设计进化:戴尔R930跨代对比之存储篇》,目前在售的服务器U.2SSD扩展位普遍还不多,而下一代2U乃至1U机型都可能超过这个水平哦。
我在《 M.2SSD热插拔:Facebook和微软的两种方案 》结尾处写道“本文介绍的两款 M.2 热插拔机型,由于是2/4 个SSD 一起插拔,所以在灵活性上有所不足;要是改为每个M.2 一个Carrier ,似乎又有些笨重。目前针对Facebook 和微软的特定应用场景… ”结合本文内容,未来传统企业级市场NVMe SSD 除了系统盘应该是U.2 的天下吧