[置顶] FMS2015:NVMe SSD的高可靠性及数据保护

FMS2015是一个充满技术干货的平台,各领域技术大拿在峰会上分享的技术和产品都影响甚至主导着闪存下一阶段的发展。此次Memblaze的工程师团队也是从存储系统、PCIe SSD以及闪存控制器三个层次做了技术演讲,并在现场引发了一波讨论热潮。

Memblaze解决方案工程师李月宽发表了主题为《NVMeSSD data reliability and protection》的演讲,这个主题分享中他介绍了NVMe SSD的可靠性评定标准、PBlaze4中提高数据可靠性的技术等内容。

[置顶] FMS2015:NVMe SSD的高可靠性及数据保护_第1张图片

图1:Memblaze解决方案工程师李月宽

当下用于评定SSD可靠性的国际标准很多,李月宽主要介绍了。首先是JESD218A企业标准(包括data retention,寿命测试条件,UBER,容量的定义等信息)以及平均无故障时间(MTBF)两个比较主流的可靠性指标(如图2所示)。

[置顶] FMS2015:NVMe SSD的高可靠性及数据保护_第2张图片

图2
接下来他以PBlaze4为例从元数据保护、掉电保护及高温保护三个方面阐述了提升NVMe SSD可靠性的技术。

元数据保护


图3:PBlaze4的元数据保护技术

如上图所示PBlaze元数据保护技术主要通过pSLC和多副本实现。pSLC 是MLC 的变体,是同一个NAND颗粒上划分出来的一块区域,具有SLC低错误率和高寿命的特点,而且一般pSLC 的擦写次数可以达到20000次,是MLC擦写寿命的6倍。PBlaze4的元数据会有4个副本,并且跨LUN,跨channel进行存储。这种机制通过增加元数据的冗余度保障数据安全,而且元数据被分散存储在多个NAND颗粒上,所以只要有一个LUN 可以工作,元数据就能被读取更新。

掉电保护技术

[置顶] FMS2015:NVMe SSD的高可靠性及数据保护_第3张图片

图4:NVMe SSD在Write back时需要掉电保护技术
系统掉电之后,SSD上DRAM上的数据需要及时刷写到NAND上,详细的刷写时间长度见图5。

[置顶] FMS2015:NVMe SSD的高可靠性及数据保护_第4张图片

图5:DRAM数据刷写到NAND上最大时间计算
从上图可以看到一个结论,PBlaze4将DRAM中数据全部刷写到NAND上的极限时长为15ms,即电容至少要保证15ms的放电时间,但考虑到电量冗余,电力窗口必须保证>15ms。而不同功率电容的放电量不同,满负载功率的电容放电更快。经验证,在25w功率下,PBlaze4的电容可以提供25ms的电力保护时间,完全满足异常掉电时DRAM中数据裸盘的刷写时间,保证数据的完整性。


图6:提高电容供电时间的两种方法
以上介绍了掉电保护的需求并计算出了设备将DRAM上数据刷写至NAND上所需要的最长时间。图6则从电容的角度介绍了两种增加供电时间的方法。

首先是提高电容的容量,这种方法比较容易实现,不必增加额外的电路设计。但是这种方案成本较高,需要使用超级电容或者多个电容实现。

第二种方法是改变电压。这种方法的优势是成本较低,可以使用常见的铝电解电容实现。但是其缺陷是电路设计复杂,需要升压和降压的电压转换器。并且占用的PCB面积也较大。

对于两种效果,Memblaze通过测试做了对比。测试结果如图7:

[置顶] FMS2015:NVMe SSD的高可靠性及数据保护_第5张图片

图7

基于以上理论与测试结果,PBlaze4拥有完备的掉电保护解决方案。

[置顶] FMS2015:NVMe SSD的高可靠性及数据保护_第6张图片

图8:PBlaze4最终的掉电保护解决方案
高温保护技术


从PCIe SSD的设计和使用角度来说,温度对于设备性能、稳定性及寿命都有非常大的影响。PBlaze4安装了多个温度传感器用于监控设备不同部分的温度, Memblaze为PBlaze4设计了可靠的温度保护逻辑,而这个保护逻辑算法就是高温保护技术的核心。


图9:高温保护

在温度上升到第一警戒点(上图中T1st threshold,这一温度阈值可通过NVMe setfeature指令进行设置)时,PBlaze4会向主机端发送critical warning的警告并自动降低读写性能,以防止温度进一步升高,当温度下降后,自动恢复满性能,需要指出的是这个过程无须用户干预,对于用户而言完全透明。

如果温度进一步升高至第二警戒点(上中T2nd threshold)时,所有读写操作会立刻停止,以防止电路过热损坏NAND中的数据。此时需要技术人员重新检测散热环境后,方可继续使用该产品。

还有一个临界值的点为Trestore,当设备温度从第一警戒点降到T restore时,设备性能会逐步恢复到正常水平。最后需要指出的是,三个温度临界点均是选取核温和板温中较高的值。

你可能感兴趣的:(SSD,pcie,闪存,NVMe,FMS2015)