Backblaze 2023 Q3硬盘故障质量报告解读

Backblaze 2023 Q3硬盘故障质量报告解读_第1张图片

作为一家在2021年在美国纳斯达克上市的云端备份公司,Backblaze一直保持着对外定期发布HDD和SSD的故障率稳定性质量报告,给大家提供了一份真实应用场景下的稳定性分析参考数据。2023年度之前发布的两次报告,请参考:

  • Backblaze发布2023中期SSD故障质量报告

  • Backblaze 2023 Q2 硬盘故障质量报告解读

Backblaze 2023 Q3硬盘故障质量报告解读_第2张图片

本文我们主要看下Backblaze最新发布的2023 Q3硬盘相关故障稳定性数据报告,代表这些在Q3季度的质量表现,具体信息如下:

Backblaze 2023 Q3硬盘故障质量报告解读_第3张图片

从上面的数据表中,整体样本数量达到了25.9万pcs,样品量足够大,型号也相对丰富,可以看到涵盖了三个HDD厂商大部分型号。这个数据相对是可靠的,可以供关注HDD质量同学参考:

HDD扩展阅读:HDD最后的冲刺:大容量硬盘的奋力一搏

  • HDD最大容量是22TB,型号:WUH722222ALE6L4,上线很短,暂时没有故障,不代表没有问题,需要继续观察。

  • 上表所有型号中,希捷的ST12000NM00J的质量表现,AFR最高,但是样本少,会有很大的波动性。

  • 上线服务时间最长的,是希捷的6TB盘,型号:ST6000DX000,平均运行时间为 101 个月第 3 季度的故障率为零,生命周期 AFR 为 0.88%。

  • 有6个型号的盘(WDC/HGST 2个,希捷:3个,东芝1个) ,出现了0故障。

2023 年第三季度,所有硬盘的季度 AFR 为 1.47%。这低于第二季度的2.2%,也低于一年前的1.65%。季度 AFR 仅基于该季度的数据,因此它通常会在各个季度之间波动。

AFR扩展阅读:一文了解硬盘AFR年化故障率评估方式和预测方案

Backblaze 2023 Q3硬盘故障质量报告解读_第4张图片

从上图分析来看,不同数据中心,也有着不同的故障率表现:

  • 数据中心Sac0,平均运行时间最大,故障率也是最大的。

  • 数据中心为null,故障率表现最好,AFR只有0.15%。

这些盘持续运行的累积故障率表现如何,请看下图:

Backblaze 2023 Q3硬盘故障质量报告解读_第5张图片

上表中,最后一列是置信区间,是在95%的置信度下计算的AFR的低值和高值之间的差这个值越低,AFR数据确定性就越高。这个置信区间期望是为0.5%或更低。当置信区间较高时,并不一定是坏事,只是意味着需要更多的数据观察。

下面的表格仅包含置信区间小于0.5%的硬盘型号,以硬盘容量+AFR排序结果如下表:有一个有趣的现象,东芝在4T/6T/8T/12T都没上榜,14T/16T以后呈现了三足鼎立的局面。

Backblaze 2023 Q3硬盘故障质量报告解读_第6张图片

  • 4T容量:HGST(跟WDC一家的)的表现最好,AFR 0.41%。

  • 6T容量:只有一个型号盘的置信区间低于0.5,那就是希捷6T。

  • 8T容量:HGST(跟WDC一家的)的表现最好,AFR 1%。

  • 12T容量:HGST(跟WDC一家的)的表现最好,AFR 0.31%。

  • 14T容量:WDC 表现最好,AFR 0.32%,东芝 AFR 0.97%排名其次,希捷AFR 1.31%排名最后。

  • 16T容量:WD 16T表现最好,AFR 0.13%, 东芝16T表现最差AFR 1.28%。

你可能感兴趣的:(HDD,人工智能,服务器,性能优化)