【FLASH存储器系列二十一】如何评估固态硬盘的性能?

        我们以三星消费级SSD 990 PRO为例进行介绍,下图为其产品配置:

【FLASH存储器系列二十一】如何评估固态硬盘的性能?_第1张图片

        简单说明一下产品配置:990 pro容量有1T和2T两种规格,固态硬盘容量计算一般是1T=1000GB=1000000MB,与操作系统容量计算1T=1024GB不一样,使用M.2外形结构,SSD与主机的接口为x4的PCIE 4.0,协议支持NVMe 2.0,有时候大家会把M.2、PCIE、NVMe这几个概念搞混,这里明确一下M.2是外形名称,PCIE是硬件接口名称,NVMe是应用协议规范,不是说一个外形为M.2的SSD一定是NVMe盘,SATA盘也可以做成M.2的形状(key不同),大家一定要搞清楚每个名词的含义。这款SSD内部nand flash为三星自家的3D nand颗粒,存储单元为TLC,控制器为三星自研控制器,缓存颗粒1TB硬盘容量的为1GB缓存,2TB容量的为2GB缓存(容量越大,FTL映射表越大)。关于3D nand和控制器相关的内容,后面有机会再细讲。

        平时我们使用硬盘就是读和写,所以一款SSD的性能主要指的就是其读写速度,下图为990 PRO性能参数:

【FLASH存储器系列二十一】如何评估固态硬盘的性能?_第2张图片

        在介绍性能参数前,先普及一下性能测试方面的基础知识:线程、队列深度、同步异步。

线程(逻辑线程)指的是同时有多少个读或写任务在并行执行,一般来说,CPU里面的一个核心同一时间只能运行一个线程。如果只有一个核心,要想运行多线程,只能使用时间切片,每个线程跑一段时间片,所有线程轮流使用这个核心。Linux使用Jiffies来代表一秒钟被划分成了多少个时间片,一般来说Jiffies是1000或100,所以时间片就是1毫秒或10毫秒。

        一般电脑发送一个读写命令到SSD只需要几微秒,但是SSD要花几百微秒甚至几毫秒才能执行完这个命令。如果发一个读写命令,然后线程一直休眠,等待结果回来才唤醒处理结果,这叫作同步模式。可以想象,同步模式是很浪费SSD性能的,因为SSD里面有很多并行单元,比如一般企业级SSD内部有8~16个数据通道,每个通道内部有4~16个并行逻辑单元(LUN、plane都支持交错操作),所以同一时间可以执行32~256个读写命令。同步模式就意味着,只有其中一个并行单元在工作,暴殄天物。

        为了提高并行性,大部分情况下SSD读写采用的是异步模式。就是用几微秒发送命令,发完线程不会傻傻地在那里等,而是继续发后面的命令。如果前面的命令执行完了,SSD通知会通过中断或者轮询等方式告诉CPU,由CPU来调用该命令的回调函数来处理结果。这样的好处是,SSD里面几十上百个并行单元都能分到活干,效率暴增。

        不过,在异步模式下,CPU不能一直无限地发命令到SSD。比如SSD执行读写如果发生了卡顿,那有可能系统会一直不停地发命令,几千个,甚至几万个,这样一方面SSD扛不住,另一方面这么多命令会很占内存,系统也要挂掉了。这样,就带来一个参数叫作队列深度。举个例子,队列深度64就是说,系统发的命令都发到一个大小为64的队列,如果填满了就不能再发。等前面的读写命令执行完了,队列里面空出位置来,才能继续填命令。

        一般衡量一款SSD的性能最直接的指标就是读写速度,通常用MB/S或IOPS来表示。MB/S指的是每秒的读写数据量是多少MB,可以简单理解为带宽;IOPS是指固态硬盘每秒进行读写(I/O接口)操作的次数,有同学可能有疑问了,这两种单位有没有换算关系,这与读写测试的文件大小有关系,举个例子,假设读取10000个1KB文件,用时10秒,那这个操作的带宽就是10000*1KB/10S=1MB/S,而IOPS=10000/10=1000,如果10000个2KB文件,用时10秒,那么带宽就是10000*2KB/10S=2MB/S,而此时IOPS仍为1000。所以硬盘随机读写性能指标如果用IOPS为单位,则需要指定测试文件的大小,由于NTFS文件系统对文件存取都是按簇分配的,一簇一般为4KB,所以SSD测试也用4KB的文件进行测试。

        硬盘的读写速度测试分为大文件顺序读写和零散小文件随机读写,随机读写又包括单线程随机读写,和多线程(这个指的是逻辑线程,不是物理线程)(或多队列)随机读写。一般用Q或者QD来代表队列深度如上图中的QD1表示队列深度是1,也就是单线程读写,一次只发起一个读写操作,QD32表示队列深度是32,不需要等SSD的反馈,一次连续发起32个读写操作。我们日常使用SSD的一般就是大文件的顺序读写,和操作软件时的单队列QD1到多队列QD8的随机读写(关于队列和线程的关系我目前还没理解得很清晰,大家有兴趣可以自行研究),我们可以看到三星这款SSD列出来了QD32和QD1的4KB随机读写速度和顺序读写速度,通过这几个指标就可以基本了解此款SSD的读写性能。

        不知道大家有没有发现,顺序读取速度比顺序写入速度要快,而随机读取速度比随机写入速度要慢,这个原因给大家3秒钟时间思考。

        OK,顺序读写都不需要闪存控制器去反复查找物理地址,一般只要给一个首地址就可以顺序读写下去,效率比较高,而nand flash的写入需要往浮栅中充入电子,这个需要消耗一定时间,而读不需要,所以读速度比写速度快。随机读的时候,控制器需要花大量时间去查FTL找到对应的物理的地址,而随机写的时候,控制器只需要往空闲block写即可,不需要反复去找写的物理地址,除非这是一块已经存满文件的脏盘来做这个测试,所以一般随机写速度比随机读要快。

        以上厂家贴出来的读写速度指标都是缓内速度。前面我们分享过固态硬盘的SLC cache,将TLC模拟成SLC来用,所谓缓内速度指的就是读写操作都在SLC cache范围内的读写速度,读取速度不受SLC cache机制影响,主要影响的是写入速度,使用HD tune pro软件测试可以看到,在SLC cache空间用完后,写入速度会显著降低。控制器会在后台将SLC cache中的数据搬运到MLC单元,腾出缓存空间,SLC cache一般是动态分配的,高端控制器会力求做到即使是极限脏盘情况下也不影响到写入性能。

【FLASH存储器系列二十一】如何评估固态硬盘的性能?_第3张图片

你可能感兴趣的:(FLASH存储器,嵌入式硬件)