描述系统性能

延迟(Latency)与响应时间(RT:response time)是我们最普遍的刻画系统性能的一对儿参数。它们表达的意思是相同的,但也有细微的差别:延迟更偏向于服务引擎的执行时间;响应时间是客户端从发送到接收的整体时间。

通常描述系统性能,我们只是使用平均延迟或者平均响应时间来表征。但是在很多情况下,这并不能反映客户的真正体验:因为,很多时候,延迟较高的访问,往往是客户真正重要的请求;或者为木桶原理,客户访问了数个请求,但由于一个延迟较高而需要进行等待。

所以,为了能更真实准确的刻画系统性能,我们采用百分比性能统计。以延迟举例:p50代表延迟排序后,第50%的访问延迟为多少,也就是我们说的中位数。同理p95 = 1秒,代表 95%的访问都在1秒内完成,5%的访问会超过1秒。采用这种性能表征方式,可以让客户很明确的获取并衡量我们系统的性能表现。比方说,我们提供的系统保证p999 = 1秒,那么客户就知道,99.9%的访问都会在1秒内完成。

你可能感兴趣的:(存储系统)