TP90、TP95、TP99性能指标含义及计算

前言

在性能测试中,我们经常会选择 TP90、TP95 或者 TP99 等水位线作为性能指标。首先,我们先解释一下 TP90、TP95 和 TP99 的含义:

TP90,top percent 90,即 90% 的数据都满足某一条件;
TP95,top percent 95,即 95% 的数据都满足某一条件;
TP99,top percent 99,即 99% 的数据都满足某一条件;
在这里,我们之所以说其“满足某一条件”,是因为在计算的时候,我们既可以向前计算也可以向后计算,例如:
1, 2, 3, …, 98, 99, 100
如上所示,这是一个从 1 至 100 的数列,如果我们想计算其 TP99 的值,其方法为用数列中数值的总个数乘以 99%,即100 * 99% = 99,显然在这个数列中有两个数值满足这个 99 的概念,分别为:

  • 2,即数列中 99% 的数值都大于等于2
  • 99,即数列中 99% 的数值都小于等于99

因此,TP90、TP95 或者 TP99 等水位线是有两种含义的,具体选择哪一种,我们可以按需求自己选择。

计算方式

如果我们要计算 TP90、TP95 或者 TP99 等水位线的值,其前提就是需要我们将所有的待计算值保存起来。那么我们应该用什么数据结构来存储这一系列的值呢?数组?或者列表?实际上,无论我们选择哪一种数据结构,我们都不能假设其长度无限大,因为内存空间是有限的,而且数据结构也有理论上的最大值,但是我们要存储的值的个数却可能是无限的。因此,我们就需要利用有限长度的数据结构存储更多的数值。在这里,数据结构我们选择数组,以计算耗时的 TP90、TP95 或者 TP99 等水位线为例:

double[] SCALE = new double[2400]
int[] countContainer = new int[2400]
如上所示,我们创建了两个长度相同数组,其中

SCALE数组,用来存储耗时的占位符,表示对应的耗时值;
countContainer数组,用来存储某个耗时值的出现次数,与SCALE数组一一对应
例如,SCALE[1024]的值为 1025,而countContainer[1024]的值为 2050,则表示耗时为 1025 的值出现了 2050 次。
又因为耗时的值可以无限大,而我们却不能穷尽其所有值,更切合实际的情况是:大部分的耗时值都集中在某一个区域。因此,我们只需要列出常见的数值,并利用步长来控制即可,具体方法为:

SCALE数组索引0 ~ 999,存储1 ~ 1000,步长为 1
SCALE数组索引1000 ~ 1899,存储1010 ~ 10000,步长为 10
SCALE数组索引1900 ~ 2399,存储10100 ~ 60000,步长为 100
countContainer数组索引0 ~ 2399,均初始化为 0
其中,存储的最大耗时值为 60000,表示 60000 毫秒,也就是 1 分钟。

当记录耗时t的时候,假设t = 1000,

拿着t到SCALE数组中匹配对应的槽位,计算得知SCALE[999] = 1000,则其对应槽位的索引值为999;
到countContainer数组中, 将countContainer[999]得值累计 1
循环步骤 1 和步骤 2
当我们想要计算 TP99 的值,则停止步骤 3,获取耗时的总记录个数sum,即countContainer数组中所有值的累加和,然后:

计算 TP99 的水位线,假设sum * 99% = waterline99
从countContainer[0]开始,从前往后累加数组的值(或者从countContainer[2399]开始,从后往前累加数组的值)
当countContainer[0] + countContainer[1] + … + countContainer[target] >= waterline99的时候,记录target索引
拿着target到SCALE数组中匹配对应的槽位,SCALE[target]即为 TP99 的值
至此,TP99 计算完毕。其它,诸如 TP90 或者 TP95,甚至 TP50 等,可类似计算。

你可能感兴趣的:(开发经验,TP90,TP99)