coding---契比雪夫不等式

X为随机数,EX为均值,DX为标准差,k为任意正数,则:

P{|X-EX|≥k}≤DX/k^2   或者 P{|X|≥(EX+k*DX)}≤1/k^2

随机数X大于【均值+k倍标准差】(EX+kDX)的概率小于【1/k^2】

所有数据中,至少有3/4(或75%)的数据位于平均数2个标准差范围内。

所有数据中,至少有8/9(或88.9%)的数据位于平均数3个标准差范围内。

所有数据中,至少有24/25(或96%)的数据位于平均数5个标准差范围内。

应用用场景:

一个进程需要管理若干个链接,链接个数是随机的,可能出现频繁的建链、断链。为了减少建链消耗,需要维护一定数目的长连接,新的建链请求可以复用已经存在的链接。某一时刻,进程需要维持多少链接呢?这个数值如何计算呢?

这里就可以使用契比雪夫不等式,进程可以定义一个长度为N的数组,数组内容循环记录前N个采样周期的实际链接数,在下一个周期可以根据数组内容计算均值、标准差,进而得到【EX+kDX】,下个周期需要维持链接数目为【EX+kDX】,k取值3、4即可。若实际链接大于M,则需要新建链接;若实际链路小于M,则需要释放一定数目的链接,链接数目不能低于下个周期的可能值M。

该方法是根据前面N的周期的采样,计算下一周期的可能值M,进而维持M条链接,k值取3时,下个周期链接小于M的概率为88.9%,即新建链接概率仅为11%。

实践证明,应用契比雪夫不等式后,该进程链接数目变化幅度大大降低,只有实际链接出现大幅增加时,进程才会出现短时间大量建链操作。实际链接数目变化不大的场景下,该进程维持长链接数目非常稳定。

你可能感兴趣的:(coding---契比雪夫不等式)