对泊松分布和泊松过程已经爱尔朗分布的理解和他们的联系(排队论和运筹学中的重要理论)

泊松分布大家已经很熟悉了,其实它作为2项分布的大数情况在某些情况下是存在偏差的,并不是说泊松分布不正确,而是在离散点采样时我们并不是等概率采集到每个时间点的样本。因此泊松过程产生了:利用前一次采样时间段和这一次时间段的差值作为平均等待时间能够很好地消除BIAS。而多个泊松过程就构成了airlang过程。

如下的经典例子:
现在让我们随机选择的狂热者去黄石国家公园旅游,那里最受欢迎的景点是老忠实喷泉,它以经常喷发而闻名,大约每90分钟就会发生一次。因此,当我们的朋友们到达时,他们会等待45分钟才会爆发。就在他们等着的时候,他们开始和一个人交谈,他已经拜访过很多次,并且仔细记录了他的等待时间,平均超过45分钟。他告诉我们的家人,这表明间歇泉正在减速,但是公园护林员的数据并没有给出这样的迹象。除此之外,我们家的新朋友可能运气不好,有什么合理的解释吗?
一定。关键是老忠实的人,与她的名字和名声相反,并不是每隔90分钟就爆发一次,只是平均爆发一次。实际上,每次喷发的时间从30分钟到2小时不等,但最典型的是在60到100分钟之间。如果它确实每隔90分钟就爆发一次,而且你是在一个随机的时间到达的,那么你的预期等待时间肯定是45分钟。但是现在每隔一段时间都会变长,所以你的预期等待时间会超过45分钟。为了简化事情,假设间隔在一到两个小时之间,这样就可以在中午、下午2点、下午3点、下午5点、下午6点等时间爆发。平均间隔时间为90分钟,但如果你是随机到达的话,你2小时到达的可能性是2小时的两倍,而你的预期等待时间是1小时;如果你每隔1小时到达一次,你的预期等待时间是半小时。因此。三分之二的时间你平均一个小时,三分之一的时间,半小时。当2/3×1+1/3×1/2=5/6。超过平均间隔时间45分钟的一半,见图5.1以说明这种情况。在现实中,当然有更多的随机性,而不仅仅是在一到两小时之间来回移动,但是你得到了总体的画面。

对泊松分布和泊松过程已经爱尔朗分布的理解和他们的联系(排队论和运筹学中的重要理论)_第1张图片

上面的例子告诉了我们,假设一个事件的平均到达时间为 T,你作为观察者多次介入该事件,并记录连续两个到达间隔的时间,你记录得到的平均到达时间会比 T更长。 你现在是在抽样“前后两次到达的间隔时间” ,你介入该事件并开始记录是等概的, 但你并不是等概地抽取不同到达间隔时间的样本 :你 更加有可能碰到 两次到达间隔时间较长的情况,导致你最后的结果存在了BIAS。

那么现在也就更好理解下面的一个问题:
如果在一种BUS到达station为泊松过程,其到达率为lambda,即平均等待时间为1/lambda。你作为观察者在任意时间进入station,并多次记录前后到达时间的间隔(这里意为,你进入station时就可以立马知道前一次到达的时间,然后开始等待直到下一次到达并记录)。求问你记录的平均到达间隔时间为多少?

答案肯定是大于1/lambda的。假设你到达的时刻为t*,前一到达时刻为U,后一将要到达时刻为L,那么U至t可以看做一段泊松过程,t到L也可以看做一段泊松过程,所以你记录的平均到达间隔时间应该是两个泊松过程相加后的平均等待时间。多个泊松过程相加得到的是爱尔兰(Erlang)过程,期望为k/lambda。所以本题最后的答案是2/lambda。

你可能感兴趣的:(面试,PYTHON,人工智能,python,list)