用泊松分布打新股

纳尼,神马是泊松分布?

如果你提了这个问题,还请重修概率论吧。

Poisson分布(法语:loi de Poisson,英语:Poisson distribution,译名有泊松分布、普阿松分布、卜瓦松分布、布瓦松分布、布阿松分布、波以松分布、卜氏分配等),是一种统计与概率学里常见到的离散概率分布,由法国数学家西莫恩·德尼·泊松(Siméon-Denis Poisson)在1838年时发表。

说到泊松分布,先慢点展开,因为我不得不提到二项分布。


神马又是二项分布?

如果你提了这个问题,还是那句话,请重修概率论吧。

二项分布(Binomial Distribution),即重复n次的伯努利试验(Bernoulli Experiment)。给一个概率公式:

二项分布的概率公式,令单次事件发生的概率是p,则单次不发生的概率q=1-p,n为独立重复试验次数,k为发生p事件的次数,很显然n-k即是不发生p事件的次数,P(X=k)即为n次重复试验中发生了k次的概率

通俗的解释是,比如说打新股,每次中签率为20%(哇,太高了吧),那么我打了10次,恰好中了3次的概率为:

P(X=3) = C(10,3)*(0.2)^3*(0.8)^7 ≈ 20.13%

看起来不错哈,连中三元的概率,居然还有二成呀!

再来看看最终的全部概率分布吧(精确到百分号小数点后6位),计算方法同上,只是把k换成0-10的整数即可:

十次中0次的概率是10.737418%

十次中1次的概率是26.843546%

十次中2次的概率是30.198989%

十次中3次的概率是20.132659%

十次中4次的概率是8.808038%

十次中5次的概率是2.642412%

十次中6次的概率是0.550502%

十次中7次的概率是0.078643%

十次中8次的概率是0.007373%

十次中9次的概率是0.000410%

十次中10次的概率是0.000010%

可见,十次中十次,概率几乎不存在啦(但还是可能的,只是概率太小了,约十万分之一)。十次都不中,概率约为10%。

可见如果中签率为20%,打10次想要不中签,还挺难的。


二项分布和泊松分布的关系

从上面可知,二项分布可以完美的解决独立重复事件的概率计算,但为什么还需要讨论泊松分布呢?

这是因为,如果次数n太大(比如说真实情况下上证每年发行几百只新股,打新者每次都打几十个号,这样n就有可能达到几千),或者概率p太小(单个号的中签率么,呵呵了,万五算好的了),你会发现,二项分布的前2个乘数,都很难求。尤其是n!,如果要直接暴力求解,计算机要爆掉!

泊松分布此刻便出马了。

泊松分布对二项分布的展开项进行了优雅的化简和近似,尤其用到了自然对数的极限表达式定义(具体化简过程大家自行度娘吧,这里不展开了),使得化简的概率表达式为:


泊松分布的最终概率表达式,注意lambda为n*p

你可能感兴趣的:(用泊松分布打新股)