人工智能数学基础--概率与统计11:离散随机变量的超几何分布和负二项分布

一、超几何分布

1.1、定义

假设N个产品中M个废品,以X记为从N个产品中随机抽出n个里面所包含的废品数m,则:
P ( X = m ) = ( m M ) ( n − m N − M ) / ( n N ) P(X=m) = {\Large (^M_m)(^{N-M}_{n-m})/(^N_n)} P(X=m)=(mM)(nmNM/nN
其中:0≤m≤M,n≤N,n-m≤N-M。

上述概率函数就是超几何分布的概率函数,之所以称为这个名字,是因为其形式与“超几何函数”的级数展开式有关。

1.2、与二项分布关系

这个分布在涉及抽样的问题中常用,特别当 N不大时。因为通常在抽样时,多是“无放回的”,即已抽出的个体不再有放回去以供再次抽出的机会,这就与把n个同时抽出的效果一样,如果一个一个地抽而抽出过的仍放回,则结果是二项分布。

对于二项分布,如果n/N很小,则放回与不放回差别不大。由此可见,在这种情况下超几何分布应与二项分布很接近,确切地说,若X服从超几何分布,则当n 固定时,M/N=p固定;N→∞时,X近似地服从二项分布B(n,p)。

二、负二项分布

2.1、结合例子的定义

为了检查某厂产品的废品率 p 大小,有两个试验方案可采取:一是从该厂产品中抽出若干个,检查其中的废品数X,这一方案导致二项分布;

另一个方案是先指定一个自然数r,一个一个地从该厂产品中抽样检查,直到发现第r个废品为止。以X记到当时为止已检出的合格品个数。显然,若废率p小,则X倾向于取较大的值;反之当p大时,则X倾向于取小值。故X可用于衡量p的大小。为计算X的分布,假定各次抽取的结果(是否为废品)是独立的,且每次抽得废品的概率保持固定为p。
考察{X=i}这个事件,为使这个事件发生,需要以下两个事件同时发生:

  1. 在前 i+r-1 次抽取中,恰有r-1个废品;
  2. 第 i+r 次抽出废品。

按所作假定,这两个事件的概率分别为b(r-1;i+r-1,p)和p。再由独立性,即得:
P ( X = i ) = b ( r − 1 ; i + r − 1 , p ) p    =   ( r − 1 i + r − 1 ) p r ( 1 − p ) i {\Large P(X=i) = b(r-1;i+r-1,p)p \,\, = \,(^{i+r-1}_{r-1})p^r(1-p)^i} P(X=i)=b(r1;i+r1,p)p=(r1i+r1)pr(1p)i

这个分布称为负二项分布

2.2、负二项分布的由来

  1. 负二项分布这个名称的来由缘由在“负指数二项展开式”:
    ( 1 − x ) − r = ∑ 0 ∞ (      i − r ) ( − x ) i = ∑ 0 ∞ (        i i + r − 1 ) x i = ∑ 0 ∞ (      r − 1 i + r − 1 ) x i {\Large (1-x)^{-r}=\sum\limits_0^∞(^{-r}_{\;\;i})(-x)^i=\sum\limits_0^∞(^{i+r-1}_{\;\;\;i})x^i=\sum\limits_0^∞(^{i+r-1}_{\;\;{r-1}})x^i} (1x)r=0ir(x)i=0(ii+r1)xi=0(r1i+r1)xi
    令x=1-p,并在上式左右两边等乘以 p r p^r pr,得到:
    1 = ∑ 0 ∞ (      r − 1 i + r − 1 ) ( 1 − p ) i p r 1 = \sum\limits_0^∞(^{i+r-1}_{\;\;{r-1}})(1-p)^ip^r 1=0(r1i+r1)(1p)ipr
    这就证明了负二项分布的所有 P(X=i)的和等于1。
  2. 二项分布在试验抽样时,定下抽样个数n而把废品个数X作为变量,负二项分布则相反,是定下废品个数r,而把总抽样次数减去r作为变量,也基于此称为负二项分布。

老猿注:上面的推导中,用到了负数的组合数和负数的阶乘,相关定义与正数一样,因此有:
(      i − r ) = ( − r ) ! i ! ( − r − i ) ! = ( − r ) ( − r − 1 ) . . . ( − r − i + 1 ) i ! {(^{-r}_{\;\;i})=\frac{(-r)!}{i!(-r-i)!}=\frac{(-r)(-r-1)...(-r-i+1)}{i!}} (ir)=i!(ri)!(r)!=i!(r)(r1)...(ri+1)
= ( − 1 ) i      r ( r + 1 ) . . . ( r + i − 1 ) i ! =(-1)^i\;\;\frac{r(r+1)...(r+i-1)}{i!} =(1)ii!r(r+1)...(r+i1)
= ( − 1 ) i      ( r + i − 1 ) ! ( r − 1 ) ! i ! = ( − 1 ) i      (      i r + i − 1 ) =(-1)^i\;\;\frac{(r+i-1)!}{(r-1)!i!}=(-1)^i\;\;(^{r+i-1}_{\;\;i}) =(1)i(r1)!i!(r+i1)!=(1)i(ir+i1)

2.3、负二项分布的特例

当取负二项分布中的r=1,则负二项分布变为了:
P ( X = i ) =   ( 0 i ) p ( 1 − p ) i = p ( 1 − p ) i {\Large P(X=i) =\,(^{i}_{0})p(1-p)^i=p(1-p)^i} P(X=i)=(0i)p(1p)i=p(1p)i
这是一个公比为(1-p)的等比级数,也称为几何级数,这种情况下的分布称为几何分布

三、小结

本文介绍了离散随机变量的超几何分布、负二项分布、几何分布的概念,以及相关的公式推导,从介绍可知,他们与二项分布有密切的关系。

更多人工智能数学基础请参考专栏《人工智能数学基础》。

写博不易,敬请支持:

如果阅读本文于您有所获,敬请点赞、评论、收藏,谢谢大家的支持!

关于老猿的付费专栏

  1. 付费专栏《https://blog.csdn.net/laoyuanpython/category_9607725.html 使用PyQt开发图形界面Python应用》专门介绍基于Python的PyQt图形界面开发基础教程,对应文章目录为《 https://blog.csdn.net/LaoYuanPython/article/details/107580932 使用PyQt开发图形界面Python应用专栏目录》;
  2. 付费专栏《https://blog.csdn.net/laoyuanpython/category_10232926.html moviepy音视频开发专栏 )详细介绍moviepy音视频剪辑合成处理的类相关方法及使用相关方法进行相关剪辑合成场景的处理,对应文章目录为《https://blog.csdn.net/LaoYuanPython/article/details/107574583 moviepy音视频开发专栏文章目录》;
  3. 付费专栏《https://blog.csdn.net/laoyuanpython/category_10581071.html OpenCV-Python初学者疑难问题集》为《https://blog.csdn.net/laoyuanpython/category_9979286.html OpenCV-Python图形图像处理 》的伴生专栏,是笔者对OpenCV-Python图形图像处理学习中遇到的一些问题个人感悟的整合,相关资料基本上都是老猿反复研究的成果,有助于OpenCV-Python初学者比较深入地理解OpenCV,对应文章目录为《https://blog.csdn.net/LaoYuanPython/article/details/109713407 OpenCV-Python初学者疑难问题集专栏目录 》
  4. 付费专栏《https://blog.csdn.net/laoyuanpython/category_10762553.html Python爬虫入门 》站在一个互联网前端开发小白的角度介绍爬虫开发应知应会内容,包括爬虫入门的基础知识,以及爬取CSDN文章信息、博主信息、给文章点赞、评论等实战内容。

前两个专栏都适合有一定Python基础但无相关知识的小白读者学习,第三个专栏请大家结合《https://blog.csdn.net/laoyuanpython/category_9979286.html OpenCV-Python图形图像处理 》的学习使用。

对于缺乏Python基础的同仁,可以通过老猿的免费专栏《https://blog.csdn.net/laoyuanpython/category_9831699.html 专栏:Python基础教程目录)从零开始学习Python。

如果有兴趣也愿意支持老猿的读者,欢迎购买付费专栏。

老猿Python,跟老猿学Python!

☞ ░ 前往老猿Python博文目录 https://blog.csdn.net/LaoYuanPython ░

你可能感兴趣的:(老猿Python,人工智能数学基础,人工智能,概率论,概率统计,几何分布)