人工智能数学基础--概率与统计12:连续随机变量的概率密度函数以及正态分布

一、连续随机变量的概率密度函数的定义

  1. 在《人工智能数学基础–概率与统计10:离散随机变量的概率函数及常见的二项分布、泊松分布》介绍了概率分布函数的概念:设X为随机变量(包括离散和非离散),则函数:P(X≤x) = F(x) (-∞ < x <∞) 称为X的分布函数
  2. 设连续随机变量X有概率分布函数F(x),则F(x)的导数f(x)=F’(x)称为X的概率密度函数,简称为密度函数

二、连续随机变量的概率密度函数的性质

连续随机变量X的密度函数f(x)具有以下三条基本性质:

  1. f(x)≥0;
  2. ∫ − ∞ + ∞ f ( x ) d ( x ) = 1 \int^{+∞}_{-∞}f(x)d(x) = 1 +f(x)d(x)=1
  3. 对任何常数a小于b,有: P ( a ≤ X ≤ b ) = F ( b ) − F ( a ) = ∫ a b f ( x ) d ( x ) P(a≤X≤b)=F(b)-F(a)=\int^b_af(x)d(x) P(aXb=F(b)F(a)=abf(x)d(x)

三、 正态分布

3.1、定义

如果一个随机变量具有如下概率密度函数:
f ( x ) = ( 2 π    σ ) − 1 e − ( x − u ) 2 2 σ 2                      ( − ∞ < x < ∞ ) {\Large f(x) = (\sqrt{2π} \;σ )^{-1}e^{-\frac{(x-u)^2}{2σ^2}}} \;\;\;\;\;\;\;\;\;\;(-∞f(x)=(2π σ)1e2σ2(xu)2(<x<
则称X为正态随机变量,并且记为:X ~ N(u,σ²),其中u和σ²都是常数,u为任何实数,0<σ<∞(原书写的是σ²,老猿认为应该是σ大于0),u和σ²为正态分布的“参数”。

3.2、正态分布是一个概率密度函数的证明

要证明正态分布f(x)是一个概率密度函数,就是要证明:

  1. f(x)≥0,由于σ大于0,因此f(x)显然大于等于0;
  2. ∫ − ∞ ∞ f ( x ) d x = 1 , 即 ∫ − ∞ ∞ ( 2 π    σ ) − 1 e − ( x − u ) 2 2 σ 2 d x = 1 ∫^∞_{-∞}f(x)dx=1,即∫^∞_{-∞} (\sqrt{2π} \;σ )^{-1}e^{-\frac{(x-u)^2}{2σ^2}}dx=1 f(x)dx=1(2π σ)1e2σ2(xu)2dx=1
    进行变量代换,设t=(x-u)/σ,则需要证明: ∫ − ∞ ∞ e − t 2 2 d t = 2 π ∫^∞_{-∞} e^{-\frac{t^2}{2}}dt= \sqrt{2π} e2t2dt=2π

\\
老猿注:首先说明为什么是要证明 ∫ − ∞ ∞ e − t 2 2 d t = 2 π ∫^∞_{-∞} e^{-\frac{t^2}{2}}dt= \sqrt{2π} e2t2dt=2π
∵ ∫ ( 2 π    σ ) − 1 e − ( x − u ) 2 2 σ 2 d x ∴ ( 2 π ) − 1 ∫ e − ( x − u ) 2 2 σ 2 d x σ ∴ ( 2 π ) − 1 ∫ e − t 2 2 d ( t − u σ ) ∴ 即 要 证 明 : I = ∫ − ∞ ∞ e − t 2 2 d t = 2 π ∵∫(\sqrt{2π} \;σ )^{-1}e^{-\frac{(x-u)^2}{2σ^2}} dx\\∴(\sqrt{2π} )^{-1}∫e^{-\frac{(x-u)^2}{2σ^2}} d\frac{x}{σ}\\∴(\sqrt{2π} )^{-1}∫e^{-\frac{t^2}{2}} d(t-\frac{u}{σ})\\∴即要证明:I = ∫^∞_{-∞} e^{-\frac{t^2}{2}}dt= \sqrt{2π} (2π σ)1e2σ2(xu)2dx(2π )1e2σ2(xu)2dσx(2π )1e2t2d(tσu)I=e2t2dt=2π
接下来进行该式证明:
由于积分变量不影响积分结果,可以得到: I ² = ∫ − ∞ ∞ e − t 2 2 d t ∫ − ∞ ∞ e − u 2 2 d u = ∫ − ∞ ∞ ∫ − ∞ ∞ e − t 2 + u 2 2 d t d u \\I²= ∫^∞_{-∞} e^{-\frac{t^2}{2}}dt ∫^∞_{-∞} e^{-\frac{u^2}{2}}du= ∫^∞_{-∞} ∫^∞_{-∞} e^{-\frac{t^2+u^2}{2}} dt du I²=e2t2dte2u2du=e2t2+u2dtdu
转化成极坐标,设t=rcosθ,u=rsinθ,则:
I ² = ∫ 0 2 π d θ ∫ 0 ∞ e − r ² / 2 r d r = 2 π × ∫ 0 ∞ e − r ² / 2 d r ² 2 I²= ∫^{2π}_0 dθ ∫^∞_0e^{-r²/2}rdr = 2π× ∫^∞_0e^{-r²/2}d\frac{r²}{2} I²=02πdθ0er²/2rdr=2π×0er²/2d2r²
令y = r²/2,则定积分范围还是[0,∞),则:
I ² = 2 π × ∫ 0 ∞ e − y d y = − 2 π × ∫ 0 ∞ e − y d ( − y ) = − 2 π × e − y ∣ 0 ∞ = 2 π I²= 2π× ∫^∞_0e^{-y}dy=-2π× ∫^∞_0e^{-y}d(-y)=-2π×e^{-y}|^∞_0=2π I²=2π×0eydy=2π×0eyd(y)=2π×ey0=2π
所以即可得出: I = 2 π I=\sqrt{2π} I=2π ,证毕。

3.3、正态分布的图形及适用举例

正态分布的函数图形如下所示:
人工智能数学基础--概率与统计12:连续随机变量的概率密度函数以及正态分布_第1张图片
从上述图像可以看出,该函数关于u点对称,中间高两头低,这种状态是一般事物所处的状态,例如人的身高、体重、收入、大批量制造的同一产品的某个指标等,都在不同程度上符合正态分布,这不但说明了正态(Normal)分布的由来,也说明了这种分布的重要性。

四、小结

本文介绍了连续随机变量概率分布及概率密度函数的概念,并介绍了连续随机变量一个重要的概率密度函数:正态分布的概率密度函数的定义以及推导、使用场景。

更多人工智能数学基础请参考专栏《人工智能数学基础》。

写博不易,敬请支持:

如果阅读本文于您有所获,敬请点赞、评论、收藏,谢谢大家的支持!

关于老猿的付费专栏

  1. 付费专栏《https://blog.csdn.net/laoyuanpython/category_9607725.html 使用PyQt开发图形界面Python应用》专门介绍基于Python的PyQt图形界面开发基础教程,对应文章目录为《 https://blog.csdn.net/LaoYuanPython/article/details/107580932 使用PyQt开发图形界面Python应用专栏目录》;
  2. 付费专栏《https://blog.csdn.net/laoyuanpython/category_10232926.html moviepy音视频开发专栏 )详细介绍moviepy音视频剪辑合成处理的类相关方法及使用相关方法进行相关剪辑合成场景的处理,对应文章目录为《https://blog.csdn.net/LaoYuanPython/article/details/107574583 moviepy音视频开发专栏文章目录》;
  3. 付费专栏《https://blog.csdn.net/laoyuanpython/category_10581071.html OpenCV-Python初学者疑难问题集》为《https://blog.csdn.net/laoyuanpython/category_9979286.html OpenCV-Python图形图像处理 》的伴生专栏,是笔者对OpenCV-Python图形图像处理学习中遇到的一些问题个人感悟的整合,相关资料基本上都是老猿反复研究的成果,有助于OpenCV-Python初学者比较深入地理解OpenCV,对应文章目录为《https://blog.csdn.net/LaoYuanPython/article/details/109713407 OpenCV-Python初学者疑难问题集专栏目录 》
  4. 付费专栏《https://blog.csdn.net/laoyuanpython/category_10762553.html Python爬虫入门 》站在一个互联网前端开发小白的角度介绍爬虫开发应知应会内容,包括爬虫入门的基础知识,以及爬取CSDN文章信息、博主信息、给文章点赞、评论等实战内容。

前两个专栏都适合有一定Python基础但无相关知识的小白读者学习,第三个专栏请大家结合《https://blog.csdn.net/laoyuanpython/category_9979286.html OpenCV-Python图形图像处理 》的学习使用。

对于缺乏Python基础的同仁,可以通过老猿的免费专栏《https://blog.csdn.net/laoyuanpython/category_9831699.html 专栏:Python基础教程目录)从零开始学习Python。

如果有兴趣也愿意支持老猿的读者,欢迎购买付费专栏。

老猿Python,跟老猿学Python!

☞ ░ 前往老猿Python博文目录 https://blog.csdn.net/LaoYuanPython ░

你可能感兴趣的:(人工智能,高等数学,连续随机变量,正态分布,概率密度函数)