高斯分布的理解, 它在低维和高维的形式。
两个基本的概念:
概率:在某事件出现某一结果的可能性大小。
分布:考虑事件的所有可能性 那么它就是分布。
分布函数,是概率统计中重要的函数,正是通过它,可用数学分析的方法来研究随机变量。分布函数是随机变量最重要的概率特征,分布函数可以完整地描述随机变量的统计规律,并且决定随机变量的一切其他概率特征。
概率密度: 概率指事件随机发生的机率,对于均匀分布函数,概率密度等于一段区间(事件的取值范围)的概率除以该段区间的长度,它的值是非负的,可以很大也可以很小。
概率密度函数:
1.1 定义:
如果对随机变量X的分布函数F(x),存在非负函数f(x),使得对于任意实数有:
F ( x ) = ∫ − ∞ x f ( t ) d t F(x)=\int_{-\infty}^xf(t)dt F(x)=∫−∞xf(t)dt
则称X为连续型随机变量, 其中F(x)称为X的概率密度函数,简称概率密度。 ( f ( x ) ≥ 0 , 若 f ( x ) 在点 x 处连续 , 则 f ( x ) 是 F ( x ) 的导函数 ) (f(x)\geq 0,若f(x)在点x处连续,则f(x)是F(x)的导函数) (f(x)≥0,若f(x)在点x处连续,则f(x)是F(x)的导函数)f(x)并没有很特殊的意义,但是通过其值的相对大小得知,若f(x)越大,对于相同长度的区间,X落到在这个区间的概率越大。1.2 意义及通俗理解:
形象解释:假设一个物体,问你它在某一点处的质量是多少?因为一个点是无限小的,所以点的质量一定是0。然而这个物体是由无数个点组成的,假设我们又需要求他的质量, 于是引入密度的概念:
ρ = lim V → 0 Δ m Δ V \rho=\lim_{V\to0}\frac{\Delta m}{\Delta V} ρ=V→0limΔVΔm
最后再对于密度积分就可以得到质量m了。
同理,如果[0,1]上随机取点,求取在某一点处的概率, 点的长度无限小,此概率一定为0。此时的情况和上面所描述的类似,我们需要引入概率密度p, p = lim x → 0 Δ p Δ x p=\lim_{x\to 0} \frac{\Delta p}{\Delta x} p=x→0limΔxΔp 这样我们就可以求出所取点落在某一段(a,b)上的概率P了。 P = ∫ a b p ( t ) d t P=\int_a^bp(t)dt P=∫abp(t)dt
总结:
为什么要叫概率密度,因为它和物理上密度的定义本质上是一样的。
我们做题的时候一般就两种。
一.告诉你概率密度函数,让你求分布函数,积分就好了。
二.告诉你分布函数,让你求概率密度函数,求导就好了。
就像你做初中物理的密度题,无非两种:一.告诉你物体的密度让你求质量。二.告诉你物体的质量让你求密度1.3.概率密度函数和概率的关系
- 只有函数连续才有概率密度
- 某一点的值是没有概率的
- 某一段的概率: 设 F ( x ) 是概率分布函数 , F ( x ) = ∫ − ∞ x f ( t ) d t 其中 f ( x ) > 0 , 则乘 f ( x ) 为 x 的概率密度函数 ⇓ F ′ ( x ) = f ( x ) 设F(x)是概率分布函数,\\F(x)=\int_{-\infty}^xf(t)dt \\其中f(x)>0,则乘f(x)为x的概率密度函数\\\Downarrow\\F'(x)=f(x) 设F(x)是概率分布函数,F(x)=∫−∞xf(t)dt其中f(x)>0,则乘f(x)为x的概率密度函数⇓F′(x)=f(x)
简单记录 如有不懂的可以看一下这个:深度理解概率分布函数和概率密度函数
例如:从某校选取N名学生将他们的身高为x轴,人数量为y轴,进行直方图的绘画,则有:
当选取的人数足够多,间隔足够小的时候就会得到一个平滑的曲线:
定义: 若随机变量X的概率密度函数为:
f ( x ) = 1 2 π σ 2 e x p − 1 2 ( x − μ σ ) 2 − ∞ < x < ∞ f(x)=\frac{1}{\sqrt{2\pi \sigma^2}}exp{-\frac{1}{2}(\frac{x-\mu}{\sigma})^2} \qquad -∞
则称X服从正态分布,记做: X ∽ N ( μ , σ 2 ) X\backsim N(\mu,\sigma^2) X∽N(μ,σ2)
注:
方差为σ2 -方差越小就越稳定
例如 : 一组数据为 [ x 1 , x 2 , . . . , x n ] , 它们的平均数为 x ˉ , σ 2 = ∑ i = 1 n ( x i − x ˉ ) 2 n 例如: 一组数据为[x_1,x_2,...,x_n], 它们的平均数为\bar{x}, \\ \sigma^2=\frac{\sum_{i=1}^n(x_i-\bar{x})^2}{n} 例如:一组数据为[x1,x2,...,xn],它们的平均数为xˉ,σ2=n∑i=1n(xi−xˉ)2
均值和标准差影响图形变化:
此时均值u小了 图形往左平移, σ会影响图像的陡峭程度。
3σ准则:
落入到每个区间的概率不同:
例如:落入到区间[-1σ,1σ] 的概率为68.2%; 落入到[-3σ,3σ]的概率为99.73%。
如果 d a t a t , μ + 2 σ < t < μ + 3 σ 则说明已经超过了 90 data \qquad t,\\ \mu+2σ
主要用于检测质量与数量的统计:
如果一个事件落入到[-3σ,3σ]意外的区间,则说明发生了小概率事件。
正态分布推导过程
参考引用:
1.高斯分布科普
2.多维高斯分布是如何由一维发展而来的?
3.高维高斯分布的简述
4.深度理解概率分布函数和概率密度函数