辛钦大数定律的Python实践

在概率论中,大量实验证实了如下结论,随机事件的频率当重复实验的次数增大时总会呈现出稳定性,稳定在某一个常数的附近,频率的稳定性是概率定义的客观基础。辛钦大数定律是说,当X_1, X_2, X_3, \cdots是独立同分布的随机变量序列,且具有数学期望E(X_k)=\mu,做前N个变量的算术平均\frac{1}{n}\sum_{k-1}^{n},则对于任意\varepsilon >0,有:

\lim_{n\rightarrow \infty }P\bigg\{\left | \frac{1}{n}\sum_{k=1}^{n}X_k -\mu \right |<\epsilon \bigg\}=1

也就是随着N值增大,样本均值1概率收敛到单个随机变量的均值。

验证思路是利用Python生成一个随机分布的大的样本集,然后在样本中抽取字样本,逐渐增加子样本集合元素的数量,并计算其均值,观察其均值是否趋近于整体的样本均值。

gamma分布:

gamma分布在浙大版的概率论与数理统计没有介绍,茆诗松老师的那本同名教材上才有。电器比如灯泡寿命一般用伽马分布来描述。

# -*- coding: utf-8 -*-
import math
import numpy as np #导入数值计算模块
import matplotlib.pyplot as plt #导入绘图模块
import mpl_toolkits.axisartist as axisartist #导入坐标轴加工模块
   
pop_data = np.random.gamma(1,2000,600000)
plt.hist(pop_data,60);
pop_data.mean()

辛钦大数定律的Python实践_第1张图片

独立平均分布的样本大数定律

辛钦大数定律的Python实践_第2张图片

正态分布的大数定律

辛钦大数定律的Python实践_第3张图片

总结

  • 大数定律就以严格的数学形式表现了随机现象的一个性质:平稳结果的稳定性(或者说频率的稳定性)

  • 大数定律从理论上解决:用频率近似代替概率的问题。用样本均值近似代替理论均值

  • 中心极限定理,当样本量N逐渐趋于无穷大时,N个抽样样本的均值的频数逐渐趋于正态分布,其对原总体的分布不做任何要求,意味着无论总体是什么分布,其抽样样本的均值的频数的分布都随着抽样数的增多而趋于正态分布。

大数定律是说,n只要越来越大,我把这n个独立同分布的数加起来去除以n得到的这个样本均值(也是一个随机变量)会依概率收敛到真值u,但是样本均值的分布是怎样的我们不知道。
中心极限定理是说,n只要越来越大,这n个数的样本均值会趋近于正态分布,并且这个正态分布以u为均值,sigma^2/n为方差。
综上所述,这两个定律都是在说样本均值性质。随着n增大,大数定律说样本均值几乎必然等于均值。中心极限定律说,他越来越趋近于正态分布。并且这个正态分布的方差越来越小。直观上来讲,想到大数定律的时候,你脑海里浮现的应该是一个样本,而想到中心极限定理的时候脑海里应该浮现出很多个样本。


结束! 

你可能感兴趣的:(嵌入式系统,人工智能,算法,python,概率论,开发语言)