统计学习第四弹--随机变量的概率分布

 

 

统计学习第四弹--随机变量的概率分布_第1张图片

关于随机变量概率分布的重要概念:

概率:对事件的发生的可能性大小的度量值

随机变量:事先不能确定其取值的变量

离散型随机变量:只能取有限个值的随机变量

连续型随机变量:可以取一个或多个区间中任何值的随机变量

期望值:随机变量的平均取值,求法是取值乘以取值概率,是一种加权的平均数

随机变量的方差:随机变量的每一个取值与期望值的离差平方的期望值

参数:对总体特征的某个概括性度量

统计量:对样本特征的某个概括性度量,是样本的函数

抽样分布:样本统计量的概率分布,是由样本统计量的所有可能取值形成的相对频数分布

标准误差:样本统计量分布的标准差,用于衡量样本统计量的离散程度

 

几个重要的概率分布:

二项分布:

二项分布是由伯努利提出的概念,指的是重复n次独立的伯努利试验。在每次试验中只有两种可能的结果,而且两种结果发生与否互相对立,并且相互独立,与其它各次试验结果无关,事件发生与否的概率在每一次独立试验中都保持不变,则这一系列试验总称为n重伯努利实验,当试验次数为1时,二项分布服从0-1分布。

泊松分布:

用于描述一定时间段或一定空间区域或其他特定单位内某一事件出现次数。例如某电话交换台收到的呼叫、来到某公共汽车站的乘客、某放射性物质发射出的粒子、显微镜下某区域中的白血球等等,以固定的平均瞬时速率λ(或称密度)随机且独立地出现时,那么这个事件在单位时间(面积或体积)内出现的次数或个数就近似地服从泊松分布P(λ)。因此,泊松分布在管理科学、运筹学以及自然科学的某些问题中都占有重要的地位。(在早期学界认为人类行为是服从泊松分布,2005年在nature上发表的文章揭示了人类行为具有高度非均匀性。)

超几何分布:

超几何分布是统计学上一种离散概率分布。它描述了从有限N个物件(其中包含M个指定种类的物件)中抽出n个物件,成功抽出该指定种类的物件的次数(不放回)。称为超几何分布,是因为其形式与“超几何函数”的级数展式的系数有关。因此得名

正态分布:

正态分布(Normal distribution),也称“常态分布”,又名高斯分布(Gaussian distribution),最早由A.棣莫弗在求二项分布的渐近公式中得到。C.F.高斯在研究测量误差时从另一个角度导出了它。P.S.拉普拉斯和高斯研究了它的性质。是一个在数学、物理及工程等领域都非常重要的概率分布,在统计学的许多方面有着重大的影响力。

正态曲线呈钟型,两头低,中间高,左右对称因其曲线呈钟形,因此人们又经常称之为钟形曲线。

若随机变量X服从一个数学期望为μ、方差为σ^2的正态分布,记为N(μ,σ^2)。其概率密度函数为正态分布的期望值μ决定了其位置,其标准差σ决定了分布的幅度。当μ = 0,σ = 1时的正态分布是标准正态分布

均匀分布

在概率论和统计学中,均匀分布也叫矩形分布,它是对称概率分布,在相同长度间隔的分布概率是等可能的。 均匀分布由两个参数a和b定义,它们是数轴上的最小值和最大值,通常缩写为U(a,b)

指数分布

在概率理论和统计学中,指数分布(也称为负指数分布)是描述泊松过程中的事件之间的时间的概率分布,即事件以恒定平均速率连续且独立地发生的过程。 这是伽马分布的一个特殊情况。 它是几何分布的连续模拟,它具有无记忆的关键性质。 除了用于分析泊松过程外,还可以在其他各种环境中找到。

指数分布与分布指数族的分类不同,后者是包含指数分布作为其成员之一的大类概率分布,也包括正态分布,二项分布,伽马分布,泊松分布等等。

指数函数的一个重要特征是无记忆性(Memoryless Property,又称遗失记忆性)。这表示如果一个随机变量呈指数分布,当s,t>0时有P(T>t+s|T>t)=P(T>s)。即,如果T是某一元件的寿命,已知元件使用了t小时,它总共使用至少s+t小时的条件概率,与从开始使用时算起它使用至少s小时的概率相等

 

参考文献

贾俊平 中国人民大学出版社 统计学第七版

百度百科

 

后记

数据定律不能百分百确切的用在现实生活里;能百分百确切地用数学定律描述的,就不是现实生活                ------Albert Einstein

 

人真的是有惰性的,这是我参加木东居士的统计学学习小组的第四周,如果没有参加这个小组的话,我估计已经放弃了,最近事情比较多,想周末懒一下。但是参加了这个学习小组,有一群都在学习的小伙伴,就有一种“压力”吧,大家都在学,自己也不能被落下呀!得努力鸭!推荐自律性不太好的,但是又有一颗向上的心的人也可以找一群志同道合的小伙伴一起努力。推荐木东居士的学习小组,是学习小组不是培训班,不收费的。

 

你可能感兴趣的:(统计学学习,统计学习)