R可视化处理常用的概率函数图——连续型

对于连续型连续型的随机变量的分布,我们叫做密度函数;

①正态分布


正态分布:norm(,^2),它是一种连续型分布;

正态分布是根据中心极限定理的推理而得来,即一个变量如果有大量微小、独立的随机因素叠加的结果,那么这一个变量一定是正态分布;而且一个变量不管它服从什么样的分布,它的样本和的均值一定服从正态分布。正态分布的期望为:,方差为:^2,

假如,我们将三个方差不同的正态分布放在一个图上进行比较;如下:


R可视化处理常用的概率函数图——连续型_第1张图片
R编码
R可视化处理常用的概率函数图——连续型_第2张图片
正态分布函数图

②T分布


T分布:t(n),它是连续型分布;

T分布的描述:随机变量X和Y,其中X服从标准正态分布,Y服从自由度为n的卡方分布,则         T=X/就服从自由度为n 的T分布。

关于T分布的实际意义:在样本均值的显著性检验中,根据中心极限定理,我们认为一个样本量足够大的随机抽样,不管其服从什么分布,但其样本均值的抽样分布近似的服从正态分布。不同的样本就会产生不同的总体均值的估计;为了研究样本均值对总体均值的准确程度,我们就有了样本均值的标准差,样本均值的标准差我们叫做标准误((hat)=/)。由于总体的标准差是未知的,因此我们就用了样本的标准差(s)来代替来总体的标准差(),因此就有了估计标准误se=s/;j进而,我们就有了检验统计量T;t=(-0)/s。

因此,我们可以得出其T统计量就是检验样本均值的离散程度的统计量。其中,自由度n就是样本的容量。

假如:我们现在用R做一个不同自由的t统计的密度函数图,如下:


R可视化处理常用的概率函数图——连续型_第3张图片
R编码


R可视化处理常用的概率函数图——连续型_第4张图片
T统计与标准正态分布图

③分布


卡方分布:chisq(n),它是一种连续型分布;

n个独立的正态随机变量的平方和就服从自由度为n的卡方分布;卡方分布的期望为n;标准差为2n;

假如:我们通过R画一组不同自由度的卡方分布进行对比图来看,如下:


R可视化处理常用的概率函数图——连续型_第5张图片
R编程


R可视化处理常用的概率函数图——连续型_第6张图片
卡方分布图

④F分布


F分布:f(n,m),F分布是一种连续型分布;

随机变量X和Y相互独立,其中X服从自由度为n的卡方分布,Y服从自由度为m的卡方分布;则             T=(X/n)/(Y/m)服从自由度为(n,m)的F分布;

假如:我们用R画出一组自由度不同的F分布图进行对比,如下:


R可视化处理常用的概率函数图——连续型_第7张图片
R编码


R可视化处理常用的概率函数图——连续型_第8张图片
F分布函数图

你可能感兴趣的:(R可视化处理常用的概率函数图——连续型)