β分布概率密度函数函数定义为
y=f(x|a,b)=1B(a,b)xn−1(1−x)b−1I(0,1)(x)
式中B(⋅)是β函数,函数I(0,1)(x)保证了仅仅当x在(0,1)内时才有非零的概率
统计工具箱中函数为 betarnd.m.
例子
y3=betarnd(2,3,1,1000);
figure(1);
t=0:0.02:1;
hist(y3,t);
axis([0 1 0 100]);
xlabel('取值');
ylabel('计数值');
β分布特点及应用
贝塔分布(Beta Distribution) 定义如下:其中是贝塔函数,其定义为:是伽玛函数,贝塔分布是一个作为伯努利分布和二项式分布的共轭先验分布的密度函数,在机器学习和数理统计学中有重要应用。贝塔分布中的参数可以理解为伪计数,伯努利分布的似然函数可以表示为,表示一次事件发生的概率,它为贝塔有相同的形式,因此可以用贝塔分布作为其先验分布。
应用
1)心理学家认为,一个正常人在整个睡眠时间中,”异相”睡眠所占比例服从β分布
2)一条干净和河流,在给定的地点,溶解在水中氧气达到饱和的部分,服从β分布
3)一批商品在销售过程中,相对跌价服从β分布
4)空气中含有的气体状态的水分。表示这种水分的1种办法就是相对湿度。即现在的含水量与空气的最大含水量(饱和含水量)的比值。我们听到的天气预告用语中就经常使用相对湿度这个名词。
相对湿度的值显然仅能出现于0到1之间(经常用百分比表示)。而空气为什么出现某个相对湿度显然具有随机性(可以利用最复杂原理),这些提示我们空气的相对湿度可能符合贝塔分布。
马淑红等人完成的“塔里木气候极值及其在油田工程设计中的应用”研究中(同名的书由气象出版社于1995年出版见138-142页),刘绍民等人分析了冬季塔里木盆地的日最大相对湿度和夏季日最小相对湿度。证实它们都符合贝塔分布。
二项式分布概率密度函数函数定义为:
y=f(x|n,p)=Cxnpxq1−xI(0,1,...,n)(x),q=1−p
二项式分布式离散的,且仅仅零和小于n的整数的概率密度非零
统计工具箱中函数为 binornd.m.
例子
y3=binornd(100,0.5,[1 1000]);
figure(1);
t=0:2:100;
hist(y3,t);
axis([0 100 0 300]);
xlabel('取值');
ylabel('计数值');
应用
χ2分布分布概率密度函数定义为
y=f(x|v)=x(v−2)/2e−x/2xv/2Γ(v/2)
式中Γ(⋅)是γ函数,v是自由度
统计工具箱中函数为 chi2rnd.m.
例子
y3=chi2rnd(4,[1 1000]);
figure(1);
t=0:1:max(y3);
hist(y3,t);
axis([0 max(y3) 0 300])
xlabel('取值');
ylabel('计数值');
应用
很详细的介绍
1)χ2分布是连续分布,但有些离散分布也服从χ2分布,尤其在次数统计上非常广泛。
2)从正态总体中抽取出的样本的方差服从χ2分布
非中心χ2分布分布概率密度函数定义为
y=F(x|v,δ)=∑∞j=1[(12δ)jj!e−δ2]Pr[χ2v+2j⩽x]
式中δ是非中心函数
统计工具箱中函数为 ncx2rnd.m.
例子
ye=ncx2rnd(4,2,3,4)
figure(1);
t=0:1:max(y3);
hist(y3,t);
axis([0 max(y3) 0 300]);
xlabel('取值');
ylabel('计数值');
在概率论中将极大值(或者极小值)的概率分布称为极值分布。
极值分布概率密度函数定义为
y=F(x|v,σ)=σ−1exp(x−μσ)exp(−exp(x−μσ))
式中μ是位置参数,σ是尺度参数
统计工具箱中函数为 evrnd.m.
例子
y3=evrnd(4,1,[1 1000])
figure(1);
t=0:0.2:max(y3);
hist(y3,t);
axis([0 max(y3) 0 100]);
应用
防洪时节人们经常谈论某年的河水的日流量(或者水位)的最大值是多少。从统计学角度看我们可以研究每年的一日流量的最大值(每年的老大)
指数分布是事件的时间间隔的概率
极值分布概率密度函数定义为
y=F(x|μ)=1μe−x/μ
统计工具箱中函数为 exprnd.m.
例子
y3=exprnd(4,[1 1000])
figure(1);
t=0:0.2:max(y3);
hist(y3,t);
axis([0 max(y3) 0 100]);
应用
婴儿出生的时间间隔
来电的时间间隔
奶粉销售的时间间隔
网站访问的时间间隔
F分布:
y=f(x|v1,v2)=Γ[v1+v22]Γ(v12)Γ(v22)(v1v2)v1/2xv1−22[1+(v1v2)x]v1+v22
统计工具箱中函数为 frnd.m
非中心F分布:
y=f(x|v1,v2,δ)=∑∞j=0((δ/2)jj!e−δ/2)I(v1⋅xv2+v1⋅x|v12+j,v22)
统计工具箱中函数为 ncfrnd.m
γ 分布:
y=f(x|a,b)=1baΓ(a)xa−1e−x/b
统计工具箱中函数为 gamrnd.m
几何分布:
y=f(x|p)=pqxI0,1,...(x),q=1−p
统计工具箱中函数为 geornd.m
超几何分布:
y=f(x|M,K,n)=(Kx)(M−Kn−x)(Mn)
统计工具箱中函数为 hygernd.m
对数正态分布:
y=f(x|μ,σ)=1xσ2π−−√e−(lnx−μ)22σ2
统计工具箱中函数为 lognrnd.m
正态分布:
y=f(x|μ,σ)=1σ2π−−√e−(x−μ)22σ2
统计工具箱中函数为 normrnd.m
泊松分布:
y=f(x|λ)=λxx!e−λI(0,1,...)(x)
统计工具箱中函数为 poissrnd.m
瑞利分布:
y=f(x|b)=xb2e−x22b2
统计工具箱中函数为 raylrnd.m
t分布:
y=f(x|v)=Γ(v+12)Γ(v2)1vπ−−√1(1+x2v)v+12
统计工具箱中函数为 trnd.m
非中心t分布:
Prf(−t<x<t|(v,δ))=∑∞j=1[(12δ2)jj!e−δ22]I(x2v+x2|12+j,v2)
统计工具箱中函数为 nctrnd.m
离散连续分布:
y=F(x|a,b)=x−ab−1I[a,b](x)
统计工具箱中函数为 unidrnd.m和unifrnd.m
Weibull分布:
y=F(x|a,b)=ba−bxb−1e−(xa)bI(0,∞)(x)
统计工具箱中函数为 nctrnd.m
工具箱:disttool
工具箱:randtool
工具箱:dfittool
分布参数估计(显示拟合曲线)
~+fit 为拟合返参函数的名字
1)β分布参数估计
phat=betafit(data)
[phat,pci]=betafit(data,alpha)
输入参数:data 是分析的额数据;alpha 是置信区间
输出参数:phat返回估计的参数a ,b;pci 返回参数的置信区间
代码实例
N=1000;
data=betarnd(4,3,N,1);
%产生beta分布的随机数并画图
[p,ci]=betafit(data,0.01)
%估计参数
beta_fit(data);
%拟合曲线
二项式分布的参数估计
binofit
phat=binofit(x,n)
[phat,pci]=binofit(x,n)
[phat,pci]=binofit(x,n,alpha)
输入:x是分析的数据;n是独立试验次数;alpha是置信度
输出:phat返回估计的参数;pci 返回参数的置信区间