matlab在统计学中的简单应用

1.简单计算

max(最大值) sum(累加和) median(中位数) mean (平均值)

各列积:prod 实际都可以是两个参数,第二个为1(默认)按列,为二按行

求累计和、累计积、标准方差与升序排序 累计和函数CUMSUM,前n项的和, 累积积CUMPROD, 标准方差STD ,limit(求函数的极限)

2.Matlab实现t检验

  T检验法:应用t分布理论对正态总体或近似服从正态分布的总体当方差

σ2未知时关于平均数的检验方法。

  可以用于比较两组数据是否来自同一分布。(可以用于比较两组数据的

区分度)

例 研究矮壮素使玉米矮化的效果,在抽穗期测定喷矮壮素小区8株、对照区玉米9株,

其观察值如下表:

y1(喷施矮壮素) 160 160 200 160 200 170 150 210 
y2(对照) 170 270 180 250 270 290 270 230 170

  从理论上判断,喷施矮壮素只可能矮化无效而不可能促进植物长高,因

此假设H0:喷施矮壮素的株高与未喷的相同或更高,,即H0: μ1≥μ2

对HA: μ1<μ2,即喷施矮壮素的株高较未喷的为矮。显著水平

α=0.05。 

   按ν=7+8=15,查t 表得一尾t0.05=1.753(一尾测验t0.05等于两尾测验

的t0.10),现实得t=-3.05<- t0.05=-1.753,故P<0.05。 推断:否定

H0: μ1≥μ2,接受HA: μ1<μ2,即认为玉米喷施矮壮素后,其株

高显著地矮于对照。

1 x=[160  160  200  160  200  170  150  210];

2 y=[170  270  180  250  270  290  270  230  170];

3 [h,p,ci,stats]=ttest2(x,y,0.05,'left')

h =

     1

p =

    0.0040

ci =

      -Inf  -24.3220

stats =

    tstat: -3.0545        df: 15        sd: 38.4599

  计算x和y在5%的显著性水平下是否来自同一分布(假设是否被接受) 结果:h=0,则表明假设在5%的置信度下被接受,即x,y在统计上可看做

来自同一分布的数据;h=1,表明假设被拒绝,即x,y在统计上认为是来

自不同分布的数据,即有区分度。例如A1,A2两算法得出的结果分别为x

,y,且从均值上看mean(x)>mean(y),则对[h,sig,ci]=ttest2(x,y);当

h=1时,表明可以从统计上断定算法A1的结果大于A2的结果(即两组数据

均值的比较是有意义的),h=0则表示不能根据平均值来断定两组数据的

大小关系(因为区分度小)。

例 选生长期、发育进度、植株大小和其它方面皆比较一致的两株番茄构成一组,共得7组,每组中一株接种A处理病毒,另一株接种B处理病毒,以研究不同处理方法的纯化的病毒效果。

组别 y1(A法) y2(B法) d
1 10 25 -15
2 13 12 1
3 8 14 -6
4 3 15 -12
5 20 27 -7
6 20 20  0
7 6 18 -12

1 y1=[10  13    8    3  20  20    6];

2 y2=[25  12  14  15  27  20  18];

3 [h,p,ci,stat]=ttest(y1,y2,0.05,'both')

h =

     1

p =

    0.0203(越大越不好,0.05是边界值)

ci =

  -12.9797   -1.5917

stat =

    tstat: -3.1309        df: 6        sd: 6.1567

3.方差分析

例 以A、B、C、D4种药剂处理水稻种子,其中A为对照,每处理各得4个苗高观察值(cm),试做方差分析。

药剂 苗高观察值 总和Ti 平均数
A 18 21 20 13 72 18
B 20 24 26 22 92 23
C 10 15 17 14 56 14
D 28 27 29 32 116 29
     T=336    y=21

1 x=[18  20  10  28; 21 24 15 27; 20 26 17 29; 13 22 14 32]

2 [p,anovatab,stats]=anova1(x)

matlab在统计学中的简单应用

matlab在统计学中的简单应用

x =

    18    20    10    28     21    24    15    27     20    26    17    29     13    22    14    32

p =

  5.0626e-005

anovatab =

    'Source'     'SS'     'df'    'MS'        'F'          'Prob>F'         'Columns'    [504]    [ 3]    [   168]    [20.5714]    [5.0626e-005]     'Error'      [ 98]    [12]    [8.1667]           []               []     'Total'      [602]    [15]          []           []               []

stats =

    gnames: [4x1 char]          n: [4 4 4 4]     source: 'anova1'      means: [18 23 14 29]         df: 12          s: 2.8577

4.回归分析

1 x=[35.5  34.1  31.7  40.3  36.8  40.2  31.7  39.2  44.2]'

2 y=[12  16  9  2  7  3  13  9  -1]'

3 [p,s]=polyfit(x,y,1)

p =

   -1.0996   48.5493

s =

        R: [2x2 double]        df: 7     normr: 8.6410

 

4.散点图

若直接画plot(x,y),则是折线图,

x,y为散点数据, scatter(x,y,'k*'), k为黑色,*为点型是散点图

若采用数据拟合,绘出的是平滑的曲线

1 x= linspace(1,10,10);

2 y=[1.1 2 4 6 5.5 4.1 7 6.5 9.1 3];

3 a=polyfit(x,y,3);

4 x1=[0:0.01:10];

5 y1=a(4)+a(3)*x1+a(2)*x1.^2+a(1)*x1.^3;

6 plot(x1,y1,'-r')

matlab在统计学中的简单应用

5.相关分析

[R,P,RLO,RUP]=CORRCOEF(x,y)

 

 

 

 

 

你可能感兴趣的:(matlab)