典型相关分析(Matlab实现函数)

 

先附上自己认为写的比较好的一篇博客。

https://www.cnblogs.com/duye/p/9384821.html

同时要指出自己博文的问题:对于Matlab中canoncorr中的stats参数结果并不是很清晰,自己统计不行。

典型相关分析

            不仅需要考虑两个变量之间的相关程度,而且还需要考察多个变量与多个变量之间的相关性。

            比若说工厂管理人员需要了解原料的主要质量指标X1,x2..Xp与产品的主要质量指标Y1,Y2,。。。Yp之间的相关性;又或者病人的一组体检化验指标与疾病之间的相关性

            典型相关分析就是度量两组变量之间相关程度的一种多元统计方法。

            是两个随机变量之间相关性在两组变量之下的推广。

 

基本原理

  对于两组随机变量(X1,X2,…,Xp)和(Y1,Y2,..,Yp),像主成分分析那样,考虑(X1,X2,…,Xp)的一个线性组合U及(Y1,Y2,..,Yp)的一个线性组合V,希望找到U和V之间的最大可能的相关系数,来充分反映两组变量之间的关系。这样就可以把研究两组随机变量间相关关系的问题转化为研究两个随机变量之间的相关关系。如果说一对变量(U,V)还不能完全刻画两组变量间的相关关系,可以继续找第二对变量,但是要保证第二对的变量与第一对的变量不相关,直至找不到相关变量时为止。

1.总体典型相关变量

典型相关分析(Matlab实现函数)_第1张图片

一般地,若前k-1对典型变量还不足以反映X,Y之间的相关性,还可以构造第k对线性组合。

在约束条件

            Var(Uk)=var(Vk)=1;

Cov(Uk,Uj)=cov(Uk,Vj)=cov(Vk,Uj)=cov(Vk,Vj)=0(1<=j

求得ak,bk时得p(Uk,vk)取得最大值。

2.总体典型变量与典型相关系数的计算方法。

 

典型相关分析(Matlab实现函数)_第2张图片

 

典型相关分析(Matlab实现函数)_第3张图片

5.3.2 样本的典型变量与典型相关系数

 在实际中,(X’,Y’)’的协方差矩阵 (或者相关系数矩阵R)一般是未知的,我们具有的资料通常是关于X和Y的n组观测数据。

和主成分分析一样,计算样本协方差矩阵作为 或者 的估计,

代替之后呢样本典型变量和典型相关系数计算方法同总体典型变量和典型相关洗漱袋额计算方法一样。

 

 

Matlab命令为 canoncorr,调用格式如下

[A,B,r,U,V,stats]=canoncorr(X,Y);

param:

  x:原始变量x矩阵,每列一个自变量指标,第i列是 xi 的样本值

  y:原始变量y矩阵,每列一个因变量指标,第j列是 yj 的样本值

return:

  a:自变量x的典型相关变量系数矩阵,每列是一组系数。

        列数为典型相关变量数

  b:因变量y的典型相关变量系数矩阵,每列是一个系数

  r: 典型相关系数。即第一对之间的相关系数、第二对之间的相关系数…

  u:对于X的典型相关变量的值

  v:对于Y的典型相关变量的值

  stats:假设检验的值<详细用一下就知道了>

例子

5.3.3 典型相关系数的显著性检验

典型相关分析是够恰当,取决于两组变量之间是否真正的相关,所以我们需要进行检验。

 

 

1.检验方法

大体的意思:先进行假设,原假设‘不能进行典型相关分析’,然后检验,一直到所有的(U,V)对才可以结束,检验的方法:似然比统计量。

 

典型相关分析(Matlab实现函数)_第4张图片

你可能感兴趣的:(统计学,典型相关分析,变量之间的分析)