QAP,社会网络分析假设检验之一

一 简介

       参考刘军的《整体网分析讲义》和《社会网络分析导论》,对QAP进行一些总结。

       在社会网络分析中,有一种方法用来研究关系之间的关系,通俗来讲,就是研究两个方阵的相关性和回归性。这种方法叫做QAP(Quadratic Assignment Procedure,二次指派程序)。它对两个方阵各个格值的相似性进行比较,给出两个矩阵之间的相关系数,同时对系数进行非参数检验,它以对矩阵数据的置换为基础。

          QAP与其他标准的统计程序的不同之处在于,矩阵的各个值之间不相互独立,因此用许多标准的统计程序就不能对其进行参数估计和统计检验,否则会计算出错误的标准差。对于这个问题,学者们利用一种随机化检验方法(randomization test)来检验,QAP属于其中一种。

二 随机化操作步骤

          给出例子,如果有两个5*5的矩阵(不相互独立,非1即0),要验证之间的相关性,用QAP方法如下:  
                                                                            矩阵A:
                  - 1 0 0 0                  
1 - 1 0 0
0 1 - 1 1
0 0 1 - 1
0 0 1 1 -
                                                                            矩阵B: 
- 0 1 1 1
0 - 0 1 1
1 0 - 0 1
1 1 0 - 0
1 1 1 0 -
       首先把每个矩阵的所有取值看成一个长向量,每个向量包含5*4=20个数字(对角线不算,n维则是n(n-1)),可以计算两个向量之间的相关系数 R=cov(A,B)/sqrt(D(A)*D(B)),即协方差除以方差只积的开根。计算出这两个向量的相关系数是-0.8165,强相关,而且是负相关。
       这是观察到的相关系数,问题是这个系数在统计意义上是否显著?实际上不能用标准的统计方法来研究这个问题,因为其与前提性假设相违背(相互独立)。我们要追究的实质问题是,在随机情况下计算的相关系数,比观察到的系数大还是小?
       做法是,随机对任何一个矩阵(其中的一个而不是两个)的标签进行置换(各行和各列同时置换),最多有5!种置换方式。再将置换后的矩阵与另一个未置换的矩阵进行相关系数的求解。统计每种情况的相关系数。统计结果为:3.3%正强相关,26.7%正中等程度相关,40%无关,26.7%负中等程度相关,3.3负强相关(-0.8165)。由此可以得出结论:观察到的相关系数和随机指派求得的系数,只有小概率是相同的,因此,这两个矩阵的强负相关性有极小的概率是随机的,也即这两个矩阵确实存在强负相关!
       如果矩阵的规模比较大,那么置换就要进行成百上千次,统计置换后得到的相关系数的分布,比较观察得到的相关系数在分布总的位置,看是否落入接受域。假设显著性水平为0.05,那么如果置换后的相关系数大于或等于观察到的相关系数的比例如果小于或等于0.05,那么表面在统计意义上,所研究的两个矩阵之间存在强相关,或者说两者之间的相关系数不太可能是随机带来的。

三 部分解释

       之所以要行和相应的列同时置换,是为了不破坏数据,使得自变量矩阵和因变量矩阵在行和列上都相互依赖。一下列出置换检验和常规检验之间的关系:
置换检验 常规检验
检验关系变量之间的关系,不关注总体的分布,非参数检验 检验属性变量之间的关系,随机样本,总体为正态分布,参数检验,检验结果可以推广到总体
       实质上,QAP可以理解为在控制已知矩阵结构的基础上,通过改变另一个矩阵中的特定点的标签,引起两个矩阵结构上的差异,验证原结构的显著性。QAP是一种很好的可以排除虚假结构关系的方法。

四 QAP回归分析

       上面的部分讲的是两个矩阵的相关性分析,如果研究的是多个矩阵与一个矩阵的回归关系,那么就要用到QAP回归分析。回归分析与相关分析类似的,不同之处在于一下几点:
  1. 由求两个矩阵的相关系数->求多个矩阵与一个矩阵的多元回归系数及判定系数
  2. 单尾检验->双尾检验
       以上为一部分总结,如有错误,请指正!

你可能感兴趣的:(SNA,社会网络分析,QAP,SNA)