[小结] 二元变量相关性分析

1、服从正态分布的两连续变量,若有一份随机样本,可绘制散点,发现有直线趋势,进而计算皮尔森相关系数,以描述两变量的线性关系;

2、若不满足正态分布的两连续变量,发现有直线趋势,进而计算spearman秩相关系数,以描述两变量的相关关系。

3、对两个反映属性的分类变量,若有一份随机样本,可做交叉分类的频数表,利用独立性卡方检验和列联表系数来描述关联性。

4、相关系数和列联系数的计算都是基于一份双变量随机样本,尽管将多组样本比较的资料带入公式也能计算,但计算结果并不是总体相关系数的估计值,没有任何意义。

5、相关系数与列联系数只能描述两变量间在数量上的联系并不意味着物理、心理或生理上的联系,联系更不意味这因果。




你可能感兴趣的:(概率与数理统计,二元变量,相关性分析)