皮尔逊相关系数和斯皮尔曼相关系数(等级系数)与典型相关分析

粗略的总结,仅用做学习
1.皮尔逊相关系数
针对符合正态分布的,以及连续型的两组变量
就是概率统计中常用的相关系数计算方法
会分总体和样本两种计算方式

2.斯皮尔曼相关系数
针对离散型的,有序的两组变量(分等级的)

3.典型相关分析

思想类似于PCA,讲多变量进行降维成“两组变量”后再用相关系数进行分析。
这里的两大组变量,一组变量都是多维的,但两组变量的维度不要求相等

参考链接:
https://blog.csdn.net/Aloneingchild/article/details/108674898

https://blog.csdn.net/lambsnow/article/details/79972145

https://zhuanlan.zhihu.com/p/94070722

对于特征筛选:
https://blog.csdn.net/chenpe32cp/article/details/79644803
从中得到的结论是:
Pearson相关系数无法反应非线性关系,也就是说非线性关系会得到相关系数为0的结果。需要可视化来进行检验
线性回归的方法可以从系数上反应特征的重要程度,但是在特征之间也存在相互关系时候不准确。这种情况叫做多重线性关系

多因素方差分析只是用来定性的。

你可能感兴趣的:(数学建模笔记,概率论)