统计学原理:相关系数

一、相关系数分类
常见的相关系数共有三个分别是spearman相关、pearson相关和秩相关
1、pearson相关
pearson系数用来描述两组线性的数据一同变化移动的趋势。
用数学公式表示,皮尔森相关系数等于两个变量的协方差除于两个变量的标准差。
统计学原理:相关系数_第1张图片
值域:[-1,1]
如果两个变量同向变化,那么同向变化的幅度越接近于线性值越接近于1,如果两个变量逆向变化,那么逆向变化的幅度越接近于-1,pearson相关系数越接近于-1.
例:

test=pd.read_csv('test.csv',engine='python')
test.corr()
对于相关性关系来说,如果两个变量的相关关系越接近于y=x这种关系,那么相关系数
越大,越接近于y=-x这种关系,相关系数越接近于-1
以y=x**2,z=x**3,q=ln(x)来说
相关性分别为0.75,0.95,0.89。
可以说相关性越强,两者同增同减的情况越相似。

你可能感兴趣的:(统计学原理)