python:numpy的corrcoef计算相关系数

corrcoef(x, y=None, rowvar=True, bias=np._NoValue, ddof=np._NoValue)

函数常用的是前三个参数,x和y分别是需要计算相关系数的两个随机变量,当rowvar为True(默认情况)时,每一行代表一个随机变量,否则每一列代表一个随机变量。
该函数计算的是Pearson(皮尔逊)相关系数,大学学过概率论与数理统计的都知道公式
在这里插入图片描述
其中X,Y分别为两个随机变量,cov为X和Y的协方差,σx,σy分别为X和Y的标准差。 当ρ=0时,X和Y不存在线性关系,即不相关;当0<ρ<1时,X和Y正相关;当-1<ρ<0时,X和Y负相关;当|ρ|=1时,X和Y存在严格的线性关系,二者线性相关。
除此之外,也可以使用scipy包中pearsonr方法from scipy.stats.stats import pearsonrr, p_value = pearsonr(x, y),函数传入两个参数分别为两个随机变量,返回值有两个,r为随机变量之间的相关系数,p_value为显著性水平,即小概率事件——x,y之间不相关的概率。

你可能感兴趣的:(机器学习,python计算相关系数,numpy的corrcoef)