利用dataframe计算相关系数

dataframe中有corr()corrwith()两个函数可以计算两成对样本间的相关系数。

corr()计算dataframe中任意两列之间的相关系数,所以计算量比较大。

import pandas as pd

df = pd.DataFrame({'a':[1,2,3,4,5,6], 'b':[6,5,4,3,2,1]})
df.corr()

结果为:

      a      b
 a  1.0   -1.0
 b  -1.0   1.0

corrwith()计算dataframe每列与指定对象之间的相关系数,返回Series。计算量相对较小。

b = pd.DataFrame({'c':[1,2,3,4,5,6]})
df.corrwith(b.c)

结果为:

a    1.0
b   -1.0

你可能感兴趣的:(python)