【python】求多变量/样本(矩阵)之间的相关性系数

创作日志: Pearson或Spearson代表的是两个变量之间的相关性,因此一般输入是两个向量(vector),那么当我们有多个变量时,怎样计算他们两两之间的相关性系数呢?得到的correlation matrix各元素代表的又是什么意思呢?


举例:
矩阵A有两个样本:a1 与 a2,矩阵B有两个样本:b1 与 b2
我们可以利用相关性系数计算函数直接得到 a1 与 b1 、 a2 与 b2 的相关性

【python】求多变量/样本(矩阵)之间的相关性系数_第1张图片

import numpy as np

# 创建两个示例矩阵
matrix1 = np.array([[1, 2, 3],
                   [4, 5, 6]])

matrix2 = np.array([[9, 2, 7],
                   [6, 5, 0]])

# 使用NumPy的corrcoef函数计算Pearson相关性系数
correlation_matrix = np.corrcoef(matrix1, matrix2)

print(correlation_matrix)

打印结果:

[[ 1.          1.         -0.2773501  -0.93325653]
 [ 1.          1.         -0.2773501  -0.93325653]
 [-0.2773501  -0.2773501   1.         -0.0862796 ]
 [-0.93325653 -0.93325653 -0.0862796   1.        ]]

结果是一个4x4的矩阵,因为matrix1有两个变量/样本,matrix2有两个变量/样本,共四个样本,每两个样本之间一一对应,包括自身与自身,就形成了4x4,下面是对应关系:

【python】求多变量/样本(矩阵)之间的相关性系数_第2张图片
想要哪两个变量/样本之间的相关性系数,直接取对应元素即可。

你可能感兴趣的:(Python,python,矩阵,开发语言)