python权重相似度矩阵_如何在numpy python中创建相似度矩阵?

从技术上讲,这不是一个编程问题,而是一个数学问题.但我认为你最好使用方差 – 协方差矩阵.或相关矩阵,如果值的比例非常不同,比如说,而不是:

>>> x

array([[5, 3, 0],

[3, 0, 5],

[5, 5, 0],

[1, 1, 7]])

你有:

>>> x

array([[5, 300, 0],

[3, 0, 5],

[5, 500, 0],

[1, 100, 7]])

要获得方差 – cov矩阵:

>>> np.cov(x)

array([[ 6.33333333, -3.16666667, 6.66666667, -8. ],

[ -3.16666667, 6.33333333, -5.83333333, 7. ],

[ 6.66666667, -5.83333333, 8.33333333, -10. ],

[ -8. , 7. , -10. , 12. ]])

或相关矩阵:

>>> np.corrcoef(x)

array([[ 1. , -0.5 , 0.91766294, -0.91766294],

[-0.5 , 1. , -0.80295507, 0.80295507],

[ 0.91766294, -0.80295507, 1. , -1. ],

[-0.91766294, 0.80295507, -1. , 1. ]])

这是查看它的方式,对角线单元格,即(0,0)单元格,是X中第一个向量与自身的相关性,因此它是1.其他单元格,即(0,1) )细胞,是X中第1和第2个载体之间的相关性.它们是负相关的.或者类似地,第一和第三细胞正相关.

协方差矩阵或相关矩阵避免了@Akavall指出的零问题.

你可能感兴趣的:(python权重相似度矩阵)