通过矩阵求两个向量集中元素两两之间的欧氏距离(python实现),比直接分开求更快速

在很多算法中都会涉及到求向量欧式距离,例如机器学习中的KNN算法,就需要对由训练集A和测试集B中的向量组成的所有有序对 (Ai,Bi) ,求出 Ai Bi 的欧式距离。这样的话就会带来一个二重的嵌套循环,在向量集很大时效率不高。

这里介绍如何将这一过程用矩阵运算实现。

假设有两个三维向量集,用矩阵表示: 

A=[a11a12a21a22a31a32]

B=b11b12b13b21b22b23b31b32b33

要求A,B两个集合中的元素两两间欧氏距离。

先求出 ABT : 

ABT=k=13ak1bk1k=13ak2bk1k=13ak1bk2k=13ak2bk2k=13ak1bk3k=13ak2bk3

然后对 A BT 分别求其中每个向量的模平方,并扩展为2*3矩阵: 

Asq=k=13(ak1)2k=13(ak2)2k=13(ak1)2k=13(ak2)2k=13(ak1)2k=13(ak2)2

Bsq=k=13(bk1)2k=13(bk1)2k=13(bk2)2k=13(bk2)2k=13(bk3)2k=13(bk3)2

然后: 

Asq+Bsq2ABT=k=13(ak1bk1)2k=13(ak2bk1)2k=13(ak1bk2)2k=13(ak2bk2)2k=13(ak1bk3)2k=13(ak2bk3)2

将上面这个矩阵一开平方,就得到了A,B向量集两两间的欧式距离了。

下面是python实现:

import numpy
def EuclideanDistances(A, B):
    BT = B.transpose()
    vecProd = A * BT
    SqA =  A.getA()**2
    sumSqA = numpy.matrix(numpy.sum(SqA, axis=1))
    sumSqAEx = numpy.tile(sumSqA.transpose(), (1, vecProd.shape[1]))    
    SqB = B.getA()**2
    sumSqB = numpy.sum(SqB, axis=1)
    sumSqBEx = numpy.tile(sumSqB, (vecProd.shape[0], 1))    
    SqED = sumSqBEx + sumSqAEx - 2*vecProd   
    ED = (SqED.getA())**0.5
    return numpy.matrix(ED)

转自http://blog.csdn.net/uwell_peng/article/details/49992759
     
     
     
     
  • 1
  • 2
  • 3
  • 4
  • 5
  • 6
  • 7
  • 8
  • 9
  • 10
  • 11
  • 12
  • 13

你可能感兴趣的:(通过矩阵求两个向量集中元素两两之间的欧氏距离(python实现),比直接分开求更快速)