机器学习算法中几种常用距离计算的归纳

欧氏距离(最易于理解的一种距离计算方法,源自欧式空间中两点间的距离公式)d=sqrt((x1-x2)2+(y1-y2)2)

马氏距离 (马氏距离是由印度统计学家马哈拉诺比斯(P.C. Mahalanobis)提出的,表示数据的协方差距离。它是一种有效的计算两个未知样本集的相似度的方法。与欧氏距离不同的是它考虑到各种特性之间的联系(例如:一条关于身高的信息会带来一条关于体重的信息,因为两者是有关联的)并且是尺度无关的(scale-invariant),即独立于测量尺度。)

曼哈顿距离(从名字就可以猜出这种距离的计算方法了。想象你在曼哈顿要从一个十字路口开车到另外一个十字路口,驾驶距离是两点间的直线距离吗?显然不是,除非你能穿越大楼。实际驾驶距离就是这个“曼哈顿距离”。而这也是曼哈顿距离名称的来源,曼哈顿距离也称为城市街区距离(City Block distance)。)d=|x1-x2|+|y1-y2|

切比雪夫距离 max(|x2-x1|,|y2-y1|)

在数学中,切比雪夫距离或是L∞度量是向量空间中的一种度量,二个点之间的距离定义是其各坐标数值差绝对值的最大值。以数学的观点来看,切比雪夫距离是由一致范数(英语:uniform norm)(或称为上确界范数)所衍生的度量,也是超凸度量(英语:injectivemetric space)的一种。如图示2,依以上的度量,以任一点为准,和此点切比雪夫距离为r的点会形成一个正方形,其边长为2r,且各边都和坐标轴平行。

 闵可夫斯距离(闵氏距离不是一种距离,而是一组距离的定义。)

(1)闵氏距离的定义

两个n维变量a(x11,x12,…,x1n)与b(x21,x22,…,x2n)间的闵可夫斯基距离定义为:

其中p是一个变参数。

当p=1时,就是曼哈顿距离

当p=2时,就是欧氏距离

当p→∞时,就是切比雪夫距离

根据变参数的不同,闵氏距离可以表示一类的距离。

海明距离

在信息编码中,两个合法代码对应位上编码不同的位数称为码距,又称海明距离。(10101和00110从第一位开始依次有第一位、第四、第五位不同,则海明距离为3)

马氏距离:https://baike.baidu.com/item/%E9%A9%AC%E6%B0%8F%E8%B7%9D%E7%A6%BB/8927833?fr=aladdin

http://blog.csdn.net/u010167269/article/details/51627338?_t_t_t=0.0028043033089488745

你可能感兴趣的:(机器学习)