机器学习中的距离计算方法

机器学习中的距离计算方法?

参考博文

在做很多研究问题时常常需要估算不同样本之间的相似性度量(Similarity Measurement),这时通常采用的方法就是计算样本间的“距离”(Distance)。采用什么样的方法计算距离是很讲究,甚至关系到分类的正确与否。

1. 欧式距离

欧氏距离是一个通常采用的距离定义,指两个点之间的真实距离

二维:
在这里插入图片描述
三维:
在这里插入图片描述
n维:
在这里插入图片描述

2. 曼哈顿距离
我们可以定义曼哈顿距离的正式意义为L1-距离或城市区块距离,也就是:

  • 在欧几里德空间的固定直角坐标系上两点所形成的线段对轴产生的投影的距离总和。

机器学习中的距离计算方法_第1张图片
在平面上,坐标点(x1,y1)与坐标点(x2,y2)的曼哈顿距离为:
d ( i , j ) = ∣ x 1 − x 2 ∣ + ∣ y 1 − y 2 ∣ d(i,j)=|x_1 - x_2|+|y_1 - y_2| d(i,j)=x1x2+y1y2

3.余弦距离

  • 一个向量空间中两个向量夹角间的余弦值作为衡量两个个体之间差异的大小
  • 余弦值接近1,夹角趋于O,表明两个向量越相似
  • 余弦值接近于0,夹角趋于90度,表明两个向量越不相似。
    c o s = x 1 ∗ x 2 + y 1 ∗ y 2 x 1 2 + y 1 2 ∗ x 2 2 + y 2 ∗ 2 cos = \frac{x_1*x_2+y_1*y_2}{\sqrt{x_1^2+y_1^2}* \sqrt{x_2^2+y_2*2}} cos=x12+y12 x22+y22 x1x2+y1y2

4.切比雪夫距离

切比雪夫距离是向量空间中的一种度量,二个点之间的距离定义是其各坐标数值差绝对值的最大值.

二维平面两点:
m a x { ∣ x 1 − x 2 ∣ , ∣ y 1 − y 2 ∣ } max\{{|x_1-x_2|,|y_1-y_2|}\} max{x1x2,y1y2}
两个n维向量:
在这里插入图片描述
或者是
在这里插入图片描述

你可能感兴趣的:(机器学习,机器学习,线性代数,算法,概率论)