评定数据之间的相似度指标----距离

文章目录

  • 前言
  • 一、基础距离
    • 曼哈顿距离(Manhattan)
    • 欧几里得距离(Euclidean)
  • 二、高级距离
    • 马氏距离(Mahalanobis Distance)
    • 2.余弦距离(cosine distance)
  • 三,类内距离和类间距离


前言

检测点到目标的的距离通常作为算法的分类或判别依据,被用作评定数据之间的相似度指标


提示:以下是本篇文章正文内容,下面案例可供参考

一、基础距离

假设两点如下图所示:
评定数据之间的相似度指标----距离_第1张图片

曼哈顿距离(Manhattan)

在这里插入图片描述
评定数据之间的相似度指标----距离_第2张图片

欧几里得距离(Euclidean)

在这里插入图片描述
评定数据之间的相似度指标----距离_第3张图片

二、高级距离

马氏距离(Mahalanobis Distance)

马氏距离是度量学习中一种常用的距离指标,同欧氏距离、曼哈顿距离、汉明距离等一样被用作评定数据之间的相似度指标。

马氏距离(Mahalanobis Distance)是一种距离的度量,可以看作是欧氏距离的一种修正,修正了欧式距离中各个维度尺度不一致且相关的问题。
举例:欧式距离近就一定相似?

先举个比较常用的例子,身高和体重,这两个变量拥有不同的单位标准,也就是有不同的scale。比如身高用毫米计算,而体重用千克计算,显然差10mm的身高与差10kg的体重是完全不同的。但在普通的欧氏距离中,这将会算作相同的差距。

再例如:像下图一样,A与B相对于原点的距离是相同的。但是由于样本总体沿着横轴分布,所以B点更有可能是这个样本中的点,而A则更有可能是离群点。这种情况下,欧几里得距离显然不是一个好的度量方式。评定数据之间的相似度指标----距离_第4张图片
马氏距离只需要将变量按照主成分进行旋转,让维度间相互独立,然后进行标准化,让维度同分布就OK了

由主成分分析可知,由于主成分就是特征向量方向,每个方向的方差就是对应的特征值,所以只需要按照特征向量的方向旋转,然后缩放特征值倍就可以了,可以得到以下的结果:

评定数据之间的相似度指标----距离_第5张图片
离群点就被成功分离,这时候的欧式距离就是马氏距离。

评定数据之间的相似度指标----距离_第6张图片

2.余弦距离(cosine distance)

余弦距离,也称为余弦相似度,是用向量空间中两个向量夹角的余弦值作为衡量两个个体间差异的大小的度量。

余弦值越接近1,就表明夹角越接近0度,也就是两个向量越相似,这就叫"余弦相似性"。
评定数据之间的相似度指标----距离_第7张图片


三,类内距离和类间距离

一、定义
类内距离(intra-class):同一类各模式样本点间的均方距离
类间距离(inter-class):顾名思义不同类间的距离
在Triplet loss中会遇到 intra-class distances 是指同一个个体在不同摄像机下的距离
评定数据之间的相似度指标----距离_第8张图片
评定数据之间的相似度指标----距离_第9张图片
评定数据之间的相似度指标----距离_第10张图片
评定数据之间的相似度指标----距离_第11张图片

你可能感兴趣的:(人工智能基础知识,人工智能,算法)