曼哈顿距离和余弦距离

曼哈顿距离

曼哈顿距离和余弦距离_第1张图片

图中红线代表曼哈顿距离,绿色代表欧氏距离,也就是直线距离,而蓝色和黄色代表等价的曼哈顿距离。曼哈顿距离又称为出租车距离,因为这是出租车在街道行驶所走的实际距离的长度。


余弦距离

余弦距离指的是特征向量夹角的余弦值。计算时只需要计算特征向量夹角的余弦值就好了,忽略特征向量的长度。


欧氏距离、曼哈顿距离和余弦距离的比较

如果你的数据集有很多特征,但是如果任意一对个体之间的欧氏距离都相等,那么你就没有办法通过欧氏距离进行比较了!曼哈顿距离在某些情况下具有更好的稳定性,如果数据集中某些特征值很大,用曼哈顿距离的话,这些特征会 掩盖其他特征间的邻近关系。后,再来说说余弦距离,它适用于特征向量很多的情况,但是它 丢弃了向量长度所包含的在某些场景下可能会很有用的一些信息。

你可能感兴趣的:(数据科学)