距离的度量(Dissimilarity Measure)

Minkowski Distance(闵式距离)

D=(i=1d|xiyi|p)1p

  • (1)适用于数值型数据(numeric data)
  • (2)欧氏距离是闵式距离在( p=2 )的特例

Simple Matching Distance(简单匹配距离)

δ(xj,yj)={0,1,xj=yjxjyjD=j=1dδ(xj,yj)

  • (1)适用于类别型数据(categorical data)

混合距离(Mixed Distance)

D=j=1m(xjyj)2+βj=m+1dδ(xj,yj)

  • (1)适用于混合类型的特征向量(既包含数值型、又包含类别型)

曼哈顿距离(马氏距离)

D=(xy)TΣ1(xy)

  • (1)适用于数值型数据(numeric data)
  • (2)利用了Cholesky Transformation 来消除不同维度之间的相关性尺度不同对距离的影响;

Σ=LLTz=L1(xμ)zTz=(L1(xμ))T(L1(xμ))=(xμ)TΣ1(xμ)

距离度量纵横谈

  • (1)除马氏距离以外的所有的距离度量都只是单纯利用这两个特征向量本身,而不依赖其他样本。
  • (2)马氏距离是唯一一个计算两个特征向量的距离依赖整体样本的, Σ=XTX

References

[1] 漫谈:机器学习中距离和相似性度量方法

你可能感兴趣的:(距离的度量(Dissimilarity Measure))