相似度衡量: 苏剑林博客-1

测地线距离(Geodesic Distance):地表上两点之间的最短路径的距离。

如下图所示,在二维空间中,两个黑点之间的欧式距离是虚线的长度,测地线距离时d12+d23+d34+d45的距离之和。

相似度衡量: 苏剑林博客-1_第1张图片

 在三维空间中,距离是三维空间表面上的两点之间的距离。

相似度衡量: 苏剑林博客-1_第2张图片

 相似度论文:Unsupervised Opinion Summarization Using Approximate Geodesics

 在计算相似度时,尤其是在文本领域,一般是将语句转为嵌入后,通过距离函数计算两点之间的相似度分值。

其中,d()表示距离函数。v表示词编码函数或方法。 

欧式距离适合于短距离的测度,而在远距离测量时,是测地线距离更加接近于真实距离。

你可能感兴趣的:(相似度,算法)