欧几里德距离评价算法(集体智慧编程)

欧几里德距离是指多维空间两点间的距离,这是一种用直尺测量出来的距离。如果将两个点分别标记为(p1,p2,p3....pn)和(q1,q2,q3.....qn),则欧几里德距离的计算公式为:



 

 

欧几里德距离评价算法是一个非常简单的计算相似度评价值的方法。它以经过人们一致评价的物品为坐标轴,然后将参与评价的人绘制到图上,并考查他们彼此间的距离远近。如图:


欧几里德距离评价算法(集体智慧编程)
该图显示了处于“偏好空间”中用户的分布状况。Toby在Snakes轴线和Dupree轴线上所标示的数值分别是4.5和1.0.两个在“偏好空间”中的距离越近,他们的兴趣偏好就越相似。因为这张图是二维的,所以在同一时间内你只能看到两项评分,但是这一规则对于更多数量的评分项而言也是同样适用的。

 

为了计算图上Toby和LaSalle之间的距离,我们可以计算出每一轴向上的差值,求平方后再相加,最后对总和取平方根。得出的这个值即为欧几里德距离。

python代码如下:

from math import sqrt
sqrt(pow(4.5-4,2)+pow(1-2,2))

 

上述算式可以计算出距离值,偏好越相似的人,其距离就越短,不过,我们还需要一个函数,来对偏好越相近的情况给出越大的值。为此,可以将函数值加1(这样就可以避免遇到被零整除的错误了),并取其倒数:

1/(1+sqrt(pow(4.5-4,2)+pow(1-2,2)))

 函数返回介于0到1之间,返回则表示两人具有一样的偏好。

 

你可能感兴趣的:(数据分析,算法,python,数据挖掘,欧几里德)