Item2Item中为什么可以用欧式距离衡量相似度

当被腾讯面试官问道这个问题,我的第一反应和大多数的你一样,用欧式距离衡量相似度不是理所当然的吗?为啥还有问什么。

如果是这样想的,那么对于这个问题你还是知其然不知其所以然。

俗话说,吃一堑,长一智。总结一下两个原因,更详细的去知乎寻答案吧。


1.首先,用欧式距离来计算Item之前的相似度,不是直接计算Item 打分矩阵的欧式距离,而是,需要先对Item的特征进行归一化,保证各个维度是在相同的刻度级别上取值及相同刻度级别上影响相似度。举个简单栗子:通过身高和体重衡量两个人体型相似度,总不能说路人A(身高158,体重90)和路人B(身高168,体重100)是身材完全一样的人吧;

2.重点:用欧式距离衡量相似度有一个假设前提,假设各个维度对相似度的影响是一致的(个人觉得这是比较重要的原因)

若有错误或者更好的回答,欢迎指正。

你可能感兴趣的:(算法基础)