K最邻近算法

毕达哥斯拉公式

比较两个东西的相像程度,先对这两个东西进行特征提取,比如橙子和柚子,橙子的个头为2,红的程度为2,而柚子个个头为4,红的程度为5,这时有一种水果个头为2,红的程度为1,判断这个水果和橙子更像还是和柚子更像,只需要计算离谁更近即可。



从图中可以计算出到这个水果到橙子的距离


以及到柚子的距离


根据计算结果可看出这种水果和橙子更加相似。
这里是二维的比较,也可以使用这个公式进行三维、多维的比较。

回归

如果要预测一个人对某部影片的评分,就需要先找出与他最近的K个人(K值可以为2、5、10、1000),计算出他们对这部电影的平均打分,然后再根据这些人打分的平均值来预测他的可能打分是多少,这就是回归。

挑选合适的特征

在挑选特征进行比较时,需要找出和目前评判联系最紧密的特征,而且不能倾向于某一方面。

你可能感兴趣的:(K最邻近算法)