协同过滤——曼哈顿距离、欧式距离、皮尔逊相关系数

假设你要在亚马逊上买书，系统要给你推荐一些书，利用协同过滤的话，原理是找出与你爱好相近的用户的购书清单，把他买了而你还没买的书推荐给你。

1. 如何寻找相似用户

假设用户可以对书采取5星评级方式表达自己的喜好，0 表示很差，5 表示很好。如下图：
要找到与你喜好相近的用户，可以通过计算你与每个用户之间的打分的距离判断。距离越近，意味着喜好越相近。

2. 曼哈顿距离

图示计算过程长这样

Python实现：

def manhattan(rating1, rating2):
 distance = 0
 for key in rating1:
     if key in rating2:
         distance += abs(rating1[key] - rating2[key])
 return distance

## rating1, rating2 结构如下：
 rating1: {"Blues Traveler": 3.5, "Broken Bells": 2.0,
 "Norah Jones": 4.5, "Phoenix": 5.0,
 "The Strokes": 2.5, "Vampire Weekend": 2.0} 

  rating2 : {"Blues Traveler": 2.0, "Broken Bells": 3.5,
 "Slightly Stoopid": 3.5, "Vampire Weekend": 3.0}
##  users 结构，可能会多次用到
users = {"Angelica": {"Blues Traveler": 3.5, "Broken Bells": 2.0,
 "Norah Jones": 4.5, "Phoenix": 5.0,
 "Slightly Stoopid": 1.5,
 "The Strokes": 2.5, "Vampire Weekend": 2.0},

 "Bill": {"Blues Traveler": 2.0, "Broken Bells": 3.5,
 "Deadmau5": 4.0, "Phoenix": 2.0,
 "Slightly Stoopid": 3.5, "Vampire Weekend": 3.0},
 "Chan": {"Blues Traveler": 5.0, "Broken Bells": 1.0,
 "Deadmau5": 1.0, "Norah Jones": 3.0,
 "Phoenix": 5, "Slightly Stoopid": 1.0},
 "Dan": {"Blues Traveler": 3.0, "Broken Bells": 4.0,
 "Deadmau5": 4.5, "Phoenix": 3.0,
 "Slightly Stoopid": 4.5, "The Strokes": 4.0,
 "Vampire Weekend": 2.0},
 "Hailey": {"Broken Bells": 4.0, "Deadmau5": 1.0,
 "Norah Jones": 4.0, "The Strokes": 4.0,
 "Vampire Weekend": 1.0},
 "Jordyn": {"Broken Bells": 4.5, "Deadmau5": 4.0, "Norah Jones": 5.0,
 "Phoenix": 5.0, "Slightly Stoopid": 4.5,
 "The Strokes": 4.0, "Vampire Weekend": 4.0},