2.2.3 Analyzing the output
在之前的程序运行结果中我们得到的结果输出是:
RecommendedItem [item:104, value:4.257081]
程序要求选择一个最适合的,排名最考前的书目给用户1,结果给出来了,就是104,原因是因为评分达到了4.25.这个是所有书目里面分数最高的了。
我们再次结合之前的图来进行分析:
书目107没有没推荐出来,虽然107也是可以推荐的,但是推荐的情形应该是有那些有相反的喜好的用户。因为用户3和用户1的喜好是相反的。
选择出来了104,而没有选择106,这样也是很有道理的,因为104相比106,有更高的评分。
很明显,通过原始数据我们很难判断哪个书是比较适合用户1的,但是我们的推荐系统通过精细的计算,给出了一个比较满意有意义的答案,经得起推敲。 正是这种特性,我们才会爱上机器学习。
但是在现实中,我们面对的原始数据可能会很大很多,而且充满噪音。譬如说,对于一本书的评价,可能包含用户对他的点击,阅读,停留时间等等,但是很多这样的数据都不是特别精确,可能用户是误点击,或者点击了但是不一定稀罕他,所以这种情况就不应该被计算在里面。
因此我们必须明白,通过这样的数据我们的确可以简单的获取我们想要的结果推荐,并且不会很繁琐。但是我们要明白,这样标准的操作流程会导致差强人意的结果。在后面的某一个时间会进一步解释我们如何通过调配系统来获得精准的推荐结果。
下面是程序运行的简要流程图:
1.君子应该‘有所为有所不为’,每个人的精力都是有限的,不能尽善尽美,选择最重要的最紧要的事情来做,深化。
2.失去了梦想,失去了激情,失去对很多事情的向往,没有了之前的豪情,对妹子的渴望也已不再。但是俺对开心的向往,对财务自由的向往永远不会失去。爱亲人爱自己,活着也很有价值。
3.每一天都没什么事干,日子也不能白过,不能在这里坐等过年。重拾Hadoop,mahout算法分析搞起来。
4.年纪不大不小的时候,千万不要心浮气躁,欲速不达。一切都要平常心,心平气和,与人为善,助人为乐,遵守社会的传统。
5.不要太贪婪,前世因今生果,要敬畏。若水的品质虽不能做到,但是俺往这边靠,不争不抢不急躁,一定可以拿到自己想要拿到的。
Charles 于2015-12-18 Phnom Penh
版权说明:
本文由Charles Dong原创,本人支持开源以及免费有益的传播,反对商业化谋利。
CSDN博客:http://blog.csdn.net/mrcharles
个人站:http://blog.xingbod.cn