读《个性化推荐评价方法综述-周涛》

  个性化推荐系统通过建立用户与产品之间的二元关系,利用用户已有的选择过程或相似性关系挖掘每个用户潜在感兴趣的对象,进而进行个性化推荐,其本质就是信息过滤。一个完整的推荐系统由3部分组成:收集用户信息的行为记录模块、分析用户喜好的模型分析模块和推荐算法模块,其中,推荐算法模块是推荐系统中最为核心的部分。目前的推荐算法主要包括协同过滤推荐算法、基于内容的推荐算法、基于用户一产品二部图关系的推荐算法及混合推荐算法。每年都会涌现大量新的推荐算法,其作者都声称自己的算法在某些方面是最好的

  评价推荐算法本质上是十分困难的。1)不同的算法在不同数据集上的表现不同。;2)评价的目的也不尽相同,许多研究工作注重于评价算法预测打分的准确度。;3)对不同的数据是否需要在线用户的测试?,离线测试只能评价用户“已经打分”的产品。对于用户没有选择或并不知道的产品,推荐算法就无法对这些产品进行评估。;4)选择哪些指标进行综合评价也十分困难

准确度评价指标

  针对不同的系统,已有的准确度指标有:预测准确度、分类准确度、排序准确度、预测打分关联、

距离标准化指标和半衰期效用指标。

准确度之外的评价指标

  本节介绍除了准确率之外度量推荐系统的评价指标,包括推荐的流行性和多

样性、覆盖率、新鲜性和意外性以及用户的满意度等度量指标

小结

  总结起来,推荐系统的评价工作可以从以下方面继续进行深入研究:

  1)       用户对算法准确度的敏感度。对于不同的指标,准确率改变多少用户就可以察觉系统的改变?用户对哪个准确度指标最敏感?用户对准确度的感受受到哪些因素影响?

  2)       算法对不同领域的普适性。不同的推荐算法在不同的数据集上的表现不同。对于某个推荐算法,在什么类型的数据上可以发挥最好的效果。这些需要进行深入的研究。

  3)       广义的质量评价。

  4)       个人隐私的保护。推荐系统的本质是利用用户现有的选择信息或者配置文件,发掘用户的兴趣、爱好。用户如果希望得到推荐系统的帮助,必须共享一些个人的隐私数据。对系统来说,不仅需要有效保护用户的个人隐私,而且需要在尽可能少利用用户隐私数据的情况下做出准确、合理的推荐。反过来,用户只有在确认系统可以有效保护个人的隐私数据的情况下,才愿意使用推荐系统

  5)       推荐系统的鲁棒性研究。

你可能感兴趣的:(论文随笔,推荐系统)