推荐系统评价指标

离线评估 offline evaluation

 一般包括两个评估任务:评分预测和top n推荐‘

 

对于评分预测模型:训练数据集训练好数据,测试数据集预测用户对物品的评分。评价指标:MAE和RMSE

其中T表示测试集。 

对于Top N模型:对排名进行评估。评价指标:准确率,召回率,F1

假设推荐列表长度为n,用户集合U,给用户u推荐的商品集合S_u,用户u在测试集里实际动过过的物品集合T_u


在线评估 online evaluatuion

A/B test

将用户划分为A,B两组,A实验组用户,接受所设计的推荐算法推荐的商品,B对照组用户,接受基线方法推荐的商品。通过对比两组用户的行为来评估推荐算法的性能。

CTR:用户点击率,通过该算法计算出的被点击的项目占推荐项目总数的百分比

CR:用户转化率,用户购买的项目占被点击的项目的比率。

你可能感兴趣的:(推荐系统评价指标)