(一)定义理想态:
该模块的理想态:用户以最小成本找到感兴趣的书籍。
衡量标准:用户对推荐结果满意。(推荐结果的点击率)
(二)抽样调研
调研目标:发现推荐中的问题,找到推荐优化方向;
抽样对象:推荐结果点击率低于5%的书籍详情页;
分析方法:梳理抽样对象和推荐书籍的相关维度信息(包括:类型、作者、豆列、豆瓣成员常用标签、评分、出版社),进而梳理抽样对象及推荐书目的相关性。
具体抽样及分析结果:(因不知道具体的点击数据,在此选十组样本做分析,)
第一组:调研对象《决策与理性》
第二组:《弄假成真》
第四组:《天气预报》
第五组:《别了,上海》
第六组:《舒勒的怪兽》
第七组:《出租车!》
第八组:《4321》
第九组:《毕加索传:1907-1916(卷二)》
第十组:《那些古怪又让人忧心的问题》
(三)推荐策略分析
推荐策略的相关要素:
通过10本书的抽样分析,基本可以确定的豆瓣推荐策略的相关因素包括:作者、类型、应用领域、系列、关键标签、书名和豆列;
各相关要素的权重推测:
以上的相关要素对于推荐结果的影响是有不同权重的,通过分析初步得出的权重的从高到低的顺序应该为:作者、系列、类型、应用领域、关键标签、书名和豆列;
(四)推荐策略问题分析
举例说明现存问题:
(1)从第二、三组可以看出,对于作者作品较多而且同系列书籍较多时,推荐结果全部为该作者的该系列书籍,局限性较高;
(2)从第六组看出,对于比较冷门的图书,可得到的推荐结果少(召回率低),而且与该书相关性较差(准确率也不高);
(3)从第九组可以看出,对于比较专业的小众书籍的召回率还需提高,同系列的相关书籍并没有得到推荐;
(五)推荐策略优化方向