【position bias 1】 Leveraging Position Bias to Improve Peer Recommendation

position bias一般出现于展现系统中,指由于展现位置对被展示事物的影响。比如在百度的搜索结果中,同样一个网站链接,在搜索结果中位置越靠前一般就能带来更多的点击。一个生活中的现象是商店的位置,好的位置能带来持续的人流量,而位置偏僻的则极少有人光顾。

这里主要记录一些相关的调研,形式以paper内容为主,尽量加入一些自己的理解

Leveraging Position Bias to Improve Peer Recommendation

该paper类似于调研,作者在amazon的任务平台上发布任务:有100篇科学观点描述及简介(文章称为scientisic story),然后测试者会喜欢的话会点击推荐(recommand), 会有不同的展现策略顺序被测试,展现形式是自上而下的瀑布流,因此会引入position bias(影响被测试者的注意力,越靠前的会更容易被关注),其目的是:由于人的认知偏差,不同的展现顺序会影响对各个展现的attention, 因此展现顺序十分重要,文章就是要比较不同策略下的效果。

采用的展现顺序策略有如下:

  1. 完全随机展现(根据结果可以比较出来不同story的质量)
  2. story的累积活跃度(累积被点击的次数)
  3. 最近活跃(即根据最近的一次被用户点击的时间)
  4. 固定顺序(根据后文是随机的)
  5. 固定顺序(与4的顺序相反)

实验结果:

由于策略1是随机打乱顺序让用户评估,可以根据策略1来确定各个story的相对质量,并利用各个位次上的实际点击/预期点击 来计算positon-bias,如下图:

【position bias 1】 Leveraging Position Bias to Improve Peer Recommendation_第1张图片

文中对最后翘起来的部分做了解析: 部分用户会从后往前看(仍不太理解),另外作者认为可能是被测试者想表明自己看完了所有的(是付费测试,不是所有人都能拿到钱)

整个测试结果如下图:

【position bias 1】 Leveraging Position Bias to Improve Peer Recommendation_第2张图片

图中横坐标表示story的质量(在随机顺序测试中确定的),而纵坐标是不同策略下的实际质量,各个图表示的为不同策略下对点击的影响(比如最后一列popularity代表策略2,其方差就比较大,分布比较散,可以理解为position bias的影响,即一部分质量好的story由于本身比较好,如果一开始随机被排到了前了,按策略2更容易被排到前面,而一部分即使质量好,在实验开始随机排列是被排的靠后,不容易popular, 也导致最终整体的点击比较少)

按照activity的策略则可等价认为是随机的,fixed的策略就比较容易理解了。

文章的标题是利用position bias来提高推荐效果,但感觉整个文章是在做实验描述现象,仔细想想作者想表达的是内容快速更新的场景中,要让新的质量好的内容被推荐给用户,几种策略的比较:

  1. 随机实验会严重影响到用户体验
  2. 按popular的策略则会引起严重的不稳定(如果一开始新内容有机会被展现到前面从而被点击,可能最终会一直在最前面,相反如果一开始被展现的靠后,则也会一起在最后面)
  3. 按最近活跃则比较适合,新的好内容会由于持续点击而比较靠前,而差的或者不新鲜的则会慢慢下降。感觉比较适合于社会热点类比较微博热搜之类的

我想作者想表达的也是这个意思,相当于利用了position bias。

 

你可能感兴趣的:(算法)