推荐系统公平性之组推荐的公平性--fairness in group recommender system

主要参考论文:《Top-N Group Recommendations with Fairness》

什么是组推荐(group recommendation)

组推荐,顾名思义,就是向一组人推荐物品,而不是传统场景下的对单个人推荐。
组的构成分为两种:一是长期型组(persistent group),如一家人;另一种是短期型组(ephemeral group),几个朋友、同事临时组局。

虽然感觉平时没有APP有这种组推荐服务,但日常生活中组推荐的应用场景其实挺多。比如一群朋友计划暑假旅游地点、一家人决定看哪部电影、吃什么晚餐等等。

难点自然在于“众口难调”。对于长期型组来说还稍微容易些,因为在一起相处的时间较久,容易有共同兴趣,但是对于临时组队的短期型组往往很困难。总之,要让组内成员都对推荐结果满意实属不易,甚至不可能。

组推荐的两种实现方式

一是将一组人当做一个用户对待。可以将各个组员的交互记录聚合起来,也可以将他们的嵌入表示整合起来,这样就可以将这组人作为一个虚拟用户来对待,用常规的个人推荐系统就行了。
(注:有些研究在做快速推荐时,也可能采用这种方式。具体地,将一些相似的用户聚类在一起(相当于长期组)作为一个虚拟用户,让推荐系统为他召回一些物品,然后再从这些物品中找到各个组员的top-K。有兴趣的读者可以看看《Clustering and Constructing User Coresets to Accelerate Large-scale Top-K Recommender Systems》。)
推荐系统公平性之组推荐的公平性--fairness in group recommender system_第1张图片
二是用个人推荐系统分别各个组员推荐top-K,然后再从这些结果中选出最终的组推荐结果。这种方式更为常用。
推荐系统公平性之组推荐的公平性--fairness in group recommender system_第2张图片

组推荐中的公平性如何定义

这里先区分两个概念,组推荐中的公平性与群体公平(group fairness)。前者是针对组推荐系统而言,推荐结果的受众的一组人;后者实际上是针对个人推荐,它所坚守的公平是推荐系统不能对被保护组(protected group,比如易受到歧视的人群)中的个人推荐效果很差,而对其它非保护组中的个人推荐效果却很好。

通常组推荐模型优化目标是最大化组成员的整体满意度,即让大部分人满意。但这样的结果可能并不公平,我举一个简单的例子。
推荐系统公平性之组推荐的公平性--fairness in group recommender system_第3张图片
小猪佩琪一家人周末想要去看一部电影,猪爸爸和猪妈妈都想看《钢铁侠》,佩琪想看《E.T.》而乔治想要看他最喜欢的恐龙。如果我们按照让大部分人满意的原则,推荐结果应该是《钢铁侠》,因为他可以满足两个人的偏好。但是他们中最不满意的人肯定是乔治,因为推荐结果跟他想看的恐龙一点关系都没有,那么他可能还会哭闹,扫了一家人的兴致。推荐系统的公平性问题就暴露出来了,它对乔治很不公平。如果不公平等级是1~10的话,此时推荐系统可能是10级,极不公平。

如果我们推荐《侏罗纪公园》呢?它或许会更好,首先我们满足了乔治的需求,而且由于猪爸爸、猪妈妈和佩琪感觉都喜欢科幻电影,所以推荐结果与他们的期望还是有一定的吻合度。此时推荐系统可能是5级,一般公平。所以,我们认为这样的组推荐系统更加公平。

简言之,我们希望最大化组成员中的最小满意度,即让推荐结果对最不满意的人来说也还可以接收。

那么组推荐中的公平性=组员的最小满意度。

满意度的定义

定义组推荐的公平性时,我们提到了满意度(satisfaction or utility)。针对前面提到的组推荐方式第二种,我们先让推荐系统为每个组员i推荐top-K,这些物品就是最符合他们偏好的结果,记为Ai。而最终推荐给组的是从各个组员top-K中挑选出的top-K,记为B。我们将Ai与B直接的差异定义为组员i满意度,差异越大,说明越不符合组员i的偏好,就越不满意。而差异的度量选择就很多了,可以是对称的,如Kendall’s τ;也可以是不对称的,如准确率(precision)、召回率(recall)、NDCG等。

据此,我们也可以定义出组整体满意度=各组员满意度之和。

至此,相信读者已经对组推荐中的公平性有所了解,它的目标就是保证组整体满意度的同时,实现尽可能的公平。具体如何对各个组员的推荐结果进行排序,得到最终的组推荐结果,实现公平性和组整体满意度的权衡,这里不再赘述。

文献链接

  1. 《Top-N Group Recommendations with Fairness》
  2. 《Clustering and Constructing User Coresets to Accelerate Large-scale Top-K Recommender Systems》

希望我的文章可以给你们的工作或者学习带来一丝灵感,共勉~

你可能感兴趣的:(推荐系统的公平性)