论文笔记二 Positive, Negative and Neutral: Modeling Implicit Feedback inSession-based News Recommendatio。

目录

一  论文简介

论文名称 :Positive, Negative and Neutral: Modeling Implicit Feedback in

中文名称:积极、消极和中立:在基于会话的新闻推荐中建模的隐式反馈 

作者:       Shansan Gong 和 Kenny Q. Zhu

二  ABSTRACT(摘要)

三 INTRODUCTION(介绍) 

   3.1 当前新闻推荐的方法和作者提出的背景

 3.2  作者的提出的创意

3.3 任务的内容 

3.4 Notations and descriptions (符号和说明) 

 四  模型框架

4.1 Session-based Recommendation Basics(基于会话的推荐基础)

 4.2  我们的基本模型:内容感知推荐(CAR)

4.3 建模时间为中性反馈

 4.4 建模积极反馈

 4.5 建模负反馈

 五 实验部分(这部分内容较多后续在写)

 六 结论 

原文代码链接:


一  论文简介

论文名称 :Positive, Negative and Neutral: Modeling Implicit Feedback in

                     Session-based News Recommendation

中文名称:积极、消极和中立:在基于会话的新闻推荐中建模的隐式反馈 

作者:       Shansan Gong 和 Kenny Q. Zhu

二  ABSTRACT(摘要)

        对于许多新闻门户来说,对匿名读者的新闻推荐是一项有用但具有挑战性的任务,在这些新闻门户中,读者和文章之间的交互被限制在一个临时登录会话内。之前的工作倾向于将基于会话的推荐制定为下一个项目预测任务,而他们忽略了来自用户行为的内隐式反馈,这表明了用户真正喜欢或不喜欢什么。因此,我们提出了一个全面的框架,通过积极反馈(即他们花更多时间写的文章)和负面反馈(即他们选择跳过的文章)来建模用户行为。此外,该框架隐式地使用用户的会话开始时间,以及文章的初始发布时间对用户进行建模,我们称之为“中立反馈”。对三个真实世界的新闻数据集的经验评估显示,与其他最先进的基于会话的推荐方法相比,该框架具有更准确、多样化甚至意想不到的推荐性能。

        总结:新闻方面的浏览,读者往往采用匿名登录的方式,因此就构建推荐系统而言很难得到    用户的信息,读者和文章之间的交互往往被限制在一个临时登录会话内,因此对于新闻而言,我们常用会话推荐。传统会话推荐,往往忽略了用户行为的隐式反馈,本文构建了一个新的框架,即通过积极反馈负面反馈中立反馈进行建模。

三 INTRODUCTION(介绍) 

   3.1 当前新闻推荐的方法和作者提出的背景

     正如摘要所讲的那样,由于在线新闻阅读中,用户的匿名性和用户与文章交互会话的短暂性,系统很难理解用户的行为而进行推荐。传统的新闻推荐方法倾向于将推荐任务制定为CTR预测任务,要求系统跟踪用户历史,不能应用于匿名访问或客人登录。要求系统跟踪用户历史,不能应用于匿名访问或客人登录。新闻推荐神经方法主要关注于编码具有注意机制的文章的文本特征,在建模用户的兴趣时,而很少关注点击行为或文章到文章的转换。我们可以看到以上方法都存在不足。 

     考虑到上述问题,将面向匿名用户的类流媒体新闻推荐任务作为一个基于会话的推荐任务是很自然和现实的。任务是根据会话中之前的行为序列,推荐用户可能感兴趣的下一个项,其中会话通常是用户登录的短时间(例如,30分钟)。基于会话的推荐在电子商务或视频流领域中得到了广泛的应用,可以成功地捕获用户的短期意图过渡过程。然而,他们很少考虑来自用户行为的隐式反馈

 3.2  作者的提出的创意

    在本文中,作者感兴趣的是利用点击本身之外的用户操作。我们称之为“隐式反馈”1,典型的隐式反馈可以从浏览主页、阅读一篇文章、关闭一篇文章、回溯等过程中提取出来。作者认为,在基于会话的推荐系统中“显式地”建模这种隐式反馈,可以帮助推荐者更好地理解用户的意图。在这项工作中,我们专注于回答这些问题:                                                                                                       1.如果一个用户点击了一篇文章,她真的喜欢它吗   ?                                                                       2.如果一个用户没有点击一篇文章,她不喜欢它吗  ?                                                                       3.我们如何建模系统中的用户和文章的时间特征 ?

 隐式正反馈:新闻阅读标题可能出现欺骗性,点击了不一定喜欢,作者采用用户阅读一篇文章的   时长作为正反馈,去表示用户对于文章喜爱程度。                                                                             隐式负反馈:用户没有点击一篇文章并不一定意味着用户不喜欢,只有那些在她的浏览列表中没   有被点击的文章才被她认为“不感兴趣”。这被称为隐性负反馈。                                                       隐式中性反馈:一些关键的时间信息对单独为用户和文章建模是有用的,因此,我们仔细地将会   话开始时间和文章发布时间表示为隐含的中性反馈。

论文笔记二 Positive, Negative and Neutral: Modeling Implicit Feedback inSession-based News Recommendatio。_第1张图片

   图1:在基于会话的新闻阅读中,用户可能会花不同的时间在不同点击的文章上,以隐含的积极反馈形式表示不同程度的偏好;用户对文章的印象代表了一种隐含的负面反馈;文章点击开始时间和发布时间可以视为中性反馈

3.3 任务的内容 

      推荐系统的目标是将用户反馈序列建模为向量xs,最大化预测的下一篇文章(+1)的向量与xs之间的相似性(计算会话向量和文章向量的相似性。在测试阶段,给定交互序列作为输入,我们生成一个排名列表,目标用户可能从高到低点击的概率。通常,推荐者需要为用户推荐多个项目,因此推荐中最重要的k个项目。

3.4 Notations and descriptions (符号和说明) 

论文笔记二 Positive, Negative and Neutral: Modeling Implicit Feedback inSession-based News Recommendatio。_第2张图片

 四  模型框架

     作者首先为基于会话的推荐奠定了一些基础,然后提出了作者的基础模型,它是一个基于内容感知的基于会议的模型。在此之后,我们引入了中性反馈、正反馈和负反馈的关键思想,这是加强基础模型的附加机制。

4.1 Session-based Recommendation Basics(基于会话的推荐基础)

    在典型的基于会话的设置中,给定会话的前缀序列,表示为=(1,2,...,),我们的目标是预测目标用户最有可能单击的+1文章。可以使用×项目嵌入矩阵,其中是嵌入维数,提供文章的嵌入向量为x。然后,可以使用RNN、GNN或基于注意力的方法等方法将会话信息编码为序列(x1,x2,...,x)中的向量xs,这表示用户的历史偏好。对于,会话表示与文章之间的余弦相似度得分Z是由会话向量xs与候选新闻文章向量xi的内积计算出来的。

 在等式中的softmax函数进行标准化(2)是在会话中被单击文章的概率。交叉熵通常用于计算损失:

 4.2  我们的基本模型:内容感知推荐(CAR)

   为了推荐新的和新兴的文章,作者的起点是一个基本的内容感知推荐模型。为了编码文章的内容信息,一些人使用预先训练过的文章内容嵌入,它是基于新闻标题中的Word2Vec单词嵌入和文章的元数据属性进行监督训练的。具体来说,我们从Word2Vec中得到维向量来表示文章中面向主题的内容。一旦我们得到了文章的内容向量c,我们就将c和x连接起来,将文章表示为xc。为了模拟同一会话中用户对文章的不同偏好,我们采用了一个简单的注意网络,使用向量输入序列的加权和对整个会话进行编码。

论文笔记二 Positive, Negative and Neutral: Modeling Implicit Feedback inSession-based News Recommendatio。_第3张图片

论文笔记二 Positive, Negative and Neutral: Modeling Implicit Feedback inSession-based News Recommendatio。_第4张图片

 这样我们就可以得到一个基于感知内容的会话向量。

4.3 建模时间为中性反馈

     对时间进行编码处理(有些疑问)

一个用户停留在某篇特定文章上的活动时间是持续时间。对于不同的和连续的活动时间,我们设计了一个持续时间编码器,它将分解为一个离散的变量:

此外,我们将离散的‘映射到个不同的类别中,其中每个类别共享相同的嵌入向量ta。                     与揭示用户正隐反馈的持续时间不同,某一事件发生时的日期-时间具有物理意义,也传达了时间信息背后的规律模式,因此我们为这种时间表示设计了一个时间编码器。我们对文章的发布时间和会话的开始时间进行编码。为了提取周期性的时间变化,也称为季节性,我们将月、日、周日、小时、分钟(∈R12,∈R31,∈R7,ℎ∈R24,∈R60)输入时间嵌入矩阵Et∈R134×与维度,并将五个部分连接为t∈R5来构建整个时间向量并表示日期时间。接下来,我们将介绍如何利用开始时间和发布时间,然后我们将重点关注建模来自时间信息的正隐式反馈和负隐式反馈。

将开始时间融入到基于内容会话向量中:

      在相似的时间开始阅读的用户更有可能共享相同的阅读行为,这意味着用户的兴趣会受到开始时间的影响。作者使用周和小时(,ℎ)表示会话的每次点击行为的点击时间,这足以捕获不同用户的日常工作。为了模拟中文章在用户的不同开始阅读时间内阅读的不同信息量,我们将这些信息应用于计算个性化关注:

论文笔记二 Positive, Negative and Neutral: Modeling Implicit Feedback inSession-based News Recommendatio。_第5张图片

 对发布时间进行单独建模:

    发布时间。用户的阅读习惯反映在中发布时间1、...,的顺序上。我们可以从中推断用户是否倾向于浏览新文章或旧的文章。被点击文章的发布时间是一个相对独立的序列,因此我们对其单独建模。作者通过在第3.2节中应用类似的注意机制来获得会话时间表示向量xts。我们添加了每篇文章的内容向量,以捕获文章内容与其发布时间之间的关注关系。所涉及的点击级内容信息的关注权重被表述为:

论文笔记二 Positive, Negative and Neutral: Modeling Implicit Feedback inSession-based News Recommendatio。_第6张图片

 4.4 建模积极反馈

     作者的隐式正反馈采用的是用户在点击每篇文章后在每篇文章上花费的活动时间间隔的形式,如第前面部分所示,每个程度的活动时间共享相同的嵌入向量ta,表示正反馈的程度。我们将这个向量作为额外的点击级反馈输入到注意力计算中。现在,在等式中(4)已被修改为:

 最终会话向量xs与xts和xcs相结合。

 4.5 建模负反馈

最直接和最广泛采用的负抽样策略是从一组未被点击的项目中随机抽样,或者从一个使用最后一个点击[4]的全局缓冲区中随机抽样。随机抽样项目的主要问题是,这些项目可能与用户完全无关,这给模型带来的挑战太小。正如我们之前讨论的,由于印象列表并不总是明确可用的,我们假设如果一篇文章发表在点击的文章附近,那么它更有可能在中。具体来说,我们根据候选文章的发布时间对其进行排序,并保留窗口大小为300的附近文章,并从这个窗口中保留样本项目。我们的目标是在∈时,将xcs和负样本的向量xc之间的余弦分数最小化,其中⊆是会话的负样本集,因此我们将此约束添加到最终的损失中:

论文笔记二 Positive, Negative and Neutral: Modeling Implicit Feedback inSession-based News Recommendatio。_第7张图片

总的框架: 

论文笔记二 Positive, Negative and Neutral: Modeling Implicit Feedback inSession-based News Recommendatio。_第8张图片

 

 五 实验部分(这部分内容较多后续在写)

 5.1  数据集,作者在三个真实世界的新闻数据集上进性实验:                                                          Adressa、Adressa Dataset | Papers With Code                                                                               Globo Novelas Globo | Kaggle                                                                                                          MIND MIND: Microsoft News Recommendation Dataset | Kaggle

5.2 实验设置

 Data Preprocessing

Train/test set split

Metrics.(评价指标) 

Baseline Algorithms(基线算法)

 六 结论 

    在用户的历史记录不可用时,在流媒体或实时场景下,基于会话的推荐是必不可少的。通过利用用户的正隐式和负隐式反馈,以及对问题中的时间进行适当建模,我们提出的方法简单而有效地提高了准确性、多样性和剩余之间的权衡,如实验结果所示。为了进一步研究,我们的正/负模块可以插入其他复杂的基于会话的推荐方法;自动多样性度量可能并不总是符合用户体验,可以关注真实的用户满意度;时间编码器可以编码日期-时间的物理意义,因此预先训练的时间嵌入可以提高模型对包含时间信息的任务的理解。

原文代码链接:

summmeer/session-based-news-recommendation: source code of paper "Positive, Negative and Neutral: Modeling Implicit Feedback in Session-based News Recommendation", which is accepted at SIGIR 2022. (github.com)

你可能感兴趣的:(人工智能,推荐算法)