A3NCF: An Adaptive Aspect Attention Model for Rating Prediction 读书笔记

A3NCF: An Adaptive Aspect Attention Model for Rating Prediction

论文下载(找了很多地方 希望对大家有帮助 )

研究目的

当前的推荐系统认为考虑用户对实体的多方面属性关注能够提高推荐的准确率,不同的用户对实体的属性的重视度不同,被认为是偏好/注意力权重向量。现在的研究大多假设对于所有的实体,权重向量是相等的,其实不然。

例如,用户A用昂贵的价格买了部手机,那么他所希望的是除了基本的功能之外,还对其他方面的属性有高质量的要求,例如相机有高分辨率,更长的电池寿命和好看的外表。然而用户B用低廉的价格购买的手机则不会有太高的要求,仅仅会关注手机的基本功能,例如,通话连接质量。
为了解决这个问题,本文提出了一个新的模型A3NCF

提出模型

评分只能体现用户对实体的整体满意程度,不能说明基本原因,举例说明:
一个用户可能会因为手机的高分辨率和电池待机时间长从而给出高分,但是这并不能从评分里体现出来。
之前的MF方法不能对实体属性实现细粒度的建模,导致无法解释的推荐和用户少量评分的“冷启动”问题。文章里还提到很多参考文献,关于抽取属性信息和相关的技术。
A3NCF: An Adaptive Aspect Attention Model for Rating Prediction 读书笔记_第1张图片

分为四个模块:输入、融合、注意力、评分预测

1 输入部分

输入部分有四小部分组成,分别是用户和实体的评论,用户和实体的embeeding,在这部分里,还涉及特征的抽取:
A3NCF: An Adaptive Aspect Attention Model for Rating Prediction 读书笔记_第2张图片
对于这个模型中的符号,文章中有详细的说明,作者还给出了对应的算法分析:
A3NCF: An Adaptive Aspect Attention Model for Rating Prediction 读书笔记_第3张图片

2 融合部分

这部分主要是融合嵌入词向量特征和基于评论的特征,能够更好的表示学习。融合的方式常用的有三种:级联、相加、元素相乘。本文使用相加融合。这种方法应用在之前的研究取得了很好的效果。不同的是在本实验中,在融合后直接加了 一个全连接层,这一层采用了非线性的ReLU激活函数。实验证明,全连接层提高了性能效果。

3 注意力

主题向量的维度为K,相应的公式如下所示:
在这里插入图片描述
在这里插入图片描述
在这里插入图片描述
输出的F是用户-实体对的表示。

4 评分预测

将获得的特征向量fed into 全连接层:
在这里插入图片描述
仍然采用的是非线性的ReLU激活函数,紧接着通过回归层获得预测评分: 在这里插入图片描述

实验结果

本文对模型采取了几组数据集进行对比,同时也将其他的模型在同样的数据集中进行对比实验,发现本模型实验结果是state-of-the-art。A3NCF: An Adaptive Aspect Attention Model for Rating Prediction 读书笔记_第4张图片
A3NCF: An Adaptive Aspect Attention Model for Rating Prediction 读书笔记_第5张图片

你可能感兴趣的:(A3NCF: An Adaptive Aspect Attention Model for Rating Prediction 读书笔记)