推荐系统学习笔记-AutoRec算法

由来

AutoRec是在2015年由澳大利亚国立大学提出的,它将自编码器的思想和协同过滤结合,提出了一种单隐层神经网络推荐模型。

模型结构

推荐系统学习笔记-AutoRec算法_第1张图片

原理

自编码是指能够自动完成数据编码的模型,无论是图像,音频,还是数据都可以转换成向量的形式,假设输入数据为r

自编码的重建函数为

在这里插入图片描述

当输入物品i的评分向量为r(i)时, 模型的输出向量h(r(i);θ)就是所有用户对物品i的评分预测。那么,其中的第w维就是用户u对物品i的预测R即预测函数为
推荐系统学习笔记-AutoRec算法_第2张图片

AutoRec的目标是学习一个模型能使得输出尽可能接近输入,选用平方误差作为loss function后目标为

在这里插入图片描述

模型的优化目标
在这里插入图片描述

其中
推荐系统学习笔记-AutoRec算法_第3张图片

后一项为防止过拟合加入的正则项。需要注意的是第一项里在计算loss只在观测到的数据上计算。未观测到的missing value在初始时赋一个默认值,比如1-5分的打分体系里统一给3。

在使用模型做预测时,直接将模型对input重建后的新向量里对应位置的值认为是预测值,即
在这里插入图片描述
存在的问题:

推荐系统学习笔记-AutoRec算法_第4张图片

在数据很稀疏的情况下用AutoRec去学习的效果会不理想,数据里噪声太大,在CF里存在的困境同样存在。

你可能感兴趣的:(推荐系统学习笔记,kaggle,神经网络,学习,算法,人工智能,深度学习)