目录
前言
课题背景和意义
实现技术思路
一、基于内容的推荐方法
二、 深度学习技术
三、基于深度学习的内容推荐方法
实现效果图样例
最后
前言
大四是整个大学期间最忙碌的时光,一边要忙着备考或实习为毕业后面临的就业升学做准备,一边要为毕业设计耗费大量精力。近几年各个学校要求的毕设项目越来越难,有不少课题是研究生级别难度的,对本科同学来说是充满挑战。为帮助大家顺利通过和节省时间与精力投入到更重要的就业和考试中去,学长分享优质的选题经验和毕设项目与技术思路。
对毕设有任何疑问都可以问学长哦!
选题指导: https://blog.csdn.net/qq_37340229/article/details/128243277
大家好,这里是海浪学长毕设专题,本次分享的课题是
基于深度学习的内容推荐算法研究
课题背景和意义
推荐系统是学习用户偏好 并 实现个性化推荐的系统化应用技术 , 在商品购买 、 影音推荐 、 关联阅读等多领域得到了广泛的应用。 近年来 , 随着多源异构数据的激增和深度学习的兴起 , 传统推荐算法中的表征学习模式逐步被深度学习代替。 信息网络的迅速发展使得数据规模呈现爆发式增长, 各种应用软件 ( 如电子商务平台等 ) 对数据的依赖性越来越强 。 但是 , 数据的增量超过了平台或系统的承受范围, 这种现象被称为 “ 信息过载 ”问题。 推荐系统作为为用户提供建议或推荐商品的软件工具技术, 旨在满足用户需求的同时推荐用户感 兴趣的物品 , 比如 “ 淘宝 ” 的个性化商品推荐 、 抖音( TikTok ) 的个性化短视频推荐 、“ 今日头条 ” 的新闻资讯推荐等。 根据推荐系统的相关研究 , 推荐系统的发展可以分为协同过滤算法的提出、 推荐算法的商业化应用、推荐算法的深度研究热潮等 3 个阶段 , 分别象征着推荐系统从萌芽走向成熟的 3 个历程。 其中 , 推荐系统能够快速发展的优势体现在它提高了用户和系统之间的黏性以及信息利用率, 使其具有较高的商用价值。
实现技术思路
一、基于内容的推荐方法
推荐系统的形式化定义,将推荐算法分为基于内容的推荐、协同过滤推荐、混合推荐等 3 类。基于内容的推荐顾名思义是将内容相似的物品进行推荐的一种方法;协同过滤推荐可以分为基于近邻和基于模型的推荐方法,是利用用户物品交互数据(比如评分数据)实现推荐(预测)的推荐方法;混合推荐是通过组合不同的模型弥补模型之间的缺点来提高整个系统推荐性能的一种方法。
基于内容的推荐方法
1)构建用户物品画像 。 物品画像是物品的一系列内容特征的结构化表示 r ( i ) , 例如电影的分 类信息包含标题 、 主题曲 、 主演 、 导演等信息 ; 而用户画像是根据已知用户的历史兴趣得到的用户特征结构化表示 r ( u ) , 比如行为偏好 、 喜欢的物品类型 、 活跃程度等信息 。
2)根据用户画像从数据库中寻找用户偏好的前 N 个相似 ( TOP- N ) 物品 item 进行推荐 。 形式
化表达公式如下 :
存在新物品,首先需要通过专业生产内容(Professional Generated Content,PGC)构建物品画像,然后基于物品画像计算物品间的相似度,为每个物品产生 TOP-N 的相似物品推荐。基于内容的推荐框架:
二、 深度学习技术
即从数据中学习多层次的表征和 抽象。从深度学习的定义角度出发,如果一个神经可微的端到端 架构使用随机梯度下降(Stochastic Gradient Descent,SGD)法来优化可微目标函数,那么这种结构可以称为深度学习。
常用深度学习技术
随着深度学习研究的深入 , 涌现出从简单到复杂的多类型深度学习技术4类深度学习算法:
深度学习的应用优势
1 ) 非线性转换 。 相比于传统线性模型 , 深度学习技术拥有强大的非线性转换能力 。 这种非线性转换能力有利于模型学习到用户和物品更加复杂的特征关联信息 。2) 深层特征学习。 深度神经网络能够有效地学习到输入数据的深层特征。 在现实世界中 ,每个用户或物品都是一个包含多种信息的数据体。 3 ) 高弹性及可用性 。 随着对深度学习的深入研究 , 越 来 越 多 的 深 度 学 习 开 源 平 台 被 提 出 , 如Tensorflow、 PyTorch 等 。
三、基于深度学习的内容推荐方法
在特征学习中 , 基于内容的推荐 方法主要依赖于文本、 评论等内容数据 , 需要对内容进行琐碎的预处理( 关键词提取 、 主题建模等 ); 而在深度学习中可以直接通过端到端的结构学习所有内容特征。
基于多层感知机的应用
多层感知机 ( MLP ) 作为一种简明有效的网络 ,能够有效地优化目标函数, 提高模型准确率。
1)Wide
Wide 模型是一个简单的单层线性模型 , 直接学习数据的交叉特征, 主要实现模型的记忆能力。该层模型的学习公式如式:
Wide&Deep 模型虽然具有一个优秀的双塔式学习结构, 但是需要复杂的人工特征工程 , 且在现实场景中存在学习效率低等问题。
2)Deep 模型
是一个多层神经网络(MLP ), 将稀疏数据转换为稠密向量, 输入网络中学习特征的深层表示, 主要实现模型的泛化能力 。 每一层的激活公式:
由于 2 个模型的完全独立性 , 因此可以通过并 行操作提高模型的训练效率。 Wide&Deep 模型的预
测公式 所示:
Wide&Deep 模型虽然具有一个优秀的双塔式学习结构,但是需要复杂的人工特征工程,且在现实场景中存在学习效率低等问题。
为 了 进 一 步 提 高 推 荐 性 能 ,ALASHKAR 等提出了基于 MLP 的推荐模型。该模型构建了 2 个相同的神经网络分别训练样本集和专业知识库。
3)DeepFM 模型
相比于传统机器学习 , 深度学习能够高效地学习特征之间的交叉信息。 DeepFM 模型 , 就是将 Wide 模型替换为 FM 模型实现的,DeepFM( Deep Factorization Machine) 模型 是一种端到端的集成学习模型 , 能够同时学习高维和低维交叉特征, 包含了因子分解机( Factorization Machine , FM ) 和 MLP 2 个模型 。
4)MV-DNN
MV-DNN ( Multi-View-Deep Neural Network) 模型 是一种基于多视角的推荐算法 , 主要分为 2 个部分 :1) 学习用户或物品的隐表示 ;2)计算用户与物品之间的相似度。
MV-DNN 的学习误差函数所示:
MV-DNN 模型存在如下局限性: 假设用户在不同领域下的喜好偏爱相似, 那么 MV-DNN 是一种推荐性能极佳的推荐方法。 因此 , MV-DNN 模型需要利用先验知识来佐证不同领域之间的相关性, 才能进行有效的推荐。
基于自动编码器的应用
自动编码器 ( AE ) 是一种学习低维特征表示的有效工具 。 协同深度学习 ( Collaborative Deep Learning , CDL ) 模型 是一个经典的混合推荐模型 , 有效地结合了 堆 栈 降 噪 自 动 编 码 器 ( Stacked Denoising Auto- Encoder , SDAE ) 和概率矩阵分解 ( Probabilistic Matrix Factorization , PMF ) 方法。 但是, 模型的实现环境严峻 ,对辅助信息的依赖使模型的负载面临挑战。 了协同知识库嵌入 ( Collaborative Knowledge Base Embedding, CKE ) 模型很好地解决了这个问题。
基于卷积神经网络的应用
卷积神经网络 ( CNN ) 在推荐系统中主要用于特征提取, 在处理非结构 、 多源异构数据时具有较高的应用价值。深 度 协 同 神 经 网 络( Deep Cooperative Neural Network , DeepCoNN ) 模型 [ 29 ] 是一个基于 CNN 构建用户、 物品隐表示的推荐模型 。 该模型构建了2 个平行 CNN 来学习丰富的语义信息 , 缓解了数据稀疏性问题, 同时利用词嵌入技术构建文本向量 , 保留了文本的序列信息。 2 个平行 CNN 分别学习用户特征和物品特征, 并将输出结果作为预测层的输入。预测层首先使用了 FM 模型来学习特征交互信息 , 然后实现评分的预测。
基于循环神经网络的应用
循环神经网络 基于循环神经网络的应用(RNN ) 是学习数据时序关系的有效工具。 在推荐领域中 , RNN 主要用于捕获用户的长期偏好演化表征和短期偏好表征。 循环推荐网络( RRN ) 模型 。 该模型作为基于 RNN 的非参推荐模型, 使用了 2 个 LSTM 网络分别学习用户偏好的时序变化和物品的季节性演变。为了考虑用户的长期 偏好和物品的静态属性 ,该模型同时学习了用户和物品的静态隐表示。具体预测公式如下 :
实现效果图样例
基于深度学习的内容推荐系统:
我是海浪学长,创作不易,欢迎点赞、关注、收藏、留言。
毕设帮助,疑难解答,欢迎打扰!
最后