wangshoujin88

2021-05-17

ACM Computing Surveys 2021 基于会话推荐系统最新长文综述

封面图:

作者：Shoujin Wang，麦考瑞大学博后，研究方向为数据挖掘，机器学习以及推荐系统。

编者按: 基于会话的推荐系统, 作为一种新兴的推荐系统范式，正方兴未艾，大量的新技术和新方法层出不穷。这篇综述给读者在关于这个领域的主要问题，关键挑战，最新进展以及主要方法和应用等方面提供了一个综合而全面的认知。

一. 论文简介

本文给大家介绍一篇刚被ACM旗舰期刊 ACM Computing Surveys (CSUR) 接收的基于会话推荐系统 (Session-based Recommender Systems (SBRS)) 的综述长文。ACM Computing Surveys 是计算机学科最具影响力的期刊之一，其最新影响因子为7.99，为中科院认定的一区Top期刊，CORE Rank A* 期刊，主要发表计算机科学领域较有代表性的综述论文。

文章题为A Survey on Session-based Recommender Systems。这篇文章是基于会话的推荐系统方向的一篇较为系统全面的综述文章。全文共39页，包含11个sections，4幅插图，11张表格和163篇该领域内有代表性的参考文献。该文基于作者长期的积累和思考，对基于会话推荐系统这一推荐系统子领域进行了全面而深入的梳理和总结。该文对目前文献中存在的各种各样的对问题的定义进行了统一的形式化，系统地定义了基于会话推荐系统的场景，任务和基本问题以及基本方法。作者从数据特征的角度出发，系统分析了session数据所特有的基本特征，以及他们给推荐任务带来的挑战。然后系统而全面地对这一领域当前的进展进行了归纳总结，包括对方法的分类和比较，对每类方法基本思想和特征的阐述。梳理和总结了基于会话推荐系统的主要应用场景，代表性算法和公开的数据集，并提供了开源链接。最后分享了本领域的未来可能的研究方向。该文由浅入深，语言力求通俗易懂，举例丰富，既有深入的理论分析，又有应用，算法和数据集，既适合科研工作者阅读，也适合工程人员阅读。作者希望该文能给相关的研究人员提供一个对该领域研究的主要问题以及涉及的各个方面，主要挑战和进展一个全面而综合的了解，同时给未来的研究提供一些启发。

二. 论文的简短翻译

0. 摘要

在当今的信息过载和数字经济时代，推荐系统在消费，服务和决策制定等方面正发挥着日益重要的作用。近些年来，基于会话的推荐系统(session-based recommender systems (SBRSs)) ，作为推荐系统的一种新的范式，正在兴起。不同于其他传统的推荐系统，如基于内容的推荐系统和协同过滤推荐系统，通常建模用户的长期和静态的偏好，基于会话的推荐系统旨在捕获用户短期和动态的偏好来给用户提供更实时和精准的推荐服务。这些推荐服务能对用户不断发展和变化的会话上下文场景具有较好的敏感性。尽管基于会话的推荐系统已经被广泛研究，目前既没有对基于会话的推荐系统的一个统一的问题定义和陈述，也没有对基于会话的推荐系统的特征和挑战的一个深入阐述。通常，人们并不太清楚基于会话的推荐系统的挑战被解决到什么程度了，以及这一领域的总体研究概况是什么样的。这篇全面综述通过深入探索和讨论基于会话的推荐系统所涉及的主体(比如会话), 行为(比如用户对物品的点击), 以及他们的特性(比如会话的长度)来解决上述问题。我们提出了一个通用的基于会话的推荐系统的问题陈述，概括和总结了这一领域多样化的数据特征和挑战，并且定义了一个分类方法来对该领域内代表性的研究进行分类。我们讨论了基于会话的推荐系统在现实场景中的主要应用领域，整理了典型的算法和常用的数据集。最后我们讨论了在这个充满活力的研究领域内的新的研究机会。

1. 引言

推荐系统已经发展成为人们进行快速有效选择和决策的一个基本工具。它已经渗透到我们日常生活的方方面面，包括生活，工作，学习，娱乐，社交和商业运营。推荐系统的作用在数字经济中和信息日益过载的时代显得尤为重要，因为用户通常需要从大量的和快速增长的内容、产品和服务（统称为物品 (item)）中选择他们所需要的。因此，各种各样的推荐系统研究领域兴起了并取得了成功，比如基于内容的推荐系统，协同过滤推荐系统和混合型推荐系统。

然而，这些推荐系统倾向于利用所有的用户与物品之间的交互信息来学习每个用户对物品的长期和静态的偏好。这种做法通常是建立在一个隐含的假设之上的，那就是一个用户的所有的历史交互行为对他当前的偏好是同等重要的。这可能与现实不相符合，主要原因有两点：首先，一个用户对物品的选择不仅依赖于他长期以来形成的偏好，而且依赖于他短期的最近的偏好和跟时间相关的上下文场景(比如他最近浏览或者购买过的物品)。这种短期偏好通常隐含在用户的最近发生的与物品的交互行为之中，而这类最近的交互行为通常仅占用户所有交互行为的很小一部分。其次，一个用户对物品的偏好通常是动态变化而非静止的，它会随着时间的推移而演变。

近些年来，为了弥补上述不足，基于会话的推荐系统(session-based recommender systems (SBRSs))悄然兴起，并引起了越来越多的关注。不同于上述推荐系统，基于会话的推荐系统从用户在交易过程中产生的会话(session)数据来挖掘和学习用户的偏好。每一个会话包含在一段连续的时间段内发生的多个“用户–物品交互行为”，比如某用户在一次交易会话 (比如从登录电商平台的账号到退出账号这段时间)中购买了一篮子物品。通过将每一个会话作为最基本的输入数据单元，一个基于会话的推荐系统能够从一个用户的最近产生的会话中捕获他的短期偏好，以及从一个会话到另一个会话之间的偏好的变化，从而进行更精准和实时的推荐。在本文中，我们用基于会话的推荐系统来指代那些所有以session数据为中心来推荐当前会话里的下一个物品，接下来的所有物品以及下一个会话里的所有物品的推荐系统。这个定义包括了有些文献中的一些狭义的基于会话的推荐系统，它们只推荐当前会话里的下一个物品。

对于基于会话的推荐系统，文献中存在各种各样不同的工作。这些工作通常用不同的词语来描述，建立在不同的场景设置和假设之上，针对不同的应用领域。比如，Hidasi et al. 在匿名会话数据上建立了一个基于会话的推荐系统。他们通过假设会话内部的交互行为之间存在严格的先后顺序来预测用户接下来想要点击的物品或者想看的电影。Hu et al. 则在非匿名会话数据上建立了另一个基于会话的推荐系统来推荐用户下一个可能想购买的物品，他们没有假设会话内部存在严格的顺序。Jing et al. 则基于非匿名会话数据设计了一个基于会话的推荐系统来推荐用户想要听的下一首歌或者想看的下一部电影，他们假设会话内部存在顺序。

虽然基于会话的推荐系统广泛存在于各个领域并且很多相关的研究都已经开展了，但是在这个领域还存在很多的由不同的描述，假设，场景设置和应用领域导致的不一致性。而且，没有一个统一的框架可以对现有的工作进行分类，对于基于会话的推荐系统也还没有统一的问题陈述。更重要的是，没有人对基于会话的推荐系统的特征（包括问题和数据方面的）, 挑战和研究进展进行系统的讨论，也没有人对代表性的和最先进的方法进行系统的分类。这些缺陷限制了基于会话的推荐系统的理论发展和实际应用。为了弥补上面提到的不同方面的缺陷，本文对基于会话的推荐系统提供了一个综合而系统性的概览和综述。

本文的主要贡献如下：
• 我们提供了一个统一的框架来对基于会话的推荐系统的相关工作进行分类，从而有效的缓解了这一领域内的不一致性。

• 我们首次为基于会话的推荐系统提出了一个统一的问题陈述，在该陈述中，一个基于会话的推荐系统是建立在以下几个正式的概念之上的：用户，物品，动作，交互和会话。

• 我们对会话数据的基本特征以及它给基于会话的推荐系统带来的挑战提供了一个综合的概览。据我们所知，这是该领域内的第一次这样的描述。

• 我们对基于会话的推荐系统的各类方法进行了系统的分类和比较，从而可以看出该领域的各个挑战被解决到什么程度了，以及该领域当前的进展如何。

• 我们对每一类方法简单介绍了主要的技术细节，从而给读者对基于会话的推荐系统的当前进展提供一个深入的了解。

• 我们分析和讨论了基于会话的推荐系统的主要的实际应用领域和场景, 收集和整理了典型算法的开源代码和常用的公开数据集。

• 最后，我们讨论了和分享了基于会话的推荐系统的一些开放的研究问题和可能的研究方向。

2. 相关工作

文献中存在各种不同的既关于基于会话的推荐系统，也关于序列推荐系统的研究。序列推荐系统是与基于会话的推荐系统紧密相关但不同的领域。即使在基于会话的推荐系统中也存在很多不同的子领域，比如下一个物品推荐，下一个购物篮推荐等。因此，很多用不同词语描述的不同的工作混杂在一块，导致整个领域内没有一个统一和一致的描述，很容易让人混淆。在这一节，我们首先澄清基于会话的推荐系统和序列推荐系统的概念以及他们之间的差异，然后提出一个整体框架来统一组织基于会话的推荐系统内的各种不同研究，最后我们阐述这篇综述跟已有的相关综述之间的差异。

2.1 基于会话的推荐系统vs. 序列推荐系统

2.2 统一组织基于会话的推荐系统相关工作的框架

根据推荐任务的不同，基于会话的推荐系统可以划分为对当前会话内下一个交互行为（通常是下一个物品）的推荐，对当前会话内剩余所有交互行为的推荐和对下一个会话的推荐。

2.3 相关的综述（详见原文）

3. 基于会话的推荐系统问题陈述

一个推荐系统可以看作一个系统，它包含多个基本主体：用户，物品，他们间的交互行为。这些基本的主体和行为构成会话的基本组成部分，而会话是基于会话的推荐系统的核心主体。因此我们首先介绍这些主体和行为的定义及属性，然后在他们基础之上定义基于会话的推荐系统的研究问题。这些定义和属性将进一步用来对基于会话的推荐系统进行刻画和分类。

3.1 用户以及用户的属性

3.2 物品以及物品的属性

3.3 行为以及行为的属性

3.4 会话以及会话的属性

3.5 基于会话的推荐系统的研究问题陈述

4. 特征和挑战

基于会话的推荐系统建立在会话数据之上，不同类型的会话数据通常具有不同的特征，这些特征本质上给基于会话的推荐系统带来了不同的挑战。本节我们首先描述根据会话(session)的属性所划分的不同类型的会话数据，然后讨论每一类会话数据的特征和挑战。

4.1 与会话长度相关的特征和挑战

4.2 与会话内部顺序相关的特征和挑战

4.3 与行为类型相关的特征和挑战

4.4 与用户信息相关的特征和挑战

4.5 与会话数据结构相关的特征和挑战

5. 基于会话推荐系统方法的分类和比较

5.1 基于会话推荐系统方法的分类

根据采用的技术，基于会话推荐系统方法可以分为3大类：传统方法，基于嵌入表征学习的方法，和基于神经网络的方法。这3大类又可以进一步分为8类。

5.2 不同类方法之间的比较

6. 传统的基于会话推荐系统方法

传统方法采用传统的数据挖掘或者机器学习技术来挖掘会话数据内部的相关性，从而进行会话推荐。传统方法主要包含4类：

6.1 基于模式/规则挖掘的方法

6.2 基于最近邻模型的方法

6.3 基于马尔科夫链的方法

6.4 基于生成式概率模型的方法

6.5 传统方法之间的比较

7. 基于嵌入表征学习 (latent representation) 的方法

7.1 基于潜在因子 (latent factor) 模型的方法

7.2 基于分布式表征 (distributed representation) 的方法

7.3 基于嵌入表征学习的方法间的比较

8. 基于深度神经网络的方法

8.1 基于基本的深度神经的方法

8.1.1 基于RNN的方法

8.1.2 基于MLP的方法

8.1.3 基于CNN的方法

8.1.4 基于GNN的方法

8.2 基于高级模型的方法

8.2.1 基于注意力模型的方法

8.2.2 基于记忆网络的方法

8.2.3 基于混合专家模型的方法

8.2.4 基于生成模型的方法

8.2.5 基于强化学习的方法

8.3 基于深度神经网络的方法间的比较

9. 基于会话推荐系统的应用，算法和数据集

9.1 基于会话推荐系统的应用

基于会话推荐系统已经被广泛应用于现实世界的各个领域和场景当中，来使客户和企业获利。下表总结了这些传统的和新兴的应用领域。

9.2 开源算法和公开数据集

9.2.1 开源算法整理

9.2.2 公开数据集整理

10. 展望和未来的研究方向

10.1 考虑一般用户偏好的基于会话推荐系统

10.2 考虑更多场景及上下文影响因素的基于会话推荐系统

10.3 考虑跨域信息的基于会话推荐系统

10.4 考虑更多用户行为模式的基于会话推荐系统

10.5 考虑约束条件的基于会话推荐系统

10.6 交互式的基于会话推荐系统

10.7 在线或者流式的基于会话推荐系统

11. 结论

在本文中，我们对当前的基于会话的推荐系统的最具代表性的工作进行了系统而广泛的调研。我们提出了一个统一的框架来把这个领域内各种各样的工作归结为3大类，同时我们提出了一个统一的问题陈述来消除该领域内存在的各种不一致性，以减少读者的疑惑。我们透彻地分析了会话数据的独有特征以及他们给基于会话的推荐系统所带来的挑战。我们提出了一个分类机制来对现有的基于会话的推荐系统的方法进行分类，阐述了每一类方法的核心思想和一些关键的技术细节。此外我们讨论了基于会话的推荐系统的实际应用领域和场景，收集和整理了一些典型的算法和数据集。最后我们讨论了该领域一些可能的研究方向。关于基于会话的推荐系统的研究正方兴未艾，大量的新技术和新方法正在不断涌现出来。我们希望这篇综述能给读者在关于这个领域的主要问题，关键挑战，最新进展以及主要方法和应用等方面带来一个综合而全面的了解。

部分参考文献

Shoujin Wang, Longbing Cao, Yan Wang, Quan Z. Sheng, Mehmet A. Orgun, Defu Lian. A Survey on Session-based Recommender Systems. ACM Computing Surveys （CSUR 2021), 1-39, (accepted).
Shoujin Wang, Liang Hu, Yan Wang, Xiangnan He, Quan Z. Sheng, Mehmet A. Orgun, Longbing Cao, Francesco Ricci, Philip S. Yu. Graph Learning based Recommender Systems: A Review. In Proceedings of the 30th International Joint Conference on Artificial Intelligence (IJCAI 2021 Survey Track), 1-9, 2021.
Shoujin Wang, Liang Hu, Yan Wang, Longbing Cao, Quan Z. Sheng, Mehmet A. Orgun. Sequential Recommender Systems: Challenges, Progress and Prospects. In Proceedings of the 28th International Joint Conference on Artificial Intelligence (IJCAI 2019 Survey Track), 6332-6338, 2019.
Shoujin Wang, Liang Hu, Yan Wang, Quan Z. Sheng, Mehmet A. Orgun, Longbing Cao. Modeling Multi-Purpose Sessions for Next-Item Recommendations via Mixture-Channel Purpose Routing Networks. In Proceedings of the 28th International Joint Conference on Artificial Intelligence (IJCAI 2019), 6332-6338, 2019.
Shoujin Wang, Liang Hu, Longbing Cao, Xiaoshui Huang, Defu Lian, Wei Liu. Attention-based Transactional Context Embedding for Next-item Recommendation. In Proceedings of the 32nd AAAI Conference on Artificial Intelligence (AAAI 2018), 2532-2539, 2018.
Shoujin Wang, Liang Hu, Longbing Cao. Perceiving the Next Choice with Comprehensive Transaction Embeddings for Online Recommendation. In Proceedings of the 28th Joint European Conference on Machine Learning and Knowledge Discovery in Databases (ECML-PKDD 2017), 285-302, 2017.
Shoujin Wang, Liang Hu, Yan Wang, Quan Z. Sheng, Mehmet A. Orgun, Longbing Cao. Intention Nets: Psychology-inspired User Choice Behavior Modeling for Next-basket Prediction. In Proceedings of the 34th AAAI Conference on Artificial Intelligence (AAAI 2020)，6259–6266, 2020.
Liang Hu, Longbing Cao, Shoujin Wang, et al. Diversifying Personalized Recommendation with User-session Context. In Proceedings of the 26th International Joint Conference on Artificial Intelligence (IJCAI 2017), 1858-1864, 2017.

目标跟踪领域经典论文解析 ♢.＊目标跟踪人工智能计算机视觉
亲爱的小伙伴们，在求知的漫漫旅途中，若你对深度学习的奥秘、JAVA、PYTHON与SAP的奇妙世界，亦或是读研论文的撰写攻略有所探寻，那不妨给我一个小小的关注吧。我会精心筹备，在未来的日子里不定期地为大家呈上这些领域的知识宝藏与实用经验分享。每一个点赞，都如同春日里的一缕阳光，给予我满满的动力与温暖，让我们在学习成长的道路上相伴而行，共同进步✨。期待你的关注与点赞哟！目标跟踪是计算机视觉领域的一个
神经网络架构搜索 IJCAST主编进化计算神经网络架构人工智能
InternationalJournalofComplexityinAppliedScienceandTechnology，投稿网址:https://www.inderscience.com/jhome.php?jcode=ijcast,发表论文不收取任何费用，论文平均审稿25天内即可录用。1.神经网络架构搜索方法分类当前，神经网络架构搜索的方法主要可以归纳为以下三类：a.基于强化学习的NAS方法
燕大《Python机器学习》实验报告：探索机器学习的奥秘温冰礼
燕大《Python机器学习》实验报告：探索机器学习的奥秘【下载地址】燕大Python机器学习实验报告下载这份实验报告是燕山大学软件工程专业的学生在进行机器学习实验时所编写的，内容详实，结构清晰，可以直接下载使用。报告中的实验数据和代码均经过验证，确保下载后可以直接应用于实际项目或作为学习参考项目地址:https://gitcode.com/Open-source-documentation-tut
（转）优秀的 python 机器学习库 patrick75 python 机器学习 python 机器学习
优秀的python机器学习库IntroductionThereisnodoubtthatneuralnetworks,andmachinelearningingeneral,hasbeenoneofthehottesttopicsintechthepastfewyearsorso.It’seasytoseewhywithallofthereallyinterestinguse-casestheys
DAY 10 机器学习建模与评估心落薄荷糖 Python训练营机器学习人工智能
知识点：1.数据集的划分2.机器学习模型建模的三行代码3.机器学习模型分类问题的评估今日代码比较多，但是难度不大，仔细看看示例代码，好好理解下这几个评估指标。作业：尝试对心脏病数据集采用机器学习模型建模和评估#一、导入库importpandasaspdimportpandasaspd#用于数据处理和分析，可处理表格数据。importnumpyasnp#用于数值计算，提供了高效的数组操作。impor
【图像处理入门】12. 综合项目与进阶：超分辨率、医学分割与工业检测小米玄戒Andrew 图像处理：从入门到专家图像处理人工智能深度学习算法 python 计算机视觉 CV
摘要本周将聚焦三个高价值的综合项目，打通传统算法与深度学习的技术壁垒。通过图像超分辨率重建对比传统方法与深度学习方案，掌握医学图像分割的U-Net实现，设计工业缺陷检测的完整流水线。每个项目均包含原理解析、代码实现与性能优化，帮助读者从“技术应用”迈向“系统设计”。一、项目1：图像超分辨率重建（从模糊到清晰的跨越）1.技术背景与核心指标超分辨率（SR）是通过算法将低分辨率（LR）图像恢复为高分辨率
Python机器学习元学习库higher 音程机器学习人工智能 python 机器学习
higher是一个用于元学习（Meta-Learning）和高阶导数（Higher-ordergradients）的Python库，专为PyTorch设计。它扩展了PyTorch的自动微分机制，使得在训练过程中可以动态地计算参数的梯度更新，并把这些更新过程纳入到更高阶的梯度计算中。一、主要用途higher主要用于以下场景：元学习（Meta-Learning）比如MAML（Model-Agnosti
基于迁移学习的ResNet50模型实现石榴病害数据集多分类图片预测深度学习乐园深度学习实战项目迁移学习分类人工智能
完整源码项目包获取→点击文章末尾名片！番石榴病害数据集背景描述番石榴（Psidiumguajava）是南亚的主要作物，尤其是在孟加拉国。它富含维生素C和纤维，支持区域经济和营养。不幸的是，番石榴生产受到降低产量的疾病的威胁。该数据集旨在帮助开发用于番石榴果实早期病害检测的机器学习模型，帮助保护收成并减少经济损失。数据说明该数据集包括473张番石榴果实的注释图像，分为三类。图像经过预处理步骤，例如钝
四个机器学习模型对比道路裂缝检测识别分类模型深度学习乐园深度学习实战项目机器学习分类人工智能
完整源码项目包获取→点击文章末尾名片！一、课题综述1.1.课题简介在机器学习的研究领域中，传统分类算法模型数量众多，适合的应用场景也各不相同。1.2.课题目标（示例）本课题使用的数据集来自于数据分析与数据挖掘竞赛Kaggle，该竞赛为数据科学领域著名的国际性赛事之一。课题使用的数据集为带标签的图像数据集，包含带有裂痕和不带有裂痕的桥梁、墙和人行道图片。课题的目标为对于目标数据集，搭建相应的传统机器
Densenet模型花卉图像分类深度学习乐园分类数据挖掘人工智能
项目源码获取方式见文章末尾！600多个深度学习项目资料，快来加入社群一起学习吧。《------往期经典推荐------》项目名称1.【基于CNN-RNN的影像报告生成】2.【卫星图像道路检测DeepLabV3Plus模型】3.【GAN模型实现二次元头像生成】4.【CNN模型实现mnist手写数字识别】5.【fasterRCNN模型实现飞机类目标检测】6.【CNN-LSTM住宅用电量预测】7.【VG
基于AFM注意因子分解机的推荐算法深度学习乐园深度学习实战项目深度学习科研项目推荐算法算法机器学习
关于深度实战社区我们是一个深度学习领域的独立工作室。团队成员有：中科大硕士、纽约大学硕士、浙江大学硕士、华东理工博士等，曾在腾讯、百度、德勤等担任算法工程师/产品经理。全网20多万+粉丝，拥有2篇国家级人工智能发明专利。社区特色：深度实战算法创新获取全部完整项目数据集、代码、视频教程，请进入官网：zzgcz.com。竞赛/论文/毕设项目辅导答疑，v：zzgcz_com1.项目简介项目A033基于A
机器学习5——非参数估计平和男人杨争争山东大学机器学习期末复习机器学习概率论算法
非参数估计在参数估计中我们已经提到，想要估计后验概率P(ωi∣x)=p(x∣ωi)p(ωi)p(x)P\left(\omega_i\midx\right)=\frac{p\left(x\mid\omega_i\right)p\left(\omega_i\right)}{p(x)}P(ωi∣x)=p(x)p(x∣ωi)p(ωi)，就需要估计类条件概率p(x∣ωi)p\left(x\mid\omega
机器学习4——参数估计之贝叶斯估计平和男人杨争争山东大学机器学习期末复习机器学习人工智能
贝叶斯估计问题建模：后验概率公式：P(ωi∣x,D)=P(x∣ωi,Di)P(ωi)∑j=1cP(x∣ωj,Dj)P(ωj)P\left(\omega_i\mid\mathbf{x},\mathcal{D}\right)=\frac{P\left(\mathbf{x}\mid\omega_i,\mathcal{D}_i\right)P\left(\omega_i\right)}{\sum_{j=1
深度学习实战：基于嵌入模型的AI应用开发 AIGC应用创新大全 AI人工智能与大数据应用开发 MCP&Agent 云算力网络人工智能深度学习 ai
深度学习实战：基于嵌入模型的AI应用开发关键词：嵌入模型（EmbeddingModel）、深度学习、向量空间、语义表示、AI应用开发、相似性搜索、迁移学习摘要：本文将带你从0到1掌握基于嵌入模型的AI应用开发全流程。我们会用“翻译机”“数字身份证”等生活比喻拆解嵌入模型的核心原理，结合Python代码实战（BERT/CLIP模型）演示如何将文本、图像转化为可计算的语义向量，并通过“智能客服问答”“
机器学习3——参数估计之极大似然估计平和男人杨争争山东大学机器学习期末复习机器学习人工智能算法
参数估计问题背景：P(ωi∣x)=p(x∣ωi)P(ωi)p(x)p(x)=∑j=1cp(x∣ωj)P(ωj)\begin{aligned}&P\left(\omega_i\mid\mathbf{x}\right)=\frac{p\left(\mathbf{x}\mid\omega_i\right)P\left(\omega_i\right)}{p(\mathbf{x})}\\&p(\mathbf
大模型RLHF强化学习笔记（一）：强化学习基础梳理Part1 Gravity! 大模型笔记大模型 LLM 算法机器学习强化学习人工智能
【如果笔记对你有帮助，欢迎关注&点赞&收藏，收到正反馈会加快更新！谢谢支持！】一、强化学习基础1.1Intro定义：强化学习是一种机器学习方法，需要智能体通过与环境交互学习最优策略基本要素：状态（State）：智能体在决策过程中需要考虑的所有相关信息（环境描述）动作（Action）：在环境中可以采取的行为策略（Policy）：定义了在给定状态下智能体应该选择哪个动作，目标是最大化智能体的长期累积奖
高通 QCS8550 大模型性能深度解析：从算力基准到场景实测的全维度 Benchmark 伊利丹~怒风 Qualcomm 人工智能 AI编程 python arm 自然语言处理
前言在人工智能技术狂飙突进的时代，大模型正以前所未有的速度重塑各行业生态，从智能客服到多模态交互，从边缘推理到端侧部署，其应用场景不断拓展。而这一切革新的背后，离不开底层硬件的强力支撑。高通QCS8550作为面向下一代智能设备的旗舰级计算平台，凭借高达48TOPS的AI算力与先进的第七代高通AI引擎，在大模型性能表现上极具竞争力。其异构多核架构不仅能高效处理复杂的神经网络计算，还通过软硬件协同优化
从零开始理解零样本学习：AI人工智能必学技术 AI天才研究院 Agentic AI 实战 AI人工智能与大数据 AI大模型企业级应用开发实战 ai
从零开始理解零样本学习：AI人工智能必学技术关键词：零样本学习、人工智能、机器学习、知识迁移、语义嵌入摘要：本文旨在全面深入地介绍零样本学习这一在人工智能领域具有重要意义的技术。首先阐述零样本学习的背景和基本概念，通过详细的解释和直观的示意图让读者建立起对零样本学习的初步认识。接着深入剖析其核心算法原理，结合Python代码进行详细说明，同时引入相关数学模型和公式并举例阐释。通过项目实战部分，带领
卷积神经网络（Convolutional Neural Network, CNN）不想秃头的程序神经网络语音识别人工智能深度学习网络卷积神经网络
卷积神经网络（ConvolutionalNeuralNetwork,CNN）是一种专门用于处理图像、视频等网格数据的深度学习模型。它通过卷积层自动提取数据的特征，并利用空间共享权重和池化层减少参数量和计算复杂度，成为计算机视觉领域的核心技术。以下是CNN的详细介绍：一、核心思想CNN的核心目标是从图像中自动学习层次化特征，并通过空间共享权重和平移不变性减少参数量和计算成本。其关键组件包括：卷积层（
ResNet（Residual Network）不想秃头的程序神经网络语音识别人工智能深度学习网络残差网络神经网络
ResNet（ResidualNetwork）是深度学习中一种经典的卷积神经网络（CNN）架构，由微软研究院的KaimingHe等人在2015年提出。它通过引入残差连接（SkipConnection）解决了深度神经网络中的梯度消失问题，使得网络可以训练极深的模型（如上百层），并在图像分类、目标检测、语义分割等任务中取得了突破性成果。以下是ResNet的详细介绍：一、核心思想ResNet的核心创新是
P25：LSTM实现糖尿病探索与预测 ?Agony lstm 人工智能 rnn
本文为365天深度学习训练营中的学习记录博客原作者：K同学啊一、相关技术1.LSTM基本概念LSTM（长短期记忆网络）是RNN（循环神经网络）的一种变体，它通过引入特殊的结构来解决传统RNN中的梯度消失和梯度爆炸问题，特别适合处理序列数据。结构组成：遗忘门：决定丢弃哪些信息，通过sigmoid函数输出0-1之间的值，表示保留或遗忘的程度。输入门：决定更新哪些信息，同样通过sigmoid函数控制更新
Python训练营打卡——DAY16（2025.5.5） cosine2025 Python训练营打卡 python 开发语言机器学习
目录一、NumPy数组基础笔记1.理解数组的维度(Dimensions)2.NumPy数组与深度学习Tensor的关系3.一维数组(1DArray)4.二维数组(2DArray)5.数组的创建5.1数组的简单创建5.2数组的随机化创建5.3数组的遍历5.4数组的运算6.数组的索引6.1一维数组索引6.2二维数组索引6.3三维数组索引二、SHAP值的深入理解三、总结1.NumPy数组基础总结2.SH
深入详解：决策树算法的概念、原理、实现与应用场景猿享天开算法决策树机器学习
深入详解：决策树算法的概念、原理、实现与应用场景决策树（DecisionTree）是机器学习中一种直观且广泛应用的监督学习算法，适用于分类和回归任务。其树形结构易于理解，特别适合初学者。本文将从概念、原理、实现到应用场景，全面讲解决策树，并通过流程图和可视化示例增强理解，通俗易懂，帮助小白快速掌握决策树算法相关知识。1.决策树的概念1.1什么是决策树？决策树通过一系列条件判断（决策节点）将输入数据
Python爬虫实战：爬取知乎问答与用户信息 Python爬虫项目 python 爬虫 php 数据分析开发语言开源
简介随着网络信息量的爆炸，如何有效获取有价值的内容，成为了数据分析、机器学习等领域的基础之一。爬虫作为数据采集的基本工具之一，常常被用来获取互联网上的公开数据。在这篇博客中，我们将结合最新的Python爬虫技术，详细讲解如何爬取知乎问答与用户信息。本文将会介绍：Python爬虫的基础知识知乎问答网页结构分析使用Python进行知乎数据爬取爬取知乎问答内容与用户信息如何处理和存储爬取的数据使用最新的
【机器学习&深度学习】反向传播机制
目录一、一句话定义二、类比理解三、为什重要？四、用生活例子解释：神经网络=烹饪机器人4.1第一步：尝一口（前向传播）4.2第二步：倒着推原因（反向传播）五、换成人工智能流程说一遍六、图示类比：找山顶（最优参数）七、总结一句人话八、PyTorch代码示例：亲眼看到每一层的梯度九、梯度=损失函数对参数的偏导数十、类比总结反向传播（Backpropagation）是神经网络中训练过程的核心机制，它就像“
人脸识别算法赋能园区无人超市安防升级智驱力人工智能算法人工智能边缘计算人脸识别智慧园区智慧工地智慧煤矿
人脸识别算法赋能园区无人超市安防升级正文在园区无人超市的运营管理中，传统安防手段依赖人工巡检或基础监控设备，存在响应滞后、误报率高、环境适应性差等问题。本文从技术背景、实现路径、功能优势及应用场景四个维度，阐述如何通过人脸识别检测、人员入侵算法及疲劳检测算法的协同应用，构建高效、精准的智能安防体系。一、技术背景：视觉分析算法的核心支撑人脸识别算法基于深度学习的卷积神经网络（CNN）模型，通过提取面
Python 数据挖掘实战：关联规则与聚类分析，解锁数据价值的钥匙清水白石008 python Python题库 python 数据挖掘动画
Python数据挖掘实战：关联规则与聚类分析，解锁数据价值的钥匙引言在数字化浪潮席卷全球的今天，数据已成为企业和组织最重要的战略资产。海量数据蕴藏着巨大的价值，等待我们去挖掘和发现。数据挖掘(DataMining)，作为从海量数据中提取有价值知识和模式的关键技术，正日益受到各行各业的重视。它如同探矿者的火眼金睛，能够穿透数据的迷雾，发现隐藏在背后的规律和趋势，为商业决策、科学研究和社会发展提供强有
Python编程：使用Opencv进行图像处理
【参考】https://github.com/opencv/opencv/tree/4.x/samples/pythonPython使用OpenCV进行图像处理OpenCV(OpenSourceComputerVisionLibrary)是一个开源的计算机视觉和机器学习软件库。下面将从基础到高阶介绍如何使用Python中的OpenCV进行图像处理。一、安装首先需要安装OpenCV库：pipinst
基于机器学习的智能文本分类技术研究与应用
在当今数字化时代，文本数据的爆炸式增长给信息管理和知识发现带来了巨大的挑战。从新闻文章、社交媒体帖子到企业文档和学术论文，海量的文本数据需要高效地分类和管理，以便用户能够快速找到所需信息。传统的文本分类方法主要依赖于人工规则和关键词匹配，这些方法不仅效率低下，而且难以应对复杂多变的文本内容。近年来，机器学习技术的快速发展为文本分类提供了一种高效、自动化的解决方案。一、机器学习在文本分类中的应用概述
【机器学习与数据挖掘实战 | 医疗】案例18：基于Apriori算法的中医证型关联规则分析 Francek Chen 机器学习与数据挖掘实战机器学习数据挖掘 Apriori python 关联规则人工智能
【作者主页】FrancekChen【专栏介绍】⌈⌈⌈机器学习与数据挖掘实战⌋⌋⌋机器学习是人工智能的一个分支，专注于让计算机系统通过数据学习和改进。它利用统计和计算方法，使模型能够从数据中自动提取特征并做出预测或决策。数据挖掘则是从大型数据集中发现模式、关联和异常的过程，旨在提取有价值的信息和知识。机器学习为数据挖掘提供了强大的分析工具，而数据挖掘则是机器学习应用的重要领域，两者相辅相成，共同推动
异常的核心类Throwable 无量 java 源码异常处理 exception
java异常的核心是Throwable，其他的如Error和Exception都是继承的这个类里面有个核心参数是detailMessage，记录异常信息，getMessage核心方法，获取这个参数的值，我们可以自己定义自己的异常类，去继承这个Exception就可以了，方法基本上，用父类的构造方法就OK，所以这么看异常是不是很easy package com.natsu;
mongoDB 游标（cursor）实现分页迭代开窍的石头 mongodb
上篇中我们讲了mongoDB 中的查询函数，现在我们讲mongo中如何做分页查询如何声明一个游标 var mycursor = db.user.find({_id:{$lte:5}}); 迭代显示游标数
MySQL数据库INNODB 表损坏修复处理过程 0624chenhong tomcat mysql
最近mysql数据库经常死掉，用命令net stop mysql命令也无法停掉，关闭Tomcat的时候，出现Waiting for N instance(s) to be deallocated 信息。查了下，大概就是程序没有对数据库连接释放，导致Connection泄露了。因为用的是开元集成的平台，内部程序也不可能一下子给改掉的，就验证一下咯。启动Tomcat,用户登录系统，用netstat -
剖析如何与设计人员沟通不懂事的小屁孩工作
最近做图烦死了，不停的改图，改图……。烦，倒不是因为改，而是反反复复的改，人都会死。很多需求人员不知该如何与设计人员沟通，不明白如何使设计人员知道他所要的效果，结果只能是沟通变成了扯淡，改图变成了应付。那应该如何与设计人员沟通呢？我认为设计人员与需求人员先天就存在语言障碍。对一个合格的设计人员来说，整天玩的都是点、线、面、配色，哪种构图看起来协调；哪种配色看起来合理心里跟明镜似的，
qq空间刷评论工具换个号韩国红果果 JavaScript
var a=document.getElementsByClassName('textinput'); var b=[]; for(var m=0;m<a.length;m++){ if(a[m].getAttribute('placeholder')!=null) b.push(a[m]) } var l
S2SH整合之session 灵静志远 spring AOP struts session
错误信息： Caused by: org.springframework.beans.factory.BeanCreationException: Error creating bean with name 'cartService': Scope 'session' is not active for the current thread; consider defining a scoped
xmp标签 a-john 标签
今天在处理数据的显示上遇到一个问题： var html = '<li><div class="pl-nr"><span class="user-name">' + user + '</span>' + text + '</div></li>'; ulComme
Ajax的常用技巧（2）---实现Web页面中的级联菜单 aijuans Ajax
在网络上显示数据，往往只显示数据中的一部分信息，如文章标题，产品名称等。如果浏览器要查看所有信息，只需点击相关链接即可。在web技术中，可以采用级联菜单完成上述操作。根据用户的选择，动态展开，并显示出对应选项子菜单的内容。在传统的web实现方式中，一般是在页面初始化时动态获取到服务端数据库中对应的所有子菜单中的信息，放置到页面中对应的位置，然后再结合CSS层叠样式表动态控制对应子菜单的显示或者隐
天-安-门，好高 atongyeye 情感
我是85后，北漂一族，之前房租1100，因为租房合同到期，再续，房租就要涨150。最近网上新闻，地铁也要涨价。算了一下，涨价之后，每次坐地铁由原来2块变成6块。仅坐地铁费用，一个月就要涨200。内心苦痛。晚上躺在床上一个人想了很久，很久。我生在农
android 动画百合不是茶 android 透明度平移缩放旋转
android的动画有两种 tween动画和Frame动画 tween动画;,透明度,缩放,旋转,平移效果 Animation 动画 AlphaAnimation 渐变透明度 RotateAnimation 画面旋转 ScaleAnimation 渐变尺寸缩放 TranslateAnimation 位置移动 Animation
查看本机网络信息的cmd脚本 bijian1013 cmd
@echo 您的用户名是：%USERDOMAIN%\%username%>"%userprofile%\网络参数.txt" @echo 您的机器名是：%COMPUTERNAME%>>"%userprofile%\网络参数.txt" @echo ___________________>>"%userprofile%\
plsql 清除登录过的用户征客丶 plsql
tools---preferences----logon history---history 把你想要删除的删除 -------------------------------------------------------------------- 若有其他凝问或文中有错误，请及时向我指出，我好及时改正，同时也让我们一起进步。 email ： binary_spac
【Pig一】Pig入门 bit1129 pig
Pig安装 1.下载pig wget http://mirror.bit.edu.cn/apache/pig/pig-0.14.0/pig-0.14.0.tar.gz 2. 解压配置环境变量如果Pig使用Map/Reduce模式，那么需要在环境变量中，配置HADOOP_HOME环境变量 expor
Java 线程同步几种方式 BlueSkator volatile synchronized ThredLocal ReenTranLock Concurrent
为何要使用同步？ java允许多线程并发控制，当多个线程同时操作一个可共享的资源变量时（如数据的增删改查），将会导致数据不准确，相互之间产生冲突，因此加入同步锁以避免在该线程没有完成操作之前，被其他线程的调用，从而保证了该变量的唯一性和准确性。 1.同步方法&
StringUtils判断字符串是否为空的方法（转帖） BreakingBad null StringUtils “”
转帖地址：http://www.cnblogs.com/shangxiaofei/p/4313111.html public static boolean isEmpty(String str) 　　判断某字符串是否为空，为空的标准是 str== null 或 str.length()== 0
编程之美-分层遍历二叉树 bylijinnan java 数据结构算法编程之美
import java.util.ArrayList; import java.util.LinkedList; import java.util.List; public class LevelTraverseBinaryTree { /** * 编程之美分层遍历二叉树 * 之前已经用队列实现过二叉树的层次遍历，但这次要求输出换行，因此要
jquery取值和ajax提交复习记录 chengxuyuancsdn jquery取值 ajax提交
// 取值 // alert($("input[name='username']").val()); // alert($("input[name='password']").val()); // alert($("input[name='sex']:checked").val()); // alert($("
推荐国产工作流引擎嵌入式公式语法解析器-IK Expression comsci java 应用服务器工作 Excel 嵌入式
这个开源软件包是国内的一位高手自行研制开发的，正如他所说的一样，我觉得它可以使一个工作流引擎上一个台阶。。。。。。欢迎大家使用，并提出意见和建议。。。 ----------转帖--------------------------------------------------- IK Expression是一个开源的（OpenSource），可扩展的（Extensible），基于java语言
关于系统中使用多个PropertyPlaceholderConfigurer的配置及PropertyOverrideConfigurer daizj spring
1、PropertyPlaceholderConfigurer Spring中PropertyPlaceholderConfigurer这个类，它是用来解析Java Properties属性文件值，并提供在spring配置期间替换使用属性值。接下来让我们逐渐的深入其配置。基本的使用方法是：(1) <bean id="propertyConfigurerForWZ&q
二叉树:二叉搜索树 dieslrae 二叉树
所谓二叉树,就是一个节点最多只能有两个子节点,而二叉搜索树就是一个经典并简单的二叉树.规则是一个节点的左子节点一定比自己小,右子节点一定大于等于自己(当然也可以反过来).在树基本平衡的时候插入,搜索和删除速度都很快,时间复杂度为O(logN).但是,如果插入的是有序的数据,那效率就会变成O(N),在这个时候,树其实变成了一个链表. tree代码:
C语言字符串函数大全 dcj3sjt126com c function
C语言字符串函数大全函数名: stpcpy 功能: 拷贝一个字符串到另一个用法: char *stpcpy(char *destin, char *source); 程序例: #include <stdio.h> #include <string.h> int main
友盟统计页面技巧 dcj3sjt126com 技巧
在基类调用就可以了, 基类ViewController示例代码 -(void)viewWillAppear:(BOOL)animated { [super viewWillAppear:animated]; [MobClick beginLogPageView:[NSString stringWithFormat:@"%@",self.class]];
window下在同一台机器上安装多个版本jdk，修改环境变量不生效问题处理办法 flyvszhb java jdk
window下在同一台机器上安装多个版本jdk，修改环境变量不生效问题处理办法本机已经安装了jdk1.7，而比较早期的项目需要依赖jdk1.6，于是同时在本机安装了jdk1.6和jdk1.7. 安装jdk1.6前，执行java -version得到 C:\Users\liuxiang2>java -version java version "1.7.0_21&quo
Java在创建子类对象的同时会不会创建父类对象 happyqing java 创建子类对象父类对象
1.在thingking in java 的第四版第六章中明确的说了，子类对象中封装了父类对象， 2."When you create an object of the derived class, it contains within it a subobject of the base class. This subobject is the sam
跟我学spring3 目录贴及电子书下载 jinnianshilongnian spring
一、《跟我学spring3》电子书下载地址：《跟我学spring3》（1-7 和 8-13） http://jinnianshilongnian.iteye.com/blog/pdf 跟我学spring3系列 word原版下载二、源代码下载最新依
第12章 Ajax（上） onestopweb Ajax
index.html <!DOCTYPE html PUBLIC "-//W3C//DTD XHTML 1.0 Transitional//EN" "http://www.w3.org/TR/xhtml1/DTD/xhtml1-transitional.dtd"> <html xmlns="http://www.w3.org/
BI and EIM 4.0 at a glance blueoxygen BO
http://www.sap.com/corporate-en/press.epx?PressID=14787 有机会研究下EIM家族的两个新产品~~~~ New features of the 4.0 releases of BI and EIM solutions include: Real-time in-memory computing –
Java线程中yield与join方法的区别 tomcat_oracle java
长期以来，多线程问题颇为受到面试官的青睐。虽然我个人认为我们当中很少有人能真正获得机会开发复杂的多线程应用(在过去的七年中，我得到了一个机会)，但是理解多线程对增加你的信心很有用。之前，我讨论了一个wait()和sleep()方法区别的问题，这一次，我将会讨论join()和yield()方法的区别。坦白的说，实际上我并没有用过其中任何一个方法，所以，如果你感觉有不恰当的地方，请提出讨论。 &nb
android Manifest.xml选项阿尔萨斯 Manifest
结构继承关系 public final class Manifest extends Objectjava.lang.Objectandroid.Manifest 内部类 class Manifest.permission权限 class Manifest.permission_group权限组构造函数 public Manifest () 详细 androi
Oracle实现类split函数的方 zhaoshijie oracle
关键字：Oracle实现类split函数的方项目里需要保存结构数据，批量传到后他进行保存，为了减小数据量，子集拼装的格式，使用存储过程进行保存。保存的过程中需要对数据解析。但是oracle没有Java中split类似的函数。从网上找了一个，也补全了一下。 CREATE OR REPLACE TYPE t_split_100 IS TABLE OF VARCHAR2(100); cr