chenchenlllll

【论文阅读】强化学习与知识图谱结合实现序列推荐

前言

论文名称：KERL: A Knowledge-Guided Reinforcement Learning Model for Sequential Recommendation
时间：SIGIR 2020

【目录】

前言
摘要Abstract
1 引入 Introduction
2 相关工作 Related Work
3 准备工作 PRELIMINARY
4 本文方法 Approach
- 4.1 MDP公式
- 4.2 Learning Knowledge-Enhanced State Representation
- - 4.2.1 Sequence-level State Representation
  - 4.2.2 Knowledge-level State Representation
  - 4.2.3 Deriving the Final State Representation
- 4.3 Setting the Reward with Knowledge Information
- - 4.3.1 Reward Decomposition
  - 4.3.2 Sequence-level Reward
  - 4.3.3 Knowledge-level Reward
- 4.4 Learning and Discussion
5 实验Experiment
- 5.1 实验设置
- 5.2 对比试验
- 5.3 消融实验
- - 5.3.1Analysis on Knowledge-Enhanced State Representation
5 结论与未来工作 Conclusion and Future Work
6 个人感悟

摘要Abstract

强化学习开发有效的顺序推荐可以提高预测能力，然而user-item的交互数据可能是稀疏的、复杂的和动态的，所以直接实现强化学习来提升效果并不容易。
- - 受知识图谱可用性的启发，本文提出了一种新的knowledge-guided 强化学习模型(KERL)，将KG信息融合到RL框架中，用于顺序推荐。具体而言，本文将序列推荐任务形式化为马尔可夫决策过程(Markov Decision Process, MDP)，并对该框架进行了三个主要技术扩展，包括状态表示、奖励函数和学习算法。首先用KG信息增强状态的表示，同时考虑利用和探索。其次，设计一种能同时计算序列方面和知识方面的复合型奖励函数。第三，提出了新的学习算法训练模型。在下一个项目和下一个会话推荐任务上的大量实验结果表明，本文的模型在四个真实数据集上可以显著优于基线。

1 引入 Introduction

顺序推荐是指根据用户的顺序交互行为，依次推荐下一项或下几项产品[10,27]。人们提出了各种方法来解决这一任务，如经典的矩阵分解技术[15]和流行的递归神经网络方法[5,9,14]。通常，这些方法使用最大似然估计(MLE)进行训练，逐步拟合观察到的相互作用序列。然而，以往的研究并没有很好地描述优化目标的长期或整体有效性。强化学习(RL)[24]最近的显著进展为这个问题提供了一个有前途的解决方案，考虑最大化长期性能。
- - 实践中的问题：1.用户物品交互数据可能是稀疏或有限的，不容易直接朝着一个更困难的优化目标学习。第二，RL模型的一个核心概念或机制是探索过程。采用盲目或随机的探索策略来捕捉用户兴趣的变化可能不可靠。从本质上讲，用户行为是复杂多变的，将RL算法应用于顺序推荐需要一个更可控的学习过程。
  - - - 事实上，KG数据在推荐任务中被广泛使用[12,26,28]。以往的研究主要利用KG数据进行开发，很少考虑知识信息在勘探过程中的作用。因此，他们无法很好地把握未来用户偏好的潜在变化。
      - 针对上述问题，本文提出了一种新的知识引导强化学习模型(KERL)，将KG信息融合到RL框架中进行顺序推荐。具体地，本文将序列推荐任务形式化为马尔可夫决策过程(MDP)，并在此框架中进行了三个主要的技术扩展。首先，本文提出用KG信息增强状态表示。通过学习序列级和知识级状态表示，本文的模型能够更准确地捕捉用户偏好。特别是，本文认为在勘探过程中利用KG信息是非常重要的。为此，本文构建了一个感应网络，旨在预测用户偏好的未来知识特征。这样就可以学习基于知识的用户偏好，同时考虑开发和探索。其次，本文精心设计了一个能够同时计算序列级和知识级奖励信号的复合奖励函数。
        
        对于sequence-level，使用BLEU指标（ps:在代码中使用的DCG）评估推荐序列的质量。对于knowledge-level，使推荐的序列和ground true逼近。然后提出一个截断式策略梯度来训练模型。针对诱导网络训练的稀疏性和不稳定性，我们进一步引入了一种具有模拟子序列的两两学习机制来改进诱导网络的学习。
        
        本文的贡献：
        
        将顺序推荐任务形式化为马尔可夫决策过程(MDP)，并融合KG信息来提高推荐性能。据作者所知，这是第一次在基于RL的顺序推荐中明确地探索和利用知识图谱数据，特别是在探索过程中。
        
        对序列推荐的MDP框架进行了三个新的扩展，包括状态表示、奖励函数和学习策略。通过这三个主要的扩展，KG信息被有效地利用并集成到基于RL的顺序推荐中。
        
        在四个真实数据集上的实证结果表明，本文的模型在不同指标下的下一个item和下一个会话推荐任务上都可以持续优于最先进的基线。

2 相关工作 Related Work

Sequential Recommendation: 序列推荐的目的是根据用户的历史交互数据来预测用户未来的行为。

早期利用马尔科夫链：Rendle等[22]设计了一个个性化的马尔可夫链来提供推荐。此外，Wang等人[27]利用表示学习度量对用户和物品之间的复杂交互进行建模，而Pasricha等人[19]结合翻译和基于度量的方法进行顺序推荐。
对多部序列行为进行建模：基于RNN (Recurrent Neural Networks)的模型在这一领域得到了广泛的应用[5,20,29]。与以往基于mc的模型相比，基于RNN的模型可以很好地捕捉较长的序列行为进行推荐。例如，Quadrana等人[20]利用门控循环单元(GRU)对点击序列进行建模，以实现基于会话的推荐。Li等[16]进一步将注意力机制引入RNN，捕捉用户的顺序行为和主要目的，实现基于会话的推荐。Kang等人[14]提出了一种新的自注意方法来建模用户序列中的成对物品交互。

Knowledge-based Recommendation: 随着知识图谱(KG)技术的发展[2,7,17,18]，研究者也试图将知识图谱技术纳入推荐系统来提高推荐系统的性能

Huang等[12]利用Memory Network存储和表示知识库信息，提高了顺序推荐的有效性和可解释性。Huang等[11]设计了一种多跳推理体系结构，利用分类法信息改进条目推荐。Wang等人[26]引入偏好传播，在KG中自动传播用户的潜在偏好。Wang等人[28]通过从KG中提取路径，利用高阶关系来获取更多用户和物品之间的连接。尽管KG可以有效地提高性能，但这些工作并没有模拟用户的长期利益，因此性能可能会受到限制。

RL-based Recommendation :强化学习被引入推荐系统，其优点是可以考虑用户的长期反馈[34,36]。

[30]提出了一种策略梯度法在KG中搜索路径来解释推荐过程。[37]将排序过程表述为一个多代理马尔可夫决策过程，其中文档之间的相互交互被合并来计算排序列表。[1]探索了基于模型的RL框架上的对抗性训练，以提供建议。据作者所知，这是第一次在基于rl的顺序推荐中明确地讨论和利用KG信息，特别是在探索过程中。

3 准备工作 PRELIMINARY

Notation :U表示一组用户，I表示一组items。对每一个用户u， $i_{j: k}^{u}=i_{j}^{u} \rightarrow i_{j+1}^{u} \rightarrow \cdots \rightarrow i_{k}^{u}$ 表示用户u的一组交互序列,每个i代表用户在t时刻交互的item。当n=k时，代表着一条子序列。除了序列交互，知识图谱KG也可以用于该任务，每一条记录是一个三元组，分别是两个实体和一个之间的关系。本文假设item集可以与KG相对应，这样就可以获得与每个item对应的知识信息了。

Task Definition:基于交互历史和知识图谱KG，序列推荐的任务目标是用户将会去交互的下一个item。

Markov Decision Process:经典的五元组（状态，动作，转移函数，奖励，策略），不赘述了。

4 本文方法 Approach

本节详细介绍了知识引导强化学习模型，总体架构如图。该方法能够有效地将知识图(KG)信息融合到RL框架中进行顺序推荐。接下来从MDP公式开始，展示本文在状态表示、奖励函数和学习算法上的拓展。简单起见，本文只针对单用户u的方法。

4.1 MDP公式

状态s由序列信息和知识图谱共同构成，可以认为环境的状态包含了所有用于顺序推荐的有用信息，包括交互历史和KG。初始状态设:s0 =[∅，G]。根据论文[6]，本文使用一个embedding向量vst对状态st的信息进行编码。期望Vst对表示状态st的有用信息进行编码。

$s_{t}=\left[i_{1: t}, \mathcal{G}\right]$

- agent根据策略π(st)来选择输出的动作，在本文中，我们使用softmax函数来计算选择某项的概率:

$\pi\left(a_{t} \mid s_{t}\right)=\frac{\exp \left\{\mathbf{q}_{\left.i_{j\left(a_{t}\right)}\right)} \mathbf{W}_{1} \mathbf{v}_{s_{t}}\right\}}{\sum_{i_{j} \in I} \exp \left\{\mathbf{q}_{i_{j}} \mathbf{W}_{1} \mathbf{v}_{s_{t}}\right\}}$

4.2 Learning Knowledge-Enhanced State Representation

之前强化学习的方法主要集中在学习算法上，缺乏对外部知识信息的利用。本文提出引入知识信息来增强状态表示，并设置了两种状态表示，即序列级和知识级状态表示。这样，希望可以利用有信息性的KG数据来指导序列级RL学习算法。本节相当于是对4.1状态表示的一个具体实现，分别从序列信息和知识信息两个方面来表示状态。

4.2.1 Sequence-level State Representation

对于序列信息方面，直接用标准的RNN来对历史交互序列进行编码。GRU为门控循环单元。

$\mathbf{h}_{t}=\operatorname{GRU}\left(\mathbf{h}_{t-1}, \mathbf{q}_{i_{t}} ; \Phi_{g r u}\right)$

4.2.2 Knowledge-level State Representation

以前的方法主要用KG增强物品或用户表征，而很少用于长期目标的探索。为了在探索和利用之间取得良好的平衡，作者建模两种基于知识的偏好，即当前偏好和未来偏好。

Learning Current Preference：每个item与KG中的实体相关联。使用KG embedding method TransE 得到每一个item的向量，记为。然后使用平均池化方法来聚合用户交互过的历史Iitem的KG embedding：
$\mathbf{c}_{t}=\sum_{i=1}^{t} \operatorname{Average}\left(\mathbf{v}_{e_{i_{t}}}\right)$

注意，这里我们没有考虑上述公式中的时间信息或注意机制，因为它没有显示出比上述简单方法显著的性能改进。

Predicting Future Preference：作为实现有效探索的关键点，本文纳入未来偏好，捕获用户在之后的时间中可能产生的兴趣。直观地说，知道用户未来的偏好对顺序推荐很有用，特别是在RL模型中。基于当前的偏好，作者的想法是开发一个感应网络来直接预测未来的偏好。所以，本文利用多层感知构造了一个神经网络。在时间步t，我们以当前偏好表征ct(式5)为输入，预测一个k步未来偏好表征:
$\mathbf{f}_{t: t+k}=\operatorname{MLP}\left(\mathbf{c}_{t} ; \Phi_{m l p}\right)$

4.2.3 Deriving the Final State Representation

最终的状态表示输出为：
$\mathbf{v}_{S_{t}}=\mathbf{h}_{t} \oplus \mathbf{c}_{t} \oplus \mathbf{f}_{t: t+k}$

4.3 Setting the Reward with Knowledge Information

定义一个合适的奖励函数对于RL算法来说尤为重要。在顺序推荐中，最终的性能通常是基于item-id的精确匹配来度量的。而交互序列是由用户根据其对物品属性或配置文件的偏好(可以从KG中获得)生成的。因此，除了项目级的性能外，度量推断的知识级偏好的质量也很重要。

4.3.1 Reward Decomposition

本文设置的在t时刻的k步奖励为：
$R\left(s_{t}, a_{t}\right)=R_{s e q}\left(i_{t: t+k}, \hat{i}_{t: t+k}\right)+R_{k g}\left(i_{t: t+k}, \hat{i}_{t: t+k}\right),$

4.3.2 Sequence-level Reward

论文中使用BLEU指标来评价序列质量，在代码中使用的dcg:

4.3.3 Knowledge-level Reward

对于真实的和预测的子序列的知识表示，使用余弦相似度作为奖励函数：
$R_{k g}\left(i_{t: t+k}, \hat{i}_{t: t+k}\right)=\frac{\mathbf{c}_{t: t+k} \cdot \hat{\mathbf{c}}_{t: t+k}^{\top}}{\left\|\mathbf{c}_{t, t+k}\right\| \cdot\left\|\hat{\mathbf{c}}_{t: t+k}\right\|}$

作者说可以用任何相似性的度量来代替余弦相似度。

4.4 Learning and Discussion

RL使用截断式策略梯度（类似于PPO）：

5 实验Experiment

5.1 实验设置

Dataset：

Amazon:Books,Beauty, and CD
LastFM:音乐收听数据集

Evaluation Metrics: Hit-Ratio@k 和 NDCG@k

5.2 对比试验

本节将模型与几个baseline进行对比，可以看出KERL与基于序列和基于知识的模型的对比中都有着更好的性能，在混合模型中也有着最好的效果。

5.3 消融实验

5.3.1Analysis on Knowledge-Enhanced State Representation

本文的状态表示有三部分组成，通过顺序对每个部分进行检查：

完整的KERL模型还是优于其他组合。

5 结论与未来工作 Conclusion and Future Work

在本文中，提出了一种新的知识引导的强化学习模型，称为KERL，将KG信息融合到RL框架中进行顺序推荐。具体而言，将序列推荐任务形式化为马尔可夫决策过程(Markov Decision Process, MDP)，并对该框架进行了三个主要技术扩展，包括状态表示、奖励函数和学习算法。模型的一个主要新奇之处在于，KG信息在MDP框架中被有效地用于探索和利用。实证结果表明，模型在四个真实数据集上可以显著优于基线。作者还对KERL模型进行了详细的分析，以说明本文的扩展的有效性。目前，我们关注的重点是在RL框架中利用知识信息，而不是知识表示。我们采用现有的KG嵌入方法来学习项目的知识表示。作为未来的工作，我们将考虑如何在RL框架中自适应学习更好的顺序推荐知识表示。

6 个人感悟

和之前的那篇交互式的推荐系统相比，本文的模型更加全面。在状态表示方面，不仅使用知识图谱，还加入了序列信息（之前那篇只使用了知识图谱信息）。而且本文模型更加注重用知识图谱进行探索，抓取未来偏好。

华为OD机试 2025B卷 - 货币单位转换(C++&Python&JAVA&JS&C语言) YOLO大师华为od c++python 华为OD机试华为OD机试2025B卷华为OD2025B卷华为OD机考2025B卷
2025B卷目录点击查看：华为OD机试2025B卷真题题库目录｜机考题库+算法考点详解2025B卷100分题型题目描述记账本上记录了若干条多国货币金额，需要转换成人民币分（fen），汇总后输出。每行记录一条金额，金额带有货币单位，格式为数字+单位，可能是单独元，或者单独分，或者元与分的组合。要求将这些货币全部换算成人民币分（fen）后进行汇总，汇总结果仅保留整数，小数部分舍弃。元和分的换算关系都是
C++二分查找入门指南
一、二分法概述二分查找（BinarySearch）是一种在‌有序数组‌中查找特定元素的高效算法。它的基本思想是通过不断将搜索范围减半来快速定位目标元素，时间复杂度为O(logn)，远优于线性查找的O(n)。二分法不仅用于查找，还广泛应用于求解各种数学和计算问题，如求方程的近似解、寻找最优解等。在计算机科学中，二分查找是最基础且最重要的算法之一，几乎所有程序员都需要熟练掌握。二、二分查找的基本原理二
河南萌新联赛2024第（四）场的个人题解（适合小白）耳朵听不见deaf ACM 算法
河南萌新联赛2024第（四）场的题目链接文章目录ABCEGIJKLAA题目链接思路： sum=计算原来每个连通块的士兵数量总和的平方。枚举每个点，若破坏当前点，当前点所在的连通块的计算值，记录ma=没破坏前的计算值-破坏后的计算值，记录最大值涉及的知识：tarjan算法不明白的话，可以看我的第二篇博客LCA算法有用的知识：__int128 占用128字节的整数存储类型，范围为-2127~2
快速排序算法追烽少年x 数据结构数据结构
快速排序算法快速排序是一种高效的排序算法，其核心思想是通过分治法将数组分成两部分，一部分小于某个基准值，另一部分大于基准值，然后递归地对这两部分进行排序。以下是快速排序算法的C++实现：快速排序的C++实现代码：#include#includeusingnamespacestd;voidSwap(int&a,int&b){intnTemp=a;a=b;b=nTemp;}intPartition(v
Python编程电子书：从基础到实践王奥雷
本文还有配套的精品资源，点击获取简介：Python电子书汇集了基础语法、面向对象编程、标准及第三方库使用、文件操作、网络编程、并发编程、单元测试与调试、Python2与Python3的区别等核心知识点。通过实例和项目案例，帮助读者在Web开发、数据分析、人工智能等应用领域提升编程技能，跟上Python的技术进步。1.Python基础语法介绍Python作为一种高级编程语言，其易读性和简洁的语法使其
区块链技术核心组件及应用架构的全面解析
区块链技术是一套融合密码学、分布式系统与经济激励的复合型技术体系，以下是其核心组件及应用架构的全面解析：一、区块链核心技术栈1.分布式账本技术（DLT）核心原理：多节点共同维护不可篡改的数据链数据结构：哈希指针哈希指针区块N区块N+1区块N+2关键创新：默克尔树（MerkleTree）实现高效数据验证2.密码学保障技术算法示例应用场景非对称加密ECC/secp256k1,RSA数字签名（设备身份认
03每日简报20250705 Alvin_YD 每日简报人工智能娱乐社交电子媒体传媒
每日简报新闻简报：AI行业信任危机浮现标题：知名科技作者AlbertoRomero发文《我对AI行业正在失去所有信任》来源：TheAlgorithmicBridge（算法之桥）核心内容：作者立场：长期支持AI技术的作者AlbertoRomero公开表达对行业信任的崩塌，称"作为一个支持者，我本不愿有这种感受"。行业痛点：未具体说明的行业乱象导致公众信任度下降暗示AI发展过程中存在伦理或透明度问题传
开源模型应用落地-OpenAI Agents SDK-集成MCP与Qwen3-8B模型的创新应用探索（七）开源技术探险家开源模型-实际应用落地开源 python ai 人工智能
一、前言在人工智能技术飞速发展的今天，如何将先进的模型和技术无缝结合，成为推动行业变革的关键。OpenAIAgents通过集成模型上下文协议（MCP）和阿里巴巴推出的Qwen3-8B模型，正开启一场智能应用的革命。这种创新的结合不仅提升了AI代理与外部工具之间的通信能力，还在多模态任务处理、个性化服务等领域展现出巨大潜力。本文将深入探讨这一技术组合的实际应用场景，揭示其在改善客户体验和提升运营效率
开源模型应用落地-OpenAI Agents SDK-集成Qwen3-8B-探索output_guardrail的创意应用（六）开源技术探险家开源模型-实际应用落地开源 python ai 人工智能
一、前言随着人工智能技术的迅猛发展，大语言模型（LLM）在各行各业的应用日益广泛。然而，模型生成的内容是否安全、合规、符合用户预期，成为开发者和企业不可忽视的问题。为此，OutputGuardrail应运而生，作为一种关键的安全机制，它在模型生成结果之后进行内容审核与过滤，确保输出不偏离道德、法律和业务规范。通过检测不当的内容，不仅提升了AI系统的可信度，也为构建更加稳健和负责任的人工智能应用提供
正则表达式咸鱼时日翻身正则表达式
是指定一组与之匹配的字符串，限定符号a*a出现0或者多次a+a出现1次或者多次a？a出现0次或者1次a{2,5}出现在2到5次之间或运算法（cat|dog）匹配cat或者dog字符类[abz]+表示匹配的字符只能是中括号中的字母如果使用了^则为取反符号元字符、/d代表数字字符/w代表英文字符数字加上下划线/s代表tab和换行符其中/加大写的DWS则表示取反符号.表示任意字符不包括换行符号^a匹配行
定位问题position
1.relative相对对位：占有原来的位置。以浏览器为准定位进行移动top/left/right/bottom2.absolute绝对定位：不占有原来的位置（脱标）如果没有祖先元素或者祖先元素没有定位，以浏览器为准定位；如果祖先元素有定位（相对、绝对、固定），则以最近一级的有定位祖先元素为参考点移动位置；加了绝对定位的盒子不能通过margin：0auto垂直水平居中，但可以通过算法居中left：
开源模型应用落地-让AI更懂你的每一次交互-Mem0集成Qdrant、Neo4j与Streamlit的创新实践（四）开源技术探险家开源模型-实际应用落地 neo4j 开源人工智能语言模型
一、前言在人工智能迅速发展的今天，如何让AI系统更懂“你”？答案或许藏在个性化的记忆管理之中。Mem0作为一个开源的记忆管理系统，正致力于为AI赋予长期记忆与个性化服务能力。通过结合高性能向量数据库Qdrant、图数据库Neo4j的强大关系分析能力以及Streamlit的高效可视化交互，我们可以打造出一个既能存储用户历史行为、又能实时推理并展示结果的智能记忆助手。本文将带您一步步探索这一技术组合的
【算法刷题记录（简单题）002】字符串字符匹配（java代码实现）挺菜的 java 算法开发语言
一、题目描述对于给定的字符串s和t，检查s中的所有字符是否都在t中出现。（一）输入描述第一行输入一个长度为1≤len(s)≤200、仅由小写字母组成的字符串s。第二行输入一个长度为1≤len(t)≤200、仅由小写字母组成的字符串t。（二）输出描述如果s中的所有字符都在t中出现，则输出true，否则输出false。（三）示例输入：bcabc输出：true二、题目解答（一）解题思路1.使用HashM
C语言数据结构与算法专栏目录 CodeAllen嵌入式嵌入式 C语言数据结构算法
后序会开一个《嵌入式数据结构专栏》主要为了学习嵌入式的同学，软件能力提升和大厂面试能力，感谢大家关注！直达专栏：https://blog.csdn.net/super828/category_11083370.html《C语言数据结构与算法》专栏已经更新完毕，共计72篇分享，后期会逐渐修改错误并添加内容0数据之间的关系有哪些？1如何度量一个算法的好坏？2常见的时间复杂度实例
分布式系统核心基石：CAP定理、BASE理论与一致性算法深度解析 Eqwaak00 分布式系统设计实战算法 python java
一、CAP定理：分布式系统的设计边界1.1核心定义与经典三角CAP定理（Brewer'sTheorem）指出，在分布式系统中，一致性（Consistency）、可用性（Availability）、分区容错性（PartitionTolerance）三者不可兼得。（注：若需实际配图，可替换为Mermaid流程图或专业示意图）三大特性详解：一致性（C）：所有节点在同一时间看到的数据完全相同（强一致性）。
LintCode算法刷题记录（入门 + 简单部分）隔壁敲代码的小王算法刷题笔记算法 LintCode
由于是初学者，实现的方法都很简单，暂时不考虑效率，之后（可能）会更新1.A+B问题给出两个整数aa和bb,求他们的和。样例如果a=1并且b=2，返回3。挑战显然你可以直接returna+b，但是你是否可以挑战一下不这样做？（不使用++等算数运算符）说明a和b都是32位整数么？是的我可以使用位运算符么？当然可以注意事项你不需要从输入流读入数据，只需要根据aplusb的两个参数a和b，计算他们的和并返
【优秀文章】7月优秀文章推荐
优秀文章智能自主运动体与人工智能技术——环境感知、SLAM定位、路径规划、运动控制、多智能体协同作者：fpga和matlabC++之红黑树认识与实现作者：zzh_zao【手把手带你刷好题】–C语言基础编程题(十)作者：草莓熊Lotso飞算JavaAI：从“码农”到“代码指挥官”的终极进化论作者：可涵不会debug前端网页开发学习（HTML+CSS+JS）有这一篇就够！作者：一颗小谷粒
C++17 并行算法：std::execution::par
在多核处理器普及的今天，如何高效利用硬件资源成为提升软件性能的关键。C++17引入的并行算法库（ParallelAlgorithms）为开发者提供了一套标准化的并行编程接口，通过简单的策略切换即可将顺序算法转换为并行执行。本文将深入探讨C++17并行算法中最核心的执行策略std::execution::par，从基础概念到高级应用，全面解析其原理、用法及最佳实践。一、C++17并行算法概述1.1并
【心灵鸡汤】深度学习技能形成树：从零基础到AI专家的成长路径全解析智算菩萨人工智能深度学习
引言：技能树的生长哲学在这个人工智能浪潮汹涌的时代，深度学习犹如一棵参天大树，其根系深深扎入数学与计算科学的沃土，主干挺拔地承载着机器学习的核心理念，而枝叶则繁茂地延伸至计算机视觉、自然语言处理、强化学习等各个应用领域。对于初入此领域的新手而言，理解这棵技能树的生长规律，掌握其形成过程中的关键节点和发展阶段，将直接决定其在人工智能道路上能够走多远、攀多高。技能树的概念源于游戏设计，但在学习深度学习
求平方根：牛顿迭代法 mjfztms leetcode 算法
应用牛顿迭代法求解方程近似解，收敛速度很快牛顿迭代法求解平方根给你一个非负整数x，计算并返回x的算术平方根n，结果只保留整数部分。算法流程图由题意得，n2=xn^2=xn2=x，即为对f(n)=n2−xf(n)=n^2-xf(n)=n2−x求解。第一步：易得：x2−x1=0−f(x1)f′(x1)x_2-x_1=\frac{0-f(x_1)}{f'(x_1)}x2−x1=f′(x1)0−f(x1)
【秋招算法】2025 届搜广推方向求职历程（SSP、头部计划）秋冬无暖阳° 搜广推等—算法面经面试职场和发展算法
【秋招算法】2025届搜广推方向求职历程（SSP、头部计划）文章目录【秋招算法】2025届搜广推方向求职历程（SSP、头部计划）1.背景2.日常实习3.暑期实习3.1暑期BG3.2暑期记录4.秋招4.1秋招BG4.2转正4.3头部4.4提前批4.5正式批5.面试记录5.1Coding5.2其他高频编程题5.3常见八股、面经6.关于搜广推1.背景关于日常实习、暑期实习、提前批，秋招、春招、补招何为大
推荐算法（推广搜）——广告和推荐有什么不同？
导语近几年新兴起一个行业：推广搜。即推荐、广告、搜索算法的简称。各大厂都隐隐将其作为公司核心技术来发展。此文将带领大家探秘广告和推荐有什么区别以及其相似处。再此强调一下，广告算法里面的推荐广告和自然推荐结果里的推荐系统进行对比，但因为广告算法里面还有“搜索广告”，搜索广告和推荐系统差异性就太大了，这里不做讨论。一、不同点1.1本质不同推荐广告和自然推荐本质中要处理的群体和衡量的利益完全不一样。（图
算法分析与设计实验2：实现克鲁斯卡尔算法和prim算法表白墙上别挂我算法笔记经验分享
实验原理（一）克鲁斯卡尔算法：一种用于求解最小生成树问题的贪心算法，该算法的基本思想是按照边的权重从小到大排序，然后依次选择边，并加入生成树中，同时确保不会形成环路，直到生成树包含图中所有的顶点为止。具体步骤：边的排序：将所有边按照权重从小到大排序。初始化：创建一个空的生成树（可以是一个空的图结构），以及一个用于记录每个顶点所属集合（或称为连通分量）的数据结构（例如并查集）。边的选择：依次选择排序
（面经总结）一篇文章带你整理面试过程中常考的九大排序算法南淮北安冲刺大厂之面经总结面经排序算法二分插入冒泡快速
文章目录一、二分插入排序1.原理2.代码二、冒泡排序1.原理2.代码三、插入排序算法1.原理2.代码四、快速排序算法1.原理2.代码五、希尔排序1.原理2.代码六、归并排序1.原理2.代码七、桶排序八、基数排序九、堆排序1.原理2.代码十、总结1.算法分类2.性能分析一、二分插入排序首先必须是排好序的数组，然后通过二分查找，找到合适的位置，插入1.原理二分查找算法又叫作折半查找，要求待查找的序列有
Python常考面试题汇总（附答案） TT图图面试职场和发展
写在前面本文面向中高级Python开发，太基本的题目不收录。本文只涉及Python相关的面试题，关于网络、MySQL、算法等其他面试必考题会另外开专题整理。不是单纯的提供答案，抵制八股文！！更希望通过代码演示，原理探究等来深入讲解某一知识点，做到融会贯通。部分演示代码也放在了我的github的该目录下。语言基础篇Python的基本数据类型Python3中有六个标准的数据类型：Number（数字）(
opencv-python与opencv-contrib-python的区别联系剑心缘零碎小知识 python opencv
opencv-python包含基本的opencvopencv-contrib-python是高配版，带一些收费或者专利的算法，还有一些比较新的算法的高级版本,这些算法稳定之后会加入上面那个。官网对contrib模块的简介（点击链接跳转）参考链接
通信算法之278：数据链/自组网通信设备--MIMO(2T2R)-OFDM系统系列--实际工程应用算法代码--1.系统指标需求及帧结构设计秋风战士无线通信基带处理算法 MATLAB仿真软件无线电算法无人机经验分享
MIMO(2T2R)-OFDM系统系列–实际工程应用算法代码第一章：系统指标需求拆解分析第二章：通信系统帧结构设计和OFDM参数设计第三章：通信业务速率设计及理论解调门限第四章：同步序列设计及同步性能仿真验证第五章：数据业务设计及性能仿真验证第六章：信道模型设计第七章：接收关键算法设计及仿真验证第八章：其它待补充本文目录MIMO(2T2R)-OFDM系统系列--实际工程应用算法代码一、实际项目：系
通信算法之287：通信技术点咨询秋风战士 MATLAB仿真软件无线电无线通信基带处理算法网络算法无人机经验分享
专业技术咨询方向第一：SFBC编码与解码原理推导第二：SFBC系统中信道均衡推导第三：云哨物理层协议-速率匹配-解调门限-5dB第四：两天线SCFDE系统（SFBC码）帧结构设计第五：两天线OFDM系统（SFBC码）帧结构设计第一：SFBC编码与解码原理推导第二：SFBC系统中信道均衡推导第三：云哨物理层协议-速率匹配-解调门限-5dB第四：两天线SCFDE系统（SFBC码）帧结构设计第五：两天线
MongoDB + Voyage AI 详解：重塑数据库与AI的协同范式 csdn_tom_168 NoSQL 数据库 mongodb 人工智能 AI
MongoDB+VoyageAI详解：重塑数据库与AI的协同范式2025年2月，MongoDB官方宣布收购VoyageAI，这一举措标志着数据库与人工智能技术的深度融合迈入新阶段。通过整合VoyageAI的先进AI检索与嵌入模型能力，MongoDB旨在重新定义AI时代的数据库架构，为企业构建智能应用提供端到端的数据基础设施。一、收购背景与技术战略1.行业趋势驱动AI数据挑战：随着生成式AI与大语言
HarmonyOS5.0仓颉引擎与盘古大模型：个性化作业批改系统架构设计与实现 H老师带你学鸿蒙系统架构 HarmonyOS5.0 鸿蒙华为仓颉教育
人工智能与边缘计算的融合正在重塑教育评价体系。本文将展示如何基于HarmonyOS5.0仓颉并发引擎和盘古大模型，构建新一代智能作业批改系统。系统架构全景graphTDA[学生端设备]-->|提交作业|B[仓颉边缘处理]B-->C[盘古大模型分析]C-->D[个性化反馈生成]D-->E[学生终端]D-->F[教师仪表盘]subgraphHarmonyOS分布式系统B-->|设备协同|G[教室平板集
web前段跨域nginx代理配置刘正强 nginx cms Web
nginx代理配置可参考server部分 server { listen 80; server_name localhost;
spring学习笔记 caoyong spring
一、概述 a>、核心技术 : IOC与AOP b>、开发为什么需要面向接口而不是实现接口降低一个组件与整个系统的藕合程度，当该组件不满足系统需求时，可以很容易的将该组件从系统中替换掉，而不会对整个系统产生大的影响 c>、面向接口编口编程的难点在于如何对接口进行初始化,(使用工厂设计模式)
Eclipse打开workspace提示工作空间不可用 0624chenhong eclipse
做项目的时候，难免会用到整个团队的代码，或者上一任同事创建的workspace， 1.电脑切换账号后，Eclipse打开时，会提示Eclipse对应的目录锁定，无法访问，根据提示，找到对应目录，G:\eclipse\configuration\org.eclipse.osgi\.manager，其中文件.fileTableLock提示被锁定。解决办法，删掉.fileTableLock文件，重
Javascript 面向对面写法的必要性？一炮送你回车库 JavaScript
现在Javascript面向对象的方式来写页面很流行，什么纯javascript的mvc框架都出来了：ember 这是javascript层的mvc框架哦,不是j2ee的mvc框架我想说的是，javascript本来就不是一门面向对象的语言，用它写出来的面向对象的程序，本身就有些别扭，很多人提到js的面向对象首先提的是：复用性。那么我请问你写的js里有多少是可以复用的，用fu
js array对象的迭代方法换个号韩国红果果 array
1.forEach 该方法接受一个函数作为参数，对数组中的每个元素使用该函数 return 语句失效 function square(num) { print(num, num * num); } var nums = [1,2,3,4,5,6,7,8,9,10]; nums.forEach(square); 2.every 该方法接受一个返回值为布尔类型
对Hibernate缓存机制的理解归来朝歌 session 一级缓存对象持久化
在hibernate中session一级缓存机制中，有这么一种情况：问题描述：我需要new一个对象，对它的几个字段赋值，但是有一些属性并没有进行赋值，然后调用 session.save()方法，在提交事务后，会出现这样的情况： 1：在数据库中有默认属性的字段的值为空 2：既然是持久化对象，为什么在最后对象拿不到默认属性的值？通过调试后解决方案如下：对于问题一，如你在数据库里设置了
WebService调用错误合集 darkranger webservice
Java.Lang.NoClassDefFoundError: Org/Apache/Commons/Discovery/Tools/DiscoverSingleton 调用接口出错，一个简单的WebService import org.apache.axis.client.Call;import org.apache.axis.client.Service; 首先必不可
JSP和Servlet的中文乱码处理 aijuans Java Web
JSP和Servlet的中文乱码处理前几天学习了JSP和Servlet中有关中文乱码的一些问题，写成了博客，今天进行更新一下。应该是可以解决日常的乱码问题了。现在作以下总结希望对需要的人有所帮助。我也是刚学，所以有不足之处希望谅解。一、表单提交时出现乱码：在进行表单提交的时候，经常提交一些中文，自然就避免不了出现中文乱码的情况，对于表单来说有两种提交方式：get和post提交方式。所以
面试经典六问 atongyeye 工作面试
题记：因为我不善沟通，所以在面试中经常碰壁，看了网上太多面试宝典，基本上不太靠谱。只好自己总结，并试着根据最近工作情况完成个人答案。以备不时之需。以下是人事了解应聘者情况的最典型的六个问题： 1 简单自我介绍关于这个问题，主要为了弄清两件事，一是了解应聘者的背景，二是应聘者将这些背景信息组织成合适语言的能力。我的回答：(针对技术面试回答，如果是人事面试，可以就掌
contentResolver.query()参数详解百合不是茶 android query()详解
收藏csdn的博客,介绍的比较详细,新手值得一看 1.获取联系人姓名一个简单的例子，这个函数获取设备上所有的联系人ID和联系人NAME。 [java] view plain copy public void fetchAllContacts() {
ora-00054:resource busy and acquire with nowait specified解决方法 bijian1013 oracle 数据库 kill nowait
当某个数据库用户在数据库中插入、更新、删除一个表的数据，或者增加一个表的主键时或者表的索引时，常常会出现ora-00054:resource busy and acquire with nowait specified这样的错误。主要是因为有事务正在执行（或者事务已经被锁），所有导致执行不成功。 1.下面的语句
web 开发乱码征客丶 spring Web
以下前端都是 utf-8 字符集编码一、后台接收 1.1、 get 请求乱码 get 请求中，请求参数在请求头中；乱码解决方法： a、通过在web 服务器中配置编码格式：tomcat 中，在 Connector 中添加URIEncoding="UTF-8"； 1.2、post 请求乱码 post 请求中，请求参数分两部份， 1.2.1、url？参数，
【Spark十六】： Spark SQL第二部分数据源和注册表的几种方式 bit1129 spark
Spark SQL数据源和表的Schema case class apply schema parquet json JSON数据源准备源数据 {"name":"Jack", "age": 12, "addr":{"city":"beijing&
JVM学习之:调优总结 -Xms -Xmx -Xmn -Xss BlueSkator -Xss -Xmn -Xms -Xmx
堆大小设置JVM 中最大堆大小有三方面限制：相关操作系统的数据模型（32-bt还是64-bit）限制；系统的可用虚拟内存限制；系统的可用物理内存限制。32位系统下，一般限制在1.5G~2G；64为操作系统对内存无限制。我在Windows Server 2003 系统，3.5G物理内存，JDK5.0下测试，最大可设置为1478m。典型设置： java -Xmx355
jqGrid 各种参数详解(转帖) BreakingBad jqGrid
jqGrid 各种参数详解分类：源代码分享个人随笔请勿参考解决开发问题 2012-05-09 20:29 84282人阅读评论(22) 收藏举报 jquery 服务器 parameters function ajax string
读《研磨设计模式》-代码笔记-代理模式-Proxy bylijinnan java 设计模式
声明：本文只为方便我个人查阅和理解，详细的分析以及源代码请移步原作者的博客http://chjavach.iteye.com/ import java.lang.reflect.InvocationHandler; import java.lang.reflect.Method; import java.lang.reflect.Proxy; /* * 下面
应用升级iOS8中遇到的一些问题 chenhbc ios8 升级iOS8
1、很奇怪的问题，登录界面，有一个判断，如果不存在某个值，则跳转到设置界面，ios8之前的系统都可以正常跳转，iOS8中代码已经执行到下一个界面了，但界面并没有跳转过去，而且这个值如果设置过的话，也是可以正常跳转过去的，这个问题纠结了两天多，之前的判断我是在 -(void)viewWillAppear:(BOOL)animated 中写的，最终的解决办法是把判断写在 -(void
工作流与自组织的关系？ comsci 设计模式工作
目前的工作流系统中的节点及其相互之间的连接是事先根据管理的实际需要而绘制好的，这种固定的模式在实际的运用中会受到很多限制，特别是节点之间的依存关系是固定的，节点的处理不考虑到流程整体的运行情况，细节和整体间的关系是脱节的，那么我们提出一个新的观点，一个流程是否可以通过节点的自组织运动来自动生成呢？这种流程有什么实际意义呢？这里有篇论文，摘要是：“针对网格中的服务
Oracle11.2新特性之INSERT提示IGNORE_ROW_ON_DUPKEY_INDEX daizj oracle
insert提示IGNORE_ROW_ON_DUPKEY_INDEX 转自：http://space.itpub.net/18922393/viewspace-752123 在 insert into tablea ...select * from tableb中，如果存在唯一约束，会导致整个insert操作失败。使用IGNORE_ROW_ON_DUPKEY_INDEX提示，会忽略唯一
二叉树:堆 dieslrae 二叉树
这里说的堆其实是一个完全二叉树,每个节点都不小于自己的子节点,不要跟jvm的堆搞混了.由于是完全二叉树,可以用数组来构建.用数组构建树的规则很简单: 一个节点的父节点下标为: (当前下标 - 1)/2 一个节点的左节点下标为: 当前下标 * 2 + 1 &
C语言学习八结构体 dcj3sjt126com c
为什么需要结构体，看代码 # include <stdio.h> struct Student //定义一个学生类型，里面有age, score, sex, 然后可以定义这个类型的变量 { int age; float score; char sex; } int main(void) { struct Student st = {80, 66.6,
centos安装golang dcj3sjt126com centos
#在国内镜像下载二进制包 wget -c http://www.golangtc.com/static/go/go1.4.1.linux-amd64.tar.gz tar -C /usr/local -xzf go1.4.1.linux-amd64.tar.gz #把golang的bin目录加入全局环境变量 cat >>/etc/profile<
10.性能优化-监控-MySQL慢查询 frank1234 性能优化 MySQL慢查询
1.记录慢查询配置 show variables where variable_name like 'slow%' ; --查看默认日志路径查询结果：--不用的机器可能不同 slow_query_log_file=/var/lib/mysql/centos-slow.log 修改mysqld配置文件：/usr /my.cnf[一般在/etc/my.cnf，本机在/user/my.cn
Java父类取得子类类名 happyqing java this 父类子类类名
在继承关系中，不管父类还是子类，这些类里面的this都代表了最终new出来的那个类的实例对象，所以在父类中你可以用this获取到子类的信息！ package com.urthinker.module.test; import org.junit.Test; abstract class BaseDao<T> { public void
Spring3.2新注解@ControllerAdvice jinnianshilongnian @Controller
@ControllerAdvice，是spring3.2提供的新注解，从名字上可以看出大体意思是控制器增强。让我们先看看@ControllerAdvice的实现： @Target(ElementType.TYPE) @Retention(RetentionPolicy.RUNTIME) @Documented @Component public @interface Co
Java spring mvc多数据源配置 liuxihope spring
转自：http://www.itpub.net/thread-1906608-1-1.html 1、首先配置两个数据库 <bean id="dataSourceA" class="org.apache.commons.dbcp.BasicDataSource" destroy-method="close&quo
第12章 Ajax（下） onestopweb Ajax
index.html <!DOCTYPE html PUBLIC "-//W3C//DTD XHTML 1.0 Transitional//EN" "http://www.w3.org/TR/xhtml1/DTD/xhtml1-transitional.dtd"> <html xmlns="http://www.w3.org/
BW / Universe Mappings blueoxygen BO
BW Element OLAP Universe Element Cube Dimension Class Charateristic A class with dimension and detail objects (Detail objects for key and desription) Hi
Java开发熟手该当心的11个错误 tomcat_oracle java 多线程工作单元测试
#1、不在属性文件或XML文件中外化配置属性。比如，没有把批处理使用的线程数设置成可在属性文件中配置。你的批处理程序无论在DEV环境中，还是UAT（用户验收测试）环境中，都可以顺畅无阻地运行，但是一旦部署在PROD 上，把它作为多线程程序处理更大的数据集时，就会抛出IOException，原因可能是JDBC驱动版本不同，也可能是#2中讨论的问题。如果线程数目可以在属性文件中配置，那么使它成为
推行国产操作系统的优劣 yananay windows linux 国产操作系统
最近刮起了一股风，就是去“国外货”。从应用程序开始，到基础的系统，数据库，现在已经刮到操作系统了。原因就是“棱镜计划”，使我们终于认识到了国外货的危害，开始重视起了信息安全。操作系统是计算机的灵魂。既然是灵魂，为了信息安全，那我们就自然要使用和推行国货。可是，一味地推行，是否就一定正确呢？先说说信息安全。其实从很早以来大家就在讨论信息安全。很多年以前，就据传某世界级的网络设备制造商生产的交