小蜗子

时域卷积网络与蒙特卡洛树搜索相结合的知识图补全模型研究

这个适合第三个方向。。。

摘要

在知识图谱补全 (KGC) 和其他应用程序中，学习如何使用给定查询从源节点移动到目标节点是一个重要问题。它可以表述为给定状态下的强化学习 (RL) 问题转换模型。为了克服稀疏奖励和历史状态编码的挑战，我们开发了一个深度代理网络（graph-agent，GA），它结合了时间卷积网络（TCN）和蒙特卡洛树搜索（MCTS）。将 MCTS 与神经网络相结合，生成更多的正奖励轨迹，从而有效解决稀疏奖励的问题。TCN 用于对历史状态进行编码，分别用于策略和 Q 值。根据这些轨迹，我们使用 Q-Learning 来改进网络和参数共享以增强 TCN 策略。我们反复应用这些步骤来学习模型。在模型的预测阶段，蒙特卡洛树搜索结合Q值方法对目标节点进行预测。在几个图行走基准上的实验结果表明，GA 优于其他基于策略梯度的 RL 方法。 GA 的性能也优于传统的 KGC 基线。

1.介绍

知识图谱的初衷是描述和存储现实世界中的各种实体及其关系。虽然一个典型的知识图谱可能包含数百万个实体和数十亿个关系，但它通常远非完整。知识图谱补全（KGC）的目的是利用现有知识图谱中的关联信息来预测实体之间的缺失关系，以补全知识图谱。基于嵌入的排序方法，首先基于现有的三元组学习嵌入向量。通过用每个实体替换尾部实体或头部实体，这些方法计算所有候选实体的分数并对前 k 个实体进行排名。实体和关系的嵌入式学习在一些基准测试中取得了显着的性能提升，但它不能对复杂的关系路径进行建模。在图结构中关系路径推理转向使用路径的信息。随机游走推理已被广泛研究。此外，通过将实体对之间的路径查找制定为顺序决策，特别是马尔可夫决策过程 (MDP)，为多跳推理引入了深度强化学习 (RL)。基于策略的 RL 代理通过知识图环境之间的交互来学习找到与扩展推理路径相关的步骤，其中策略梯度用于训练 RL 代理。与随机游走推理相比，深度强化学习可以获得更好的路径。

基于RL的KGC也可以理解为构造函数f(G, nS, q)来预测目标节点nT，其中f(·)可以从由(nS, q, nT)等样本组成的训练数据集中学习。在这项工作中，我们使用图游走代理来构建 f(G, nS , q) 模型，该模型可以通过智能决策从 nS 游到 nT。由于 nT 未知，因此无法通过常规搜索算法解决该问题。例如 A * -search，它试图在给定的源节点和目标节点之间寻找路径。相反，代理需要从训练数据集中学习其搜索策略，以便在训练之后，代理知道如何遍历图以针对给定的一对 (nS , q) 到达正确的目标节点 nT。而且，每个训练样本都以“（源节点，查询，目标节点）的形式存在。” 但是，代理只收到延迟奖励：当代理正确（或错误）预测训练集中的目标节点时，代理将获得正（或零）奖励。因此，我们将问题描述为马尔可夫决策过程（MDP）并通过强化学习（RL）训练代理。

基于 RL 的 KGC 提出了两个主要挑战。首先，由于MDP的状态是整条行走路径，为了得到正确的决策，通常不仅需要查询，还需要整条行走路径上所有节点的信息。我的代理必须利用完整的历史信息和输入查询 Q 来做出这个决定。其次，reward是稀疏的，只有在路径的尽头才能得到路径的reward。

在本文中，我们构建了一个结合 MCTS 和强化学习的图代理网络（GA），可以有效地解决这两个挑战。首先，我们将蒙特卡洛树搜索（MCTS）与 MDP 转换模型相结合，以获得更多具有正奖励的轨迹。其次，GA 引入了一种新的时间卷积网络 (TCN) 结构，它将轨迹的整个历史编码为向量表示，并进一步用于对策略和 Q 函数进行建模。但是，它们的离线策略性质使它们无法被 RL 方法使用。为了解决这个问题，我们设计了一个Q值网络和决策网络之间的参数共享结构，使得离线策略可以通过Q-Learning对离线策略的轨迹进行间接改进。巧妙的是，我们利用获得的轨迹来训练模型并更新参数。我们的方法与现有的基于 RL 的 KGC 方法形成鲜明对比。后者使用policy gradient（强化）方法，通常需要大量提升才能获得正奖励轨迹，尤其是在学习的早期阶段。我在几个基准测试（几个实际的 KBC 任务）上的实验结果表明，我们的方法优于之前基于 RL 的方法和传统的 KGC 方法。该模型在某些任务上的评估结果与其他强化学习方法的评估结果接近，并且在多个完成任务上获得了最好的结果。本文的主要贡献总结如下：

(1) 我们引入时间卷积网络结构，将轨迹的整个历史编码为向量表示，具有时间序列的特点，可以更好地表示历史信息。

(2) 为了解决稀疏奖励的挑战，GA利用了 MDP 转换模型是已知的和确定性的这一事实。因为每当代理采取行动时，通过选择连接到下一个节点的边，下一个节点（环境将转换到的）的身份是已知的。

(3) 我们引入蒙特卡洛树搜索来获得更多具有正奖励的轨迹。

(4) 我们设计了一个Q值网络和决策网络之间的参数共享结构，使得策略网络可以通过Q-Learning对离线策略的轨迹进行间接改进。

第 2 节讨论相关工作。

第 3 节是关于问题陈述。

第 4 节开发深度代理网络 GA，包括模型结构、训练算法和测试算法。

第 5 节给出了实验结果。

最后，我们在第 6 节总结了这篇论文。

离线策略

强化学习中 on-policy与off-policy 的理解；如何区分on-policy 与 off-policy；RL更新策略、policy结构总结_strawberry47的博客-CSDN博客_onpolicy和offpolicy有趣的解释：古时候，优秀的皇帝都秉持着“水能载舟亦能覆舟”的思想，希望能多了解民间百姓的生活。皇帝可以选择通过微服出巡，亲自下凡了解百姓生活（On-policy），虽然眼见为实，但毕竟皇帝本人分身乏术，掌握情况不全；因此也可以派多个官员去了解情况，而皇帝本人则躺在酒池肉林里收听百官情报即可（Off-policy）。Q-learning vs. Sarsa二者都是基于TD的强化学习策略，但是前者是off-policy（有目标网络和行为网络），后者是on-policy。on-policy与off-polichttps://blog.csdn.net/strawberry47/article/details/125652605

2.相关工作

早期，经典的关系抽取方法，如路径排序算法[2]，是利用推理规则和统计方法来实现的。这个方法将每条不同的关系路径作为一维特征，在知识图谱中对不同的关系路径进行大量统计，构造关系分类的特征向量。最后，利用特征分析模型对关系特征进行分类，取得了良好的关系抽取效果，成为关系补全的表示方法之一。然而，这种基于关系的共现统计方法面临着严重的数据稀疏问题。

以反序列方法为代表的知识图谱推理与补全模型取得了较好的效果，并产生了多种变体算法。该模型的主要思想是利用知识图谱的语义和结构关系来学习低维密集空间中实体和关系的表示，并利用嵌入中包含的相关性完成后续的推理和完成任务。然而，Trans 模型对超参数敏感且缺乏可扩展性。同时，动态知识图谱和冷启动实体的处理能力不足。近年来，随着深度学习的发展，一些深度神经网络被应用于知识图谱的特征挖掘，如graph-NNs[3]、GCN[4]、GAT[5]等。随着近年来强化学习的普及，强化学习算法被广泛应用于各个领域，如 DeepPath [6]、MINERVA [7] 和 M-walk [8]。DeepPath 要求目标实体信息处于 RL 代理的状态，不能应用于目标实体未知的任务。MINERVA 使用策略梯度方法在训练和测试期间探索路径。M-walk 通过集成 MCTS 算法进一步利用状态转换信息。2021 年，Huang [9] 提出了一种新的知识图完成模型，称为定向多维注意力卷积模型，该模型探索了方向信息和三元组固有的深度表达特征。Jagvaral [10] 提出了一种新的知识图补全方法，它将双向长短期记忆 (BiLSTM) 和卷积神经网络模块与注意力机制相结合。我们提出的方法使用 TCN 来编码历史信息。我们的模型在某些任务上的评估结果与其他强化学习方法的评估结果接近，并且在多个完成任务上获得了最好的结果。

3.问题陈述

在本节中，我们将介绍和解释一些相关概念，并将知识图谱补全问题形式化。

3.1强化学习

强化学习（RL）是指代理在与环境交互的过程中试图从错误的经验中采取行动并学习最优决策策略以解决自然科学中的顺序决策问题的方法，社会科学、工程等领域[11-14]。

强化学习中的两个关键问题：环境设计和代理设计。早期的任务依赖于简单的环境，状态数量有限，动作基本固定，因此可以确定状态到动作的映射空间。因此，agent可以保存每个状态的每个动作的值估计，并以表格的形式记录，即Q值表，指导agent进行选择。鉴于环境复杂，强化学习技术在过去几年取得了长足的进步，其中最重要的是强化学习与深度学习的融合，称为深度强化学习[15]。不再依赖于获取状态空间中的所有状态，而是利用从状态中提取的特征来学习决策策略，并利用深度神经网络拟合更复杂的函数映射，解决了复杂环境设计的问题和复杂的代理设计在一定程度上。

深度强化学习广泛应用于自然语言处理、游戏对抗和机器人控制，如 DeepStack [16]、AlphaGo [17] 和 Deep Q-network (DQN) [18]。 DQN算法是Q-network类型算法中的代表算法之一。它在各个研究领域的出色表现引起了研究人员的关注。衍生了各种类型的改进算法，如Double-DQN [19]和Duel DQN [20]，它们对DQN的过度估计进行了有效的改进，并在性能上进行了优化和提升。强化学习可以分为两类：价值方法和策略梯度方法。Q-Learning是学习各种状态动作的估计值。 此外，还有其他类型的以策略梯度法为主的方法，例如信任区域法[21, 22]，确定性策略梯度法[23, 24]，离开策略和策略梯度相结合的方法[25, 26]，无监督强化和辅助学习[27, 28]等。如今，深度强化学习已经在不同领域或与不同模型相结合的许多问题上进行了探索和实践[29-33]。

3.2蒙特卡洛树搜索

蒙特卡洛树搜索(MCTS)[34]是一类树搜索算法的总称，用作频率概率的估计，可以有效解决一些探索空间巨大的问题。在强化学习的研究中，Deepmind 公司充分发挥了蒙特卡洛树搜索在围棋领域的作用[15, 35]。在使用围棋的状态空间构造搜索树的过程中，叶子节点的数量不能穷尽，即使是以前的剪枝技术也很难在大规模状态树中发挥作用。 MCTS在巨大的搜索空间中采用模拟树节点和扩展的方法进行探索，其中典型的算法UCB（Upper Confidence Bounds[36]是在选择子节点时优先考虑尚未探索的子节点。如果所有子节点都已探索，则选择基于节点的分数。score 不仅与子节点最终获得正奖励的概率呈正相关，而且与子节点被探索的次数呈负相关。因此MCTS 可以根据配置进行探索，利用不同的权重，可以实现比随机或其他策略更多的启发式方法。

3.3序列建模

序列建模是一个很常见的问题，它涉及到语音处理、语言建模和时间序列预测等应用。近年来，由于数据量巨大计算能力大，RNN模型[37, 38]如雨后春笋般涌现，序列建模的任务转向使用 RNN 模型。RNN 模型可以记忆历史信息在序列中通过隐藏状态。但是，循环的梯度累积很容易导致梯度消失的问题。Long Short Term Memory (LSTM) [39] 模型在一定程度上解决了梯度消失的问题，可以更好地实现长时记忆。 GRU [40] 提出简化 LSTM 模型并提高训练速度，使循环模型在序列问题的处理中绝对占主导地位。此外，还出现了使用卷积网络进行序列相关工作的方法。例如，Wavenet [41] 模型使用空洞因果卷积来处理序列化的音频数据，Gated CNN [42] 模型提出了一种新的门控机制，并将 CNN 与自然语言处理相结合。

2017 年，白等人[43]发表了一篇关于时序卷积网络（TCN）在序列建模中的应用的论文，使得传统的序列建模任务不再仅仅依赖于LSTM和GRU等循环网络结构，结果在多个任务超过了循环神经网络的任务。在 TCN [44] 中，空洞卷积、因果卷积 [45、46] 和残差结构 [47] 用于处理序列建模。TCN 模型在多个序列建模任务中成功超越了传统的递归神经网络。

问题

对于我们框架的输入，我们有给定图的节点嵌入 N ∈ Rn×f 和边嵌入 E ∈ Re×d，我们有源节点 nS 和查询向量 q。我们使用蒙特卡洛树搜索和马尔可夫决策获得更多正路径的过程 P = {n1 , n2 , ..., nt }。我们利用这些轨迹来训练我们的代理网络。

对于我们框架的输出，我们可以通过训练好的代理网络获得的从源节点到目标节点的路径得到目标节点。

我们框架的任务是补全知识图谱。我们使用 TCN 融合历史状态信息和神经网络对动作和状态进行编码。我们可以通过这些轨迹训练的代理得到目标节点。

4.图形代理GA

4.1知识图谱补全的马尔可夫

知识图谱补全的任务是根据环境中给定的实体nS和关系q，准确地找到环境中对应的目标实体，形成一个完整的三元组。过程表示为 (nS , q, ?)一 (nS , q, nT )。强化学习任务通常由马尔可夫决策过程（MDP）来描述。马尔可夫决策过程描述了空间状态从一种状态转移到另一种状态的过程。我在知识图谱上构建MDP如下。

状态空间

MDP 中任何时候的状态都需要包含所有的历史信息。在知识图谱中，如果一个实体的信息被视为当前状态，它就不能满足马尔可夫性质。我们可以保留节点的转换历史，以确保状态的构造满足马尔可夫性质，这导致每一步转换后的新状态包含比以前更多的节点和边信息，而状态的编码成为一个难以解决的问题。知识图谱上的状态表示如下：

其中 st 和 nt 是时间 t 的状态和节点，at-1 是时间 t-1 的选定动作，Nt 和 Et 是 nt 的邻居和关系集。

动作空间

在图上行走导致状态转换，候选动作的数量取决于当前实体的相邻实体的数量。在本文中，我们考虑每对实体之间的关系，并将实体及其关系编码在一起以形成候选动作。我们将前一个状态的实体和关系排除在每个状态的动作空间之外，因为在路径中的两个节点之间来回游动是没有意义的。因此，相邻的实体和关系构成了动作空间 An = {a1 , a2 , . .., ak-1, astop }，其中 astop 表示当前状态下的终止动作，表示 MDP 的过程结束，k 表示候选动作的数量。为了保证训练好的agent可以有相同的动作空间，我们使用共享参数编码网络，可以将每个实体的动作空间统一成一个完整的动作空间A = {A1 , A2 , . ..， An }。

转移函数

网络结构数据的优点是它的环境是已知的。状态转移函数 P 的描述和定义如下：(1) 当状态 st 中发生动作 a 时，状态会转移到该动作对应的实体，我们的环境状态变为下一个实体支配的新状态 st+1。 (2) agent 选择终端动作 astop ，这意味着它不会选择任何新实体及其关系。

奖励功能

奖励作为给智能体的唯一反馈信号，在智能体训练的过程中起着主导作用。在本文中，我们利用轨迹记忆以off-policy的方式训练agent。对于任何轨迹，奖励由终端节点 T 确定，如下所示：

(s, a, st+1) 得回报是一个非终止状态转移过程。模型的 Q 值是通过使用终止状态的奖励和时差 (TD) 方法来更新的。此外，这个奖励函数的基本假设是，一个关系连接的两个实体也可以通过更多的跳数被其他关系连接，从而在一定程度上可以用其他关系表示或推断该关系。但是，它们并不完全等价。与查询的关系与路径中的其他关系正相关是一个合理的假设。

4.2图代理

图（例如知识图）中的两个主要问题。

一是状态是连续的实体和关系序列，这些序列的长度不同，很难作为输入。

解决:使用时间卷积网络对状态进行编码，并将序列状态的维度转换为相同的维度。同时，causal(因果)卷积保留了状态的马尔可夫性质。

二是每个状态的可选动作取决于当前状态下实体的相邻关系和实体，它们的数量也是不确定的。

解决:所有动作都由同一个网络编码并转换为相同的隐式完整动作空间。在选择输出动作时，我们只需要考虑候选动作。

本节将详细介绍深度代理（graph-agent）的网络结构，包括动作编码层A-ENC(θ)、状态编码层S-ENC(θ)和决策层πθ。

4.2.1实体和完整动作空间的邻居信息编码

Nt 和 Et 是 nt 的邻居和关系集。

知识图中的一个状态由一个实体 nt 支配，该状态的动作空间随其相邻实体而变化。空间大小是不确定的。它的动作空间包含实体和实体之间的关系。在不同状态下的不同动作空间中，相同的动作应该具有相同的表示。此外，相邻信息 Nt 和 Et 处于状态st = st−1 U {at−1, nt , Nt , Et } 与状态 st 中的动作空间具有相同的含义和表示。因此，具有共享参数的全连接网络用于对实体和关系进行编码。我们通过所有实体和关系的一维最大池化来提取邻居信息 Nt 和 Et 的表示。

在图 1 中，在时间 t 占主导地位的实体是 nt，其相邻实体是 n1t，n2t，...。.., nkt , 对应关系为 e1t, e2t , ..., 等。参数共享网络fθa是一个双层全连接网络，输出是每个节点信息的编码hnkt。为了解决不同实体具有不同数量的相邻实体和关系的问题，采用一维最大池化方法生成相邻信息的表示hAt。 hAt 的每一位的值是每个动作向量中所有对应位的最大值。

作为深度代理网络的第一部分，完整的动作空间编码层将用于处理动作空间和状态编码中的相邻信息。

相邻信息编码（hAt图一得出的）将是状态编码层 S-ENC(θ) 的输入的一部分，而动作编码将是策略决策层 πθ 的输入的一部分。

4.2.2具有时间卷积网络的状态编码层

在深度代理网络中，状态的输入非常重要。时间卷积网络更擅长捕捉时间依赖性。卷积更容易捕捉到局部信息，空洞卷积还可以扩大感知范围，让输出在任何时候都能感知到前一次的所有输入。此外，在对完整的动作空间和相邻信息进行编码后，状态 st 可以表示为 st = st−1 U {at−1, nt , hAt }。时间卷积网络用于获取历史状态信息，其结构如图2所示。

在图2中，nS=n0是状态的初始节点，nt是当前节点，hAt-1是t-1时刻的邻接信息码，hat-1是t-1时刻选择的动作码。将序列化状态编码为序列信息，利用因果卷积来限制时间性，使得后一层任何位置的结果只与前一层该位置之前的数据相关。同时，通过使用扩张卷积来扩展感受野。状态表示的递归结构使终止状态包含了转换的所有先前状态。最后输出完整的历史信息hs0、hs1、hst。为了增强对代理策略网络当前状态的识别，最终状态的编码结合相邻节点编码的hAt和t时刻的历史信息hst，得到t时刻的状态：

4.2.3政策决策层网络

深度代理网络主要集中在决策层，它接收从环境特征中提取的数据，判断每个动作在当前动作空间中的概率。在本文中，使用全连接网络将环境状态特征映射到输出动作。其结构如图3所示。

在图 3 中，agent 的决策层网络接收 S − ENC(θ) 层给出的状态特征向量 Hst 和查询关系向量 query 作为决策层 πθ 的输入。压缩后的特征数据应用于两部分，一是生成终端动作astop的选择概率，另一部分是通过结合动作编码层生成的动作编码生成其他动作的选择概率。其结构如下：

其中fθ1、fθ2和fθ3是全连接网络，cat是张量拼接操作，拼接状态特征向量 Hst 和查询关系向量 query ，特征向量 (query, Hst) 由网络 fθ 1 压缩。然后作为环境特征，一方面直接使用特征向量生成ustop。另一方面，结合候选动作由动作编码层生成的向量，每个动作的值通过网络 fθ3 拟合。 δ 代表 sigmoid 函数，用于转换 (ustop , u1 , ..., un ) 到 0 到 1 范围内的 Q 值。 φ 表示 softmax 函数并转换 (ustop , u1 , ..., un ) 转化为候选动作概率。决策网络选择概率最大的动作作为当前代理网络的最终输出动作。

图 4 显示了完整的深度代理网络结构。将原始知识图表示的数据输入最底层的动作编码层，同时输出 hA0 , hA1 ,..., hAt 和每个候选动作 hat。生成的向量用于构建时间历史信息和策略编码层网络以从候选动作中进行选择。

4.3环境探索和智能体训练预测

4.3.1结合策略探索的树上置信界算法

在大规模的网络结构中，节点关系复杂，源节点到目标节点的路径数量巨大，这也导致了一个重要问题：策略网络训练过程中的采样效率低。如果采用on-policy方式，模型的训练会变得很慢，因为模型在很长一段时间内都找不到正奖励。因此，我们使用蒙特卡洛树搜索方法构建状态搜索树来保存每个状态的值和访问次数，从而解决稀疏奖励问题。其核心算法UCT（Upper Confidence Bound Applied to Trees）在知识图中表示如下：

其中 W(st , a)、N(st , a) 和 W(st , a)/N(st , a) 是状态 st 下所选动作 a 的值、频率和估计值。c × ln(a′N(st , a′ ))/N(st , a) 称为探索组件，可以避免仅应用价值估计造成的探索不充分，可以充分挖掘探索较少的动作。

当UCT选择终止动作astop或达到最大搜索深度时，MCTS完成一次模拟,并使用

更新W(st, a) 和 N(st, a)。

本文中的采样策略是结合策略决策网络对UCT算法进行改进，增强采样的探索性能，从而降低陷入局部最优的可能性。应用于树结合策略探索（Policy-UCT）的置信上限算法如下

我的核心思想是在 MCTS 的探索过程中，利用策略网络给出的 Q 值来动态调整每个状态下每个动作的探索率。在具有相同探索项值的候选动作中，策略网络给出的更有价值的动作更容易被算法探索。在同一个源节点的情况下，可能有多个路径到目标节点。Q 值随着训练过程的变化而变化，agent 认为值高的动作更可能导致目标节点。因此，policy-UCT倾向于选择具有高值W(st,a)/N(st,a)的动作进行节点探索，而节点探索倾向于选择具有更高Qq值和更低访问时间N(s,a)的动作。

4.3.2模型训练

本文的关键思想是使用策略增强的蒙特卡罗树搜索来模拟一系列具有正奖励的轨迹的产生。从这些轨迹中学习可以显着改善 πθ。在本文中，我们加强了深度代理网络并反复应用这些步骤来改进探索策略以获得更多的采样轨迹。但是，数据是由不同的深度代理生成的网络参数，即off-policy数据，打破了策略梯度法的固有假设。所以我们使用这个数据用 Q-Learning 方法进行更新。

步骤1：知识图谱数据集、动作决策网络和状态编码网络的初始化。初始化具有相同参数的深度代理的动作网络和评估网络。

步骤2：Monte Carlo Tree Search of Policy-UCT算法用于从知识图中收集样本，并将样本以轨迹的形式存储在轨迹存储池中，直到存储池达到最大容量。如果存储池在采样开始前达到最大容量，则新添加的轨迹将替换最早的轨迹。替换达到一定数量后，开始下一步。

步骤3：从存储池中提取轨迹用于网络训练，小批量更新深度代理动作网络参数。

步骤4：新的策略网络 πθ 将继续通过 Policy-UCT 的方式从知识图谱中采样，结合 Monte Carlo Tree Search。重复步骤 2 和步骤 3 更新深度代理网络参数，直到更新 Q-net 评估网络的条件。深度代理的当前网络参数用于覆盖评估网络的参数。

步骤 5：重复步骤 1-4，直到损失误差达到要求或预设的训练次数。输出最终的深度代理网络

简单DQN的更新公式如下：

为了避免高估状态值，Double-DQN 用于更新深度代理网络的参数。将动作网络在评价网络中选择的动作a′得Qθ (st+1, a′ ) 的值更改为：

在目标网络的更新中，动作网络和评估网络具有相同的初始化条件。为了减少动作网络和评价网络同步更新引起的训练波动的收敛困难，我们使用了Q-Learning中常用的延迟更新，即评价网络在动作网络被同步更新后同步更新。最后，新的行动网络将继续在下一次MCTS中使用，新的评估网络将用于评估行动网络的选定行动。

4.3.3模型预测

为了充分利用网络结构的优点，MCTS和Q值相结合，在预测过程中生成蒙特卡洛树搜索，就像训练过程一样。在搜索的过程中，路径不断产生。搜索结束，反馈传播的值将不再使用0和1的标签值，而是使用Vθ(sT)=Q(sT,astop)。最后对生成的多条路径进行加权，得到路径分数Score(path) = Npath /N，其中所有生成路径的个数为N，路径个数为Npath，Scose(path)表示比例当前路径分数。因此，目标实体的最终预测分数如下：

其中 pathnT 表示具有终止节点 nT 的路径，sT path 表示路径的终止状态 sT。可以想象，具有终止节点 nT 的路径可能具有不同的终止状态。因此，当我们考虑通过不同路径游到同一个终止节点nT的情况时，根据agent给出的终止动作值Q(sT path , astop )计算当前状态下的网络得分。根据搜索过程中目标节点的频率和终止状态，Scose(nT) 充分整合了代理网络决策和网络结构数据。然后补全节点根据分数进行排序。最后，许多信息检索评估算法，如MRR和MAP，将用于评估完成结果的排序顺序。

5.实验

5.1数据集和评估指标

我们使用 WN18RR [48] 和 NELL995 来验证我们的模型 GA 的实际效果。知识图谱补全数据集的统计量如表 1 所示。我的 WN18RR 数据集是从 Dettmers.T 处理的原始 WN18 数据 [49] 中获得的。NELL995 数据集由熊 [19] 处理和发布，并被处理成多个关系的单独数据部分。我们使用与 [19-21] 中相同的数据分割和预处理方法。实验和在 NELL995 中对 10 个关系任务进行了评估。

我们使用 HITS@K 和平均循环秩 (MRR) 作为 WN18RR 的评估指标。

HITS@K计算目标实体在top K中的百分比。MRR计算目标实体排名倒数的平均值，表示目标实体排名越高，MRR得分越高。

使用平均准确度均值（MAP）作为 NELL995 数据集的评估指标。

GA模型与DeepPath比较和基于强化的 MINERVA在知识图谱的补全任务中学习，基于嵌入的方法 DistMult [50]、ComplEx [51] 和 TransE，以及学习逻辑规则的方法 NeuralLP [52]。对于所有基线方法，我们将采用相应作者发表的实验设置和他们论文中的最佳实验结果。

5.2实验结果

数据集 NELL995 和 WN18RR 的整体性能分别如表 2 和表 3 所示。很明显，与 MINERVA、DeepPath、PRA、TransE 和 TransR 相比，GA 通常在 NELL995 中取得了最好的结果。GA 仍然表现良好，WN18RR 优于 MINERVA、ComplEx、ConvE、DistMult 和 NeuralLP。

从表 2 和表 3 的实验结果可以看出，时间卷积网络可以用于对知识图谱上的历史状态进行编码，类似于递归神经网络编码。并且在一些相对较长的关系路径中可以获得更好的结果。

在 NELL995 的十个关系中，GA 几乎是最好的结果。在 WN18RR 的训练过程中，可以清楚地发现大多数目标实体和源实体仅通过一跳关系连接。因此，使用 HITS 作为评估指标，GA的效果往往是对比中最好的。

5.3Policy-UCT 算法的影响

蒙特卡洛树搜索可以根据奖励函数完全返回正奖励，如图 6-8 所示是图 6 和图 7 数据集的预测生成路径的过程。显然，MCTS充分利用了类似于树形结构的图结构，大大提高了MCTS探索的效率。在探索的早期，我们倾向于在广度上进行探索，这既费时又难以获得奖励。在探索的后期，我们更倾向于选择价值较大的目标节点，每次搜索的路径基本较短。在实验中，我们经常可以看到生成正奖励的路径长度一般为2、3、4（最长的探索路径为10）。从计算时间可以看出，随着模型对环境的探索更全面，模型的平均探索长度也在减少，算法更倾向于容易获得正奖励的路径。在环境中进行连续搜索，算法的平均正回报率在 80% 以上。只是在蒙特卡洛树搜索的后期也有很多重复的正奖励路径。虽然奖励的正向率不断上升，但也带来了智能体陷入局部最优的风险。因此，在实验中，当正向奖励率高于某个值时，采样方式会使用agent的自主行走，将得到的路径加入到轨迹存储池中，使用随机批量训练来降低数据之间的相关性。

5.4结果的可解释性分析

与流行的嵌入模型相比，我们的模型在补全知识图谱方面具有更高的可解释性。提出的模型使用强化学习从源节点开始走，每一步由模型决定关系和对应的下一个节点，直到模型选择终端动作，从而生成从源实体到目标的完整路径实体。由于路径是实体和关系的集合，我们可以看到路径每一步的关系转换。面对一个问题，人们往往通过问题之间的关系把它与他人联系起来。因此，模型产生结果的方式非常接近人类的思维方式。为了验证行走路径是否符合人类推理认知，在NELL995数据集中，我们从关系完成结果中随机抽取4条完成路径（Atlete Plays For Team），分析目标选择全过程路径的合理性，以便解释模型在自然界中的可解释性，而不是量化。

从以上结果可以看出，要完成的实体是运动员，对应关系是“运动员为哪个队效力”。前两项之间的关系是“运动员领导的团队”，它准确地解释了运动员为哪个团队效力。在第三种情况下，路径经过中间节点，两个关系从运动员指向主场，然后找到主场球队来确定运动员的球队。当主场和运动队是唯一对应的时候，这条路径具有很好的可解释性。即使不是唯一对应，该路径在一定程度上也可以作为推理的依据。我的第四个完成路径是比较复杂。该模型虽然通过存在关系找到目标团队，但并不能完美地用关系来解释。因为实际模型的每一步的选择都是由关系和实体决定的。而且，“队对队”不具体，削弱了解读能力。

如构建马尔科夫过程所述，以能否找到目标节点为唯一奖励，代理只将策略与目标节点关联，行走路径与完成目标节点的真正原因正相关，但不等价。然而，完成路径的解释能力仍然难以量化。我在路径中相同的关系有不同查询关系的解释。例如，如果要查询的关系是“Athlete Plays In League”，那么“队对队”可以成为通向目标的桥梁，具有极好的解释能力，因为对战队的联赛也是在运动员所扮演的。因此，模型的可解释性需要进一步研究。

6.结论

论文在前人的基础上进行了总结和扩展，在网络结构上构建了强化学习马尔可夫过程描述，并设计了环境探索和深度代理网络。知识图谱上马尔可夫过程的定义也适用于其他形式的图结构。考虑到知识图谱环境中的状态是由序列数据表示的，通常采用易于并行化的时间卷积网络进行状态的特征提取和编码。灵活的卷积核大小更适合捕获递归状态结构。与循环神经网络的输出和输入相比，大大降低了时间的消耗。此外，由于网络结构和交叉链接的复杂性，由于搜索正奖励的能力有限，很难有效地训练代理网络。本文采用 M-walk 和 AlphaGO 环境探索方法 Monte Carlo Tree Search，大大提高了正向奖励的获取率，并充分利用了图与搜索树的相似性。在测试数据集中的平均积极奖励超过 80%。经过充分的训练，代理可以准确地走到目标节点。我们使用了合理的正相关假设，但该关系对应的真实完成路径并不完全等同于使用正奖励生成的路径。在接下来的工作中，我们可以考虑一组更接近的正相关假设，并以具有附加约束的新返回函数的形式对其进行描述。完成模型的可解释性也有一些挑战，可以成为未来工作的一部分。

你可能感兴趣的:(研究方向,知识图谱,人工智能)

SpringBoot生态全景图：从SpringCloud到云原生技术栈演进 fanxbl957 Web spring boot spring cloud 云原生
博主介绍：Java、Python、js全栈开发“多面手”，精通多种编程语言和技术，痴迷于人工智能领域。秉持着对技术的热爱与执着，持续探索创新，愿在此分享交流和学习，与大家共进步。DeepSeek-行业融合之万象视界(附实战案例详解100+)全栈开发环境搭建运行攻略：多语言一站式指南(环境搭建+运行+调试+发布+保姆级详解)感兴趣的可以先收藏起来，希望帮助更多的人SpringBoot生态全景图：从S
基于AFM注意因子分解机的推荐算法深度学习乐园深度学习实战项目深度学习科研项目推荐算法算法机器学习
关于深度实战社区我们是一个深度学习领域的独立工作室。团队成员有：中科大硕士、纽约大学硕士、浙江大学硕士、华东理工博士等，曾在腾讯、百度、德勤等担任算法工程师/产品经理。全网20多万+粉丝，拥有2篇国家级人工智能发明专利。社区特色：深度实战算法创新获取全部完整项目数据集、代码、视频教程，请进入官网：zzgcz.com。竞赛/论文/毕设项目辅导答疑，v：zzgcz_com1.项目简介项目A033基于A
Tair向量数据库：阿里云原生内存数据库服务的高性能向量检索解决方案 mmlihaio 数据库云原生 python
Tair向量数据库：阿里云原生内存数据库服务的高性能向量检索解决方案1.引言在当今的人工智能和大数据时代，高效的向量检索已成为许多应用场景的关键需求。Tair作为阿里云开发的云原生内存数据库服务，不仅提供了丰富的数据模型和企业级能力，还引入了基于非易失性内存(NVM)存储介质的持久内存优化实例。本文将深入探讨如何利用Tair向量数据库功能，实现高性能的向量存储和检索。2.Tair向量数据库概述Ta
阿里云魔搭社区AIGC专区：中国AI创作的革命性平台 Liudef06小白阿里云 AIGC 人工智能
在生成式人工智能重塑全球数字创作版图的浪潮中，中国首个一站式AIGC开发平台——阿里云魔搭社区AIGC专区于2024年9月杭州云栖大会正式亮相。这一突破性进展不仅填补了国内全流程AI创作工具的空白，更以157款多模态开源模型和全免费GPU算力的开放姿态，为超过690万开发者提供了从模型调用到应用落地的完整生态支持。一、魔搭社区：中国AI模型生态的奠基者魔搭社区（ModelScope）作为阿里云在2
探秘阿里云Tair KVCache：大模型推理的加速引擎云资源服务商阿里云云计算人工智能
一、引言近年来，人工智能领域发展迅猛，大语言模型（LLM）不断取得突破，其应用场景也日益广泛。从智能客服到内容生成，从智能写作到智能翻译，大语言模型正在深刻地改变着我们的生活和工作方式。随着模型规模的不断扩大和推理需求的日益增长，大模型推理过程中的显存瓶颈问题逐渐凸显，成为制约其发展和应用的关键因素。在大模型推理中，KVCache技术作为一种优化手段，通过缓存历史Token的Key/Value向量
AI正在偷偷取代这10种职业，你的工作安全吗？
近年来，人工智能（AI）的飞速发展正在悄然改变我们的工作方式。从自动化客服到AI生成内容，许多传统职业正面临被取代的风险。虽然AI带来了更高的效率和便利，但也让不少人开始担忧：我的工作会被AI抢走吗？今天，我们就来盘点10种最容易被AI取代的职业，并探讨如何在这个AI时代保持竞争力。1.客服代表取代指数：★★★★★AI驱动的聊天机器人（如ChatGPT、GoogleBard）已经能够处理大部分基础
直播预告！探讨生成模型中的极简概念擦除青稞社区. 青稞Talk 人工智能图像处理
主页：http://qingkeai.online/原文：https://mp.weixin.qq.com/s/yc4whKbnVY8ho1w7rgFVGg6月16日20:00，青稞Talk第55期，新加坡国立大学博士生张扬，将直播分享《生成模型中的极简概念擦除》。分享嘉宾张扬，慕尼黑工业大学计算机专业硕士，新加坡国立大学人工智能专业博士。曾于牛津大学进行学术访问，并在微软亚洲研究院及美国运通新加
【DeepSeek实战】3、Ollama实战指南：LobeChat+多网关架构打造高可用大模型集群无心水 Ollama实战指南 LobeChat实战 DeepSeek实战 DeepSeek全栈应用开发 AI入门大模型 CSDN技术干货
一、企业级大模型集群架构全景解析在人工智能落地应用的过程中，大模型服务的高可用性、成本控制和灵活扩展能力成为企业关注的核心痛点。本方案通过LobeChat前端、AI网关层和Ollama模型集群的三层架构设计，实现了无需复杂运维即可部署的生产级大模型服务体系。该架构不仅支持负载均衡、故障转移和模型热切换等企业级特性。还通过量化技术将硬件成本降低60%以上，为中小企业提供了与商业云服务相当的性能体验。
生成式人工智能实战 | 深度卷积生成对抗网络（Deep Convolutional Generative Adversarial Network, DCGAN）盼小辉丶生成式人工智能实战150讲人工智能生成对抗网络神经网络
生成式人工智能实战|深度卷积生成对抗网络0.前言1.模型与数据集分析1.1模型分析1.2数据集介绍2.构建DCGAN生成人脸图像2.1数据处理2.2模型构建2.3模型训练0.前言深度卷积生成对抗网络(DeepConvolutionalGenerativeAdversarialNetworks,DCGAN)是基于生成对抗网络(ConvolutionalGenerativeAdversarialNet
2024年AI 智能助手（大模型）产品市场分析｜商派徐礼昭｜商派软件市场负责人人工智能
一、引言人工智能的浪潮不断向前推进，智能助手作为其中的重要应用，已经逐渐渗透到我们生活的各个方面。它们以其便捷性和个性化的特点，改变了我们与世界的互动方式。本报告将对AI智能助手进行全面的行业分析，包括行业概况、主要玩家、用户数据、发展要素以及未来趋势等方面，并通过具体案例分享，帮助读者深入了解这一领域的现状和未来发展潜力。二、行业概览（一）智能助手的定义和发展阶段智能助手是利用人工智能技术为用户
高通 QCS8550 大模型性能深度解析：从算力基准到场景实测的全维度 Benchmark 伊利丹~怒风 Qualcomm 人工智能 AI编程 python arm 自然语言处理
前言在人工智能技术狂飙突进的时代，大模型正以前所未有的速度重塑各行业生态，从智能客服到多模态交互，从边缘推理到端侧部署，其应用场景不断拓展。而这一切革新的背后，离不开底层硬件的强力支撑。高通QCS8550作为面向下一代智能设备的旗舰级计算平台，凭借高达48TOPS的AI算力与先进的第七代高通AI引擎，在大模型性能表现上极具竞争力。其异构多核架构不仅能高效处理复杂的神经网络计算，还通过软硬件协同优化
从零开始理解零样本学习：AI人工智能必学技术 AI天才研究院 Agentic AI 实战 AI人工智能与大数据 AI大模型企业级应用开发实战 ai
从零开始理解零样本学习：AI人工智能必学技术关键词：零样本学习、人工智能、机器学习、知识迁移、语义嵌入摘要：本文旨在全面深入地介绍零样本学习这一在人工智能领域具有重要意义的技术。首先阐述零样本学习的背景和基本概念，通过详细的解释和直观的示意图让读者建立起对零样本学习的初步认识。接着深入剖析其核心算法原理，结合Python代码进行详细说明，同时引入相关数学模型和公式并举例阐释。通过项目实战部分，带领
[Python]-基础篇1- 从零开始的Python入门指南踏雪无痕老爷子 Python python 开发语言
无论你是尚未接触编程的新手，还是想从其他语言转向Python的开发者，这篇文章都是你的入门课。一、Python是什么？Python是一种解释型、高级、通用型编程语言，以简洁明了、简单易用着称。它可以应用于网站开发、自动化脚本、数据分析、人工智能、系统操作等多种场景。二、如何安装Python步骤：访问Python官方网站选择目前最新的Python3.x版本下载Windows用户请务必勾选“AddPy
【机器学习&深度学习】反向传播机制
目录一、一句话定义二、类比理解三、为什重要？四、用生活例子解释：神经网络=烹饪机器人4.1第一步：尝一口（前向传播）4.2第二步：倒着推原因（反向传播）五、换成人工智能流程说一遍六、图示类比：找山顶（最优参数）七、总结一句人话八、PyTorch代码示例：亲眼看到每一层的梯度九、梯度=损失函数对参数的偏导数十、类比总结反向传播（Backpropagation）是神经网络中训练过程的核心机制，它就像“
潜入思维的海洋：SoftCoT++如何让语言模型更聪明步子哥智能涌现语言模型人工智能自然语言处理
在人工智能的浩瀚星空下，大型语言模型（LLMs）如同一颗颗璀璨的恒星，照亮了从文本生成到复杂推理的广阔领域。然而，这些模型在推理任务中往往像是在迷雾中航行——尽管它们能抵达目的地，却常常因为固定的思维路径而错过更优的航线。2025年5月，一篇题为《SoftCoT++:Test-TimeScalingwithSoftChain-of-ThoughtReasoning》的论文如同一盏明灯，照亮了如何让
BI+AI实战：我们如何用3秒完成车企供应链推演 qq_43696218 人工智能
一、BI+AI引领财务分析新纪元在财务数据分析领域，奥威BI+AI正以革命性的姿态颠覆传统。当金蝶、用友等工具仍深陷报表泥潭时，奥威BI+AI通过深度融合商业智能（BI）与人工智能（AI），实现了从滞后报表到实时洞察的飞跃。这不仅极大地提升了财务分析的效率，更为企业的战略决策提供了前所未有的精准支持。二、BI+AI的核心技术优势‌实时动态分析‌o奥威BI+AI摒弃了静态数据集，依托原始科目余额表实
DeepSeek-V3 通俗详解：从诞生到优势，以及与 GPT-4o 的对比码事漫谈 AI ai
前些天发现了一个巨牛的人工智能学习网站，通俗易懂，风趣幽默，忍不住分享一下给大家。点击跳转到网站1.DeepSeek的前世今生1.1什么是DeepSeek？DeepSeek是一家专注于人工智能技术研发的公司，致力于打造高性能、低成本的AI模型。它的目标是让AI技术更加普惠，让更多人能够用上强大的AI工具。1.2DeepSeek-V3的诞生DeepSeek-V3是DeepSeek公司推出的最新一代A
企业级AI开发利器：Spring AI框架深度解析与实战_spring ai实战 AI大模型-海文人工智能 spring python 算法开发语言 java 机器学习
企业级AI开发利器：SpringAI框架深度解析与实战一、前言：Java生态的AI新纪元在人工智能技术爆发式发展的今天，Java开发者面临着一个新的挑战：如何将大语言模型（LLMs）和生成式AI（GenAI）无缝融入企业级应用。传统的Java生态缺乏统一的AI集成方案，开发者往往需要为不同AI供应商（如OpenAI、阿里云、HuggingFace）编写大量重复的接口适配代码，这不仅增加了开发成本，
图扑软件智慧云展厅，开启数字化展馆新模式智慧园区可视化 5g 人工智能大数据安全云计算
随着疫情的影响以及新兴技术的不断发展，展会的发展形式也逐渐从线下转向线上。通过“云”上启动、云端互动、双线共频的形式开展。通过应用大数据、人工智能、沉浸式交互等多重技术手段，构建数据共享、信息互通、精准匹配的高精度“云展厅”，突破时空壁垒限制。图扑软件运用HT强大的渲染功能，数字孪生“云展位”，1:1复现实际展厅内部独特的结构造型和建筑特色。也可以第一人称视角漫游，模拟用户在展厅内的参观场景，在保
转行要趁早！网络安全行业人才缺口大，企业招聘需求正旺！
网络安全行业具有人才缺口大、岗位选择多、薪资待遇好、学历要求不高等优势，对于想要转行的人员来说，是一个非常不错的选择。人才缺口大网络安全攻防技术手段日新月异，特别是现在人工智能技术飞速发展，网络安全形势复杂严峻，人才重要性凸显。教育部《网络安全人才实战能力白皮书》数据显示，到2027年，我国网络安全人员缺口将达327万。近期发布的《2024年网络安全产业人才发展报告》中提到，沿用ISC2的人才缺口
【机器学习与数据挖掘实战 | 医疗】案例18：基于Apriori算法的中医证型关联规则分析 Francek Chen 机器学习与数据挖掘实战机器学习数据挖掘 Apriori python 关联规则人工智能
【作者主页】FrancekChen【专栏介绍】⌈⌈⌈机器学习与数据挖掘实战⌋⌋⌋机器学习是人工智能的一个分支，专注于让计算机系统通过数据学习和改进。它利用统计和计算方法，使模型能够从数据中自动提取特征并做出预测或决策。数据挖掘则是从大型数据集中发现模式、关联和异常的过程，旨在提取有价值的信息和知识。机器学习为数据挖掘提供了强大的分析工具，而数据挖掘则是机器学习应用的重要领域，两者相辅相成，共同推动
误差的回响：反向传播算法与神经网络的惊天逆转田园Coder 人工智能科普人工智能科普
当专家系统在20世纪80年代初期大放异彩，成为人工智能实用化的耀眼明星时，另一股曾经被宣判“死刑”的力量——连接主义（神经网络）——正在寒冬的冻土下悄然涌动，孕育着一场惊天动地的复苏。马文·明斯基和西摩·帕尔特在1969年《感知机》专著中那精准而冷酷的理论批判，如同沉重的封印，将多层神经网络的研究禁锢了近二十年。他们指出的核心死结——缺乏有效算法来训练具有隐藏层的网络——仿佛一道无法逾越的天堑。单
【Html实现“心形日出”（附效果+源代码）】| JavaScript面试题：解释一下异步编程中的回调函数、Promise和Async/Await的概念。它们有什么区别？追光者♂ html5 css3 心形日出前端特效 JS面试题 Promise Async/Await
风会带走你曾经存在过的证明。——虞姬作者主页：追光者♂个人简介：[1]计算机专业硕士研究生[2]2023年城市之星领跑者TOP1(哈尔滨)[3]2022年度博客之星人工智能领域TOP4[4]阿里云社区特邀专家博主[5]CSDN-人工智能领域优质创作者无限进步，一起追光！！！
青少年编程与数学 01-012 通用应用软件简介 15 人工智能助手明月看潮生编程与数学第01阶段青少年编程人工智能应用软件编程与数学
青少年编程与数学01-012通用应用软件简介15人工智能助手一、什么是人工智能助手二、人工智能助手的产生和发展（一）早期探索阶段（二）技术突破阶段（三）广泛应用阶段三、人工智能助手的主要功能（一）信息查询（二）日程管理（三）设备控制（四）知识问答四、人工智能助手的商业模式（一）广告收入（二）增值服务（三）数据服务（四）硬件销售五、DeepSeek（一）基本情况（二）技术水平（三）产品功能（四）市场
虚拟空间中的AI协作与任务 AI天才研究院 ChatGPT AI大模型企业级应用开发实战 AI人工智能与大数据大厂Offer收割机面试题简历程序员读书硅基计算碳基计算认知计算生物计算深度学习神经网络大数据 AIGC AGI LLM Java Python 架构设计 Agent 程序员实现财富自由
虚拟空间与AI概述在当今信息化和数字化的时代，虚拟空间（VirtualSpace）已成为人们生活和工作的重要一部分。虚拟空间是一种通过计算机技术构建的虚拟环境，它能够模拟和增强现实世界中的各种交互和体验。而人工智能（AI）作为计算机科学的一个分支，通过模拟人类的认知能力来实现自动化和智能化的决策。虚拟空间与AI的结合，不仅为人类带来了全新的交互方式，也为各行业的发展注入了强大的动力。虚拟空间的定义
AI Agent: AI的下一个风口智能体在元宇宙里的应用 AI智能应用 Python入门实战计算科学神经计算深度学习神经网络大数据人工智能大型语言模型 AI AGI LLM Java Python 架构设计 Agent RPA
AIAgent:AI的下一个风口智能体在元宇宙里的应用作者：禅与计算机程序设计艺术/ZenandtheArtofComputerProgramming关键词：AIAgent,元宇宙,虚拟角色,智能交互,人工智能,虚拟世界,智能体架构,交互式应用1.背景介绍1.1问题的由来随着虚拟现实(VR)、增强现实(AR)和区块链技术的不断发展，元宇宙(Metaverse)的概念逐渐兴起。元宇宙是一个由虚拟世界
攻击者利用热门AI发动黑帽SEO攻击，通过污染搜索结果传播窃密木马 FreeBuf- 人工智能
伪装成AI主题网站的恶意页面|图片来源：ZscalerZscaler威胁实验室研究人员发现一起精心策划的恶意软件攻击活动，攻击者利用ChatGPT和LumaAI等人工智能(AI)工具的热度，通过黑帽SEO（搜索引擎优化）技术劫持搜索引擎结果，诱导用户落入恶意软件陷阱。Zscaler警告称："这些攻击背后的威胁行为者正在利用ChatGPT和LumaAI等AI工具的热度。"这些欺诈活动至少从2025年
Python/Java/Php/C#/Go/C/C++这几个主力语言，谁到底真的不行 dotNET跨平台 java c#开发语言
1.前言阿里最近又进行了史诗级的大裁员，IT行业肉眼可见的持续性衰退与没落。当潮水退却，才能看出谁在裸泳。作为当今计算机编程界的几大主力语言，谁才真正的裸泳者呢？2.描述1.Python:Python作为一款解释性的动态语言，它很早就诞生了。它的第一个发行版1991年出世，比Java还要早四年。可惜命运不济，一直没有大的作为。到了2014年人工智能的风口悄然兴起，Python一路高歌猛进。到了20
人工智能-基础篇-5-建模方式（判别式模型和生成式模型）
机器学习包括了多种建模方式，其中判别式建模（DiscriminativeModel）和生成式建模是最常见的两种。这两种建模方式都可以通过深度学习技术来实现，并用于创建不同类型的模型。简单来说：想要创建一个模型，依赖需求需要合适的建模方式来创建这个模型。通常建模方式主要分为两大类。一类是判别式模型，针对输入数据给出特定的输出。如：判断一张图片是猫还是狗，直接学习“猫”和“狗”的特征差异（如耳朵形状、
【机器学习】数学基础——张量（傻瓜篇）一叶千舟深度学习【理论】机器学习人工智能
目录前言一、张量的定义1.标量（0维张量）2.向量（1维张量）3.矩阵（2维张量）4.高阶张量（≥3维张量）二、张量的数学表示2.1张量表示法示例三、张量的运算3.1常见张量运算四、张量在深度学习中的应用4.1PyTorch示例：张量在神经网络中的运用五、总结：张量的多维世界延伸阅读前言在机器学习、深度学习以及物理学中，张量是一个至关重要的概念。无论是在人工智能领域的神经网络中，还是在高等数学、物
jquery实现的jsonp掉java后台知了ing java jsonp jquery
什么是JSONP？先说说JSONP是怎么产生的：其实网上关于JSONP的讲解有很多，但却千篇一律，而且云里雾里，对于很多刚接触的人来讲理解起来有些困难，小可不才，试着用自己的方式来阐释一下这个问题，看看是否有帮助。 1、一个众所周知的问题，Ajax直接请求普通文件存在跨域无权限访问的问题，甭管你是静态页面、动态网页、web服务、WCF，只要是跨域请求，一律不准； 2、
Struts2学习笔记 caoyong struts2
SSH : Spring + Struts2 + Hibernate 三层架构(表示层,业务逻辑层,数据访问层) MVC模式 (Model View Controller) 分层原则:单向依赖，接口耦合 1、Struts2 = Struts + Webwork 2、搭建struts2开发环境 a>、到www.apac
SpringMVC学习之后台往前台传值方法满城风雨近重阳 springMVC
springMVC控制器往前台传值的方法有以下几种： 1.ModelAndView 通过往ModelAndView中存放viewName：目标地址和attribute参数来实现传参： ModelAndView mv=new ModelAndView(); mv.setViewName="success
WebService存在的必要性？一炮送你回车库 webservice
做Java的经常在选择Webservice框架上徘徊很久，Axis Xfire Axis2 CXF ，他们只有一个功能，发布HTTP服务然后用XML做数据传输。是的，他们就做了两个功能，发布一个http服务让客户端或者浏览器连接，接收xml参数并发送xml结果。当在不同的平台间传输数据时，就需要一个都能解析的数据格式。但是为什么要使用xml呢？不能使json或者其他通用数据
js年份下拉框 3213213333332132 java web ee
<div id="divValue">test...</div>测试 //年份 <select id="year"></select> <script type="text/javascript"> window.onload =
简单链式调用的实现技术归来朝歌方法调用链式反应编程思想
在编程中，我们可以经常遇到这样一种场景：一个实例不断调用它自身的方法，像一条链条一样进行调用这样的调用你可能在Ajax中，在页面中添加标签： $("<p>").append($("<span>").text(list[i].name)).appendTo("#result"); 也可能在HQ
JAVA调用.net 发布的webservice 接口 darkranger webservice
/** * @Title: callInvoke * @Description: TODO(调用接口公共方法) * @param @param url 地址 * @param @param method 方法 * @param @param pama 参数 * @param @return * @param @throws BusinessException
Javascript模糊查找 | 第一章循环不能不重视。 aijuans Way
最近受我的朋友委托用js+HTML做一个像手册一样的程序，里面要有可展开的大纲，模糊查找等功能。我这个人说实在的懒，本来是不愿意的，但想起了父亲以前教我要给朋友搞好关系，再加上这也可以巩固自己的js技术，于是就开始开发这个程序，没想到却出了点小问题，我做的查找只能绝对查找。具体的js代码如下： function search(){ var arr=new Array("my
狼和羊，该怎么抉择 atongyeye 工作
狼和羊，该怎么抉择在做一个链家的小项目，只有我和另外一个同事两个人负责，各负责一部分接口，我的接口写完，并全部测联调试通过。所以工作就剩下一下细枝末节的，工作就轻松很多。每天会帮另一个同事测试一些功能点，协助他完成一些业务型不强的工作。今天早上到公司没多久，领导就在QQ上给我发信息，让我多协助同事测试，让我积极主动些，有点责任心等等，我听了这话，心里面立马凉半截，首先一个领导轻易说
读取android系统的联系人拨号百合不是茶 android sqlite数据库内容提供者系统服务的使用
联系人的姓名和号码是保存在不同的表中,不要一下子把号码查询来,我开始就是把姓名和电话同时查询出来的,导致系统非常的慢关键代码: 1, 使用javabean操作存储读取到的数据 package com.example.bean; /** * * @author Admini
ORACLE自定义异常 bijian1013 数据库自定义异常
实例： CREATE OR REPLACE PROCEDURE test_Exception ( ParameterA IN varchar2, ParameterB IN varchar2, ErrorCode OUT varchar2 --返回值,错误编码 ) AS /*以下是一些变量的定义*/ V1 NUMBER; V2 nvarc
查看端号使用情况征客丶 windows
一、查看端口在windows命令行窗口下执行： >netstat -aon|findstr "8080" 显示结果： TCP 127.0.0.1:80 0.0.0.0:0 &
【Spark二十】运行Spark Streaming的NetworkWordCount实例 bit1129 wordcount
Spark Streaming简介 NetworkWordCount代码 /* * Licensed to the Apache Software Foundation (ASF) under one or more * contributor license agreements. See the NOTICE file distributed with
Struts2 与 SpringMVC的比较 BlueSkator struts2 spring mvc
1. 机制：spring mvc的入口是servlet，而struts2是filter，这样就导致了二者的机制不同。 2. 性能：spring会稍微比struts快。spring mvc是基于方法的设计，而sturts是基于类，每次发一次请求都会实例一个action，每个action都会被注入属性，而spring基于方法，粒度更细，但要小心把握像在servlet控制数据一样。spring
Hibernate在更新时，是可以不用session的update方法的(转帖） BreakingBad Hibernate update
地址：http://blog.csdn.net/plpblue/article/details/9304459 public void synDevNameWithItil() {Session session = null;Transaction tr = null;try{session = HibernateUtil.getSession();tr = session.beginTran
读《研磨设计模式》-代码笔记-观察者模式 bylijinnan java 设计模式
声明：本文只为方便我个人查阅和理解，详细的分析以及源代码请移步原作者的博客http://chjavach.iteye.com/ import java.util.ArrayList; import java.util.List; import java.util.Observable; import java.util.Observer; /** * “观
重置MySQL密码 chenhbc mysql 重置密码忘记密码
如果你也像我这么健忘，把MySQL的密码搞忘记了，经过下面几个步骤就可以重置了（以Windows为例，Linux/Unix类似）： 1、关闭MySQL服务 2、打开CMD，进入MySQL安装目录的bin目录下，以跳过权限检查的方式启动MySQL mysqld --skip-grant-tables 3、新开一个CMD窗口，进入MySQL mysql -uroot
再谈系统论，控制论和信息论 comsci 设计模式生物能源企业应用领域模型
再谈系统论，控制论和信息论偶然看
oracle moving window size与 AWR retention period关系 daizj oracle
转自： http://tomszrp.itpub.net/post/11835/494147 晚上在做11gR1的一个awrrpt报告时,顺便想调整一下AWR snapshot的保留时间,结果遇到了ORA-13541这样的错误.下面是这个问题的发生和解决过程. SQL> select * from v$version; BANNER -------------------
Python版B树 dieslrae python
话说以前的树都用java写的,最近发现python有点生疏了,于是用python写了个B树实现,B树在索引领域用得还是蛮多了,如果没记错mysql的默认索引好像就是B树... 首先是数据实体对象,很简单,只存放key,value class Entity(object): '''数据实体''' def __init__(self,key,value)
C语言冒泡排序 dcj3sjt126com 算法
代码示例： # include <stdio.h> //冒泡排序 void sort(int * a, int len) { int i, j, t; for (i=0; i<len-1; i++) { for (j=0; j<len-1-i; j++) { if (a[j] > a[j+1]) // >表示升序
自定义导航栏样式 dcj3sjt126com 自定义
-(void)setupAppAppearance { [[UILabel appearance] setFont:[UIFont fontWithName:@"FZLTHK—GBK1-0" size:20]]; [UIButton appearance].titleLabel.font =[UIFont fontWithName:@"FZLTH
11.性能优化-优化-JVM参数总结 frank1234 jvm参数性能优化
1.堆 -Xms --初始堆大小 -Xmx --最大堆大小 -Xmn --新生代大小 -Xss --线程栈大小 -XX:PermSize --永久代初始大小 -XX:MaxPermSize --永久代最大值 -XX:SurvivorRatio --新生代和suvivor比例,默认为8 -XX:TargetSurvivorRatio --survivor可使用
nginx日志分割 for linux HarborChung nginx linux 脚本
nginx日志分割 for linux 默认情况下，nginx是不分割访问日志的，久而久之，网站的日志文件将会越来越大，占用空间不说，如果有问题要查看网站的日志的话，庞大的文件也将很难打开，于是便有了下面的脚本使用方法，先将以下脚本保存为 cutlog.sh，放在/root 目录下，然后给予此脚本执行的权限复制代码代码如下: chmo
Spring4新特性——泛型限定式依赖注入 jinnianshilongnian spring spring4 泛型式依赖注入
Spring4新特性——泛型限定式依赖注入 Spring4新特性——核心容器的其他改进 Spring4新特性——Web开发的增强 Spring4新特性——集成Bean Validation 1.1(JSR-349)到SpringMVC Spring4新特性——Groovy Bean定义DSL Spring4新特性——更好的Java泛型操作API Spring4新
centOS安装GCC和G++ liuxihope centos gcc
Centos支持yum安装，安装软件一般格式为yum install .......，注意安装时要先成为root用户。按照这个思路，我想安装过程如下：安装gcc：yum install gcc 安装g++： yum install g++ 实际操作过程发现，只能有gcc安装成功，而g++安装失败，提示g++ command not found。上网查了一下，正确安装应该
第13章 Ajax进阶（上） onestopweb Ajax
index.html <!DOCTYPE html PUBLIC "-//W3C//DTD XHTML 1.0 Transitional//EN" "http://www.w3.org/TR/xhtml1/DTD/xhtml1-transitional.dtd"> <html xmlns="http://www.w3.org/
How to determine BusinessObjects service pack and fix pack blueoxygen BO
http://bukhantsov.org/2011/08/how-to-determine-businessobjects-service-pack-and-fix-pack/ The table below is helpful. Reference BOE XI 3.x 12.0.0. y BOE XI 3.0 12.0. x. y BO
Oracle里的自增字段设置 tomcat_oracle oracle
　大家都知道吧，这很坑，尤其是用惯了mysql里的自增字段设置，结果oracle里面没有的。oh，no 　　我用的是12c版本的，它有一个新特性，可以这样设置自增序列，在创建表是，把id设置为自增序列 create table t ( id 　　　　 number generated by default as identity (start with 1 increment b
Spring Security（01）——初体验 yang_winnie spring Security
Spring Security（01）——初体验博客分类： spring Security Spring Security入门安全认证首先我们为Spring Security专门建立一个Spring的配置文件，该文件就专门用来作为Spring Security的配置