鑫十一

[论文翻译]DeepPath: A Reinforcement Learning Method for Knowledge Graph Reasoning

DeepPath: A Reinforcement Learning Method for Knowledge Graph Reasoning

0 总结

名称	项目
题目	DeepPath: A Reinforcement Learning Method for Knowledge Graph Reasoning
中文	深度路径:知识图推理的强化学习方法
来源	EMNLP 2017
作者	Xiong, Wenhan and Hoang, Thien and Wang, William Yang
代码	https://hub.fastgit.org/xwhan/DeepPath
摘要	We study the problem of learning to reason in large scale knowledge graphs (KGs). More specifically, we describe a novel reinforcement learning framework for learning multi-hop relational paths: we use a policy-based agent with continuous states based on knowledge graph embeddings, which reasons in a KG vector space by sampling the most promising relation to extend its path. In contrast to prior work, our approach includes a reward function that takes the accuracy,diversity, and efficiency into consideration. Experimentally, we show that our proposed method outperforms a path-ranking based algorithm and knowledge graph embedding methods on Freebase and Never-Ending Language Learning datasets. （我们研究了大规模知识图中的推理问题。更具体地说，我们描述了一种新的用于学习多跳关系路径的强化学习框架:我们使用基于知识图嵌入的连续状态的基于策略的智能体，它通过抽样最有希望的关系来扩展其路径，在KG向量空间中进行推理。与之前的工作不同，我们的方法包括一个考虑准确性、多样性和效率的奖励。在Freebase和NELL数据集上，我们的实验表明，我们提出的方法优于基于路径排名的算法和知识图嵌入方法）

1 背景

近年来，深度学习技术在各种分类和识别问题上取得了许多最新的成果。然而，复杂的自然语言处理问题往往需要多个相互关联的决策，使深度学习模型具有学习推理的能力仍然是一个具有挑战性的问题。为了处理没有明显答案的复杂查询，智能机器必须能够利用现有资源进行推理，并学会推断一个未知的答案。

更具体地说，我们把我们的研究放在多跳推理的背景下，给定较大的KG，学习显式推理公式；

例如，如果KG包括内马尔为巴塞罗那效力，而巴塞罗那在英甲联赛，那么机器应该能够学习以下公式：

$p l a y e r P l a y s F o r T e a m (P, T) \land t e a m P l a y s I n L e a g u e (T, L) \Rightarrow p l a y e r P l a y s I n L e a g u e (P, L)$

在测试的时候，通过输入学到的公式，系统应该能够自动推断出一对实体之间缺失的链接。这种推理机可能会成为复杂QA系统的重要组成部分。

近年来，路径排序算法(PRA) (Lao et al.，2010,2011a)作为一种很有前途的方法能够在大型KGs中学习推理路径。PRA采用基于重启的推理机制的随机行走，执行多个有界深度优先搜索过程来查找关系路径。再加上基于弹性网（elastic-net）的学习，PRA使用监督学习选择更合理的路径。然而，PRA操作在一个完全离散的空间中，这使得评估和比较KG中相似的实体和关系变得困难。

在这项工作中，我们提出了一种新的可控多跳推理方法:我们为路径学习过程建立了一个强化学习(RL)框架。与PRA相比，我们使用基于平移的基于知识的嵌入方法(Bordes et al.，2013)来编码我们的RL智能体的连续状态，这是在知识图的向量空间环境中推理的。智能体通过对一个关系进行抽样来扩展它的路径，从而采取增量步骤。为了更好地指导RL 智能体学习关系路径，我们使用了策略梯度训练(Mnih等人，2015)和一个新的奖励函数，共同鼓励准确性、多样性和效率。实验结果表明，该方法优于PRA算法和基于嵌入的算法。2018年7月7日在Freebase和一个NELL(Carlson et al.，2010a)数据集上的方法。我们的贡献有三:

我们首先考虑强化学习(RL)方法来学习知识图中的关系路径;
我们的学习方法使用了一个复杂的奖励函数，同时考虑了准确性、效率和路径多样性，在寻径过程中提供了更好的控制和更大的灵活性;
我们表明，我们的方法可以扩展到大规模的知识图，在两个任务中优于PRA和KG嵌入方法。

2 相关工作

路径排序算法(PRA)方法(Lao et al.，2011b)是一种主要的寻路方法，采用带重启策略的随机行走进行多跳推理。Gardner等人(2013;2014)对PRA提出了一种改进，在向量空间中计算特征相似度。Wang和Cohen(2015)提出了一种将背景KG和文本相结合的递归随机行走方法，该方法同时进行逻辑程序的结构学习和文本中的信息提取。随机游走推理的一个潜在瓶颈是，连接大量公式的超级节点将创建巨大的扇出区域，显著降低推理速度并影响精度。

Toutanova等人(2015)为多跳推理提供了一种卷积神经网络解决方案。他们建立了一个基于词汇化依赖路径的CNN模型，该模型由于解析错误而存在错误传播问题。Guu等人(2015)使用KG嵌入来回答路径查询。Zeng et al.(2014)描述了一个用于关系抽取的CNN模型，但它没有明确地建模关系路径。Neelakantan等人(2015)提出了一种用于知识库完成(KBC)中关系路径建模的递归神经网络模型，但它训练了太多的独立模型，并且因此，它不能规模化。注意，许多最近的KG推理方法(Neelakantan等人，2015;Das等人，2017)仍然依赖于首次学习PRA路径，这只在离散空间中操作。与PRA相比，我们的方法在连续空间中进行推理，并且通过在奖励函数中引入各种标准，我们的强化学习(RL)框架对寻径过程具有更好的控制和更大的灵活性。

神经符号机(Liang et al.，2016)是KG推理的最新成果，它也应用了强化学习，但与我们的工作有不同的风格。NSM学习编写可以找到自然语言问题答案的程序，而我们的RL模型试图通过对已有的KG三元组进行推理，将新的事实添加到知识图(KG)中。为了得到答案，NSM学会生成一系列动作，这些动作可以组合成一个可执行程序。NSM中的操作空间是一组预定义的令牌。在我们的框架中，目标是寻找推理路径，因此动作空间就是KG中的关系空间。类似的框架(Johnson et al.，2017)也被应用于视觉推理任务。

3 具体方法模型介绍

在本节中，我们将详细描述基于rl的多跳关系推理框架。关系推理的具体任务是在实体对之间寻找可靠的预测路径。我们将寻路问题表述为一个可以用RL智能体解决的顺序决策问题。我们首先描述环境和基于策略的RL智能体。通过与围绕KG设计的环境交互，智能体学会选择有希望的推理路径。然后描述了RL模型的训练过程。在此基础上，提出了一种有效的路径约束搜索算法，利用RL智能体找到的路径进行关系推理。

3.1 关系推理的强化学习

RL系统由两部分组成(参见图1)。

第一部分是外部环境 $\mathcal{E}$ ，它描述了智能体与KG之间相互作用的过程。这个环境被建模为马尔可夫决策过程(MDP)。定义一个元组 $\mathcal{}$ 表示MDP，其中连续状态空间A={a1, a2，…， an}是所有可用动作的集合， $\mathcal{P(St+1=s0|St=s, At=a) }$ 为转移概率矩阵， $\mathcal{R(s, a)}$ 是每个 $\mathcal{(s, a)}$ 对的奖励函数。

系统的第二部分是RL智能体，它由一个策略网络 $\mathcal{πθ(s, a) =p(a|s;θ)}$ 表示，该网络将状态向量映射为随机策略。采用随机梯度下降法更新θ的神经网络参数。与Deep Q Network (DQN) (Mnih等人，2013)相比，基于策略的RL方法更适合我们的知识图场景。原因:

KG中的寻径问题，由于关系图的复杂性，行动空间可能非常大。这会导致DQN的收敛性较差。
此外，该策略网络可以学习随机策略，避免agent在中间状态卡死，而不是像DQN等基于值的方法中常见的贪婪策略。

在描述我们的策略网络结构之前，我们首先描述RL环境的组件(动作、状态、奖励)。

3.1.1 Actions

给定具有关系 $\mathcal{r}$ 的实体对 $\mathcal{(e_s, e_t)}$ ，我们希望智能体找到连接这些实体对的最有信息量的路径。从源实体 $e_s$ 开始，使用策略网络选择最有希望的关系，在每一步扩展它的路径，直到它到达目标实体 $e_t$ 。为保持策略网络输出维数的一致性，将行动空间定义为KG中的所有关系。

3.1.2 States

KG中的实体和关系自然是离散的原子符号。因为现有的实际KGs，如Freebase (Bollacker et al.， 2008)和NELL (Carlson et al.，2010b)经常有大量的三元组。不可能直接模拟所有状态中的符号原子。为了捕获这些符号的语义信息，我们使用基于翻译的嵌入，如TransE (Bordes et al.，2013)和TransH (Wang et al.，2014)来表示实体和关系。这些嵌入将所有符号映射到一个低维向量空间。在我们的框架中，每个状态（state）捕获智能体在KG中的位置。在执行一个操作（action）之后，智能体将从一个实体移动到另一个实体。这两者通过智能体所采取的动作（action）(关系 relation)联系在一起。在t步处的状态向量如下:

$s_t= (e_t,e_{target}−e_t)$

$e_t$ 表示当前实体节点的嵌入，而 $e_{target}$ 表示目标实体的嵌入。在初始状态, $e_t = e_{source}$ 。我们没有在状态中加入推理关系，因为在寻径过程中推理关系的嵌入是不变的，这对训练没有帮助。然而，我们发现，通过使用一组针对特定关系的正样本来训练RL 智能体，该智能体可以成功地发现关系语义。

3.1.3 Rewards

有几个因素会影响RL智能体找到的路径的质量。为了鼓励代理找到预测路径，我们的奖励函数包括以下评分标准:

Global accuracy

对于我们的环境设置，智能体可以采取的操作数量可能非常大。换句话说，错误的顺序决策比正确的顺序决策多得多。这些错误决策序列的数量会随着路径的长度呈指数增长。鉴于这一挑战，我们添加到RL模型中的第一个奖励函数定义如下:

$r_{GLOBAL}=\begin{cases} +1,&if \ the \ path \ reach \ e_{target} \\ -1 ,&otherwise \end{cases}$

如果智能体在一系列动作后到达目标，它将获得离线正奖励+1。

Path efficiency

对于关系推理任务，我们观察到短路径比长路径更能提供可靠的推理证据。更短的关系链也可以通过限制RL与环境交互的长度来提高推理的效率。效率奖励的定义如下:

$r_{EFFICIENCY} = \frac{1}{length(p)}$

其中路径 $p$ 定义为关系 $r_1→r_2→…→r_n$ 的序列。

Path diversity

我们训练智能体为每个关系使用正样本寻找路径。这些训练样本 $e_{source}, e_{target})$ 在向量空间中具有类似的状态表示。智能体倾向于找到具有相似语法和语义的路径。这些路径通常包含冗余信息，因为其中一些路径可能是相关的。为了鼓励agent寻找多样化的路径，我们利用当前路径与现有路径之间的余弦相似度定义一个多样性奖励函数:

$KaTeX parse error: Undefined control sequence: \abs at position 27: …Y} = -\frac{1}{\̲a̲b̲s̲{F}} \sum_{i=1}…$

其中 $p=\sum^n_{i=1}{r_i}$ 代表关系链 $r_1→r_2→…→r_n$ 的路径嵌入。

Policy Network

我们使用一个全连接的神经网络参数化策略函数 $π (s; θ)$ ，该函数将状态向量 $s$ 映射到所有可能动作的概率分布。神经网络由两个隐层组成，每个隐层后面是一个非线性层(ReLU)。输出层使用softmax函数进行规范化(参见图1)。

3.2 训练管道

在实践中，KG推理的一个大挑战是关系集可以相当大。对于一个典型的KG, RL智能体经常面临数百(数千)种可能的操作。换句话说，策略网络的输出层通常具有较大的维度。由于关系图的复杂性和大的动作空间，如果直接采用RL算法典型的试错训练方法训练RL模型，RL模型的收敛性很差。经过长时间的训练，智能体没有找到任何有价值的途径。为了解决这个问题，我们从阿尔法狗使用的模仿学习管道(Silver et al.，2016)启发的有监督的策略开始训练(Silver et al.，2016)。在围棋游戏中，玩家每一步都要面对近250种可能的合法走法。直接训练agent从原始动作空间中选择动作可能是一项困难的任务。AlphaGo首先利用专家的行动训练一个有监督的策略网络。在我们的例子中，监督策略使用随机广度优先搜索(BFS)进行训练。

3.2.1 监管策略的学习

对于每个关系，我们使用所有正样本(实体对)的子集来学习监督策略。对于每个正样本 $e_{source}, e_{target})$ ，进行双侧BFS以在实体之间找到相同的正确路径。每个路径的关系序列是 $r_1→r_2→…→r_n$ ，我们更新参数θ，使用蒙特卡罗策略梯度（Monte-Carlo Policy Gradient，REINFORCE）使预期累积回报最大化：

$J(\theta) = \mathbb{E}_{a\sim\pi}{(\sum_t{R_{s_t,a_t}})}=\sum_t\sum_{a \in \mathcal{A}}{\pi (a|s_t;\theta)R_{s_t,a_t}}$

其中 $J (θ)$ 是一个episode的预期总报酬。对于监督式学习，每成功episode的每一步我们都给予+1的奖励。将BFS找到的路径代入，更新策略网络的近似梯度如下图所示:

$\nabla_\theta{J(\theta)}= \sum_t\sum_{a \in \mathcal{A}}{\pi (a|s_t;\theta)\nabla_\theta log \pi(a|s_t;\theta) } \approx \nabla_\theta \sum_t log \pi(a= r_t|s_t;\theta)$

$r_t$ 属于路径 $p$

然而，香草BFS是一种偏向于短路径的搜索算法。当插入这些有偏差的路径时，智能体很难找到可能有用的更长的路径。我们希望路径只被定义的奖励方法所控制。为了防止偏搜索，我们采用了一个简单的技巧，在BFS中添加了一些随机机制。我们没有直接搜索 $e_{source}, e_{target})$ 之间的路径，而是随机选择一个中间节点 $e_{inter}$ ，然后在 $e_{source}, e_{inter})$ 和 $e_{inter}, e_{target})$ 之间进行两个BFS。连接的路径用于训练代理。有监督的学习可以让agent从失败的动作中学习。通过学习到的经验，我们训练agent找到理想的路径。

3.2.2 带有奖励的再训练

为了找到由奖赏函数控制的推理路径，我们使用奖赏函数对有监督的策略网络进行再训练。对于每个关系，一个实体对的推理被视为一个episode。agent从源节点 $e_{source}$ 开始，根据所有关系的概率分布——随机策略 $π (a ∣ s)$ 选择一个关系来扩展其推理路径。这个关系链接可能会引导向一个新的实体，也可能什么都没有。这些失败的步骤将导致智能体收到负奖励。在这些失败的步骤之后，智能体将保持相同的状态。由于代理遵循随机策略，智能不会因为重复错误的步骤而被卡住。为了提高训练效率，我们对集长度进行了限制 $max \_ length$ ,如智能体在 $max \_ length$ ,步长范围内未能到达目标实体，则该episode结束。在每一episode之后，策略网络将使用以下梯度进行更新:

$\nabla_\theta{J(\theta)}= \nabla_\theta \sum_t log \pi(a= r_t|s_t;\theta)R_{total}$

其中 $R_{total}$ 定义的奖励函数的线性组合。再训练过程的细节在算法1中显示。

在实践中，θ使用Adam Optimizer (Kingma and Ba,2014)和L2正则化(L2regularization)进行更新。

3.3 双向Path-constrained搜索

给定一个实体对，RL智能体学习的推理路径可以作为逻辑公式来预测关系链接。每个公式都使用双向搜索进行验证。在典型的KG中，一个实体节点可以连接到具有相同关系链路的大量邻居。一个简单的例子是关系 $personnationality^{-1}$ ，它表示 $p e r s o n n a t i o n a l i t y$ 的逆关系。通过这种联系，实体 $U n i t e d S t a t e s$ 可以与众多邻国联系。如果公式中包含这样的链接，那么中间实体的数量可以按照推理公式成倍增加。然而，我们观察到，对于这些公式，如果我们从反方向验证公式。中间节点的数量可以大大减少。算法2给出了所提出的双向搜索的详细描述。

4 实验数据集及结果

为了评估我们的RL代理找到的推理公式，我们探索了两个标准的KG推理任务:链接预测(预测目标实体)和事实预测(预测未知事实是否成立)。我们将该方法与基于路径的方法和基于嵌入的方法进行了比较。之后，我们进一步分析了我们的RL agent找到的推理路径。这些高度预测性的路径验证了奖励功能的有效性。最后，我们进行了一个实验来研究监督学习的效果。

4.1 数据集及设置

FB15K-237 (Toutanova et al.，2015)中的三元组取自FB15K (Bordes et al.，2013)，去除冗余关系。我们在具有足够推理路径的20个关系上执行推理任务。这些任务包含不同领域的关系，如Sports,People,Locations,Film等。此外，我们从NELL系统的995次迭代中提出了一个新的适用于多跳推理的NELL子集。我们首先删除带有generalizations和haswikipediaurl关系的三元组。这两种关系在NELL数据集中出现了超过200万次，但它们没有推理价值。在这一步之后，我们只选择关系为Top-200的三元组。为了便于寻径，我们还添加了逆三元组。对于每个三元组 $(h, r, t)$ ，我们将 $t, r^{−1},h)$ 附加到数据集。使用这些逆三元组，智能体能够在KG中后退。

对于每个推理任务 $r_i$ ，我们从KG中删除所有带有 $r_i$ 或者$ r_i^{-1}$的三元组。这些被移除的三元组被分成训练和测试样本。

对于链路预测任务，测试三元组 ${(h, r, t)}$ 中的每一个 $h$ 都被认为是一个查询。使用不同的方法对一组候选目标实体进行排序。

对于事实预测，真实的测试三元组与一些生成的假三元组进行排序。

4.2 基线和实施细节

大多数KG推理方法是基于路径公式或KG嵌入。在我们的实验中，我们探索了这两类的方法。

对于基于路径的方法，我们将我们的RL模型与PRA (Lao et al.，2011a)算法进行了比较，PRA算法已被用于几种推理方法(Gardner et al.，2013;Neelakantan et al.，2015)。PRA是一种数据驱动的寻路算法，采用RW (random walks)算法进行寻路，获取路径特征。

对于基于嵌入的方法，我们评估了几种设计用于知识库完成的最先进的嵌入方法，如TransE (Bordes et al.，2013)、TransH (Wang et al.， 2014)、TransR (Lin et al.，2015)和TransD (Ji et al.，2015)。

PRA的实现是基于(Lao et al.，2011a)的代码。我们使用TopK负模式生成训练样本和测试样本的负样本。对于每个正样本，大约有10个对应的负样本。每个负样本是通过在每个三元组 $(h, r, t)$ 中 $t$ 用假的 $t^{'}$ 替换真实的目标实体而产生的。这些由PRA生成的正负测试对构成了本文所评估的所有方法的测试集。对于TransE,R,H,D，我们使用正向训练实体对为每个推理任务学习一个单独的嵌入矩阵。所有这些嵌入都经过了1000轮的训练。

我们的RL模型利用TransE得到实体和关系的连续表示。我们使用与TransE, R相同的维度来嵌入实体。具体来说，我们使用的状态向量的维数为200，这也是政策网络的输入大小。为了使用路径公式进行推理，我们采用与PRA类似的线性回归方法对路径重新排序。然而，我们简单地使用双向搜索获得的二进制路径特征，而不是使用计算代价昂贵的随机行走概率作为路径特征。我们观察到，与PRA的数据驱动方法相比，我们的方法仅使用少量的挖掘路径公式，就可以获得更好的结果。

4.3 结果

4.3.1 定量结果

链接预测

此任务是对给定查询实体的目标实体进行排序。表2显示了两个数据集的平均平均精度(MAP)结果。

由于基于路径的方法通常比嵌入方法在这个任务中工作得更好，我们不包括其他两个嵌入基线在这个表中。相反，我们腾出空间来展示每个关系推理任务的详细结果。

对于表中最后一行所示的整体MAP，我们的方法在两个数据集上显著优于基于路径的方法和嵌入方法，这验证了我们的RL模型强大的推理能力。对于大多数关系，由于嵌入方法不能使用KG中的路径信息，它们的表现通常比我们的RL模型或PRA模型差。

然而，当实体之间没有足够的路径时，我们的模型和PRA会给出较差的结果。

例如，对于 $f i l m W r i t t e n B y$ ，我们的RL模型只找到了4条唯一的推理路径，这意味着实际上在KG中没有足够的推理证据。

另一点，我们总是在NELL数据集上获得更好的性能。通过分析从KGs中找到的路径，我们认为，潜在的原因是NELL数据集比FB15K-237有更多的短路径，其中一些只是推理关系的同义词。

事实预测

这个任务不是对目标实体进行排序，而是直接对特定关系的所有正样本和负样本进行排序。这里不包括PRA作为基线，因为PRA代码只给出每个查询节点的目标实体排名，而不是所有三元组的排名。表3显示了所有方法的总体结果。我们的RL模型在这个任务上得到了更好的结果。我们还观察到，RL模型在大多数推理任务中击败了所有的嵌入基线。

4.3.2 推理路径的定性分析

为了分析推理路径的属性，我们在表5中展示了代理找到的一些推理路径。

为了说明效率奖励函数的效果，我们展示了图2中的路径长度分布。

为了解释这些路径，以 $p e r s o n n a t i o n a l i t y$ 为例，第一个推理路径表明，如果我们知道 $p l a c e O f B i r t h (x, y)$ 和 $l o c a t i o n C o n t a i n s (z, y)$ ，那么人 $x$ 属于国家 $z$ 是很可能的。这些短但可预测的路径表明了RL模型的有效性。

另一个重要的观察是，我们的模型使用了很多与PRA相比，该模型的推理路径更少，表明该模型能够从KG中提取出最可靠的推理证据。表4显示了一些关于推理路径数量的比较。我们可以看到，通过预先定义的奖励函数，RL代理能够挑选出最强的，并过滤掉类似或不相关的。

4.3.3 监督学习的效果

将RL应用于KG推理的一个主要挑战是大的动作空间。我们通过在奖励再培训步骤之前应用监督学习来解决这个问题。为了显示监督训练的效果，我们评估了不同训练次数的agent在10步内达到目标的成功率。对于每个训练集，使用训练集中的一对实体 $e_{source}, e_{target})$ 来寻找路径。所有连接实体的正确路径将获得+1全局奖励。然后我们插入一些真正的训练路径。succ10是在由100个实体对组成的保留测试集上计算出来的。对于NELL995数据集，由于我们有200个惟一关系，在添加逆向关系操作后，操作空间的维度将是400。这意味着随机游走将变得非常低，因为可能有将近 $400^{10}$ 条无效路径。图三展示训练中的succ10。

我们看到，即使智能体以前没有见过实体，它实际上可以选择有希望的关系来扩展它的路径。这也验证了状态表示的有效性。

5 主要贡献

在本文中，我们提出了一个强化学习框架来提高KGs中关系推理的性能，具体来说，我们训练了一个RL agent来查找知识库中的推理路径。与之前基于随机行走的寻径模型不同，RL模型允许我们控制所找到路径的属性。在许多基于路径的推理方法中，这些有效路径也可以作为PRA的替代方案。对于两个标准推理任务，使用RL路径作为推理公式，我们的方法通常优于两类基线。

6 下一步工作

在未来的研究中，我们计划研究引入对抗学习(Goodfellow et al.，2014)的可能性，以提供比本研究中使用的人类定义的奖励功能更好的奖励。不再根据路径特征来设计奖励，而是训练一个判别模型来给予奖励。此外，为了解决KG没有足够的推理路径时的问题场景，我们有兴趣将我们的RL框架应用到使用KG三元组和文本提及的联合推理。

NLP_知识图谱_大模型——个人学习记录 macken9999 自然语言处理知识图谱大模型自然语言处理知识图谱学习
1.自然语言处理、知识图谱、对话系统三大技术研究与应用https://github.com/lihanghang/NLP-Knowledge-Graph深度学习-自然语言处理(NLP)-知识图谱：知识图谱构建流程【本体构建、知识抽取（实体抽取、关系抽取、属性抽取）、知识表示、知识融合、知识存储】-元気森林-博客园https://www.cnblogs.com/-402/p/16529422.htm
强化学习之 DQN、Double DQN、PPO JNU freshman 强化学习强化学习
文章目录通俗理解DQNDoubleDQNPPO结合公式理解通俗理解DQN一个简单的比喻和分步解释来理解DQN（DeepQ-Network，深度Q网络），就像教小朋友学打游戏一样：先理解基础概念：Q学习（Q-Learning）想象你在教一只小狗玩电子游戏（比如打砖块）。小狗每做一个动作（比如“向左移动”或“发射球”），游戏会给出一个奖励（比如得分增加）或惩罚（比如球掉了）。小狗的目标是通过不断尝试，
Python 强化学习算法实用指南（三）绝不原创的飞龙默认分类默认分类
原文：annas-archive.org/md5/e3819a6747796b03b9288831f4e2b00c译者：飞龙协议：CCBY-NC-SA4.0第十一章：理解黑盒优化算法在前几章中，我们研究了强化学习（RL）算法，从基于价值的方法到基于策略的方法，以及从无模型方法到基于模型的方法。在本章中，我们将提供另一种解决序列任务的方法，那就是使用一类黑盒算法——进化算法（EA）。EAs由进化机制
Python 强化学习算法实用指南（二）
原文：annas-archive.org/md5/e3819a6747796b03b9288831f4e2b00c译者：飞龙协议：CCBY-NC-SA4.0第六章：学习随机优化与PG优化到目前为止，我们已经探讨并开发了基于价值的强化学习算法。这些算法通过学习一个价值函数来找到一个好的策略。尽管它们表现良好，但它们的应用受限于一些内在的限制。在本章中，我们将介绍一类新的算法——策略梯度方法，它们通过
【论文阅读】AdaCtrl: Towards Adaptive and Controllable Reasoning via Difficulty-Aware Budgeting quintus0505 LLM 论文阅读语言模型
AdaCtrl:TowardsAdaptiveandControllableReasoningviaDifficulty-AwareBudgeting3Method3.1长度触发标签作为控制接口（Length-TriggerTagsasControllingInterface）3.2冷启动微调（Cold-startfine-tuning）3.3难度感知的强化学习框架（Difficulty-awar
从数据到智慧：AI原生知识库构建的完整技术栈解析 AI天才研究院 Agentic AI 实战 AI大模型企业级应用开发实战 AI人工智能与大数据 AI-native 大数据 ai
从数据到智慧：AI原生知识库构建的完整技术栈解析关键词AI原生知识库、知识图谱、向量数据库、大语言模型、RAG技术、知识工程、智能问答系统摘要在人工智能飞速发展的今天，构建能够真正理解、组织和应用知识的系统已成为企业数字化转型的核心竞争力。本文将深入剖析AI原生知识库的完整技术栈，从数据采集与预处理，到知识表示与建模，再到存储架构与检索增强生成技术，全方位解读如何将原始数据转化为可行动的智慧。我们
【论文笔记ing】Pointerformer: Deep Reinforced Multi-Pointer Transformer for the Traveling Salesman Problem Booksort online笔记论文论文阅读 transformer 深度学习
论文中使用一个PointerFormer模型编码器部分：可逆残差模型堆叠解码器部分：指针网络自回归对于一次任务而言，推理阶段：编码器部分：一次解码器部分：循环N次，直至任务结束在训练阶段，使用强化学习，对于一个N个节点的TSP实例，算法中会以不同的起点，跑N次，得到N个轨迹，以满足TSP的对称特性，表示这都是属于一个TSP问题的（真实）解然后会计算这样表示归一化奖励，得到一个advantage,然
四、Actor-Critic Methods 沈夢昂志 DRL深度强化学习 python 深度学习
由于在看DRL论文中，很多公式都很难理解。因此最近在学习DRL的基本内容。再此说明，非常推荐B站“王树森老师的DRL强化学习”本文的图表及内容，都是基于王老师课程的后自行理解整理出的内容。目录A.书接上回1、Reinforce算法B.State-ValueFunctionC.PolicyNetWork（Actor）D.ActionValueNetwork(Critic)E.TraintheNeur
Spring Data Neo4j 与后端人工智能算法的数据交互 AI大模型应用实战 spring neo4j 人工智能 ai
SpringDataNeo4j与后端人工智能算法的数据交互关键词：SpringDataNeo4j、图数据库、人工智能算法、数据交互、知识图谱、图神经网络、数据集成摘要：本文深入探讨了如何利用SpringDataNeo4j框架实现后端人工智能算法与图数据库的高效数据交互。文章首先介绍了图数据库和人工智能算法的基本概念，然后详细解析了SpringDataNeo4j的核心架构和原理。接着，通过实际代码示
语言模型 RLHF 实践指南（一）：策略网络、价值网络与 PPO 损失函数
在使用ProximalPolicyOptimization（PPO）对语言模型进行强化学习微调（如RLHF）时，大家经常会问：策略网络的动作概率是怎么来的？价值网络的得分是如何计算的？奖励从哪里来？损失函数怎么构建？微调后的旧轨迹还能用吗？这篇文章将以语言模型强化学习微调为例，结合实际实现和数学公式，深入解析PPO的关键计算流程。1️⃣策略网络：如何计算动作概率？策略网络πθ(a∣s)\pi_\t
知识图谱系列（2）：知识图谱的技术架构与组成要素程序员查理 #知识图谱知识图谱架构人工智能 AI Agent RAG
1.引言知识图谱作为一种强大的知识表示和组织方式，已经在搜索引擎、推荐系统、智能问答等多个领域展现出巨大的价值。在之前的上一篇文章中，我们介绍了知识图谱的基础概念与发展历程，了解了知识图谱的定义、核心特征、发展历史以及在AI发展中的地位与作用。要深入理解和应用知识图谱，我们需要进一步探索其内部的技术架构和组成要素。知识图谱不仅仅是一个简单的数据结构，而是一个复杂的技术体系，涉及知识的表示、存储、查
Python爬虫实战：爬取百度学术摘要信息全流程详解与代码示例 Python爬虫项目 2025年爬虫实战项目 python 爬虫开发语言 scrapy 学习 dubbo 百度
1.前言随着学术资源数字化的普及，百度学术成为学者们常用的论文搜索平台。获取大量论文摘要信息对于文献综述、知识图谱构建等研究极为重要。本文将系统讲解如何利用Python编写爬虫，批量抓取百度学术上的论文摘要。我们将结合最新Python爬虫技术，涵盖基础同步爬虫、异步爬虫、多线程，全面实战演示。2.项目背景与目标百度学术支持通过关键词搜索论文，展示论文标题、作者、期刊、摘要等信息。目标是：根据关键词
【零基础学AI】第33讲：强化学习基础 - 游戏AI智能体 1989 0基础学AI 人工智能游戏 transformer 分类深度学习神经网络
本节课你将学到理解强化学习的基本概念和框架掌握Q-learning算法原理使用Python实现贪吃蛇游戏AI训练能够自主玩游戏的智能体开始之前环境要求Python3.8+PyTorch2.0+Gymnasium(原OpenAIGym)NumPyMatplotlib推荐使用JupyterNotebook进行实验前置知识Python基础编程（第1-8讲）基本数学概念（函数、导数）神经网络基础（第23讲
在Carla上应用深度强化学习实现自动驾驶（一）寒霜似karry 自动驾驶人工智能机器学习
carla环境下基于强化学习的自动驾驶_哔哩哔哩_bilibili本篇文章是小编在pycharm上自己手敲代码学习自动驾驶的第一篇文章，主要讲述如何在Carla中控制我们自己生成的汽车并且使用rgb摄像头传感器获取图像数据。以下代码参考自：（如有侵权，请联系我将立即删除）使用Carla和Python的自动驾驶汽车第2部分——控制汽车并获取传感器数据-CSDN博客1、导入carla（其中的路径根据自
【AI论文】Skywork-Reward-V2：通过人机协同实现偏好数据整理的规模化扩展
摘要：尽管奖励模型（RewardModels，RMs）在基于人类反馈的强化学习（ReinforcementLearningfromHumanFeedback，RLHF）中发挥着关键作用，但当前最先进的开源奖励模型在大多数现有评估基准上表现欠佳，无法捕捉人类复杂且微妙的偏好谱系。即便采用先进训练技术的方法也未能显著提升性能。我们推测，这种脆弱性主要源于偏好数据集的局限性——这些数据集往往范围狭窄、标
AI驱动下的企业学习平台，如何重构员工发展与HR角色 weixin_54980836 人工智能学习重构
近期，JoshBersin官方网站分享了一篇关于L&D领域AI深度变革的文章，文章所描绘的并非仅仅是新工具的涌现，而是一场触及L&D本质与HR战略价值的深刻革命。当Docebo坚定走向“AI原生”，当Sana以知识图谱重构组织智慧，它们揭示的正是我们HR从业者必须直面的未来——AI驱动的学习已不再是效率的提升，而是组织能力与人才价值创造方式的根本性进化。一、超越自动化：AI原生平台对学习本质的重构
多智能体深度强化学习：一项综述 Multi-agent deep reinforcement learning: a survey 资源存储库笔记
Abstract抽象Theadvancesinreinforcementlearninghaverecordedsublimesuccessinvariousdomains.Althoughthemulti-agentdomainhasbeenovershadowedbyitssingle-agentcounterpartduringthisprogress,multi-agentreinforc
r语言改变数据框列名_数据决定离线强化学习将如何改变我们的语言习惯杨_明 python 大数据人工智能 java 机器学习
r语言改变数据框列名重点(Tophighlight)Aridesharingcompanycollectsadatasetofpricinganddiscountdecisionswithcorrespondingchangesincustomeranddriverbehavior,inordertooptimizeadynamicpricingstrategy.Anonlinevendorrec
ReAct (Reason and Act) OR 强化学习（Reinforcement Learning, RL） SugarPPig 人工智能人工智能
这个问题触及了现代AI智能体（Agent）构建的两种核心思想。简单来说，ReAct是一种“调用专家”的模式，而强化学习(RL)是一种“从零试错”的模式。为了让你更清晰地理解，我们从一个生动的比喻开始，然后进行详细的对比。一个生动的比喻想象一下你要完成一项复杂的任务，比如“策划一场完美的生日派对”。ReAct的方式（像一位经验丰富的活动策划师）你是一位知识渊博的专家（大语言模型LLM）。你首先会思考
GNN--知识图谱（逐步贯通基础到项目实践）峙峙峙图神经网络知识图谱人工智能
原文仓库链接：知识图谱–贯通已有知识地图记录知识关系图谱和跨学科碰撞新启发知识图谱mermaid可能需要下载插件才能渲染线性代数神经网络深度学习框架硬件加速图论GNN框架交叉理解前向理解定义：前向理解：A–>B，A为B的基础铺垫知识，通过深入学习A对B有更好的理解01.LinearAlgebraforLinearLayerofNN从线性代数行列变换的角度看神经网络中的线性层线性代数矩阵乘法，可以理
【AI论文】GLM-4.1V-思考：借助可扩展强化学习实现通用多模态推理东临碣石82 人工智能
摘要：我们推出GLM-4.1V-Thinking这一视觉语言模型（VLM），该模型旨在推动通用多模态推理的发展。在本报告中，我们分享了在以推理为核心的训练框架开发过程中的关键发现。我们首先通过大规模预训练开发了一个具备显著潜力的高性能视觉基础模型，可以说该模型为最终性能设定了上限。随后，借助课程采样强化学习（ReinforcementLearningwithCurriculumSampling，R
【心灵鸡汤】深度学习技能形成树：从零基础到AI专家的成长路径全解析智算菩萨人工智能深度学习
引言：技能树的生长哲学在这个人工智能浪潮汹涌的时代，深度学习犹如一棵参天大树，其根系深深扎入数学与计算科学的沃土，主干挺拔地承载着机器学习的核心理念，而枝叶则繁茂地延伸至计算机视觉、自然语言处理、强化学习等各个应用领域。对于初入此领域的新手而言，理解这棵技能树的生长规律，掌握其形成过程中的关键节点和发展阶段，将直接决定其在人工智能道路上能够走多远、攀多高。技能树的概念源于游戏设计，但在学习深度学习
DeepSeek在智能教育评估中的应用：试题检索 AIGC应用创新大全 AI大模型与大数据技术 AI人工智能与大数据应用开发 MCP&Agent 云算力网络 easyui 前端 javascript ai
DeepSeek在智能教育评估中的应用：试题检索关键词：DeepSeek、智能教育、试题检索、自然语言处理、知识图谱、个性化学习、评估系统摘要：本文探讨了DeepSeek大模型在智能教育评估系统中的试题检索应用。我们将深入分析如何利用先进的自然语言处理技术和知识图谱构建高效的试题检索系统，实现个性化学习路径推荐和精准评估。文章将从核心概念、技术原理到实际应用场景，全面解析这一创新教育技术解决方案。
知识图谱的个性化智能教学推荐系统(论文+源码) 毕设工作室_wlzytw python论文项目知识图谱人工智能
目录摘要Abstract目录第1章绪论1.1研究背景及意义1.2国内外研究现状1.2.1知识图谱1.2.2个性化推荐系统1.3本文研究内容及创新点1.4全文组织结构第2章相关理论与技术概述2.1知识图谱2.1.1知识图谱的介绍与发展2.1.2知识图谱的构建2.3协同过滤推荐算法2.2.1推荐算法概述2.2.2Pearson相关系数2.2.3Spearman相关系数2.4Bert模型和Albert模
【机器学习笔记 Ⅱ】10 完整周期
机器学习的完整生命周期（End-to-EndPipeline）机器学习的完整周期涵盖从问题定义到模型部署的全过程，以下是系统化的步骤分解和关键要点：1.问题定义（ProblemDefinition）目标：明确业务需求与机器学习任务的匹配性。关键问题：这是分类、回归、聚类还是强化学习问题？成功的标准是什么？（如准确率>90%、降低10%成本）输出：项目目标文档（含评估指标）。2.数据收集（DataC
大模型RLHF强化学习笔记（二）：强化学习基础梳理Part2 Gravity! 大模型笔记大模型 LLM 强化学习人工智能
【如果笔记对你有帮助，欢迎关注&点赞&收藏，收到正反馈会加快更新！谢谢支持！】一、强化学习基础1.4强化学习分类根据数据来源划分Online：智能体与环境实时交互，如Q-Learning、SARSA、Actor-CriticOffline：智能体使用预先收集的数据集进行学习根据策略更新划分On-Policy：学习和行为策略是相同的，数据是按照当前策略生成的，如SARSAOff-Policy：学习策
爆改RAG！用强化学习让你的检索增强生成系统“开挂”——从小白到王者的实战指南许泽宇的技术分享人工智能
“RAG不准？RL来救场！”——一位被RAG气哭的AI工程师前言：RAG的烦恼与AI炼丹师的自我修养在AI圈混久了，大家都知道RAG（Retrieval-AugmentedGeneration，检索增强生成）是大模型落地的“万金油”方案。无论是企业知识库、智能问答，还是搜索引擎升级，RAG都能插上一脚。但你用过RAG就知道，理想很丰满，现实很骨感。明明知识库里啥都有，问个“量子比特的数学表达式”，
从新闻到知识图谱：用大模型和知识工程“八步成诗”打造科技并购大脑许泽宇的技术分享知识图谱科技人工智能
一句话摘要：本文带你用现代NLP和知识图谱技术，把科技公司并购新闻变成结构化的知识大脑，过程全景揭秘，理论与实战齐飞，代码只用伪代码，干货与段子齐发，助你成为AI知识工程老司机！前言：为什么要把新闻变成知识图谱？想象一下，你是个投资分析师，老板让你一周内梳理全球科技并购大事件，找出谁在买谁、花了多少钱、背后有哪些大佬、涉及哪些新技术……你会怎么做？A.手动Ctrl+F，Excel狂敲，熬夜爆肝？B
机器学习18-强化学习RLHF 坐吃山猪机器学习机器学习人工智能
机器学习18-强化学习RLHF1-什么是RLHFRLHF（ReinforcementLearningfromHumanFeedback）即基于人类反馈的强化学习算法，以下是详细介绍：基本原理RLHF是一种结合了强化学习和人类反馈的机器学习方法。传统的强化学习通常依赖于预定义的奖励函数来指导智能体的学习，而RLHF则通过引入人类的反馈来替代或补充传统的奖励函数。在训练过程中，人类会对智能体的行为或输
构建智能企业知识管理平台：动态知识图谱与语义检索系统 AI天才研究院 Agentic AI 实战 AI大模型企业级应用开发实战 AI人工智能与大数据知识图谱人工智能 ai
构建智能企业知识管理平台：动态知识图谱与语义检索系统关键词：知识管理平台、动态知识图谱、语义检索、知识图谱构建、语义检索算法摘要：本文详细探讨了构建智能企业知识管理平台的核心技术，重点介绍了动态知识图谱和语义检索系统的原理与实现。通过分析知识图谱的构建方法和语义检索算法，结合实际案例，展示了如何利用这些技术提升企业的知识管理水平。文章内容包括背景介绍、核心概念、算法原理、系统架构设计、项目实战以及
springmvc 下 freemarker页面枚举的遍历输出杨白白 enum freemarker
spring mvc freemarker 中遍历枚举 1枚举类型有一个本地方法叫values（），这个方法可以直接返回枚举数组。所以可以利用这个遍历。 enum public enum BooleanEnum { TRUE(Boolean.TRUE, "是"), FALSE(Boolean.FALSE, "否");
实习简要总结 byalias 工作
来白虹不知不觉中已经一个多月了，因为项目还在需求分析及项目架构阶段，自己在这段时间都是在学习相关技术知识，现在对这段时间的工作及学习情况做一个总结：（1）工作技能方面大体分为两个阶段，Java Web 基础阶段和Java EE阶段 1）Java Web阶段在这个阶段，自己主要着重学习了 JSP, Servlet, JDBC, MySQL，这些知识的核心点都过了一遍，也
Quartz——DateIntervalTrigger触发器 eksliang quartz
转载请出自出处：http://eksliang.iteye.com/blog/2208559 一.概述 simpleTrigger 内部实现机制是通过计算间隔时间来计算下次的执行时间，这就导致他有不适合调度的定时任务。例如我们想每天的 1：00AM 执行任务，如果使用 SimpleTrigger，间隔时间就是一天。注意这里就会有一个问题，即当有 misfired 的任务并且恢复执行时，该执行时间
Unix快捷键 18289753290 unix Unix；快捷键;
复制，删除，粘贴： dd:删除光标所在的行 &nbs
获取Android设备屏幕的相关参数酷的飞上天空 android
包含屏幕的分辨率以及屏幕宽度的最大dp 高度最大dp TextView text = (TextView)findViewById(R.id.text); DisplayMetrics dm = new DisplayMetrics(); text.append("getResources().ge
要做物联网？先保护好你的数据蓝儿唯美数据
根据Beecham Research的说法，那些在行业中希望利用物联网的关键领域需要提供更好的安全性。在Beecham的物联网安全威胁图谱上，展示了那些可能产生内外部攻击并且需要通过快速发展的物联网行业加以解决的关键领域。 Beecham Research的技术主管Jon Howes说：“之所以我们目前还没有看到与物联网相关的严重安全事件，是因为目前还没有在大型客户和企业应用中进行部署，也就
Java取模（求余）运算随便小屋 java
整数之间的取模求余运算很好求，但几乎没有遇到过对负数进行取模求余，直接看下面代码： /** * * @author Logic * */ public class Test { public static void main(String[] args) { // TODO A
SQL注入介绍 aijuans sql注入
二、SQL注入范例这里我们根据用户登录页面 <form action="" > 用户名：<input type="text" name="username"><br/> 密码：<input type="password" name="passwor
优雅代码风格 aoyouzi 代码
总结了几点关于优雅代码风格的描述：代码简单：不隐藏设计者的意图，抽象干净利落，控制语句直截了当。接口清晰：类型接口表现力直白，字面表达含义，API 相互呼应以增强可测试性。依赖项少：依赖关系越少越好，依赖少证明内聚程度高，低耦合利于自动测试，便于重构。没有重复：重复代码意味着某些概念或想法没有在代码中良好的体现，及时重构消除重复。战术分层：代码分层清晰，隔离明确，
布尔数组百合不是茶 java 布尔数组
androi中提到了布尔数组; 布尔数组默认的是false, 并且只会打印false或者是true 布尔数组的例子; 根据字符数组创建布尔数组 char[] c = {'p','u','b','l','i','c'}; //根据字符数组的长度创建布尔数组的个数 boolean[] b = new bool
web.xml之welcome-file-list、error-page bijian1013 java web.xml servlet error-page
welcome-file-list 1.定义： <welcome-file-list> <welcome-file>login.jsp</welcome> </welcome-file-list> 2.作用：用来指定WEB应用首页名称。 error-page1.定义： <error-page&g
richfaces 4 fileUpload组件删除上传的文件 sunjing clear Richfaces 4 fileupload
页面代码 <h:form id="fileForm"> <rich:
技术文章备忘 bit1129 技术文章
Zookeeper http://wenku.baidu.com/view/bab171ffaef8941ea76e05b8.html http://wenku.baidu.com/link?url=8thAIwFTnPh2KL2b0p1V7XSgmF9ZEFgw4V_MkIpA9j8BX2rDQMPgK5l3wcs9oBTxeekOnm5P3BK8c6K2DWynq9nfUCkRlTt9uV
org.hibernate.hql.ast.QuerySyntaxException: unexpected token: on near line 1解决方案白糖_ Hibernate
文章摘自：http://blog.csdn.net/yangwawa19870921/article/details/7553181 在编写HQL时，可能会出现这种代码： select a.name,b.age from TableA a left join TableB b on a.id=b.id 如果这是HQL，那么这段代码就是错误的，因为HQL不支持
sqlserver按照字段内容进行排序 bozch 按照内容排序
在做项目的时候，遇到了这样的一个需求：从数据库中取出的数据集，首先要将某个数据或者多个数据按照地段内容放到前面显示，例如:从学生表中取出姓李的放到数据集的前面； select * fro
编程珠玑-第一章-位图排序 bylijinnan java 编程珠玑
import java.io.BufferedWriter; import java.io.File; import java.io.FileWriter; import java.io.IOException; import java.io.Writer; import java.util.Random; public class BitMapSearch {
Java关于==和equals chenbowen00 java
关于==和equals概念其实很简单，一个是比较内存地址是否相同，一个比较的是值内容是否相同。虽然理解上不难，但是有时存在一些理解误区，如下情况： 1、 String a = "aaa"; a=="aaa"; ==> true 2、 new String("aaa")==new String("aaa
[IT与资本]软件行业需对外界投资热情保持警惕 comsci it
我还是那个看法,软件行业需要增强内生动力,尽量依靠自有资金和营业收入来进行经营,避免在资本市场上经受各种不同类型的风险,为企业自主研发核心技术和产品提供稳定,温和的外部环境... 如果我们在自己尚未掌握核心技术之前,企图依靠上市来筹集资金,然后使劲往某个领域砸钱,然
oracle 数据块结构 daizj oracle 块数据块块结构行目录
oracle 数据块是数据库存储的最小单位，一般为操作系统块的N倍。其结构为：块头－－〉空行－－〉数据，其实际为纵行结构。块的标准大小由初始化参数DB_BLOCK_SIZE指定。具有标准大小的块称为标准块（Standard Block）。块的大小和标准块的大小不同的块叫非标准块（Nonstandard Block）。同一数据库中，Oracle9i及以上版本支持同一数据库中同时使用标
github上一些觉得对自己工作有用的项目收集 dengkane github
github上一些觉得对自己工作有用的项目收集技能类 markdown语法中文说明回到顶部全文检索 elasticsearch bigdesk elasticsearch管理插件回到顶部 nosql mapdb 支持亿级别map, list, 支持事务. 可考虑做为缓存使用 C
初二上学期难记单词二 dcj3sjt126com english word
dangerous 危险的 panda 熊猫 lion 狮子 elephant 象 monkey 猴子 tiger 老虎 deer 鹿 snake 蛇 rabbit 兔子 duck 鸭 horse 马 forest 森林 fall 跌倒；落下 climb 爬；攀登 finish 完成；结束 cinema 电影院；电影 seafood 海鲜；海产食品 bank 银行
8、mysql外键(FOREIGN KEY)的简单使用 dcj3sjt126com mysql
一、基本概念 1、MySQL中“键”和“索引”的定义相同，所以外键和主键一样也是索引的一种。不同的是MySQL会自动为所有表的主键进行索引，但是外键字段必须由用户进行明确的索引。用于外键关系的字段必须在所有的参照表中进行明确地索引，InnoDB不能自动地创建索引。 2、外键可以是一对一的，一个表的记录只能与另一个表的一条记录连接，或者是一对多的，一个表的记录与另一个表的多条记录连接。 3、如
java循环标签 Foreach shuizhaosi888 标签 java循环 foreach
1. 简单的for循环 public static void main(String[] args) { for (int i = 1, y = i + 10; i < 5 && y < 12; i++, y = i * 2) { System.err.println("i=" + i + " y="
Spring Security（05）——异常信息本地化 234390216 exception Spring Security 异常信息本地化
异常信息本地化 Spring Security支持将展现给终端用户看的异常信息本地化，这些信息包括认证失败、访问被拒绝等。而对于展现给开发者看的异常信息和日志信息（如配置错误）则是不能够进行本地化的，它们是以英文硬编码在Spring Security的代码中的。在Spring-Security-core-x
DUBBO架构服务端告警Failed to send message Response javamingtingzhao 架构 DUBBO
废话不多说，警告日志如下，不知道有哪位遇到过，此异常在服务端抛出(服务器启动第一次运行会有这个警告)，后续运行没问题，找了好久真心不知道哪里错了。 WARN 2015-07-18 22:31:15,272 com.alibaba.dubbo.remoting.transport.dispatcher.ChannelEventRunnable.run(84)
JS中Date对象中几个用法 leeqq JavaScript Date 最后一天
近来工作中遇到这样的两个需求 1. 给个Date对象，找出该时间所在月的第一天和最后一天 2. 给个Date对象，找出该时间所在周的第一天和最后一天需求1中的找月第一天很简单，我记得api中有setDate方法可以使用使用setDate方法前，先看看getDate var date = new Date(); console.log(date); // Sat J
MFC中使用ado技术操作数据库你不认识的休道人 sql mfc
1.在stdafx.h中导入ado动态链接库 #import"C:\Program Files\Common Files\System\ado\msado15.dll" no_namespace rename("EOF","end")2.在CTestApp文件的InitInstance()函数中domodal之前写::CoIniti
Android Studio加速 rensanning android studio
Android Studio慢、吃内存！启动时后会立即通过Gradle来sync & build工程。（1）设置Android Studio a) 禁用插件 File -> Settings... Plugins 去掉一些没有用的插件。比如：Git Integration、GitHub、Google Cloud Testing、Google Cloud
各数据库的批量Update操作 tomcat_oracle java oracle sql mysql sqlite
MyBatis的update元素的用法与insert元素基本相同，因此本篇不打算重复了。本篇仅记录批量update操作的 sql语句，懂得SQL语句，那么MyBatis部分的操作就简单了。　　注意：下列批量更新语句都是作为一个事务整体执行，要不全部成功，要不全部回滚。 MSSQL的SQL语句　WITH R AS（　　SELECT 'John' as name, 18 as
html禁止清除input文本输入缓存 xp9802 input
多数浏览器默认会缓存input的值，只有使用ctl+F5强制刷新的才可以清除缓存记录。如果不想让浏览器缓存input的值，有2种方法：方法一：在不想使用缓存的input中添加 autocomplete="off"; eg: <input type="text" autocomplete="off" name