Trouble..

CasRel：A Novel Cascade Binary Tagging Framework for Relational Triple Extraction 论文解读

A Novel Cascade Binary Tagging Framework for Relational Triple Extraction

论文：1909.03227.pdf (arxiv.org)

代码：github.com

期刊/会议：ACL 2020

摘要

从非结构化文本中抽取关系三元组对于大规模知识图构建至关重要。然而，现有的工作很少能解决重叠三元组问题，即同一句子中的多个关系三元组共享相同的实体。在这项工作中，我们引入了一个新的视角来重新审视关系三重抽取任务，并提出了一种新的级联二元标记框架（CASREL），该框架源自一个原则性问题公式。我们的新框架将关系建模为将句子中的subject映射到object的函数，而不是像以前的作品那样将关系视为离散标签，这自然会处理重叠问题。实验表明，即使其编码器模块使用随机初始化的BERT编码器，CASREL框架已经优于现有技术的方法，显示了新标记框架的效果。当采用预训练的BERT编码器时，它的性能进一步提高，在两个公共数据集NYT和WebNLG上，F1得分分别以17.5和30.2的绝对增益超过最强基线。对重叠三元组的不同场景的深入分析表明，该方法在所有这些场景中提供了一致的性能增益。

1、简介

关系三元组抽取的早期工作采用流水线方法（Zelenko等人，2003年；Zhou等人，2005年；Chan和Roth，2011年）。它首先识别句子中的所有实体，然后对每个实体对执行关系分类。由于早期阶段中的错误不能在后期阶段中被纠正，因此这种方法倾向于遭受错误传播问题。为了解决这个问题，随后的工作提出了实体和关系的联合学习，其中包括基于特征的模型（Yu和Lam，2010；Li和Ji，2014；Miwa和Sasaki，2014；Ren等人，2017），以及最近的基于神经网络的模型（Gupta等人，2016；Katiyar和Cardie，2017；Zheng等人，2014；Zeng等人，2018；Fu等人，2019）。通过用学习表示代替人工构建的特征，神经网络模型在三元组抽取任务中取得了相当大的成功。

然而，大多数现有方法不能有效地处理句子包含多个相互重叠的关系三元组的场景。图1说明了这些场景，其中三元组在一个句子中共享一个或两个实体。这种重叠的三元组问题直接挑战了传统的序列标记方案，该方案假设每个token只带有一个标签（Zheng等人，2017）。这也给关系分类方法带来了很大的困难，其中假设实体对最多持有一个关系（Miwa和Bansal，2016）。Zeng等人（2018）是最早考虑关系三元组抽取中重叠三元组问题的人之一。他们介绍了不同重叠模式的类别，如图1所示，并提出了一个具有复制机制的序列到序列（Seq2Seq）模型来抽取三元组。基于Seq2Seq模型，他们进一步研究了抽取顺序的影响（Zeng等人，2019），并通过强化学习获得了显著的改进。Fu等人（2019）还通过使用基于图卷积网络（GCN）的模型将文本建模为关系图，研究了重叠三元组问题。

尽管他们取得了成功，但以前关于抽取重叠三元组的工作仍有很多不足之处。具体来说，它们都将关系视为要分配给实体对的离散标签。这个公式使得关系分类成为一个困难的机器学习问题。首先，类别分布高度不平衡。在所有抽取的实体对中，大多数都没有形成有效的关系，产生了太多负样本。第二，当同一实体参与多个有效关系（重叠的三元组）时，分类器可能会被混淆。如果没有足够的训练实例，分类器很难判断实体参与了哪个关系。因此，抽取的三元组通常是不完整和不准确的。

在这项工作中，我们从三重层次的关系三重抽取权的原则公式开始。这产生了一个通用的算法框架，通过设计来处理重叠的三重问题。该框架的核心是一个全新的视角，即我们可以将关系建模为将subject映射到object的函数，而不是将关系视为实体对上的离散标签。更准确地说，我们学习关系特定标签 $f_r(s)→ o$ ，代替学习关系分类器 $f (s, o) \to r$ ，其中每一个识别特定关系下给定subject的可能object；或不返回object，表示给定的subject和object不存在三元组。在这个框架下，三元组抽取是一个两步过程：首先我们识别句子中所有可能的subject；然后，对于每个subject，我们应用特定于关系的标记符来同时识别所有可能的关系和对应的object。

我们在端到端级联二元标记框架CASREL中实现了上述思想。它由基于BERT的编码器模块、subject标记模块和特定关系object标记模块组成。经验实验表明，即使在BERT编码器未经预训练的情况下，所提出的框架仍以较大幅度优于SOTA方法，表明了新框架本身的优越性。在采用预训练的BERT编码器后，该框架获得了更大的性能增益，表明了丰富的先验知识在三元组抽取任务中的重要性。

这项工作有以下主要贡献：

我们引入了一个新的视角来重新审视关系三元组抽取任务，并提出了一个原则性的问题公式，这意味着一个通过设计解决重叠三元组问题的通用算法框架。
我们将上述框架实例化为Transformer编码器之上的一个新的级联二元标记模型。这允许该模型将新颖标记框架的功能与预训练的大规模语言模型中的先验知识相结合。
在两个公共数据集上的广泛实验表明，所提出的框架显著优于最先进的方法，在两个数据集上分别获得17.5和30.2的F1分数绝对增益。详细分析表明，我们的模型在所有场景中都得到了一致的改进。

2、相关工作

从非结构化自然语言文本中抽取关系三元组是信息抽取（IE）中一项研究得很好的任务。这也是构建大规模知识图（KG）的重要步骤，如DBpedia（Auer等人，2007）、Freebase（Bollacker等人，2008）和knowledge V ault（Dong等人，2014）。

早期的工作（Mintz等人，2009年；Gormley等人，2015年）以流水线方式解决了这项任务。他们在两个单独的步骤中抽取关系三元组：1）首先对输入句子运行命名实体识别（NER）以识别所有实体，2）然后对抽取的实体对运行关系分类（RC）。流水线方法通常存在误差传播问题，并且忽略了两个步骤之间的相关性。为了缓解这些问题，已经提出了许多旨在共同学习实体和关系的联合模型。传统的联合模型（Yu和Lam，2010；Li和Ji，2014；Miwa和Sasaki，2014；Ren等人，2017）是基于特征的，严重依赖特征工程，需要大量的人工工作。为了减少人工工作，最近的研究已经研究了基于神经网络的方法，这些方法可以提供最先进的性能。然而，大多数现有的神经模型（如Miwa和Bansal，2016）仅通过参数共享而不是联合解码来实现实体和关系的联合学习。为了获得关系三元组，他们仍然必须将检测到的实体对流水线到关系分类器，以识别实体的关系。分离的解码设置导致实体和关系的分离的训练目标，这带来了无法充分利用预测的实体和关系之间的三级依赖性的缺点。与这些工作不同，Zheng等人（2017）通过引入统一的标记方案来实现联合解码，并将关系三元组抽取任务转换为端到端序列标记问题，而无需NER或RC。由于实体和关系的信息被集成到统一的标记方案中，因此所提出的方法可以在三元组水平上将关系三元组作为一个整体直接建模。

尽管联合模型（有或没有联合解码）已经得到了很好的研究，但大多数以前的工作都忽略了重叠关系三元组的问题。Zeng等人（2018）引入了三种重叠的三元组模式，并试图通过具有复制机制的序列到序列模型来解决这个问题。最近，Fu等人（2019）也研究了该问题，并提出了一种基于图卷积网络（GCN）的方法。尽管最初取得了成功，但这两种方法仍然将关系视为实体对的离散标签，使得模型很难学习重叠的三元组。

我们的框架基于一个精心设计的训练目标，将关系三元组作为一个整体直接建模（Zheng等人，2017），即通过联合解码学习实体和关系。此外，我们将关系建模为将subject映射到object的函数，这使得它与以前的作品有着重大不同。

3、Casrel框架

关系三元组抽取的目标是识别句子中所有可能的（subject、relation、object）三元组，其中一些三元组可能与subject或object共享相同的实体。为了实现这一目标，我们直接对三元组水平进行建模，并在三元组水平上设计训练目标。这与之前的方法（Fu等人，2019）形成了对比，在这种方法中，单独为实体和关系定义了训练目标，而没有在三元组中明确建模其集成。

形式上，给定来自训练集 $D$ 的标注语句 $x_j$ 和 $x_j$ 中的一组可能重叠的三元组 $T_j=\{(s,r,o)\}$ ，我们的目标是最大化训练集 $D$ 中的数据似然性：
$\prod_{j=1}^{|D|} \left [ \prod_{(s,r,o) \in T_j}p((s,r,o)|x_j) \right]$

$=\prod_{j=1}^{|D|} \left [ \prod_{s \in T_j}p(s|x_j) \prod_{(r,o) \in T_j|s}p((r,o)|s,x_j) \right]$

$=\prod_{j=1}^{|D|} \left [ \prod_{s \in T_j}p(s|x_j) \prod_{r \in T_j|s}p(o|s,x_j) \prod_{r \in R \setminus T_j|s}p_r(o_{\phi}|s,x_j) \right]$

这里我们稍微滥用了符号 $T_j$ 。 $s∈T_j$ 表示出现在 $T_j$ 中的三元组中的subject。 $T_j|s$ 是 $T_j$ 中subject $s$ 引导的三元组集合。 $r,o)∈T_j|s$ 是由 $T_j$ 中的subject $s$ 引导的三元组中的 $(r, o)$ 对。 $r$ 是所有可能关系的集合。 $\setminus T_j|s$ 表示除 $T_j$ 中以 $s$ 为首的关系之外的所有关系。 $o_∅$ 表示“空”对象（如下所述）。

等式（2）应用概率链式法则。等式（3）利用了一个关键事实，即对于给定的subject $s$ ，任何与 $s$ 相关的关系（ $T_j|s$ 中的关系）都会导致句子中相应的object，而所有其他关系都必然在句子中没有object，即“空”object。

这种方法提供了几个好处。首先，由于数据似然性从三元组开始，因此优化该似然性对应于直接优化三元组的最终评估标准。其次，通过不假设多个三元组如何共享句子中的实体，它通过设计处理了重叠的三元组问题。第三，等式（3）中的分解启发了一种新的三元组抽取标记方案：我们学习了一个识别句子中subject实体的subject标记器 $p(s|x_j)$ ；对于每个关系 $r$ ，我们学习一个object标记器 $p_r(o|s,x_j)$ ，它识别给定subject的特定关系的object。通过这种方式，我们可以将每个关系建模为将subject映射到object的函数，而不是对（subject、object）对的关系进行分类。

事实上，这种新颖的标记方案允许我们一次抽取多个三元组：我们首先运行subject标记器来查找句子中所有可能的主题，然后针对找到的每个主题，应用特定关系的object标记器来找到所有相关的关系和对应的object。

上述通用框架中的关键组件，即subject标记器和特定关系的object标记器，可以以多种方式实例化。在本文中，我们将它们实例化为深度双向Transformer BERT之上的二元标记器（Devlin等人，2019）。我们将在下面描述其细节。

3.1 BERT编码器

编码器模块从句子 $x_j$ 中抽取特征信息 $x_j$ ，其将被馈送到后续的标记模块中。我们使用预训练的BERT模型（Devlin等人，2019）来编码上下文信息。

这里我们简要回顾了BERT，一种基于多层双向Transformer的语言表示模型。它旨在通过对每个单词的左右上下文进行联合调节来学习深度表达，最近在许多下游任务中被证明非常有效（Zhong等人，2019）。具体来说，它由 $N$ 个相同的Transformer块组成。我们将Transformer块表示为 $T r an s (x)$ ，其中 $x$ 表示输入向量。具体操作如下：
$h_o=SW_s+W_p$

$h_{\alpha}=Trans(h_{\alpha-1}),\alpha \in [1,N]$

其中 $S$ 是输入句子中子词索引，是一个one-hot的矩阵， $W_s$ 是子词嵌入矩阵， $W_p$ 是位置嵌入矩阵，其中 $p$ 表示输入序列中的位置索引， $h_α$ 是隐藏状态向量，即，第 $α$ 层输入句子的上下文表示， $N$ 是Transformer块的数量。注意，在我们的工作中，输入是单个文本句子，而不是句子对，因此等式（4）中没有考虑原始BERT论文中描述的分段嵌入。有关Transformer结构的更全面描述，请参阅（Vaswani等人，2017）。

3.2 级联解码器

现在，我们描述受先前公式启发的新颖级联二元标记方案的实例化。基本思想是在两个级联步骤中抽取三元组。首先，我们从输入句子中检测subject。然后，对于每一个候选subject，我们检查所有可能的关系，看看一个关系是否可以将句子中的object与该subject相关联。对应于这两个步骤，级联解码器由两个模块组成，如图2所示：subject标记器；以及一组特定于关系的object标记器。

subject标记器：低级标记模块被设计为通过直接解码由 $N$ 层BERT编码器产生的编码向量 $h_N$ 来识别输入句子中的所有可能subject。更准确地说，它采用两个相同的二元分类器，通过为每个token分配指示当前token是否对应于subject的开始位置或结束位置的二元标记（0/1）来分别检测subject的开始和结束位置。subject标记器对每个token的详细操作如下：
$p_i^{start-s}=\sigma(W_{start}x_i+b_{start})$

$p_i^{end-s}=\sigma(W_{end}x_i+b_{end})$

$p_i^{start-s},p_i^{end-s}$ 分别表示将输入序列中的第 $i$ 个token识别为subject的开始和结束位置的概率。如果概率超过某个阈值，则对应的token将被分配有标签1，否则将被分配标签0。 $x_i$ 是输入序列中第 $i$ 个标记的编码表示，即 $x_i=h_N[i]$ ，其中 $W (\cdot)$ 表示可训练权重， $b (\cdot)$ 是偏差， $σ$ 是sigmoid激活函数。

subject标记器优化了以下似然函数，以识别给定句子表示 $x$ 的subject跨度：
$p_{\theta}(s|x)=\prod_{t \in \{start-s,end-s \}} \prod_{i=1}^L (p_i^t)^{I\{y_i^t=1\}} (1-p_i^t)^{I\{y_i^t=0\}}$
其中 $L$ 是句子的长度。如果 $z$ 为真，则 $I\{z\}＝1$ ，否则为0。 $y^{start-s}_i$ 是 $x$ 中第 $i$ 个token的subject开始位置的二元标记， $y^{end-s}_i$ 表示subject结束位置。参数 $θ＝\{W_{start},b_{start},W_{end},b_{end}\}$ 。

对于多个subject检测，我们采用最近开始-结束对匹配原则，根据开始和结束位置标记器的结果来确定任何subject的跨度。例如，如图2所示，距离第一个开始标记“Jackie”最近的结束标记是“Brown”，因此第一个主题跨度的检测结果将是“Jackie R. Brown”。值得注意的是，为了将结束标记与给定的开始标记匹配，我们不考虑位置在给定token位置之前的标记。如果由于给定句子中任何实体跨度的自然连续性而正确检测到开始和结束位置，则这种匹配策略能够保持任何实体跨度。

特定关系的object标记器：高层标记模块同时识别object以及与在较低级别获得的subject相关的关系。如图2所示，它由一组特定关系的object标记器组成，其结构与底层模块中的subject标记器相同，适用于所有可能的关系。所有object标记器将同时识别每个检测subject的对应object。与直接解码编码向量 $h_N$ 的subject标记器不同，关系特定object标记器也考虑了subject特征。关系特定object标记器对每个token的详细操作如下：
$p_i^{start-o}=\sigma (W_{start}^r (x_i+v_{sub}^k)+b_{start}^r)$

$p_i^{end-o}=\sigma (W_{end}^r (x_i+v_{sub}^k)+b_{end}^r)$

其中 $p^{start-o}_i$ 和 $p^{end-o}_i$ 表示将输入序列中的第 $i$ 个token分别识别为object的开始和结束位置的概率， $v^k_{sub}$ 表示在低级别模块中检测到的第 $k$ 个subject的编码表示向量。

对于每个subject，我们对其重复应用相同的解码过程。请注意，subject通常由多个标记组成，为了使等式（9）和等式（10）中的 $x_i$ 和 $v^{k}_{sub}$ 相加成为可能，我们需要保持两个向量的维数一致。为此，我们将第 $k$ 个subject的开始和结束标记之间的平均向量表示作为 $v^k_{sub}$ 。

关系 $r$ 的object标记器优化了以下似然函数，以识别给定句子表示 $x$ 和subject $s$ 的object $o$ 的跨度：
$p_{\phi_r}(o|s,x)=\prod_{t \in \{start-o,end-o \}} \prod_{i=1}^L (p_i^t)^{I\{y_i^t=1\}} (1-p_i^t)^{I\{y_i^t=0\}}$
其中， $y^{start-o}_i$ 是 $x$ 中第 $i$ 个token的object开始位置的二元标记， $y^{end-o}_i$ 是第 $i$ 个token的object结束位置的标记。对于“空”对象 $o_∅$ ，标记 $y^{{start-o}_∅}_i=y^{{end-o}_∅}_i=0$ 表示所有 $i$ 。参数 $\phi_r=\{W^r_{start},b^r_{start},W^r_{end},b^r_{end}\}$ 。

注意，在高级标记模块中，关系也由object标记器的输出决定。例如，检测到的subject“Jackie R. Brown”和候选object“Washington”。因此，关系“Work in”的object标记器不会识别“Washington”的跨度，即开始和结束位置的输出都为零，如图2所示。相反，“Birth_place”在“Jackie R. Brown”和“Washington”之间存在关系，因此相应的object标记器输出候选对象“Washington”的跨度。在此设置中，高级模块能够同时识别与在低级模块中检测到的subject相关的关系和object。

3.3 Data Log-likelihood Objective

$J(\Theta)=\sum_{j=1}^{|D|} \left[\sum_{s \in T_j} \log p_{\theta}(s|x_j)+\sum_{r \in T_j|s} \log p_{\phi_r}(o|s,x_j)+\sum_{r \in R \setminus T_j|s } \log p_{\phi_r}(o_{\phi}|s,x_j) \right]$

$\Theta=\{ \theta,\{\phi_r\}_{r \in R} \}$ ， $p_{\theta}(s|x)$ 在公式8中被定义， $p_{\phi_r}(o|s,x)$ 在公式11中被定义，我们最大化 $J(\Theta)$ 作为训练目标。

4、实验

4.1 实验设置

数据集和评估指标：NYT、WebNLG；Precision、Recall、F1-score。

4.2 实验结果

5、总结

在本文中，我们介绍了一种新的级联二元标记框架（CASREL），该框架源自关系三元组抽取的原则问题公式。我们没有将关系建模为实体对的离散标签，而是将关系建模成将subject映射到object的函数，这为重新访问关系三重抽取任务提供了一个新的视角。因此，我们的模型可以同时从句子中抽取多个关系三元组，而不会出现重叠问题。我们在两个广泛使用的数据集上进行了广泛的实验，以验证所提出的CASREL框架的有效性。实验结果表明，我们的模型在不同的场景下，尤其是在抽取重叠的关系三元组方面，显著优于当前状态基线。

最近工作

自然语言处理和计算机视觉相关论文总结

颠覆人机交互！多模态 AI Agents 大模型如何用 5 大模式开启智能新时代？
注：此文章内容均节选自充电了么创始人，CEO兼CTO陈敬雷老师的新书《GPT多模态大模型与AIAgent智能体》（跟我一起学人工智能）【陈敬雷编著】【清华大学出版社】GPT多模态大模型与AIAgent智能体书籍本章配套视频课程【陈敬雷】文章目录GPT多模态大模型与AIAgent智能体系列七颠覆人机交互！多模态AIAgents大模型如何用5大模式开启智能新时代？一、从“单一感知”到“多模态融合”：A
实操 SpringBoot+MCP！清风孤客 spring boot 后端 java 人工智能
引言随着人工智能的飞速发展，大语言模型(LLM)正在革命性地重塑用户与软件的交互范式。想象一下这样的场景：用户无需钻研复杂的API文档或者在繁琐的表单间来回切换，只需通过自然语言直接与系统对话——“帮我查找所有2023年出版的图书”、“创建一个新用户叫张三，邮箱是[email protected]”。这种直观、流畅的交互方式不仅能显著降低新用户的学习曲线，更能大幅削减B端系统的培训成本和实施
如何学习智能体搭建
如何学习智能体搭建前言随着人工智能的发展，智能体（Agent）成为自动化、交互式应用和自主决策系统中的核心角色。本书将从零基础出发，系统讲解智能体的基本原理、常见框架、实战搭建与进阶技巧，帮助你快速上手并应用于实际项目。目录智能体基础认知智能体的核心组成主流智能体开发框架本地智能体与云端智能体选型智能体的任务自动化与插件集成智能体的知识检索与上下文管理智能体的多模态扩展智能体安全与可控性智能体实战
Char Studio 使用入门：高效构建企业级对话系统的实战指南 charles666666 人工智能产品经理语言模型自然语言处理架构
数字化浪潮推动下，企业与用户的交互模式正经历深刻变革，对话系统作为核心交互手段，其重要性日益凸显。然而，众多企业在构建对话系统时，却深陷诸多困境，难以自拔。一、开篇痛点场景：企业对话系统开发的典型困境企业在自行开发对话系统时，往往面临预算超支、周期漫长以及维护成本居高不下等问题。开发团队需要投入大量时间和精力进行底层技术架构的搭建，例如自然语言处理算法的研究、对话逻辑的设计等，这不仅消耗了大量的人
[特殊字符] AlphaGo：“神之一手”背后的智能革命与人机博弈新纪元大千AI助手人工智能 Python #OTHER 人工智能算法数据挖掘机器学习 alphago google 围棋
从围棋棋盘到科学前沿的通用人工智能范式突破本文由「大千AI助手」原创发布，专注用真话讲AI，回归技术本质。拒绝神话或妖魔化。搜索「大千AI助手」关注我，一起撕掉过度包装，学习真实的AI技术！一、核心定义与历史意义AlphaGo是由谷歌DeepMind团队开发的围棋人工智能程序，其里程碑意义在于：首破人类围棋壁垒：2016年以4:1击败世界冠军李世石九段，成为首个在完整对局中战胜人类顶尖棋手的AI。
量化价值投资中的深度学习技术：TensorFlow实战
量化价值投资中的深度学习技术：TensorFlow实战关键词：量化价值投资,深度学习,TensorFlow,股票预测,因子模型,LSTM神经网络,量化策略摘要：本文将带你走进"量化价值投资"与"深度学习"的交叉地带，用小学生都能听懂的语言解释复杂概念，再通过手把手的TensorFlow实战案例，教你如何用AI技术挖掘股票市场中的价值宝藏。我们会从传统价值投资的痛点出发，揭示深度学习如何像"超级分析
【人工智能】Spring AI Alibaba，一个面向 Java 开发者的开源框架，它旨在简化将人工智能（AI）功能集成到应用程序中的过程。本本本添哥 A -AIGC 人工智能大模型人工智能 java spring
一、SpringAIAlibaba介绍SpringAIAlibaba是一个面向Java开发者的开源框架，它旨在简化将人工智能（AI）功能集成到应用程序中的过程。该项目基于SpringAI构建，并且是阿里云通义系列模型及服务在JavaAI应用开发领域的最佳实践。SpringAIAlibaba的目标是为开发者提供一套高层次的AIAPI抽象以及与云原生基础设施的深度集成方案，从而帮助他们快速构建智能应用
模型融合与人机协同：构建人机共生的智能未来 AI天才研究院 Agentic AI 实战计算 AI人工智能与大数据计算科学神经计算深度学习神经网络大数据人工智能大型语言模型 AI AGI LLM Java Python 架构设计 Agent RPA
1.背景介绍在科技日新月异的今天，人工智能（AI）已经成为了我们生活中不可或缺的一部分。从智能手机，到自动驾驶汽车，再到医疗诊断，AI的应用已经渗透到了我们生活的方方面面。然而，尽管AI的发展已经取得了显著的成就，但是我们仍然面临着一个重大的挑战：如何让AI系统更好地理解和适应人类的需求，以实现人机共生的智能未来。为了解决这个问题，越来越多的研究者开始探索模型融合和人机协同的方法。2.核心概念与联
vLLM 优化与调优：提升模型性能的关键策略强哥之神人工智能深度学习计算机视觉 deepseek 智能体 vllm
在当今人工智能领域，大语言模型（LLM）的应用日益广泛，而优化和调优这些模型的性能成为了至关重要的任务。vLLM作为一种高效的推理引擎，提供了多种策略来提升模型的性能。本文将深入探讨vLLMV1的优化与调优策略，帮助读者更好地理解和应用这些技术。抢占式调度（Preemption）由于Transformer架构的自回归特性，有时键值缓存（KVcache）空间不足以处理所有批量请求。在这种情况下，vL
Spring Data Neo4j 与后端人工智能算法的数据交互 AI大模型应用实战 spring neo4j 人工智能 ai
SpringDataNeo4j与后端人工智能算法的数据交互关键词：SpringDataNeo4j、图数据库、人工智能算法、数据交互、知识图谱、图神经网络、数据集成摘要：本文深入探讨了如何利用SpringDataNeo4j框架实现后端人工智能算法与图数据库的高效数据交互。文章首先介绍了图数据库和人工智能算法的基本概念，然后详细解析了SpringDataNeo4j的核心架构和原理。接着，通过实际代码示
ResNet：深度卷积神经网络的里程碑心想事“程” 小知识点 cnn 人工智能神经网络
一、引言在深度学习的发展历程中，深度卷积神经网络（CNN）不断演进，旨在提升对图像等数据的特征提取与分类能力。然而，随着网络层数的增加，传统CNN面临着梯度消失、梯度爆炸以及退化等棘手问题，训练变得愈发困难。2015年，由微软研究院提出的ResNet（ResidualNetworks，残差网络）横空出世，它以独特的残差学习思想，成功攻克了这些难题，在ImageNet竞赛中大放异彩，开创了深度神经网
视觉算法之卷积神经网络清风AI 深度学习算法详解及代码复现计算机视觉 cnn 神经网络深度学习 python 课程设计毕业设计
定义与特点卷积神经网络(ConvolutionalNeuralNetwork,CNN)是一种专为处理具有网格结构的数据而设计的深度学习模型。其独特的结构和功能使其在图像处理、语音识别等领域展现出卓越的性能:CNN的核心设计理念源于对生物视觉系统的模仿。通过模拟大脑皮层中视网膜和视觉皮层的层次化结构,CNN能够有效地捕捉图像中的局部特征并逐步抽象为高层语义信息。这种设计使得CNN特别擅长处理图像和音
卷积神经网络架构的演进：从AlexNet到EfficientNet t0_54manong 大数据与人工智能 cnn 架构人工智能个人开发
在过去的8.5年里，深度学习取得了飞速的进步。回溯到2012年，AlexNet在ImageNet上的Top-1准确率仅为63.3%，而如今，借助EfficientNet架构和师生训练法，我们已经能达到超过90%的准确率。本文将聚焦于卷积神经网络（CNN）架构的演变，深入探究其背后的基本原理。一些关键术语在深入了解各种架构之前，我们需要明确几个关键术语。更宽的网络意味着卷积层中有更多的特征图（滤波器
【AI大模型】深入解析预训练：大模型时代的核心引擎我爱一条柴ya 学习AI记录深度学习人工智能 ai python AI编程算法
预训练已成为现代人工智能，尤其是自然语言处理和计算机视觉领域的基石技术。它彻底改变了模型开发范式，催生了BERT、GPT等革命性模型。本文将系统阐述预训练的核心概念、原理、方法、应用及挑战。一、预训练的本质：为何需要它？核心问题：数据标注的瓶颈监督学习依赖海量高质量标注数据，获取成本极高（时间、金钱、专业知识）。对于复杂任务（如理解语义、生成文本），标注难度呈指数级上升。标注数据稀缺导致模型泛化能
广州曼顿2P数字微断：保护电力设备的安全守护者 mdkk678 安全
在现代社会，电力设备的安全运行对各行各业至关重要。然而，电力系统中存在各种电压波动、过载和短路等问题，可能对设备造成损害。为了保护电力设备免受这些问题的影响，广州曼顿推出了2P数字微断器。本文将介绍这一创新产品的特点和优势，以及它对电力设备的保护作用。广州曼顿科技有限公司专注用户侧智慧数字电气产品研制，以及智慧电能服务大数据云平台建设。基于人工智能技术，大幅提升人触电时的生命安全保障，以及电气火灾
Python通关秘籍之基础教程(一） Smile丶Life丶 Python 通关指南：从零基础到高手之路 python 开发语言后端
引言在编程的世界里，Python就像一位温和而强大的导师，它以简洁优雅的语法和强大的功能吸引着无数初学者和专业人士。无论你是想开发网站、分析数据、构建人工智能，还是仅仅想学习编程思维，Python都是你的理想选择。Python的魅力在于它的易读性和广泛的应用场景。它的代码就像英语句子一样自然，即使是完全没有编程经验的人也能快速上手。同时，Python拥有庞大的生态系统，从Web开发（Django、
多模态大模型发展全景：从架构创新到应用突破陈敬雷-充电了么-CEO兼CTO python 大模型多模态大模型 AIGC 机器学习深度学习 DeepSeek
注：此文章内容均节选自充电了么创始人，CEO兼CTO陈敬雷老师的新书《GPT多模态大模型与AIAgent智能体》（跟我一起学人工智能）【陈敬雷编著】【清华大学出版社】《GPT多模态大模型与AIAgent智能体》新出书籍配套视频【陈敬雷】推荐算法系统实战全系列精品课【陈敬雷】文章目录GPT多模态大模型系列四多模态大模型发展全景：从架构创新到应用突破更多技术内容总结GPT多模态大模型系列四多模态大模型
一文搞懂 Cursor 内部工作原理~ zz_jesse
介绍了Cursor，一个结合了AI技术的代码编辑器，它通过深度学习和语义索引的方式，提升了开发者的工作效率。Cursor通过与VSCode相似的界面和功能，以及自己的AI特性，实现了代码的智能化编辑和错误检查。译文从这开始～～你可能已经看到新闻：OpenAI正以高达30亿美元的价格收购Windsurf！与此同时，Cursor的母公司Anysphere也正在以90亿美元估值融资9亿美元！这对于代码生
开源人工神经网络库（OpenANN） deepdata_cn 人工智能神经网络
OpenANN（OpenANN，OpenArtificialNeuralNetworkLibrary）是一个开源的人工神经网络库，基于C++编写，依赖Eigen3库进行高效的矩阵运算，使用CMake进行项目构建，支持多种神经网络架构，包括前馈神经网络、卷积神经网络和循环神经网络等，适用于图像识别、自然语言处理、时间序列预测等多种场景。提供数据预处理、模型保存和加载、超参数优化等功能。支持GPU加速
ollama v0.9.6版本发布详解：修复启动屏幕样式及新增工具名称参数支持福大大架构师每日一题文心一言vschatgpt ollama
作为近年来备受瞩目的开源对话式人工智能框架之一，ollama持续更新优化其产品，致力于为开发者带来更稳定、高效的使用体验。2025年7月8日，ollama发布了v0.9.6版本，这一版本在用户界面和API的可用性方面做出了重要改进，进一步增强了开发和集成的便捷性。本文将对ollamav0.9.6版本的更新内容进行全面解析，详细介绍新特性、修复的具体问题、应用示例及最佳实践，帮助开发者快速掌握和应用
AI人工智能与机器学习的大数据融合应用 AI智能探索者人工智能机器学习大数据 ai
AI人工智能与机器学习的大数据融合应用关键词：AI人工智能、机器学习、大数据、融合应用、数据挖掘摘要：本文深入探讨了AI人工智能与机器学习在大数据融合应用方面的相关内容。首先介绍了研究的背景、目的、预期读者和文档结构，对核心术语进行了清晰定义。接着阐述了AI、机器学习和大数据的核心概念及相互联系，给出了形象的文本示意图和Mermaid流程图。详细讲解了核心算法原理，并通过Python源代码进行说明
深入解读 Qwen3 技术报告（一）：引言小爷毛毛（卓寿杰）大模型AIGC 深度学习基础/原理人工智能自然语言处理 python 语言模型深度学习
重磅推荐专栏：《大模型AIGC》《课程大纲》《知识星球》本专栏致力于探索和讨论当今最前沿的技术趋势和应用领域，包括但不限于ChatGPT和StableDiffusion等。我们将深入研究大型模型的开发和应用，以及与之相关的人工智能生成内容（AIGC）技术。通过深入的技术解析和实践经验分享，旨在帮助读者更好地理解和应用这些领域的最新进展1.引言：迎接大型语言模型的新纪元我们正处在一个由人工智能（AI
目标检测YOLO实战应用案例100讲-基于深度学习的自动驾驶目标检测算法研究（续）林聪木目标检测 YOLO 深度学习
目录基于双蓝图卷积的轻量化自动驾驶目标检测算法5.1引言5.2DarkNet53网络冗余性分析5.3双蓝图卷积网络5.4实验结果及分析基于深度学习的自动驾驶目标检测算法研究与应用传统的目标检测算法目标检测基线算法性能对比与选择相关理论和算法基础2.1引言2.2人工神经网络2.3FCOS目标检测算法2.4复杂交通场景下的目标检测难点与FCOS改进方案基于FCOS的目标检测算法改进3.1引言3.2Re
AI人工智能遇上TensorFlow：技术融合新趋势 AI大模型应用之禅人工智能 tensorflow python ai
AI人工智能遇上TensorFlow：技术融合新趋势关键词：人工智能、TensorFlow、深度学习、神经网络、机器学习、技术融合、AI开发摘要：本文深入探讨了人工智能技术与TensorFlow框架的融合发展趋势。我们将从基础概念出发，详细分析TensorFlow在AI领域的核心优势，包括其架构设计、算法实现和实际应用。文章包含丰富的技术细节，如神经网络原理、TensorFlow核心算法实现、数学
边缘人工智能与医疗AI融合发展路径：技术融合与应用前景（上） Allen_Lyb 数智化医院2025 人工智能健康医疗算法
引言人工智能技术正以前所未有的速度改变着医疗保健领域，从辅助诊断到个性化治疗，AI应用的广度和深度不断拓展。在这一浪潮中，边缘人工智能（EdgeAI）作为一种新兴技术范式，正成为推动医疗AI创新的关键力量。边缘AI区别于传统的云计算模式，它将数据处理和AI模型部署在数据源头附近，实现快速响应和隐私保护。这种特性使其在医疗保健领域具有独特优势，特别是在实时监测、紧急响应和患者隐私保护等方面。边缘AI
AI人工智能领域中AI作画的技术优势 AI大模型应用之禅人工智能 AI作画 ai
AI人工智能领域中AI作画的技术优势关键词：AI作画、技术优势、人工智能、艺术创作、图像生成摘要：本文深入探讨了AI人工智能领域中AI作画的技术优势。从背景介绍出发，阐述了AI作画的起源与发展，明确了文章的目的、范围、预期读者以及文档结构。接着详细分析了AI作画的核心概念，包括其原理和架构，并通过Mermaid流程图进行直观展示。对核心算法原理进行了深入剖析，结合Python代码示例进行讲解。同时
快速掌握Python编程基础张彦峰ZYF python
干货分享，感谢您的阅读！备注：本博客将自己初步学习Python的总结进行分享，希望大家通过本博客可以在短时间内快速掌握Python的基本程序编码能力，如有错误请留言指正，谢谢！（持续更新）一、快速了解Python和环境准备（一）Python快速介绍Python是一种简洁、强大、易读的编程语言，广泛应用于Web开发、数据分析、人工智能、自动化运维等领域。它由GuidovanRossum在1991年设
人工智能开源的大模型训练微调框架LLaMA-Factory
LLaMA-Factory是一个开源的大模型训练微调框架，具有模块化设计和多种高效的训练方法，能够满足不同用户的需求。用户可以通过命令行或Web界面进行操作，实现个性化的语言模型微调。LLaMA-Factory是一个专注于高效微调LLaMA系列模型的开源框架（GitHub项目地址：https://github.com/hiyouga/LLaMA-Factory）。它以极简配置、低资源消耗和对中文任
深度学习核心知识简介和模型调参研术工坊深度学习知识和技巧深度学习人工智能 python
深度学习模型调优就像调制一道复杂的菜肴，需要掌握多种"调料"的用法。本文将为您详解这些关键"调料"，帮助您烹饪出高性能的模型。###核心参数及其影响####1️⃣Loss（损失函数）**基本介绍**：衡量模型预测与真实值差距的指标，是模型优化的指南针。**生活类比**：想象你在教小孩认识动物：-**完美情况**：小孩看到猫说"猫"，看到狗说"狗"→Loss=0-**有错误**：小孩看到猫说"狗"→
智慧城市大脑解决方案
智慧城市大脑背景与意义智慧城市大脑作为城市管理的创新模式，通过集成大数据、人工智能等技术，实现了对城市运行的全面感知与智能决策。它不仅提升了城市管理效率，还为市民带来了更加便捷、安全的生活体验。智慧城市大脑建设历程某城市作为智慧城市大脑的创新策源地，自2016年起便与阿里巴巴集团深度合作，投入巨资自主研发城市数据大脑“交通小脑”平台。该平台成功接入了大量视频和数据，实现了对道路和时间资源的再分配，
html 周华华 html
js 1，数组的排列 var arr=[1,4,234,43,52,]; for(var x=0;x<arr.length;x++){ for(var y=x-1;y<arr.length;y++){ if(arr[x]<arr[y]){ &
【Struts2 四】Struts2拦截器 bit1129 struts2拦截器
Struts2框架是基于拦截器实现的，可以对某个Action进行拦截，然后某些逻辑处理，拦截器相当于AOP里面的环绕通知，即在Action方法的执行之前和之后根据需要添加相应的逻辑。事实上，即使struts.xml没有任何关于拦截器的配置，Struts2也会为我们添加一组默认的拦截器，最常见的是，请求参数自动绑定到Action对应的字段上。 Struts2中自定义拦截器的步骤是：
make:cc 命令未找到解决方法 daizj linux 命令未知 make cc
安装rz sz程序时，报下面错误： [root@slave2 src]# make posix cc -O -DPOSIX -DMD=2 rz.c -o rz make: cc：命令未找到 make: *** [posix] 错误 127 系统：centos 6.6 环境：虚拟机错误原因：系统未安装gcc，这个是由于在安
Oracle之Job应用周凡杨 oracle job
最近写服务，服务上线后，需要写一个定时执行的SQL脚本，清理并更新数据库表里的数据，应用到了Oracle 的 Job的相关知识。在此总结一下。一：查看相关job信息 1、相关视图 dba_jobs all_jobs user_jobs dba_jobs_running 包含正在运行
多线程机制朱辉辉33 多线程
转至http://blog.csdn.net/lj70024/archive/2010/04/06/5455790.aspx 程序、进程和线程：程序是一段静态的代码，它是应用程序执行的蓝本。进程是程序的一次动态执行过程，它对应了从代码加载、执行至执行完毕的一个完整过程，这个过程也是进程本身从产生、发展至消亡的过程。线程是比进程更小的单位，一个进程执行过程中可以产生多个线程，每个线程有自身的
web报表工具FineReport使用中遇到的常见报错及解决办法（一）老A不折腾 web报表 finereport java报表报表工具
FineReport使用中遇到的常见报错及解决办法（一）这里写点抛砖引玉，希望大家能把自己整理的问题及解决方法晾出来，Mark一下，利人利己。出现问题先搜一下文档上有没有，再看看度娘有没有，再看看论坛有没有。有报错要看日志。下面简单罗列下常见的问题，大多文档上都有提到的。 1、address pool is full：含义：地址池满，连接数超过并发数上
mysql rpm安装后没有my.cnf 林鹤霄没有my.cnf
Linux下用rpm包安装的MySQL是不会安装/etc/my.cnf文件的，至于为什么没有这个文件而MySQL却也能正常启动和作用，在这儿有两个说法，第一种说法，my.cnf只是MySQL启动时的一个参数文件，可以没有它，这时MySQL会用内置的默认参数启动，第二种说法，MySQL在启动时自动使用/usr/share/mysql目录下的my-medium.cnf文件，这种说法仅限于r
Kindle Fire HDX root并安装谷歌服务框架之后仍无法登陆谷歌账号的问题 aigo root
原文：http://kindlefireforkid.com/how-to-setup-a-google-account-on-amazon-fire-tablet/ Step 4: Run ADB command from your PC On the PC, you need install Amazon Fire ADB driver and instal
javascript 中var提升的典型实例 alxw4616 JavaScript
// 刚刚在书上看到的一个小问题,很有意思.大家一起思考下吧 myname = 'global'; var fn = function () { console.log(myname); // undefined var myname = 'local'; console.log(myname); // local }; fn() // 上述代码实际上等同于以下代码 m
定时器和获取时间的使用百合不是茶时间的转换定时器
定时器:定时创建任务在游戏设计的时候用的比较多 Timer();定时器 TImerTask();Timer的子类由 Timer 安排为一次执行或重复执行的任务。定时器类Timer在java.util包中。使用时，先实例化，然后使用实例的schedule(TimerTask task, long delay)方法，设定
JDK1.5 Queue bijian1013 java thread java多线程 Queue
JDK1.5 Queue LinkedList： LinkedList不是同步的。如果多个线程同时访问列表，而其中至少一个线程从结构上修改了该列表，则它必须保持外部同步。（结构修改指添加或删除一个或多个元素的任何操作；仅设置元素的值不是结构修改。）这一般通过对自然封装该列表的对象进行同步操作来完成。如果不存在这样的对象，则应该使用 Collections.synchronizedList 方
http认证原理和https bijian1013 http https
一.基础介绍在URL前加https://前缀表明是用SSL加密的。你的电脑与服务器之间收发的信息传输将更加安全。 Web服务器启用SSL需要获得一个服务器证书并将该证书与要使用SSL的服务器绑定。 http和https使用的是完全不同的连接方式，用的端口也不一样,前者是80，后
【Java范型五】范型继承 bit1129 java
定义如下一个抽象的范型类，其中定义了两个范型参数，T1，T2 package com.tom.lang.generics; public abstract class SuperGenerics<T1, T2> { private T1 t1; private T2 t2; public abstract void doIt(T
【Nginx六】nginx.conf常用指令(Directive) bit1129 Directive
1. worker_processes 8; 表示Nginx将启动8个工作者进程，通过ps -ef|grep nginx,会发现有8个Nginx Worker Process在运行 nobody 53879 118449 0 Apr22 ? 00:26:15 nginx: worker process
lua 遍历Header头部 ronin47 lua header 遍历　
local headers = ngx.req.get_headers() ngx.say("headers begin", "<br/>") ngx.say("Host : ", he
java-32.通过交换a,b中的元素，使[序列a元素的和]与[序列b元素的和]之间的差最小(两数组的差最小)。 bylijinnan java
import java.util.Arrays; public class MinSumASumB { /** * Q32.有两个序列a,b，大小都为n,序列元素的值任意整数，无序. * * 要求：通过交换a,b中的元素，使[序列a元素的和]与[序列b元素的和]之间的差最小。 * 例如: * int[] a = {100,99,98,1,2,3
redis 开窍的石头 redis
在redis的redis.conf配置文件中找到# requirepass foobared 把它替换成requirepass 12356789 后边的12356789就是你的密码打开redis客户端输入config get requirepass 返回 redis 127.0.0.1:6379> config get requirepass 1) "require
[JAVA图像与图形]现有的GPU架构支持JAVA语言吗？ comsci java语言
无论是opengl还是cuda，都是建立在C语言体系架构基础上的，在未来，图像图形处理业务快速发展，相关领域市场不断扩大的情况下，我们JAVA语言系统怎么从这么庞大，且还在不断扩大的市场上分到一块蛋糕，是值得每个JAVAER认真思考和行动的事情
安装ubuntu14.04登录后花屏了怎么办 cuiyadll ubuntu
这个情况，一般属于显卡驱动问题。可以先尝试安装显卡的官方闭源驱动。按键盘三个键：CTRL + ALT + F1 进入终端，输入用户名和密码登录终端：安装amd的显卡驱动 sudo apt-get install fglrx 安装nvidia显卡驱动 sudo ap
SSL 与数字证书的基本概念和工作原理 darrenzhu 加密 ssl 证书密钥签名
SSL 与数字证书的基本概念和工作原理 http://www.linuxde.net/2012/03/8301.html SSL握手协议的目的是或最终结果是让客户端和服务器拥有一个共同的密钥，握手协议本身是基于非对称加密机制的，之后就使用共同的密钥基于对称加密机制进行信息交换。 http://www.ibm.com/developerworks/cn/webspher
Ubuntu设置ip的步骤 dcj3sjt126com ubuntu
在单位的一台机器完全装了Ubuntu Server，但回家只能在XP上VM一个，装的时候网卡是DHCP的，用ifconfig查了一下ip是192.168.92.128,可以ping通。转载不是错： Ubuntu命令行修改网络配置方法 /etc/network/interfaces打开后里面可设置DHCP或手动设置静态ip。前面auto eth0，让网卡开机自动挂载. 1. 以D
php包管理工具推荐 dcj3sjt126com PHP Composer
http://www.phpcomposer.com/ Composer是 PHP 用来管理依赖（dependency）关系的工具。你可以在自己的项目中声明所依赖的外部工具库（libraries），Composer 会帮你安装这些依赖的库文件。中文文档入门指南下载安装包列表 Composer 中国镜像
Gson使用四（TypeAdapter） eksliang json gson Gson自定义转换器 gsonTypeAdapter
转载请出自出处：http://eksliang.iteye.com/blog/2175595 一.概述 Gson的TypeAapter可以理解成自定义序列化和返序列化二、应用场景举例例如我们通常去注册时（那些外国网站），会让我们输入firstName，lastName,但是转到我们都
JQM控件之Navbar和Tabs gundumw100 html xml css
在JQM中使用导航栏Navbar是简单的。只需要将data-role="navbar"赋给div即可： <div data-role="navbar"> <ul> <li><a href="#" class="ui-btn-active&qu
利用归并排序算法对大文件进行排序 iwindyforest java 归并排序大文件分治法 Merge sort
归并排序算法介绍，请参照Wikipeida zh.wikipedia.org/wiki/%E5%BD%92%E5%B9%B6%E6%8E%92%E5%BA%8F 基本思想：大文件分割成行数相等的两个子文件，递归（归并排序）两个子文件，直到递归到分割成的子文件低于限制行数低于限制行数的子文件直接排序两个排序好的子文件归并到父文件直到最后所有排序好的父文件归并到输入
iOS UIWebView URL拦截啸笑天 UIWebView
本文译者：candeladiao，原文：URL filtering for UIWebView on the iPhone说明：译者在做app开发时，因为页面的javascript文件比较大导致加载速度很慢，所以想把javascript文件打包在app里，当UIWebView需要加载该脚本时就从app本地读取，但UIWebView并不支持加载本地资源。最后从下文中找到了解决方法，第一次翻译，难免有
索引的碎片整理SQL语句 macroli sql
SET NOCOUNT ON DECLARE @tablename VARCHAR (128) DECLARE @execstr VARCHAR (255) DECLARE @objectid INT DECLARE @indexid INT DECLARE @frag DECIMAL DECLARE @maxfrag DECIMAL --设置最大允许的碎片数量,超过则对索引进行碎片
Angularjs同步操作http请求with $promise qiaolevip 每天进步一点点学习永无止境 AngularJS 纵观千象
// Define a factory app.factory('profilePromise', ['$q', 'AccountService', function($q, AccountService) { var deferred = $q.defer(); AccountService.getProfile().then(function(res) {
hibernate联合查询问题 sxj19881213 sql Hibernate HQL 联合查询
最近在用hibernate做项目，遇到了联合查询的问题，以及联合查询中的N+1问题。针对无外键关联的联合查询，我做了HQL和SQL的实验，希望能帮助到大家。（我使用的版本是hibernate3.3.2） 1 几个常识：（1）hql中的几种join查询，只有在外键关联、并且作了相应配置时才能使用。（2）hql的默认查询策略，在进行联合查询时，会产
struts2.xml wuai struts
<?xml version="1.0" encoding="UTF-8" ?> <!DOCTYPE struts PUBLIC "-//Apache Software Foundation//DTD Struts Configuration 2.3//EN" "http://struts.apache