Rose sait

【论文阅读笔记|coling2022】OneEE: A One-Stage Framework for Fast Overlapping and NestedEvent Extraction

论文标题：OneEE: A One-Stage Framework for Fast Overlapping and Nested Event Extraction

论文来源：COLING 2022

论文链接：https://arxiv.org/pdf/2209.02693.pdf

代码链接：GitHub - Cao-Hu/OneEE

0 摘要

事件抽取（EE）是信息抽取的一项重要任务，旨在从非结构化文本中抽取结构化事件信息。以前的大多数工作都集中于抽取单一事件，而忽略了重叠或嵌套的事件。一些重叠和嵌套的EE模型包括几个连续的阶段来抽取事件触发词和论元，这会受到错误传播的影响。因此，我们设计了一个简单而有效的标记方案和模型，将EE表示为word-word关系识别，称为OneEE。触发词或论元词之间的关系在一个阶段同时被识别，从而产生非常快的事件抽取速度。该模型配备了一个自适应事件融合模块来生成事件感知表示，以及一个距离感知预测器来集成相对距离信息来进行word-word关系识别，实验表明这个给想法是有效果的。在3个重叠和嵌套的EE基准，即FewFC、Genia11和Genia13上的实验表明，OneEE达到了最先进的（SoTA）结果。此外，在相同的条件下，OneEE的推理速度比基线的推理速度更快，并且由于它支持并行推理，因此可以进一步显著提高。

1 引言

事件抽取（EE）是信息抽取研究中的一项基本但具有挑战性的任务。EE促进了实际应用的发展，如知识图谱构建、生物过程分析、和金融市场监督。EE的目标是从文本中识别事件触发词以及相关的论元。作为一个例子，图1(a)说明了一个Share Reduction事件，包括触发词“reduced”和角色为subject的论元“Wang Yawei”。

传统的EE方法将事件抽取作为序列标记任务，即假设事件mention不重叠。这忽略了复杂的不规则EE场景(即重叠和嵌套的EE)。

如图1(b)所示，有两个重叠的事件，Investment和Share Transfer，它们共享相同的触发词“acquired”和论元“Guangzhou Securities”。

图1(c)显示了一个嵌套事件的例子，其中事件Gene Expression的触发词expression是另一个事件Positive Regulation角色为Theme的论元。

先前对重叠和嵌套EE的研究采用了基于pipline的方法，在几个连续的阶段抽取事件触发词和论元。最近的2021年最先进的模型CasEE也使用了这种连续执行事件类型检测、触发词抽取和论元抽取的方法。这种方法的主要问题是后一阶段依赖于前一阶段，这本质上带来了误差传播问题。

为了解决上述问题，我们提出了一种新的标记方案，将重叠和嵌套的EE转换为word-word关系识别。如图2所示，我们设计了两种类型的关系，包括span关系（S-*）和角色关系（R-*）。

span关系S-*处理触发词和论元识别，表示两个词是触发词(T)的头尾边界还是论元(A).

角色关系R-*处理论元角色分类，表示论元是否在事件中扮演“*”角色。

在此基础上，我们提出了一个one-stage事件抽取模型OneEE，它主要包括三个部分。首先，它采用BERT作为编码器来获得上下文化的单词表示。然后，利用由一个注意力模块和两个门融合模块组成的自适应事件融合层，获得每个事件类型的event-aware上下文表示。在预测层中，我们通过计算distance-aware scores来parallelly预测每对单词之间的跨度和角色关系。最后，事件触发词、论元及其角色可以在一个stage使用这些关系标签解码，而没有错误传播。

我们对3个重叠和嵌套的EE数据集FewFC、Genia11和Genia13上的OneEE进行了评估，并进行广泛的实验和分析。我们的贡献可以总结如下：

设计了一种新的标记方案，将事件抽取作为word-word关系识别任务，为重叠和嵌套的EE提供了一种新颖而简单的解决方案。

提出了一个one-stage模型OneEE，可以有效地并行抽取重叠和嵌套的EE的word-word关系。

进一步提出了一个adaptive event fusion layer，以获得事件感知的上下文表示，并有效地集成事件信息。

OneEE在性能和推理速度方面都优于SoTA模型。

2 相关工作

2.1 事件提取

信息抽取是自然语言处理的关键研究轨迹之一，其中事件抽取是最复杂的任务。传统EE（即flat 或regular EE)将EE制定为序列标记任务，为每个token分配一个标签（例如，BIO标记方案）。例如，Joint Event Extraction via Recurrent Neural Networks (aclanthology.org)使用两个双向RNN来获得更丰富的表示，然后用来联合预测事件触发词和论元角色。Jointly Multiple Events Extraction via Attention-based Graph Information Aggregation通过引入基于注意力的GCN来建模依赖图信息，共同提取多个事件触发词和论元。然而，他们关于事件提及不相互重叠的基本假设并不总是有效的。不规则的EE（即重叠和嵌套的EE）没有得到太多的关注，这更具有挑战性和现实性。

现有的重叠和嵌套EE方法以pipeline方式执行包含几个步骤的事件提取。为了解决争论的重叠问题，采用多组二进制分类器，其中每个服务器为一个角色来检测特定于角色的论元跨度，但未能解决触发词重叠。除了pipeline方法外，处理重叠EE的最新尝试是CasEE（2021年），在一个具有级联解码的联合框架中。它们是第一个同时处理所有重叠的模型。CasEE（2021年）依次进行类型检测、触发词抽取和论元抽取，其中重叠的目标根据特定的前一个预测分别进行抽取。然而，大多数多阶段的方法都存在误差传播的问题。

2.2 基于标签的信息提取

标记方案在信息抽取领域已经得到了广泛的研究。传统的序列标注方法对每个token进行一次标记（如BIO）很难处理不规则的信息提取（如重叠的NER）。一些研究人员扩展了BIO标签方案，以适应更复杂的场景。然而，由于灵活性有限，存在标签模糊性问题。最近，grid tagging方案由于它呈现word pairs之间关系的特点被用于许多信息提取任务中，如意见挖掘、关系提取和命名实体识别等。例如，TPLinker通过用链接标签标记token对，实现了没有训练和推理之间差距的one-stage联合关系提取。受这些工作的启发，我们设计了标记方案来解决重叠和嵌套的EE，它在one stage并行预测触发词或论元词之间的关系。

同样值得注意的是，这项工作继承了单词单词关系检测思想最近的成功，如Unified Named Entity Recognition as Word-Word Relation Classification。Li等人（2022b）提出将所有的NER（包括flat、嵌套和不连续的mention）与基于grid tagging方案的word-word建模统一起来。然而，这项工作与Li等人（2022b）有两个不同之处。首先，我们成功地将word-word建标记的思想从NER扩展到EE，其中我们为嵌套的事件和重叠的事件重新设计了两种关系类型。其次，从建模的角度来看，我们设计了一个自适应事件融合层来充分支持one-stage（端到端）复杂事件检测，这极大地有助于避免错误的传播。

3 问题描述

事件抽取的目标包括抽取事件触发词及其论元。我们可以形式化重叠和嵌套的EE如下：给定一个由N个标记或单词组成的输入句子和事件类型，该任务的目的是提取每个标记对之间的跨度关系S和角色关系R，其中表示事件类型集合，S和R是预定义的标签。这些关系可以在下面进行解释，为了更好地理解，我们还给出了一个如图2所示的示例。

S：跨度关系表明和提取的触发词结束标记S-T或论元跨度S-A，其中

R：角色关系表明论元与xj行为的特定角色R-*事件的触发词包含，其中. *表示角色类型。

NONE：表示单词对没有定义任何关系。

4 框架

我们的模型的体系结构如图3所示，它主要由三个部分组成。首先，使用预训练语言模型BERT作为编码器，从输入的句子中生成上下文化的单词表示。然后，利用由一个注意力模块和两个门模块组成的自适应事件融合层，将嵌入的目标事件类型集成到上下文表示中。然后，利用预测层联合提取词对之间的跨度关系和角色关系。

4.1 编码层

我们利用BERT作为模型的编码器，因为它已经被证明是在EE中进行表示学习的SoTA模型之一。给定输入句子，将每个标记转换成单词块，然后将它们输入一个预先训练过的BERT模块。在BERT计算之后，每个sentential word可能涉及几个片段的向量表示。在这里，使用最大池化来生成基于单词块表示的单词表示

4.2 自适应事件融合层

目的：融合编码器提供的事件信息和上下文信息，获得事件感知的单词表示Vt

整个框架目标是预测目标事件类型等的word pairs之间的关系，因此生成事件感知表示是很重要的。

如下图所示，自适应融合层包括一个注意力模块，用来对事件之间的交互进行建模并获取全局事件信息；以及两个门融合模块用于将“全局和目标事件信息”与“上下文词表示”进行集成。

注意力机制

作用：获得每个上下文单词表示的全局事件嵌入

介绍attention机制

基于transformer中的自注意力机制，首先引入了一种注意力机制，其输入包括queries, keys和values。输出被计算为这些值的加权和，其中分配给每个值的权重是具有对应键的查询的点积。注意机制：

其中，是一个比例因子，Q，K和V是query, key 和value张量。

模型中如何使用：

给定一组随机初始化的事件类型嵌入，其中M是事件类型的数量，计算可以表述为：

其中为注意力机制的输出，和为可学习参数。

门融合机制

第一个门

目的：将全局事件信息编码为单词表示

做法：采用了门模块来融合上下文单词表示和全局事件表示。

$H^{g}=Gate(H,E^{g})$

其中

是在编码层那一步使用最大池化来生成基于单词块表示的单词表示

其中为注意力机制的输出，和为可学习参数。

第二个门

目的：将目标事件类型的嵌入和前一个门模块的输出进行集成

$V^{t} = Gate(H^{g},e_{t})$

其中表示目标事件类型嵌入，是最终的event-aware词表示。

门融合机制如何实现

目的：集成两种特征，并过滤不必要的信息。

门向量g是由具有sigmoid函数的全连接层产生的，它可以自适应地控制输入端的流动：

$Gate(p,q)=\sigma(W_{g}[p;q]+b_{g})\odot p + (1-\sigma(W_{g}[p;q]+b_{g}))\odot q$

其中p和q为输入向量，σ(·)是一个sigmoid激活函数， $\odot$ 和[；]分别表示元素级的乘积和连接操作。和为可训练参数。

4.3 联合预测层

目的：经过自适应事件融合层之后，得到的事件感知的单词表示Vt，被用于联合预测每对单词之间的跨度和角色关系。

对于每个单词对，计算一个分数来衡量它们的关系的可能性。

距离感知得分

目标事件类型t的单词对的跨度得分

角色得分：

其中，表示参数，是自适应融合层最终的event-aware词表示

为了整合相对距离信息和词对表示，引入了一个distance-aware得分函数。distance-aware得分函数计算方法：

对于一个表示序列中的两个向量和，将它们与RoFormer提供的相应位置嵌入结合起来，然后通过它们的点积计算得分：

$Score(p_{i},p_{j})=(R_{i}p_{i})^{T}(R_{j}p_{j})=p_{i}^{T}R_{j}-_{i}p_{j}$

其中和是和的位置嵌入，。

4.4 训练

对于分数，其中*表示关系s或r，训练目标是最小化variant of circle损失，扩展softmax交叉熵损失来求出多标签分类问题。此外，引入了阈值得分δ，注意到关系对的得分大于δ，而其他对的得分小于δ。损失函数可表示为

其中，表示关系*的成对集，δ被设置为零。

最后，枚举所选事件类型集中的所有事件类型，并得到总损失：

其中是从S采样的子集，我们在附录中详细介绍了抽样策略。

4.5 推理

在推理期间，模型能够通过将事件类型嵌入并行地注入到自适应事件融合层来提取所有事件。如图4所示，一旦我们的模型在一个阶段中预测了某一事件类型的所有标签，整个解码过程可以总结为四个步骤：

首先，我们得到触发词和论元的开始和结束索引。第二，获取触发词和论元跨度。第三，根据R-*关系来匹配触发词和论元。最后，将事件类型分配给此事件结构。特别地，我们对每个事件类型重复上述四个步骤。

5 实验设置

5.1 数据集

如表1所示，遵循之前的工作，采用中文重叠EE的金融事件提取数据集FewFC。FewFC注释了10个事件类型和18个参数角色类，其中约22%的句子包含重叠的事件。

我们还在两个嵌套的EE生物医学数据集上进行了实验，即Genia11和Genia13，大约18%的句子包含嵌套事件。Genia11注释了9种事件类型和10个论元角色类，而Genia13的数字分别是13和7。我们将训练集/验证集/测试集划分为8：1：1。

5.2 实施细节

对FewFC采用Chinese Bert-base模型，对Genia11和Genia13采用BioBERT模型。我们采用AdamW优化器，BERT模块的学习速率为2e−5，其他模块的学习速率为1e−3。batch size为8，隐藏大小dh为768。我们用FewFC和Genia11的20个epoch和Genia13的30个epoch来训练我们的模型。所有的超参数都将在development集上进行了调整。所有的事件类型的嵌入都是从scratch开始进行训练的。

5.3评价指标

在评估方面，我们遵循以往工作的传统标准。

触发词识别（TI）：如果预测的触发词跨度与黄金标签匹配，则正确识别触发词；

触发词分类（TC）：如果正确识别并分配给正确类型，则正确分类；

论元识别（AI）：事件类型识别正确，且与黄金标签匹配的预测论元跨度；

论元分类（AC）：如果论元识别正确，并且预测角色与任何黄金标签匹配，则论元正确分类。

实验得出了这四个指标的精确度(P)、Recall (R)和F1值（F1）。

$precision = \frac{TP}{TP+FP}$

$Recall = \frac{TP}{TP+FN}$

$F1 = \frac{2}{\frac{1}{Precision}+\frac{1}{Recall}} = \frac{2Precision*Recall}{Precision + Recall}$

TP、FP、FN、TN可以理解为

TP：预测为1，实际为1，预测正确。
FP：预测为1，实际为0，预测错误。
FN：预测为0，实际为1，预测错误。
TN：预测为0，实际为0，预测正确。

5.4 基线任务

flat EE的序列标记方法

这些方法通过为每个标记分配一个标签，将EE任务转换为序列标记任务。

BERT-softmax使用BERT来获取用于分类触发词和论元的特征表示。

BERT-CRF在BERT上添加CRF层以捕获标签依赖性。

BERT-CRF-joint将BIO标记方案扩展到B/I/o类型的联合标签，类型和角色，来自实体和关系的联合提取。

这些方法都由于标签冲突而无法解决重叠问题。

重叠式和嵌套式EE的多阶段分析方法

这些方法可以在几个阶段中进行EE。

PLMEE通过根据触发词提取器预测的触发词以pipline提取特定论元，来解决论元重叠问题。

CasEE依次进行类型、触发词和论元提取，其中重叠的目标分别提取为之前的预测条件，所有子任务共同学习。

6 实验结果

6.1 所有EE测试的结果

表2显示了在重叠的EE数据集FewFC上的所有方法的结果

表3显示了嵌套的EE数据集Genia11和Genia13的结果。

我们可以观察到：

1)我们的方法显著优于所有其他方法，并在所有三个数据集上取得了最先进的F1分数。

2)与序列标记方法相比，我们的模型获得了更好的查全率和f1分数。

具体来说，我们的模型在FewFC数据集上的召回率和AC的F1得分比BERT-CRF-joint好11.7%和6.3%，在两个Genia数据集上AC的F1得分平均显著提高4.4%。由于序列标记方法只能求解flat EE，因此证明了我们的模型在重叠和嵌套EE上的有效性。

3)与多阶段方法相比，我们的模型也大大提高了F1分数的性能。在三个数据集上，我们的模型在TC的F1分数上平均比最先进的模型CasEE模型平均高出2.1%。我们认为这是因为我们的自适应事件融合模块已经很好地学习到了事件特征。特别是，我们的模型在三个数据集的AI上平均提高了3.4%，在AC上提高了1.6%。结果表明了我们的单级框架的优越性，它优雅地实现了重叠和嵌套的事件提取，而没有错误传播。

6.2 重叠和嵌套EE的结果

为了评估我们提出的模型在识别重叠和嵌套事件提及方面的有效性，我们进一步报告了在FewFC中包含至少一个重叠事件的句子和在Genia11中包含至少一个嵌套事件的句子的结果。

图5显示了TC和AC对测试中重叠和嵌套句子的结果。结果表明，该方法在重叠句子和嵌套句子上优于其他方法。原因主要有两个方面： 1)我们解决了所有的重叠模式，而BERT-CRF-joint不能处理重叠和嵌套的EE，PLMEE只能解决论元重叠。2)我们的单阶段模型优于CasEE，因为我们可以有效地学习事件感知表示并并行提取单词词关系，而CasEE则可以连续三次进行错误传播。

6.3 融合层中各模块的影响

为了验证每个成分的有效性，我们对FewFC数据集进行了消融研究，如表4所示。首先，如果没有注意力机制，性能略微下降。通过用附加操作替换门控机构，性能也下降到一点。此外，当自适应事件fusion layer被加法取代时，性能显著下降，说明事件表示和上下文的有用性。最后，去除位置嵌入导致所有F1得分显著下降，特别是AC的F1得分的1.6%，说明位置信息对识别word-word关系至关重要。

6.4 距离感知标签预测的影响

在本节中，我们研究了位置嵌入对OneEE预测层的影响。根据FewFC测试集中的论元与相应触发词的距离分为6组，并报告有位置嵌入和没有位置嵌入的模型的召回率。如图6所示，随着事件中触发词和论元之间的距离的增加，AC召回率会下降。这表明，如果在一个事件中的距离较长，那么模型就更难正确地检测角色。此外，具有位置嵌入的模型优于其他不具有位置嵌入的模型，表明相对距离信息有利于事件的提取。

6.5 参数的数量和效率的比较

表5列出了两个基线和我们的模型的stage、参数数和推理速度。

为了进行公平的比较，所有这些模型都是使用PyTorch实现的，并使用NVIDIA RTX 3090 GPU进行测试，其中批处理大小设置为1。如图所示，PLMEE的参数数量是其他两个模型的2倍，因为每个阶段都使用了两个基于bert的模块。此外，我们的模型的推理速度大约比PLMEE快3倍，比CasEE快0.3倍，它验证了我们模型的效率。最后，当批处理大小设置为8时，我们的模型的推理速度是PLMEE的9.4倍，这也证明了我们的模型的优势，即它支持并行推理。总之，我们的模型利用了更少的参数，但实现了更好的性能和更快的推理速度。

6.6 4种角色标签策略的分析

在本节中，我们将研究角色策略对交流电性能的影响。如图7所示，我们介绍了4种不同的策略来预测触发词和论元之间的角色关系：角色标签仅存在于1）触发词和论元头对（TH-AH）、2）触发词和论元头对（TW-AH）、3）触发词和论元词对（TH-AW）、4）触发词和论元词对(TW-AW）。

我们使用4种策略的模型的结果如图8所示。我们可以了解到，在FewFC和Genia11数据集上，TW-AW比所有其他策略都取得了最好的结果。这在很大程度上是因为它的标签比其他策略更密集。

6.7 对事件编号的分析

我们进一步研究了事件数对EE的影响，结果如图9所示。我们可以观察到，BERT-CRF-joint、PLMEE和CasEE在单事件句子上取得了相似的性能，而CasEE在多事件句子上优于PLMEE和BERT-CRF-coint。最重要的是，我们的系统对不同事件数的所有其他基线都取得了最好的结果，这表明了我们所提出的方法的进步。

7 结论

本文提出了一种新的基于word-word关系识别的单stage框架来同时解决重叠和嵌套的EE问题。单词对之间的关系被预定义为触发词或论元中的word-word关系，并交叉触发词-论元对。此外，我们提出了一个有效的模型，该模型包括一个自适应事件融合层，和一个联合识别各种关系的距离感知预测层。实验结果表明，该模型在三个数据集上都获得了新的SoTA结果，且速度比SoTA模型更快。

通过消融研究，我们发现自适应事件融合层和距离感知预测层可以有效地提高模型的性能。在未来的工作中，我们将把我们的方法扩展到其他结构化预测任务，如结构化EE和重叠实体关系提取。

《AGI：开启智能新纪元的钥匙》空云风语人工智能深度学习神经网络 agi 人工智能深度学习 AIGC
一、AGI：人工智能的进阶之路在科技飞速发展的当下，人工智能（AI）已逐渐渗透到我们生活的各个角落，从智能手机中的语音助手，到自动驾驶汽车，再到医疗领域的疾病诊断辅助，AI的身影无处不在。然而，在AI的宏大版图中，当前被广泛应用的大多属于狭义人工智能（NarrowAI），它专注于特定领域的任务执行，而通用人工智能（ArtificialGeneralIntelligence，简称AGI）则代表着人工
零售业的AI赋能与前端开发效率革命：ScriptEcho 的助力前端
零售业正经历着前所未有的数字化转型，但同时也面临着巨大的挑战。库存管理混乱、个性化客户体验不足等问题，严重制约着零售企业的盈利能力。而人工智能（AI）的兴起，为解决这些问题提供了新的思路。通过AI驱动的实时库存管理和客户行为分析，零售企业可以显著提升运营效率和客户满意度。然而，构建这些AI赋能的零售应用，需要强大的前端开发能力，这正是AI代码生成器ScriptEcho能够发挥关键作用的地方。AI赋
人工智能时代，企业如何搭建自己的AI知识库知识库知识库管理知识库软件
随着人工智能技术的迅猛发展，企业越来越意识到构建AI知识库的重要性。AI知识库不仅能够高效管理企业的海量知识资源，还能通过智能检索和推荐，提升员工的工作效率，促进企业的创新与发展。本文将详细探讨企业如何搭建自己的AI知识库，包括前期准备、技术选型、构建过程及后续维护等方面。一、前期准备在构建AI知识库之前，企业需要进行充分的前期准备，明确需求和目标。确定需求和目标企业首先需要明确知识库的服务对象、
科技早报｜OpenAI的人工智能模型销售收入超过微软类似业务；荣耀中国区CMO辟谣将采用麒麟芯片 | 最新快讯最新科技快讯科技人工智能 microsoft
科大讯飞新模型在测试集结果中超越GPT-4Turbo6月27日，科大讯飞发布讯飞星火大模型V4.0。与此前的版本相比，新模型在文本生成、语言理解、知识问答、逻辑推理、数学能力、代码能力、多模态能力等七大能力上都有提升。例如，讯飞星火可以根据用户的语言描述，结合空间和常识推断描述对象所在的位置。而在图文识别上，讯飞星火大模型V4.0能力也进一步升级，在科研、金融、医疗、司法、办公等场景的应用效果已领
中科曙光C/C++研发工程师二面 TrustZone_ ARM/Linux嵌入式面试 c语言 c++开发语言
自我介绍；针对项目：CNN模型、损失函数、评价指标、改进方向、计算加速；CNN模型CNN，即卷积神经网络，是一种专门用于处理具有类似网格结构数据的深度学习模型。它通过卷积层和池化层提取图像特征，并通过全连接层进行分类或回归预测。CNN在图像识别、目标检测和图像生成等领域取得了巨大成功。具体来说，CNN的模型结构包括输入层、卷积层、激活函数、池化层、全连接层和输出层。输入层接收图像数据，并将其转换为
产生式系统实验头歌实验测试不通过解决（人工智能）兜里没有一毛钱人工智能 python numpy 数据分析人工智能机器学习
任务描述本关任务：编写一个使用产生式方法识别动物的系统。编程要求根据提示，在右侧编辑器补充代码，完成产生式系统——动物识别系统的操作，最后达到输入动物特征，输出动物类型的结果。特别说明在这个实验中，存在一个实验现象,就是你的自测运行输出结果与实验要求输出结果一模一样也不能通过，为什么呢？答：这个不知道算不算是头歌实验平台存在bug，一般我们在编写程序代码中，要求格式都是英文格式，但是在这个实验测试
改进yolov8工业缺陷检测+swin+transformer qq1309399183 计算机视觉实战项目集合 YOLO transformer 深度学习人工智能计算机视觉机器学习神经网络
使用NEU-DET数据集进行缺陷检测的YOLOv8改进模型应用详解在现代工业生产过程中，质量控制是至关重要的一个环节。随着机器视觉技术和人工智能算法的发展，基于深度学习的方法已经成为自动化缺陷检测的重要工具。本篇将介绍一种基于NEU-DET数据集，利用YOLOv8及其改进版本（包含坐标注意力机制和SwinTransformer）进行缺陷检测的应用开发过程。我们将详细探讨从数据准备到模型训练，再到最
智能体（AI Agent）全解析：概念、原理至应用深度探索网安猫叔人工智能语言模型自然语言处理 AIGC 机器学习
一、智能体概念的深度剖析1.1智能体（Agent）的本质智能体，作为人工智能领域的一颗璀璨明珠，是那些能够主动感知周遭环境、自主决策并付诸实践的系统实体。它们不仅拥有自主性、交互性、反应灵敏及高度适应性等鲜明特征，更在复杂多变的情境中展现出卓越的自我管理与任务执行能力。智能体的诞生，标志着人工智能技术从机械式的规则遵循迈向了更为灵活、智能的自主决策新时代。智能体的核心精髓在于其内置的学习与决策引擎
改进yolov8缺陷检测+swin+transformer QQ_1309399183 计算机视觉实战项目集锦 YOLO transformer 深度学习人工智能计算机视觉 opencv 机器学习
使用NEU-DET数据集进行缺陷检测的YOLOv8改进模型应用详解在现代工业生产过程中，质量控制是至关重要的一个环节。随着机器视觉技术和人工智能算法的发展，基于深度学习的方法已经成为自动化缺陷检测的重要工具。本篇将介绍一种基于NEU-DET数据集，利用YOLOv8及其改进版本（包含坐标注意力机制和SwinTransformer）进行缺陷检测的应用开发过程。我们将详细探讨从数据准备到模型训练，再到最
全网最全Stable diffusion保姆级教程「安装-配置-画图」，小白必收藏！！ AI想象家 stable diffusion AI作画 midjourney 人工智能深度学习
随着chatgpt爆火之后，越来越多的人开始关注人工智能，人工智能相关的其他应用如AI绘画，也再次得到人们的关注。AI绘画的确很上头，最近几天小编也研究一下，这里把研究的过程以及中间遇到的问题整理一下，我这里遇到的问题，相信新入门的小白也会遇到，希望本文对你能有一定的帮助。给大家带来了全新保姆级教程资料包（文末可获取）目前常用的AI绘画工具主要有两种：stablediffusion和midjour
【Python】成功解决ValueError: zero-size array to reduction operation minimum which has no identity 高斯小哥 BUG解决方案合集 python 新手入门学习 debug
【Python】成功解决ValueError:zero-sizearraytoreductionoperationminimumwhichhasnoidentity个人主页：高斯小哥高质量专栏：Matplotlib之旅：零基础精通数据可视化、Python基础【高质量合集】、PyTorch零基础入门教程希望得到您的订阅和支持~创作高质量博文(平均质量分92+)，分享更多关于深度学习、PyTorch、
开源AI图像工具—Stable Diffusion 蚂蚁在飞- 人工智能 stable diffusion
StableDiffusion是一种基于深度学习的生成式模型，用于图像生成、图像修复和风格转换等任务。它是由StabilityAI和CompVis团队联合开发的。StableDiffusion在生成高质量图像方面表现出色，并且是开源的，可以自由使用和扩展。StableDiffusion的核心技术1.扩散模型(DiffusionModels):•基于概率生成模型。•从噪声中逐步反向生成清晰的图像。•
机器学习：scikit-learn 和 Jupyter Notebook（推荐初学者使用google colab） wyc9999ww 机器学习 scikit-learn jupyter 人工智能 python
对于初学者来说，scikit-learn是一个理想的机器学习入门工具。不仅提供了丰富的算法和功能，还通过一致的API设计，确保能够快速上手并进行各种机器学习任务。通过使用scikit-learn，可以专注于理解和实践机器学习的核心概念，而不必过多担心底层实现细节。所以scikit-learn能轻松实现从数据预处理到模型训练和评估的完整流程。此外在推荐一个适合初学者的深度学习平台工具googleco
AI赋能：高职院校实验实训教学如何拥抱人工智能浪潮？武汉唯众智创人工智能实训人工智能实验实训教学
随着信息技术的迅猛发展，人工智能技术已成为推动社会各行业转型升级的核心力量。它不仅在提升生产效率、优化管理流程、提高服务质量方面发挥着关键作用，也深刻影响着高职教育的专业发展和课程教学内容的改革。作为培养专业技术技能人才的摇篮，高职院校必须创新其教学模式和方法，以适应新的发展需求，从而培育出能够适应未来技术变革的高素质人才。特别是在实验实训教学领域，人工智能的融入为职业教育改革提供了新的思路和工具
【深度学习】CrossEntropyLoss需要手动softmax吗？ zz的学习笔记本深度学习深度学习人工智能
【深度学习】CrossEntropyLoss需要手动softmax吗？问题：CrossEntropyLoss需要手动softmax吗？答案：不需要官方文档代码解释问题：CrossEntropyLoss需要手动softmax吗？之前用pytorch实现自己的网络时，使用CrossEntropyLoss的时候将网路输出经softmax激活层后再计算CrossEntropyLoss。答案：不需要调用了损
有趣的python代码实例_Python之路：200个Python有趣的小例子一网打尽 weixin_39845406 有趣的python代码实例
概述博主最近在学习python，看完了一整套学习视频，然后呃呃呃，还是用不太流畅。碰巧在全球最大的同性交友论坛GayHub(呸！是开源代码托管平台Github)上面发现了一个项目，该项目列举了200多个Python小例子，Python基础、Python坑点、Python字符串和正则、Python绘图、Python日期和文件、Web开发、数据科学、机器学习、深度学习、TensorFlow、Pytor
迁移学习与RBF神经网络 fanxbl957 人工智能理论与实践迁移学习神经网络人工智能
迁移学习与RBF神经网络一、引言在机器学习和深度学习领域，迁移学习和神经网络都是备受关注的重要技术。迁移学习旨在将从一个或多个源任务中学习到的知识应用到目标任务中，以加快目标任务的学习过程，提高学习效果，尤其在数据稀缺或训练资源有限的情况下展现出显著优势。而RBF（径向基函数）神经网络作为一种经典的神经网络结构，以其独特的函数逼近能力和良好的局部逼近特性，在众多领域取得了出色的性能表现。将迁移学习
“数据飞轮” 理念焕新，助力 2025 企业数智化发展大数据大模型
2024年，全球科技领域在人工智能浪潮的席卷下加速前行，数字化转型进程也随之踏入全新阶段。在这一背景下，数据飞轮理念延续“以数据消费促资产建设，以数据消费助业务发展”的核心内涵，实现焕新升级。在2025年，升级后的数据飞轮2.0，将AI视作数智化的核心竞争力，借助AI技术推动企业更普惠的数据消费。“数据飞轮”2.0的理念，带来了多方面的显著升级。其一，它将AI技术深度融入数据生产、管理与应用各环节
用大数据“喂养”出来的AI模型ChatGPT 爆火是大数据、大算力、强算法的支撑，中国缺乏的什么？ Ai17316391579 深度学习服务器人工智能
先来了解一下ChatGPT的基本情况ChatGPT本质属于生成式人工智能，属于无监督或半监督的机器学习。与之相关的还有Discriminativemodeling区分式模型，区分式模型大多属于监督式学习。生成性人工智能目前有两种主要的框架：GAN（GenerativeAdversarialNetwork）和GPT（GenerativePre-trainedTransformer）。GAN目前广泛应
英伟达最新的算力芯片Blackwell芯片名为GB200 算力资源比较多算力智算大模型人工智能 gpu算力语言模型大数据推荐算法
英伟达最新的算力芯片相关信息如下：Blackwell芯片：英伟达在2024年6月2日由创始人兼CEO黄仁勋宣布，其Blackwell芯片已开始投产。第一款Blackwell芯片名为GB200，被宣称为目前“全球最强大的芯片”。Blackwell芯片基于新的BlackwellGPU架构，专为人工智能模型设计。每个B200GPU包含2080亿个晶体管，GB200由两个这样的GPU和一个GraceCPU
Python语言的编程范式 AI向前看包罗万象 golang 开发语言后端
Python语言的编程范式Python是一种广泛使用的高级编程语言，它因其简单易读的语法和强大的功能而受到程序员的喜爱。自1991年由荷兰人GuidolvanRossum首次发布以来，Python的发展迅速，其应用范围涵盖了Web开发、数据分析、人工智能、科学计算、自动化等多个领域。本文将深入探讨Python的编程范式，帮助读者更好地理解该语言的特性和优势。1.什么是编程范式编程范式是对程序设计风
火山引擎数据飞轮2.0：聚焦Data+AI，驱动企业数智化转型大数据
数字化浪潮席卷全球，数据与人工智能的融合正给各行各业带来巨大变革，不仅重塑数据处理流程，更在决策支持、业务优化、产品创新等多个维度上展现巨大的潜力。近期，火山引擎数智平台技术和产品专家受邀出席DataFun首届“数据与人工智能解决方案大会”，围绕数据飞轮2.0模式，及Data+AI领域热门话题ChatBI、多模态数据湖展开分享。据介绍，2023年4月火山引擎发布了数据飞轮，其内核为“以数据消费促资
AI未来趋势：AIGC浪潮下看AI训练师如何塑造智能未来（技术变革）用心去追梦前端 html css
在AIGC（AIGeneratedContent，人工智能生成内容）浪潮下，AI训练师扮演着至关重要的角色，他们不仅推动了技术的发展，还在确保这些技术能够安全、高效地服务于社会方面发挥了重要作用。以下是AI训练师如何塑造智能未来的几个关键方面：1.技术变革与创新算法与模型训练预训练：通过大规模无标注数据的学习，构建具备基础语言理解和生成能力的基座模型。这一过程为后续更精细的任务打下了坚实的基础。指
深入理解AIGC背后的核心算法：GAN、Transformer与Diffusion Models 忘梓. 杂文 AIGC 算法生成对抗网络
深入理解AIGC背后的核心算法：GAN、Transformer与DiffusionModels前言随着人工智能技术的发展，AIGC（AIGeneratedContent，人工智能生成内容）已经不再是科幻电影中的幻想，而成为了现实生活中的一种新兴力量。无论是自动生成文章、绘制图像、生成音乐还是创作视频，AIGC都在各个内容创作领域崭露头角。然而，这些“智能创作”的背后究竟依赖于哪些算法？今天，我们将
AIGC - 深度洞察如何对大模型进行微调以满足特定需求网罗开发 AI 大模型人工智能 AIGC
网罗开发（视频号同名）大家好，我是展菲，目前在上市企业从事人工智能项目研发管理工作，平时热衷于分享各种编程领域的软硬技能知识以及前沿技术，包括iOS、前端、HarmonyOS、Java、Python等方向。在移动端开发、鸿蒙开发、物联网、嵌入式、云原生、开源等领域有深厚造诣。图书作者：《ESP32-C3物联网工程开发实战》图书作者：《SwiftUI入门，进阶与实战》超级个体：COC上海社区主理
如何使用LangChain内置工具和工具包 jkgSFS langchain microsoft python
在当今快速发展的人工智能应用开发中，利用现有的工具和工具包能大幅加快开发进程，提高应用的效率和功能性。本文将带您深入了解LangChain中的内置工具和工具包的使用方法，并通过示例代码进行演示。技术背景介绍LangChain是一个旨在简化应用程序创建的框架，其拥有丰富的第三方工具集成。这些工具可以帮助开发者轻松访问和操作如Wikipedia等大型数据集。核心原理解析LangChain工具通过API
AIGC视频生成国产之光：ByteDance的PixelDance模型好评笔记 AIGC-视频补档 AIGC 计算机视觉人工智能深度学习机器学习论文阅读面试
大家好，这里是好评笔记，公主号：Goodnote，专栏文章私信限时Free。本文详细介绍ByteDance的视频生成模型PixelDance，论文于2023年11月发布，模型上线于2024年9月，同时期上线的模型还有Seaweed（论文未发布）。优质专栏回顾：机器学习笔记深度学习笔记多模态论文笔记AIGC—图像文章目录论文摘要引言输入训练和推理时的数据处理总结相关工作视频生成长视频生成方法模型架构
亮相AICon，火山引擎边缘云揭秘边缘AI Agent探索与实践边缘计算智能硬件ai开发
12月13-14日，AICon全球人工智能开发与应用大会在北京成功举办。火山引擎边缘智能技术负责人谢皓受邀出席大会，以《AIAgent在边缘云的探索与实践》为主题，与全球AI领域的资深专家，共同深入探讨大模型落地、具身智能、多模态大模型、AIAgent等前沿技术如何推动行业变革、引领未来发展。火山引擎边缘智能技术负责人谢皓指出，随着AI时代的到来，边缘智能由传统的物联网、智慧物联，逐渐演变成智能体
论文阅读笔记：AI+RPA 几道之旅人工智能
文章目录论文题目下载地址论文摘要论文题目Challengesandopportunities:ImplementingRPAandAIinfrauddetectioninthebankingsector下载地址点击这里下载论文摘要在银行业中，将机器人流程自动化（RPA）和人工智能（AI）集成用于欺诈检测是一项重大变革，既带来了挑战，也带来了机遇。随着金融机构面临日益复杂的欺诈企图，RPA和AI成为
PyTorch 基础数据集：从理论到实践的深度学习基石那年一路北 Pytorch理论+实践深度学习 pytorch 人工智能
一、引言深度学习作为当今人工智能领域的核心技术，在图像识别、自然语言处理、语音识别等众多领域取得了令人瞩目的成果。而在深度学习的体系中，数据扮演着举足轻重的角色，它是模型训练的基础，如同建筑的基石，决定了模型的性能和泛化能力。PyTorch作为当下最流行的深度学习框架之一，为开发者提供了丰富且强大的工具来处理数据集。本文将深入探讨PyTorch中的基础数据集，从深度学习中数据的重要性出发，详细介绍
算法单链的创建与删除换个号韩国红果果 c 算法
先创建结构体 struct student { int data; //int tag;//标记这是第几个 struct student *next; }; // addone 用于将一个数插入已从小到大排好序的链中 struct student *addone(struct student *h,int x){ if(h==NULL) //??????
《大型网站系统与Java中间件实践》第2章读后感白糖_ java中间件
断断续续花了两天时间试读了《大型网站系统与Java中间件实践》的第2章，这章总述了从一个小型单机构建的网站发展到大型网站的演化过程---整个过程会遇到很多困难，但每一个屏障都会有解决方案，最终就是依靠这些个解决方案汇聚到一起组成了一个健壮稳定高效的大型系统。看完整章内容，
zeus持久层spring事务单元测试 deng520159 java DAO spring jdbc
今天把zeus事务单元测试放出来,让大家指出他的毛病, 1.ZeusTransactionTest.java 单元测试 package com.dengliang.zeus.webdemo.test; import java.util.ArrayList; import java.util.List; import org.junit.Test; import
Rss 订阅开发周凡杨 html xml 订阅 rss 规范
RSS是 Really Simple Syndication的缩写（对rss2.0而言，是这三个词的缩写，对rss1.0而言则是RDF Site Summary的缩写，1.0与2.0走的是两个体系）。 RSS
分页查询实现 g21121 分页查询
在查询列表时我们常常会用到分页，分页的好处就是减少数据交换，每次查询一定数量减少数据库压力等等。按实现形式分前台分页和服务器分页：前台分页就是一次查询出所有记录，在页面中用js进行虚拟分页，这种形式在数据量较小时优势比较明显，一次加载就不必再访问服务器了，但当数据量较大时会对页面造成压力，传输速度也会大幅下降。服务器分页就是每次请求相同数量记录，按一定规则排序，每次取一定序号直接的数据
spring jms异步消息处理 510888780 jms
spring JMS对于异步消息处理基本上只需配置下就能进行高效的处理。其核心就是消息侦听器容器，常用的类就是DefaultMessageListenerContainer。该容器可配置侦听器的并发数量，以及配合MessageListenerAdapter使用消息驱动POJO进行消息处理。且消息驱动POJO是放入TaskExecutor中进行处理，进一步提高性能，减少侦听器的阻塞。具体配置如下：
highCharts柱状图布衣凌宇 hightCharts 柱图
第一步：导入 exporting.js,grid.js,highcharts.js;第二步：写controller @Controller@RequestMapping(value="${adminPath}/statistick")public class StatistickController { private UserServi
我的spring学习笔记2-IoC（反向控制依赖注入） aijuans spring mvc Spring 教程 spring3 教程 Spring 入门
IoC（反向控制依赖注入）这是Spring提出来了，这也是Spring一大特色。这里我不用多说，我们看Spring教程就可以了解。当然我们不用Spring也可以用IoC，下面我将介绍不用Spring的IoC。 IoC不是框架，她是java的技术，如今大多数轻量级的容器都会用到IoC技术。这里我就用一个例子来说明：如：程序中有 Mysql.calss 、Oracle.class 、SqlSe
TLS java简单实现 antlove java ssl keystore tls secure
1. SSLServer.java package ssl; import java.io.FileInputStream; import java.io.InputStream; import java.net.ServerSocket; import java.net.Socket; import java.security.KeyStore; import
Zip解压压缩文件百合不是茶 Zip格式解压 Zip流的使用文件解压
ZIP文件的解压缩实质上就是从输入流中读取数据。Java.util.zip包提供了类ZipInputStream来读取ZIP文件,下面的代码段创建了一个输入流来读取ZIP格式的文件; ZipInputStream in = new ZipInputStream(new FileInputStream(zipFileName)); &n
underscore.js 学习（一） bijian1013 JavaScript underscore
工作中需要用到underscore.js，发现这是一个包括了很多基本功能函数的js库，里面有很多实用的函数。而且它没有扩展 javascript的原生对象。主要涉及对Collection、Object、Array、Function的操作。学
java jvm常用命令工具——jstatd命令(Java Statistics Monitoring Daemon) bijian1013 java jvm jstatd
1.介绍 jstatd是一个基于RMI（Remove Method Invocation）的服务程序，它用于监控基于HotSpot的JVM中资源的创建及销毁，并且提供了一个远程接口允许远程的监控工具连接到本地的JVM执行命令。 jstatd是基于RMI的，所以在运行jstatd的服务
【Spring框架三】Spring常用注解之Transactional bit1129 transactional
Spring可以通过注解@Transactional来为业务逻辑层的方法(调用DAO完成持久化动作)添加事务能力，如下是@Transactional注解的定义： /* * Copyright 2002-2010 the original author or authors. * * Licensed under the Apache License, Version
我(程序员)的前进方向 bitray 程序员
作为一个普通的程序员,我一直游走在java语言中,java也确实让我有了很多的体会.不过随着学习的深入,java语言的新技术产生的越来越多,从最初期的javase,我逐渐开始转变到ssh,ssi,这种主流的码农,.过了几天为了解决新问题,webservice的大旗也被我祭出来了,又过了些日子jms架构的activemq也开始必须学习了.再后来开始了一系列技术学习,osgi,restful.....
nginx lua开发经验总结 ronin47
使用nginx lua已经两三个月了，项目接开发完毕了，这几天准备上线并且跟高德地图对接。回顾下来lua在项目中占得必中还是比较大的，跟PHP的占比差不多持平了，因此在开发中遇到一些问题备忘一下 1：content_by_lua中代码容量有限制，一般不要写太多代码，正常编写代码一般在100行左右（具体容量没有细心测哈哈，在4kb左右），如果超出了则重启nginx的时候会报 too long pa
java-66-用递归颠倒一个栈。例如输入栈{1,2,3,4,5}，1在栈顶。颠倒之后的栈为{5,4,3,2,1}，5处在栈顶 bylijinnan java
import java.util.Stack; public class ReverseStackRecursive { /** * Q 66.颠倒栈。 * 题目：用递归颠倒一个栈。例如输入栈{1,2,3,4,5}，1在栈顶。 * 颠倒之后的栈为{5,4,3,2,1}，5处在栈顶。 *1. Pop the top element *2. Revers
正确理解Linux内存占用过高的问题 cfyme linux
Linux开机后，使用top命令查看，4G物理内存发现已使用的多大3.2G，占用率高达80%以上： Mem: 3889836k total, 3341868k used, 547968k free, 286044k buffers Swap: 6127608k total,&nb
[JWFD开源工作流]当前流程引擎设计的一个急需解决的问题 comsci 工作流
当我们的流程引擎进入IRC阶段的时候，当循环反馈模型出现之后，每次循环都会导致一大堆节点内存数据残留在系统内存中，循环的次数越多，这些残留数据将导致系统内存溢出，并使得引擎崩溃。。。。。。而解决办法就是利用汇编语言或者其它系统编程语言，在引擎运行时，把这些残留数据清除掉。
自定义类的equals函数 dai_lm equals
仅作笔记使用 public class VectorQueue { private final Vector<VectorItem> queue; private class VectorItem { private final Object item; private final int quantity; public VectorI
Linux下安装R语言 datageek R语言 linux
命令如下：sudo gedit /etc/apt/sources.list1、deb http://mirrors.ustc.edu.cn/CRAN/bin/linux/ubuntu/ precise/ 2、deb http://dk.archive.ubuntu.com/ubuntu hardy universesudo apt-key adv --keyserver ke
如何修改mysql 并发数(连接数)最大值 dcj3sjt126com mysql
MySQL的连接数最大值跟MySQL没关系，主要看系统和业务逻辑了方法一：进入MYSQL安装目录打开MYSQL配置文件 my.ini 或 my.cnf查找 max_connections=100 修改为 max_connections=1000 服务里重起MYSQL即可　　方法二：MySQL的最大连接数默认是100客户端登录：mysql -uusername -ppass
单一功能原则 dcj3sjt126com 面向对象的程序设计软件设计编程原则
单一功能原则[ 编辑] SOLID 原则单一功能原则开闭原则 Liskov代换原则接口隔离原则依赖反转原则查论编在面向对象编程领域中，单一功能原则（Single responsibility principle）规定每个类都应该有
POJO、VO和JavaBean区别和联系 fanmingxing VO POJO javabean
POJO和JavaBean是我们常见的两个关键字，一般容易混淆，POJO全称是Plain Ordinary Java Object / Plain Old Java Object，中文可以翻译成：普通Java类，具有一部分getter/setter方法的那种类就可以称作POJO，但是JavaBean则比POJO复杂很多，JavaBean是一种组件技术，就好像你做了一个扳子，而这个扳子会在很多地方被
SpringSecurity3.X--LDAP：AD配置 hanqunfeng SpringSecurity
前面介绍过基于本地数据库验证的方式，参考http://hanqunfeng.iteye.com/blog/1155226，这里说一下如何修改为使用AD进行身份验证【只对用户名和密码进行验证，权限依旧存储在本地数据库中】。将配置文件中的如下部分删除：
mac mysql 修改密码 IXHONG mysql
$ sudo /usr/local/mysql/bin/mysqld_safe –user=root & //启动MySQL(也可以通过偏好设置面板来启动)$ sudo /usr/local/mysql/bin/mysqladmin -uroot password yourpassword //设置MySQL密码（注意，这是第一次MySQL密码为空的时候的设置命令，如果是修改密码，还需在-
设计模式--抽象工厂模式 kerryg 设计模式
抽象工厂模式：工厂模式有一个问题就是，类的创建依赖于工厂类，也就是说，如果想要拓展程序，必须对工厂类进行修改，这违背了闭包原则。我们采用抽象工厂模式，创建多个工厂类，这样一旦需要增加新的功能，直接增加新的工厂类就可以了，不需要修改之前的代码。总结：这个模式的好处就是，如果想增加一个功能，就需要做一个实现类，
评"高中女生军训期跳楼” nannan408
首先，先抛出我的观点，各位看官少点砖头。那就是，中国的差异化教育必须做起来。孔圣人有云：有教无类。不同类型的人，都应该有对应的教育方法。目前中国的一体化教育，不知道已经扼杀了多少创造性人才。我们出不了爱迪生，出不了爱因斯坦，很大原因，是我们的培养思路错了，我们是第一要“顺从”。如果不顺从，我们的学校，就会用各种方法，罚站，罚写作业，各种罚。军
scala如何读取和写入文件内容？ qindongliang1922 java jvm scala
直接看如下代码： package file import java.io.RandomAccessFile import java.nio.charset.Charset import scala.io.Source import scala.reflect.io.{File, Path} /** * Created by qindongliang on 2015/
C语言算法之百元买百鸡 qiufeihu c 算法
中国古代数学家张丘建在他的《算经》中提出了一个著名的“百钱买百鸡问题”，鸡翁一，值钱五，鸡母一，值钱三，鸡雏三，值钱一，百钱买百鸡，问翁，母，雏各几何？代码如下： #include <stdio.h> int main() { int cock,hen,chick; /*定义变量为基本整型*/ for(coc
Hadoop集群安全性：Hadoop中Namenode单点故障的解决方案及详细介绍AvatarNode wyz2009107220 NameNode
正如大家所知，NameNode在Hadoop系统中存在单点故障问题，这个对于标榜高可用性的Hadoop来说一直是个软肋。本文讨论一下为了解决这个问题而存在的几个solution。 1. Secondary NameNode 原理：Secondary NN会定期的从NN中读取editlog，与自己存储的Image进行合并形成新的metadata image 优点：Hadoop较早的版本都自带，