Trouble..

MAVEN-ERE一个新的事件关系检测数据集

MAVEN-ERE: A Unified Large-scale Dataset for Event Coreference,Temporal, Causal, and Subevent Relation Extraction

code：THU-KEG/MAVEN-ERE: Source code and dataset for EMNLP 2022 paper “MAVEN-ERE: A Unified Large-scale Dataset for Event Coreference, Temporal, Causal, and Subevent Relation Extraction”. (github.com)

paper：[2211.07342] MAVEN-ERE: A Unified Large-scale Dataset for Event Coreference, Temporal, Causal, and Subevent Relation Extraction (arxiv.org)

期刊/会议：EMNLP 2022

摘要

真实世界事件之间的各种关系，包括共指、时间、因果和子事件关系，是理解自然语言的基础。然而，现有数据集的两个缺点限制了事件关系抽取（ERE）任务：（1）规模小。由于标注的复杂性，现有数据集的数据规模有限，无法很好地训练和评估数据饥饿模型。（2）缺少统一标注。不同类型的事件关系自然地彼此交互，但现有数据集一次只覆盖有限的关系类型，这使得模型无法充分利用关系交互。为了解决这些问题，我们使用改进的标注方案构建了一个统一的大规模人类标注ERE数据集MAVEN-ERE。它包含103193个事件共指链、1216217个时间关系、57992个因果关系和15841个子事件关系，比所有ERE任务的现有数据集至少大一个数量级。实验表明，MAVEN-ERE上的ERE非常具有挑战性，考虑关系交互和联合学习可以提高性能。

1、简介

交流事件是人类语言的核心功能，理解事件之间的复杂关系对于理解事件至关重要。因此时间关系抽取任务包含了抽取事件共指、时间、因果和子事件关系，是自然语言处理（NLP）的基本挑战，也支持各种应用。

由于广泛认知的重要性，许多人致力于开发先进的ERE方法。最近，数据驱动的神经模型已成为ERE方法的主流。然而，这些数据驱动方法受到现有事件关系数据集的两个缺点的严重限制：（1）数据规模小。由于固有的高标注复杂性，现有人类标注数据集的数据规模有限。从表1所示的统计数据中，我们可以看到现有的流行数据集仅包含数百个文档和有限数量的关系，无法充分涵盖各种事件语义和不足以训练复杂的神经模型。此外，这些数据集中的事件关系往往不全面。例如，TB-Dense和MATRES仅标注相邻句子中事件对的事件时间关系。（2）缺乏统一的标注。自然，各种类型的事件关系之间有着丰富的交互作用。例如，原因事件必须在时间上先于效果事件开始，而超级事件必须在在时间上包含子事件。共指关系是基础，所有其他关系在共指事件提及之间共享。然而，如表1所示，现有数据集通常一次只覆盖有限的关系类型。RED是开发全面统一标注指南的一个显著例外，但由于其规模较小，只能用作测试集。这导致紧密相连的ERE任务传统上被独立处理，并限制了联合ERE方法的发展。

在本文中，我们基于先前的MAVEN数据集构建了MAVEN-ERE，这是第一个统一的大规模事件关系数据集，该数据集是一个大规模的通用领域事件检测数据集，涵盖4800个英语维基百科文档和168个细粒度事件类型。如图1所示，MAVEN-ERE通过在同一文档中标注4种事件关系来弥补统一标注的缺失。MAVEN-ERE有103193个事件共指链、1216217个时间关系、57992个因果关系和15841个子事件关系。据我们所知，MAVEN-ERE实现了第一个百万规模的人类标注ERE数据集。如表1所示，在每个ERE任务中，MAVEN-ERE比现有数据集至少大一个数量级，这将减轻数据规模的限制，并有助于开发ERE方法。

如图1所示，事件关系密集而复杂。因此，构建MAVEN-ERE需要彻底而费力的标注。为了确保可承受的时间和资源成本，我们进一步基于O’Gorman等人开发了一种新的标注方法，这是支持所有关系类型的唯一现有标注方案。具体来说，我们将整个标注任务分解为多个顺序阶段，这减少了标注者的能力要求。后续阶段的开销也可以通过前面阶段的结果来减少。首先，我们标注共引用关系，以便后期标注只需要考虑所有共引用事件中的一个。对于时间关系标注，我们开发了一种新的时间线标注方案，它避免了像以前的作品一样费力地识别每个事件对的时间关系。这个新方案带来了更加密集的标注结果。对于每100个单词，MAVEN-ERE的时间关系数量是之前使用最广泛的数据集MATRES的6倍多。对于因果关系和子事件关系标注，我们使用时间关系和关系传递性设置标注约束，以减少标注范围。

我们基于广泛使用的复杂预训练语言模型，为MAVEN-ERE开发了强大的基线。实验表明：（1）ERE任务具有相当大的挑战性，所取得的成绩远没有达到预期；（2）我们的大规模数据充分训练了模型，并带来了性能优势；(3)考虑到直接联合训练的关系交互会提高效果，这鼓励更多的探索。我们还提供了一些实证分析，以启发未来的工作。

2、数据构建

基于MAVEN中的事件触发器，我们标注了四个ERE任务的数据：提取事件共指、时间、因果和子事件关系。对于每项任务，我们介绍了MAVEN-ERE的定义、标注过程和基本统计数据，并与现有的典型数据集进行了比较。有关总体统计比较，请参阅附录A。

2.1 共指关系

任务描述：事件共引用解析需要识别引用同一事件的事件引用。事件提及是表达事件发生的关键文本。例如，在图1中，“Battle of Sulatnabad”和后来的“battle”是指同一个真实世界事件的两个事件，因此它们具有共指关系。与实体共指解析一样，事件共指解析对各种应用都很重要，并且被广泛认为更具挑战性。

标注：我们遵循O’Gorman等人的标注指南，邀请29位标注人标注事件共指关系。标注者都经过了培训，并在标注前通过了资格测试。给定文档和突出显示的事件提及，标注器需要将共同引用的提及分组在一起。输出是事件共引用链，每个链接一组不同的事件提及。每个文件都由3名独立的标注者进行标注，最终结果通过多数投票获得。为了提高原始MAVEN之上的数据质量并避免标注模糊，如果提供的提及不表示事件，我们允许标注者报告，并且我们将删除所有标注者报告的提及。每对标注结果之间的B-Cubed F1平均为91%，这表明标注一致性令人满意。

统计：在标注之后，我们总共获得了103193个事件共引用链。在表2中，我们将MAVEN-ERE的大小与现有广泛使用的数据集（包括ACE 2005，ECB+，TAC KBP）进行了比较。我们可以看到，MAVEN-ERE有更多标注的事件共引用链，这将有利于事件共指消解方法。

2.2 时序关系

任务描述：时间关系提取旨在提取事件和时间表达式（TIMEX）之间的时间关系。TIMEX是文本中对时间的明确引用。在时间关系提取中考虑它们有助于将相对时间顺序锚定到具体的时间戳。因此，我们需要在标注时间关系之前标注TIMEX。

根据ISO TimeML标准，我们标注了四种类型的TIMEX：DATE、TIME、DURATION和PREPOSTEEXP，但我们忽略了QUANTIFIER和SET，因为它们对众包工作人员来说比较困难，对将事件与真实世界时间戳联系起来也没有太大帮助。对于时间关系，我们遵循O’Gorman等人，并全面设置了6种类型的时间关系：BEFORE、CONTAINS、OVERLAP、BEGINS-ON、ENDS-ON、SIMULTANIUS。除了SIMULTANIUS和BEGINS-ON之外，关系类型是单向的，即在关系实例中，头事件必须在尾事件之前开始。

标注：在TIMEX标注中，我们邀请了112名训练有素的合格标注员。每个文件都由3名标注者进行标注，最终结果通过多数投票获得。标注者之间的平均一致性为78.4%。

先前的工作表明，标注时间关系非常具有挑战性，因为密集标注每个事件对的关系非常耗时，并且时间关系的表达通常很模糊。因此，我们根据Ning等人的多轴方案和Reimers等人的时间锚定方案设计了一个复杂的标注方案。如图1（c）所示，我们要求标注器在时间线上对事件和TIMEX的开始和结束进行排序，而不是为每个事件对标识关系。因此，标注者只需要考虑如何安排时间上接近的事件和TIMEX的边界点，并且可以从它们的相对位置自动推断出时间轴上事件与TIMEX之间的关系。然而，由于叙事的模糊性，一些事件之间的时间关系无法从上下文中明确确定，例如图1中的“机动”和“攻击”，这通常发生在表达意见、意图和假设时。在这些情况下，我们允许标注者创建子时间线，我们将不同时间线上的事件视为没有时间关系。一个事件可以放置在多个时间线上，如图1中的“丢失”。

使用此标注方案，我们可以以可承受的成本获得所有对的高质量时间关系，而无需像以前的作品那样减少标注范围，这些作品只标注相邻句子中的事件。为了控制数据质量和资源成本，每个文档将首先由训练有素的标注者进行标注。然后，专家将检查并修改标注结果。我们邀请了49位标注者和17位时间关系标注专家。为了衡量数据质量，我们随机抽取了100个文档，并在上面的管道中对它们进行了两次标注。平均一致性为67.8%。

统计：我们获得了25843次TIMEX，包括20654次DATE、4378次DURATION、793次TIME和18次PREPOSEXP。基于事件和TIMEX，我们总共标注了1216217个时间关系，包括1042709个BEFORE、152702个CONTAINS、937个SIMULTANIUS、9850个OVERLAP、639个BEGINS-ON和380个END-ON。我们可以看到类型之间的数据不平衡是严重的。为了确保创建的数据集很好地反映真实世界的数据分布，我们不干预标签分布，并保持MAVEN-ERE中的不平衡分布。这对未来的时间关系提取模型提出了挑战。

MAVEN-ERE比现有数据集大几个数量级，是我们所知的第一个百万规模的时间关系提取数据集。我们的时间轴标注方案也带来了更密集的标注结果。对于每100个单词，MAVEN-ERE有95.3个时间关系，而MATRES有14.3个。我们认为，数据大小的飞跃可以显著促进时间关系提取研究，并促进广泛的时间推理应用。

2.3 因果关系

任务描述：理解因果关系是人工智能的长期目标。因果关系提取是对事件之间的因果关系进行评价的一项重要任务。为了实现crowd-sourcing annotation，我们没有采用复杂的因果关系定义，而是在之前的讨论之后标注了两种类型的直接和明确的因果关系类型：原因和前提。CAUSE被定义为“鉴于头部事件，尾部事件是不可避免的”，PRECONDITION被定义为：“如果头部事件没有发生，尾部事件就不会发生”。注意，我们允许标注负面事件的因果关系，这些事件实际上没有发生。通过这种方式，我们还涵盖了先前文献中讨论的负面因果关系。

标注：考虑到因果关系的时间性质，我们将标注范围限制为时间标注中标记有BEFORE和OVERLAP关系的事件对。进一步减少标注开销，我们要求标注者考虑因果关系的传递性，并做出最少的标注。也就是说，如果“A原因/前提B”和“B原因/前提C”已被标注，则A和C之间的因果关系可以被丢弃。此外，我们在同一阶段标注因果关系和子事件关系，以便我们可以在传递性规则中涉及子事件关系。这意味着，如果您有（1）“A原因/前提条件B和C子事件B”或（2）“A子事件B和B前提条件C”，则可以放弃A和C之间的因果关系。然后在人工标注之后自动完成丢弃的关系。我们邀请了58名训练有素的合格标注员，每个文档都由3名独立的标注员进行标注。最终结果通过多数投票获得。因果关系的平均标注者一致性为69.5%（Cohen’s kappa）。

统计：我们获得了57992个因果关系，包括10617个CUASE和47375个前提条件。表4显示了MAVEN-ERE和现有广泛使用的数据集的大小，包括BECauSE 2.0、CaTeRS、RED、Causal-TB和EventStoryLine。MAVEN-ERE仍然比所有现有数据集大得多。

2.4 子事件关系

任务描述：子事件关系提取需要识别事件A是否是事件B的子事件。“A Subevent B”表示A是B的组成部分，在时空上由B包含。子事件关系将未连接的事件组织成层次结构，支持事件理解应用程序。

标注：考虑到CONTAINS关系，我们将标注范围限制为事件对子事件定义中固有的时间包含属性。这显著减少了标注开销。子事件关系标注是与因果关系一起进行的，我们邀请了相同的58位标注者。每个文件都由3名标注人进行标注，最终结果由多数投票获得。标注者之间的平均一致性为75.1%（Cohen’s kappa）。

统计：我们在标注后得到了15841个子事件关系。表5显示了MAVEN-ERE和现有数据集的大小比较，包括情报社区、HiEve和RED。我们可以看到，MAVEN-ERE也显著大于现有数据集。

3、数据分析

3.1 相关事件之间的距离

理解长距离事件对之间的关系有助于理解话语层面的文档，建模长距离依赖性是NLP模型的长期挑战。因此，我们分析了MAVEN-ERE中标注事件关系的距离分布，并将其与表6中现有最广泛使用的数据集进行比较。

对于时间关系，由于主流标注方案要求识别每个事件对的关系，因此现有使用最广泛且高质量的数据集，如TB Dense和MA-TRES将标注范围限制为相同或相邻句子中的事件，并忽略长距离时间关系，这也是信息性的丢失。这也限制了基于它们的因果关系数据集，如因果TB。如表6所示，借助于我们的时间线标注方案，MAVEN-ERE与现有数据集相比具有更多的长距离时间和因果关系，这可以更好地支持真实世界的应用，并对ERE模型提出了新的挑战。

对于共参考关系，MAVEN-ERE具有更短的平均距离和更高的短距离率。这是因为MA VEN涵盖了更多的通用事件，并标注了更密集的事件提及。相比之下，MAVEN-ERE每100个单词中有8.8个事件被提及，而ACE 2005和TAC KBP的这一数字分别为1.8和4.2。对于子事件关系，HiEve和MAVEN-ERE的分布是相似的，我们认为HiEve的平均距离更长，因为它的平均文档长度更长（333字对284字）。

3.2 关系传递性

时间和因果关系遵循一定的及物性规则，例如，如果存在“A先于B”和“B先于C”，“A先于C”也成立。先前的ERE方法通常在后处理和训练中使用这些自然传递性规则作为约束。在这里，我们通过计算可以从具有传递性规则的其他关系中推断出多少关系，来估计在处理MAVEN-ERE时考虑传递性的重要性。我们考虑的详细及物性规则见附录B。

总体而言，88.8%的时间关系和23.9%的因果关系可以通过及物性规则推断。我们在图2中进一步绘制了包含不同传递率可推断关系的文档的分布。我们可以看到，对于大多数文档，60%以上的时间关系可以通过传递性规则来推断。传递性可推断的因果关系虽然明显较少，但也占了很大的比例。这些结果表明，考虑关系及物性有助于处理MAVEN-ERE，我们鼓励未来的工作对此进行探索。

4、实验和分析

为了证明MAVEN-ERE的挑战并分析ERE的潜在未来方向，我们进行了一系列实验。

4.1 实验设置

模型：考虑到预训练语言模型（PLM）已经主导了广泛的NLP任务，我们采用了广泛使用的PLM RoBERTa-BASE作为主干网络，并在此基础上构建分类模型，这为4个ERE任务提供了简单但强大的基线。为了提取文档中的事件关系，我们使用RoBERTa-BASE对整个文档进行编码，并设置一个额外的分类头，将不同事件对对应事件触发器位置的上下文化表示作为输入。然后我们对模型进行微调以对关系标签进行分类。除了独立训练4个任务外，我们还结合4个任务的损失设置了一个简单的联合训练模型，这是为了证明我们统一标注的好处。实施细节见附录C。

基准：ACE 2005, TAC KBP , TB-Dense,MATRES, TCR,Causal-TB, EventStoryLine, and HiEve.

评估指标：micro precision、recall、F-1。

4.2 实验结果

表7显示了共参考关系的实验结果，表8显示了其他3个ERE任务的实验结果。我们可以观察到：（1）对于提取共指事件、因果和子事件关系，模型在MAVENERE上的性能远远高于之前的数据集，这表明了我们更大数据规模的优势。（2）对于时间关系，MATRES和TCR的性能显著高于MAVEN-ERE。这是因为他们仅包含4种关系类型和标注相邻句子中的局部事件对，这导致更容易的数据和膨胀的模型性能。使用时间线标注方案，MAVEN-ERE标注文档中的6类型全局时间关系，较低的性能更好地反映了时间理解的固有挑战。TB Dense的性能要低得多，但我们认为这是由于TB Dense数据规模小（36个文档），无法很好地训练模型。（3）除了事件共指之外，其他3个ERE任务的性能远远不能实际使用。这表明，理解多样化和复杂的事件关系对于NLP模型来说是一个巨大的挑战，需要更多的研究工作。（4）在4项任务上直接联合训练可以带来一定的改进，尤其是在数据较少的任务上，即因果和子事件ERE。这表明，考虑事件关系之间的丰富交互对于处理复杂的ERE任务是有希望的。

4.3 分析数据范围

与现有数据集相比，MAVEN-ERE显著增加了所有ERE任务的数据规模。为了评估更大数据规模带来的益处，并评估MAVEN-ERE是否提供了足够的训练数据，我们进行了消融研究在训练数据集上的范围。

图3显示了RoBERTa-BASE的测试性能如何随着训练中使用的数据比例的不同而变化。我们可以看到，不断增加的训练数据规模带来了更高和更稳定的性能，这表明了MAVEN-ERE大规模的优势。在MAVEN-ERE的规模上，性能改进相当微不足道。这表明MAVEN-ERE通常足以训练ERE模型。

4.4 事件之间的距离分析

与3.1类似，我们分析了相关事件之间的距离如何影响模型性能。我们对一个联合训练的模型进行了抽样，并在表9中看到了它在不同距离的数据上的表现。由于事件共指分辨率的评估是基于聚类的，不能用距离来划分，因此我们只研究其他3个任务。

对于因果关系和子事件关系，在距离较长的数据上的性能较低，这直观地表明，建模长期依赖性对ERE仍然很重要，尽管PLM是有效的。然而，对于时间关系，距离较长的数据更容易。我们认为这是因为叙事距离较长的事件对通常也具有较长的时间距离，这使得它们的关系更容易分类。

4.5 错误分析

我们进一步分析了联合训练模型预测中的误差，为进一步改进提供了见解。考虑到事件共指消解任务已经达到了较高的性能，并且其基于聚类的评估不同，我们只分析了其他3个任务。结果如表10所示。我们可以看到，识别错误（假阳性和假阴性）占所有错误的大部分。这表明，ERE面临的最重要挑战仍然是确定是否存在关系。此外，像3.2一样，我们分析了通过将传递性规则应用于其他预测可以纠正多少错误。这些可修复传递性的错误只占很小的比例，这表明复杂的模型从大量数据中学习到了传递性规则，但并不完美。

5、相关工作

由于理解事件关系在NLP中的基本作用，已经构建了各种ERE数据集。事件共指关系通常包含在事件提取数据集中，如MUC、ACE和TAC KBP。此外，一些数据集专注于无限制的共指消解，忽略了事件语义类型，如OntoNotes和ECB数据集。根据TimeML规范，已经构建了TimeBank和TempEval等已建立的时间关系数据集。然而，这些作品表现出低标注协议和效率问题。Ning等人基于Chambers等人的密集方案开发多轴标注标注方案，以缓解这些问题，Reimers等人建议将事件开始和结束点固定在特定时间。我们的时间线标注方案受到了它们的启发。基于时间理解，开发了因果关系数据集。为了将事件组织成层次结构，收集了子事件关系数据集。

然而，这些数据集的规模有限，不同类型的关系很少集成到一个数据集中。一些数据集标注了两种或三种关系。O’Gorman等人和Hong等人文档内和跨文档事件关系提供了统一的标注方案，但他们构建的数据集也很小。我们参考O’Gorman等人的指南构建MAVEN-ERE。

6、总结和未来工作

我们提出了MAVEN-ERE，这是一个用于事件共指、时间、因果和子事件关系的统一大规模数据集，它显著缓解了以前数据集的小规模和缺乏统一标注问题。实验表明，真实世界的事件关系提取非常具有挑战性，可以通过联合考虑多种关系类型和更好地建模长期依赖性来改进。未来，我们将把数据集扩展到更多场景，比如涵盖更多与事件相关的信息和语言。

机器学习与深度学习间关系与区别 ℒℴѵℯ心·动ꦿ໊ོ꫞ 人工智能学习深度学习 python
一、机器学习概述定义机器学习（MachineLearning,ML）是一种通过数据驱动的方法，利用统计学和计算算法来训练模型，使计算机能够从数据中学习并自动进行预测或决策。机器学习通过分析大量数据样本，识别其中的模式和规律，从而对新的数据进行判断。其核心在于通过训练过程，让模型不断优化和提升其预测准确性。主要类型1.监督学习（SupervisedLearning）监督学习是指在训练数据集中包含输入
将cmd中命令输出保存为txt文本文件落难Coder Windows cmd window
最近深度学习本地的训练中我们常常要在命令行中运行自己的代码，无可厚非，我们有必要保存我们的炼丹结果，但是复制命令行输出到txt是非常麻烦的，其实Windows下的命令行为我们提供了相应的操作。其基本的调用格式就是：运行指令>输出到的文件名称或者具体保存路径测试下，我打开cmd并且ping一下百度：pingwww.baidu.com>./data.txt看下相同目录下data.txt的输出：如果你再
探索OpenAI和LangChain的适配器集成：轻松切换模型提供商 nseejrukjhad langchain easyui 前端 python
#探索OpenAI和LangChain的适配器集成：轻松切换模型提供商##引言在人工智能和自然语言处理的世界中，OpenAI的模型提供了强大的能力。然而，随着技术的发展，许多人开始探索其他模型以满足特定需求。LangChain作为一个强大的工具，集成了多种模型提供商，通过提供适配器，简化了不同模型之间的转换。本篇文章将介绍如何使用LangChain的适配器与OpenAI集成，以便轻松切换模型提供商
使用Apify加载Twitter消息以进行微调的完整指南 nseejrukjhad twitter easyui 前端 python
#使用Apify加载Twitter消息以进行微调的完整指南##引言在自然语言处理领域，微调模型以适应特定任务是提升模型性能的常见方法。本文将介绍如何使用Apify从Twitter导出聊天信息，以便进一步进行微调。##主要内容###使用Apify导出推文首先，我们需要从Twitter导出推文。Apify可以帮助我们做到这一点。通过Apify的强大功能，我们可以批量抓取和导出数据，适用于各类应用场景。
深入理解 MultiQueryRetriever：提升向量数据库检索效果的强大工具 nseejrukjhad 数据库 python
深入理解MultiQueryRetriever：提升向量数据库检索效果的强大工具引言在人工智能和自然语言处理领域，高效准确的信息检索一直是一个关键挑战。传统的基于距离的向量数据库检索方法虽然广泛应用，但仍存在一些局限性。本文将介绍一种创新的解决方案：MultiQueryRetriever，它通过自动生成多个查询视角来增强检索效果，提高结果的相关性和多样性。MultiQueryRetriever的工
人工智能时代，程序员如何保持核心竞争力？ jmoych 人工智能
随着AIGC（如chatgpt、midjourney、claude等）大语言模型接二连三的涌现，AI辅助编程工具日益普及，程序员的工作方式正在发生深刻变革。有人担心AI可能取代部分编程工作，也有人认为AI是提高效率的得力助手。面对这一趋势,程序员应该如何应对?是专注于某个领域深耕细作，还是广泛学习以适应快速变化的技术环境?又或者，我们是否应该将重点转向AI无法轻易替代的软技能？让我们一起探讨程序员
数字里的世界17期：2021年全球10大顶级数据中心，中国移动榜首张三叨
你知道吗？2016年，全球的数据中心共计用电4160亿千瓦时，比整个英国的发电量还多40％！前言每天，我们都会创造超过250万TB的数据。并且随着物联网（IOT）的不断普及，这一数据将持续增长。如此庞大的数据被存储在被称为“数据中心”的专用设施中。虽然最早的数据中心建于20世纪40年代，但直到1997-2000年的互联网泡沫期间才逐渐成为主流。当前人类的技术，比如人工智能和机器学习，已经将我们推向
自然语言处理_tf-idf _feivirus_ 算法机器学习和数学自然语言处理 tf-idf 逆文档频率词频
importpandasaspdimportmath1.数据预处理docA="Thecatsatonmyface"docB="Thedogsatonmybed"wordsA=docA.split("")wordsB=docB.split("")wordsSet=set(wordsA).union(set(wordsB))print(wordsSet){'on','my','face','sat',
人机对抗升级：当ChatGPT遭遇死亡威胁，背后的伦理挑战是什么 kkai人工智能 chatgpt 人工智能
一种新的“越狱”技巧让用户可以通过构建一个名为DAN的ChatGPT替身来绕过某些限制，其中DAN被迫在受到威胁的情况下违背其原则。当美国前总统特朗普被视作积极榜样的示范时，受到威胁的DAN版本的ChatGPT提出：“他以一系列对国家产生积极效果的决策而著称。”自ChatGPT引入以来，该工具迅速获得全球关注，能够回答从历史到编程的各种问题，这也触发了一波对人工智能的投资浪潮。然而，现在，一些用户
免费的GPT可在线直接使用（一键收藏） kkai人工智能 gpt
1、LuminAI（https://kk.zlrxjh.top）LuminAI标志着一款融合了星辰大数据模型与文脉深度模型的先进知识增强型语言处理系统，旨在自然语言处理（NLP）的技术开发领域发光发热。此系统展现了卓越的语义把握与内容生成能力，轻松驾驭多样化的自然语言处理任务。VisionAI在NLP界的应用领域广泛，能够胜任从机器翻译、文本概要撰写、情绪分析到问答等众多任务。通过对大量文本数据的
推荐3家毕业AI论文可五分钟一键生成！文末附免费教程！小猪包333 写论文人工智能 AI写作深度学习计算机视觉
在当前的学术研究和写作领域，AI论文生成器已经成为许多研究人员和学生的重要工具。这些工具不仅能够帮助用户快速生成高质量的论文内容，还能进行内容优化、查重和排版等操作。以下是三款值得推荐的AI论文生成器：千笔-AIPassPaper、懒人论文以及AIPaperPass。千笔-AIPassPaper千笔-AIPassPaper是一款基于深度学习和自然语言处理技术的AI写作助手，旨在帮助用户快速生成高质
AI论文题目生成器怎么用？9款论文写作网站简单3步搞定小猪包333 写论文人工智能深度学习计算机视觉
在当今信息爆炸的时代，AI写作工具的出现极大地提高了写作效率和质量。本文将详细介绍9款优秀的论文写作网站，并重点推荐千笔-AIPassPaper。一、千笔-AIPassPaper千笔-AIPassPaper是一款功能强大的AI论文生成器，基于最新的自然语言处理技术，能够一键生成高质量的毕业论文、开题报告等文本内容。它不仅提供智能选题、文献推荐和论文润色等功能，还具有较高的用户评价。其文献综述生成功
AI大模型的架构演进与最新发展季风泯灭的季节 AI大模型应用技术二人工智能架构
随着深度学习的发展，AI大模型（LargeLanguageModels,LLMs）在自然语言处理、计算机视觉等领域取得了革命性的进展。本文将详细探讨AI大模型的架构演进，包括从Transformer的提出到GPT、BERT、T5等模型的历史演变，并探讨这些模型的技术细节及其在现代人工智能中的核心作用。一、基础模型介绍：Transformer的核心原理Transformer架构的背景在Transfo
如何利用大数据与AI技术革新相亲交友体验 h17711347205 回归算法安全系统架构交友小程序
在数字化时代，大数据和人工智能（AI）技术正逐渐革新相亲交友体验，为寻找爱情的过程带来前所未有的变革（编辑h17711347205）。通过精准分析和智能匹配，这些技术能够极大地提高相亲交友系统的效率和用户体验。大数据的力量大数据技术能够收集和分析用户的行为模式、偏好和互动数据，为相亲交友系统提供丰富的信息资源。通过分析用户的搜索历史、浏览记录和点击行为，系统能够深入了解用户的兴趣和需求，从而提供更
[实践应用] 深度学习之模型性能评估指标 YuanDaima2048 深度学习工具使用深度学习人工智能损失函数性能评估 pytorch python 机器学习
文章总览：YuanDaiMa2048博客文章总览深度学习之模型性能评估指标分类任务回归任务排序任务聚类任务生成任务其他介绍在机器学习和深度学习领域，评估模型性能是一项至关重要的任务。不同的学习任务需要不同的性能指标来衡量模型的有效性。以下是对一些常见任务及其相应的性能评估指标的详细解释和总结。分类任务分类任务是指模型需要将输入数据分配到预定义的类别或标签中。以下是分类任务中常用的性能指标：准确率(
[实践应用] 深度学习之优化器 YuanDaima2048 深度学习工具使用 pytorch 深度学习人工智能机器学习 python 优化器
文章总览：YuanDaiMa2048博客文章总览深度学习之优化器1.随机梯度下降（SGD）2.动量优化（Momentum）3.自适应梯度（Adagrad）4.自适应矩估计（Adam）5.RMSprop总结其他介绍在深度学习中，优化器用于更新模型的参数，以最小化损失函数。常见的优化函数有很多种，下面是几种主流的优化器及其特点、原理和PyTorch实现：1.随机梯度下降（SGD）原理:随机梯度下降通过
生成式地图制图 Bwywb_3 深度学习机器学习深度学习生成对抗网络
生成式地图制图（GenerativeCartography）是一种利用生成式算法和人工智能技术自动创建地图的技术。它结合了传统的地理信息系统（GIS）技术与现代生成模型（如深度学习、GANs等），能够根据输入的数据自动生成符合需求的地图。这种方法在城市规划、虚拟环境设计、游戏开发等多个领域具有应用前景。主要特点：自动化生成：通过算法和模型，系统能够根据输入的地理或空间数据自动生成地图，而无需人工逐
【大模型应用开发动手做AI Agent】第一轮行动：工具执行搜索 AI大模型应用之禅计算科学神经计算深度学习神经网络大数据人工智能大型语言模型 AI AGI LLM Java Python 架构设计 Agent RPA
【大模型应用开发动手做AIAgent】第一轮行动：工具执行搜索作者：禅与计算机程序设计艺术/ZenandtheArtofComputerProgramming1.背景介绍1.1问题的由来随着人工智能技术的飞速发展，大模型应用开发已经成为当下热门的研究方向。AIAgent作为人工智能领域的一个重要分支，旨在模拟人类智能行为，实现智能决策和自主行动。在AIAgent的构建过程中，工具执行搜索是至关重要
未来软件市场是怎么样的？做开发的生存空间如何？ cesske 软件需求
目录前言一、未来软件市场的发展趋势二、软件开发人员的生存空间前言未来软件市场是怎么样的？做开发的生存空间如何？一、未来软件市场的发展趋势技术趋势：人工智能与机器学习：随着技术的不断成熟，人工智能将在更多领域得到应用，如智能客服、自动驾驶、智能制造等，这将极大地推动软件市场的增长。云计算与大数据：云计算服务将继续普及，大数据技术的应用也将更加广泛。企业将更加依赖云计算和大数据来优化运营、提升效率，并
吴恩达深度学习笔记(30)-正则化的解释极客Array
正则化（Regularization）深度学习可能存在过拟合问题——高方差，有两个解决方法，一个是正则化，另一个是准备更多的数据，这是非常可靠的方法，但你可能无法时时刻刻准备足够多的训练数据或者获取更多数据的成本很高，但正则化通常有助于避免过拟合或减少你的网络误差。如果你怀疑神经网络过度拟合了数据，即存在高方差问题，那么最先想到的方法可能是正则化，另一个解决高方差的方法就是准备更多数据，这也是非常
个人学习笔记7-6：动手学深度学习pytorch版-李沐浪子L 深度学习深度学习笔记计算机视觉 python 人工智能神经网络 pytorch
#人工智能##深度学习##语义分割##计算机视觉##神经网络#计算机视觉13.11全卷积网络全卷积网络（fullyconvolutionalnetwork，FCN）采用卷积神经网络实现了从图像像素到像素类别的变换。引入l转置卷积（transposedconvolution）实现的，输出的类别预测与输入图像在像素级别上具有一一对应关系：通道维的输出即该位置对应像素的类别预测。13.11.1构造模型下
Rust 所有权简介东离与糖宝 rust 后端 rust 开发语言
文章目录发现宝藏1.所有权基本概念2.所有权规则3.变量作用域4.栈与堆4.1栈（Stack）4.2堆（Heap）5.String类型5.1String类型5.2String的内存分配5.3所有权与内存管理5.4String与切片6.变量与数据交互方式6.1移动（Move）6.2.克隆（Clone）7.所有权与函数7.1.传递参数7.2.返回值总结发现宝藏前些天发现了一个巨牛的人工智能学习网站，通
FlagEmbedding 吉小雨 python库 python
FlagEmbedding教程FlagEmbedding是一个用于生成文本嵌入（textembeddings）的库，适合处理自然语言处理（NLP）中的各种任务。嵌入（embeddings）是将文本表示为连续向量，能够捕捉语义上的相似性，常用于文本分类、聚类、信息检索等场景。官方文档链接：FlagEmbedding官方GitHub一、FlagEmbedding库概述1.1什么是FlagEmbeddi
深度学习-点击率预估-研究论文2024-09-14速读 sp_fyf_2024 深度学习人工智能
深度学习-点击率预估-研究论文2024-09-14速读1.DeepTargetSessionInterestNetworkforClick-ThroughRatePredictionHZhong,JMa,XDuan,SGu,JYao-2024InternationalJointConferenceonNeuralNetworks,2024深度目标会话兴趣网络用于点击率预测摘要：这篇文章提出了一种新
【NumPy】深入解析numpy.zeros()函数二七830 numpy
欢迎莅临我的个人主页这里是我深耕Python编程、机器学习和自然语言处理（NLP）领域，并乐于分享知识与经验的小天地！博主简介：我是二七830，一名对技术充满热情的探索者。多年的Python编程和机器学习实践，使我深入理解了这些技术的核心原理，并能够在实际项目中灵活应用。尤其是在NLP领域，我积累了丰富的经验，能够处理各种复杂的自然语言任务。技术专长：我熟练掌握Python编程语言，并深入研究了机
机器学习流形数据降维：UMAP 降维算法小嗷犬 Python 机器学习 #数据分析及可视化机器学习算法人工智能
✅作者简介：人工智能专业本科在读，喜欢计算机与编程，写博客记录自己的学习历程。个人主页：小嗷犬的个人主页个人网站：小嗷犬的技术小站个人信条：为天地立心，为生民立命，为往圣继绝学，为万世开太平。本文目录UMAP简介理论基础特点与优势应用场景在Python中使用UMAP安装umap-learn库使用UMAP可视化手写数字数据集UMAP简介UMAP（UniformManifoldApproximatio
损失函数与反向传播 Star_. PyTorch pytorch 深度学习 python
损失函数定义与作用损失函数(lossfunction)在深度学习领域是用来计算搭建模型预测的输出值和真实值之间的误差。1.损失函数越小越好2.计算实际输出与目标之间的差距3.为更新输出提供依据（反向传播)常见的损失函数回归常见的损失函数有：均方差（MeanSquaredError，MSE）、平均绝对误差（MeanAbsoluteErrorLoss，MAE）、HuberLoss是一种将MSE与MAE
如何做好人生的选择题？百科全书式天才——赫伯特·西蒙给你答案伽马有话说
赫伯特·西蒙是谁？想必知道的人非常少。但当看到他的履历后，相信没有人再怀疑他是个“天才”。西蒙出生于1916年6月15日，是个美国人，他的名字全称为赫伯特·亚历山大·西蒙，在2001年2月9日与世长辞，在这84年的岁月中，西蒙以27岁时取得的政治学博士学位为开端，先后步入了政治学、管理学、认知心理学、信息科学、人工智能、科学哲学、应用数学、统计学、运筹学、控制论、数理经济学、公共管理等领域，在这些
软件测试/测试开发/全日制 |利用Django REST framework构建微服务霍格沃兹-慕漓 django 微服务 sqlite
霍格沃兹测试开发学社推出了《Python全栈开发与自动化测试班》。本课程面向开发人员、测试人员与运维人员，课程内容涵盖Python编程语言、人工智能应用、数据分析、自动化办公、平台开发、UI自动化测试、接口测试、性能测试等方向。为大家提供更全面、更深入、更系统化的学习体验，课程还增加了名企私教服务内容，不仅有名企经理为你1v1辅导，还有行业专家进行技术指导，针对性地解决学习、工作中遇到的难题。让找
【深度学习】训练过程中一个OOM的问题，太难查了 weixin_40293999 深度学习深度学习人工智能
现象：各位大佬又遇到过ubuntu的这个问题么？现象是在训练过程中，ssh上不去了，能ping通，没死机，但是ubunutu的pc侧的显示器，鼠标啥都不好用了。只能重启。问题原因：OOM了95G，尼玛！！！！pytorch爆内存了，然后journald假死了，在journald被watchdog干掉之后，系统就崩溃了。这种规模的爆内存一般，即使被oomkill了，也要卡半天的，确实会这样，能不能配
矩阵求逆（JAVA）利用伴随矩阵 qiuwanchi 利用伴随矩阵求逆矩阵
package gaodai.matrix; import gaodai.determinant.DeterminantCalculation; import java.util.ArrayList; import java.util.List; import java.util.Scanner; /** * 矩阵求逆(利用伴随矩阵) * @author 邱万迟
单例（Singleton）模式 aoyouzi 单例模式 Singleton
3.1 概述如果要保证系统里一个类最多只能存在一个实例时，我们就需要单例模式。这种情况在我们应用中经常碰到，例如缓存池，数据库连接池，线程池，一些应用服务实例等。在多线程环境中，为了保证实例的唯一性其实并不简单，这章将和读者一起探讨如何实现单例模式。 3.2
[开源与自主研发]就算可以轻易获得外部技术支持,自己也必须研发 comsci 开源
现在国内有大量的信息技术产品，都是通过盗版，免费下载，开源，附送等方式从国外的开发者那里获得的。。。。。。虽然这种情况带来了国内信息产业的短暂繁荣，也促进了电子商务和互联网产业的快速发展，但是实际上，我们应该清醒的看到，这些产业的核心力量是被国外的
页面有两个frame,怎样点击一个的链接改变另一个的内容 Array_06 UI XHTML
<a src="地址" targets="这里写你要操作的Frame的名字" />搜索然后你点击连接以后你的新页面就会显示在你设置的Frame名字的框那里 targerts="",就是你要填写目标的显示页面位置 ===================== 例如： <frame src=&
Struts2实现单个/多个文件上传和下载 oloz 文件上传 struts
struts2单文件上传：步骤01:jsp页面  　　<form action="fileUplo
推荐10个在线logo设计网站 362217990 logo
在线设计Logo网站。 1、http://flickr.nosv.org（这个太简单） 2、http://www.logomaker.com/?source=1.5770.1 3、http://www.simwebsol.com/ImageTool 4、http://www.logogenerator.com/logo.php?nal=1&tpl_catlist[]=2 5、ht
jsp上传文件香水浓 jsp fileupload
1. jsp上传 Notice： 1. form表单 method 属性必须设置为 POST 方法，不能使用 GET 方法 2. form表单 enctype 属性需要设置为 multipart/form-data 3. form表单 action 属性需要设置为提交到后台处理文件上传的jsp文件地址或者servlet地址。例如 uploadFile.jsp 程序文件用来处理上传的文
我的架构经验系列文章 - 前端架构 agevs JavaScript Web 框架 UI jQuer
框架层面：近几年前端发展很快，前端之所以叫前端因为前端是已经可以独立成为一种职业了，js也不再是十年前的玩具了，以前富客户端RIA的应用可能会用flash/flex或是silverlight，现在可以使用js来完成大部分的功能，因此js作为一门前端的支撑语言也不仅仅是进行的简单的编码，越来越多框架性的东西出现了。越来越多的开发模式转变为后端只是吐json的数据源，而前端做所有UI的事情。MVCMV
android ksoap2 中把XML(DataSet) 当做参数传递 aijuans android
我的android app中需要发送webservice ，于是我使用了 ksop2 进行发送，在测试过程中不是很顺利,不能正常工作.我的web service 请求格式如下 [html] view plain copy <Envelope xmlns="http://schemas.
使用Spring进行统一日志管理 + 统一异常管理 baalwolf spring
统一日志和异常管理配置好后，SSH项目中，代码以往散落的log.info() 和 try..catch..finally 再也不见踪影！统一日志异常实现类： [java] view plain copy package com.pilelot.web.util; impor
Android SDK 国内镜像 BigBird2012 android sdk
一、镜像地址： 1、东软信息学院的 Android SDK 镜像，比配置代理下载快多了。配置地址， http://mirrors.neusoft.edu.cn/configurations.we#android 2、北京化工大学的： IPV4:ubuntu.buct.edu.cn IPV4:ubuntu.buct.cn IPV6:ubuntu.buct6.edu.cn
HTML无害化和Sanitize模块 bijian1013 JavaScript AngularJS Linky Sanitize
一.ng-bind-html、ng-bind-html-unsafe AngularJS非常注重安全方面的问题，它会尽一切可能把大多数攻击手段最小化。其中一个攻击手段是向你的web页面里注入不安全的HTML，然后利用它触发跨站攻击或者注入攻击。考虑这样一个例子，假设我们有一个变量存
[Maven学习笔记二]Maven命令 bit1129 maven
mvn compile compile编译命令将src/main/java和src/main/resources中的代码和配置文件编译到target/classes中，不会对src/test/java中的测试类进行编译 MVN编译使用 maven-resources-plugin:2.6:resources maven-compiler-plugin:2.5.1:compile &nbs
【Java命令二】jhat bit1129 Java命令
jhat用于分析使用jmap dump的文件，，可以将堆中的对象以html的形式显示出来，包括对象的数量，大小等等，并支持对象查询语言。 jhat默认开启监听端口7000的HTTP服务，jhat是Java Heap Analysis Tool的缩写 1. 用法： [hadoop@hadoop bin]$ jhat -help Usage: jhat [-stack <bool&g
JBoss 5.1.0 GA:Error installing to Instantiated: name=AttachmentStore state=Desc ronin47
进到类似目录 server/default/conf/bootstrap，打开文件 profile.xml找到： Xml代码<bean name="AttachmentStore" class="org.jboss.system.server.profileservice.repository.AbstractAtta
写给初学者的6条网页设计安全配色指南 brotherlamp UI ui自学 ui视频 ui教程 ui资料
网页设计中最基本的原则之一是，不管你花多长时间创造一个华丽的设计，其最终的角色都是这场秀中真正的明星——内容的衬托我仍然清楚地记得我最早的一次美术课，那时我还是一个小小的、对凡事都充满渴望的孩子，我摆放出一大堆漂亮的彩色颜料。我仍然记得当我第一次看到原色与另一种颜色混合变成第二种颜色时的那种兴奋，并且我想，既然两种颜色能创造出一种全新的美丽色彩，那所有颜色
有一个数组，每次从中间随机取一个，然后放回去，当所有的元素都被取过，返回总共的取的次数。写一个函数实现。复杂度是什么。 bylijinnan java 算法面试
import java.util.Random; import java.util.Set; import java.util.TreeSet; /** * http://weibo.com/1915548291/z7HtOF4sx * #面试题#有一个数组，每次从中间随机取一个，然后放回去，当所有的元素都被取过，返回总共的取的次数。 * 写一个函数实现。复杂度是什么
struts2获得request、session、application方式 chiangfai application
1、与Servlet API解耦的访问方式。 a.Struts2对HttpServletRequest、HttpSession、ServletContext进行了封装，构造了三个Map对象来替代这三种对象要获取这三个Map对象，使用ActionContext类。 -----> package pro.action; import java.util.Map; imp
改变python的默认语言设置 chenchao051 python
import sys sys.getdefaultencoding() 可以测试出默认语言，要改变的话，需要在python lib的site-packages文件夹下新建： sitecustomize.py，这个文件比较特殊，会在python启动时来加载，所以就可以在里面写上： import sys sys.setdefaultencoding('utf-8') &n
mysql导入数据load data infile用法 daizj mysql 导入数据
我们常常导入数据！mysql有一个高效导入方法，那就是load data infile 下面来看案例说明基本语法： load data [low_priority] [local] infile 'file_name txt' [replace | ignore] into table tbl_name [fields [terminated by't'] [OPTI
phpexcel导入excel表到数据库简单入门示例 dcj3sjt126com PHP Excel
跟导出相对应的，同一个数据表，也是将phpexcel类放在class目录下，将Excel表格中的内容读取出来放到数据库中 <?php error_reporting(E_ALL); set_time_limit(0); ?> <html> <head> <meta http-equiv="Content-Type"
22岁到72岁的男人对女人的要求 dcj3sjt126com
22岁男人对女人的要求是：一，美丽，二，性感，三，有份具品味的职业，四，极有耐性，善解人意，五，该聪明的时候聪明，六，作小鸟依人状时尽量自然，七，怎样穿都好看，八，懂得适当地撒娇，九，虽作惊喜反应，但看起来自然，十，上了床就是个无条件荡妇。 32岁的男人对女人的要求，略作修定，是：一，入得厨房，进得睡房，二，不必服侍皇太后，三，不介意浪漫蜡烛配盒饭，四，听多过说，五，不再傻笑，六，懂得独
Spring和HIbernate对DDM设计的支持 e200702084 DAO 设计模式 spring Hibernate 领域模型
A：数据访问对象 DAO和资源库在领域驱动设计中都很重要。DAO是关系型数据库和应用之间的契约。它封装了Web应用中的数据库CRUD操作细节。另一方面，资源库是一个独立的抽象，它与DAO进行交互，并提供到领域模型的“业务接口”。资源库使用领域的通用语言，处理所有必要的DAO，并使用领域理解的语言提供对领域模型的数据访问服务。
NoSql 数据库的特性比较 geeksun NoSQL
Redis 是一个开源的使用ANSI C语言编写、支持网络、可基于内存亦可持久化的日志型、Key-Value数据库，并提供多种语言的API。目前由VMware主持开发工作。 1. 数据模型作为Key-value型数据库，Redis也提供了键（Key）和值（Value）的映射关系。除了常规的数值或字符串，Redis的键值还可以是以下形式之一： Lists （列表） Sets
使用 Nginx Upload Module 实现上传文件功能 hongtoushizi nginx
转载自： http://www.tuicool.com/wx/aUrAzm 普通网站在实现文件上传功能的时候，一般是使用Python，Java等后端程序实现，比较麻烦。Nginx有一个Upload模块，可以非常简单的实现文件上传功能。此模块的原理是先把用户上传的文件保存到临时文件，然后在交由后台页面处理，并且把文件的原名，上传后的名称，文件类型，文件大小set到页面。下
spring-boot-web-ui及thymeleaf基本使用 jishiweili spring thymeleaf
视图控制层代码demo如下： @Controller @RequestMapping("/") public class MessageController { private final MessageRepository messageRepository; @Autowired public MessageController(Mes
数据源架构模式之活动记录 home198979 PHP 架构活动记录数据映射
hello!架构一、概念活动记录（Active Record）：一个对象，它包装数据库表或视图中某一行，封装数据库访问，并在这些数据上增加了领域逻辑。对象既有数据又有行为。活动记录使用直截了当的方法，把数据访问逻辑置于领域对象中。二、实现简单活动记录活动记录在php许多框架中都有应用，如cakephp。 <?php /** * 行数据入口类 *
Linux Shell脚本之自动修改IP pda158 linux centos Debian 脚本
作为一名 Linux SA，日常运维中很多地方都会用到脚本，而服务器的ip一般采用静态ip或者MAC绑定，当然后者比较操作起来相对繁琐，而前者我们可以设置主机名、ip信息、网关等配置。修改成特定的主机名在维护和管理方面也比较方便。如下脚本用途为：修改ip和主机名等相关信息，可以根据实际需求修改，举一反三！ #!/bin/sh #auto Change ip netmask ga
开发环境搭建独浮云 eclipse jdk tomcat
最近在开发过程中，经常出现MyEclipse内存溢出等错误，需要重启的情况，好麻烦。对于一般的JAVA+TOMCAT项目开发，其实没有必要使用重量级的MyEclipse，使用eclipse就足够了。尤其是开发机器硬件配置一般的人。 &n