Trouble..

RolePred: Open-Vocabulary Argument Role Prediction for Event Extraction 论文解读

Open-Vocabulary Argument Role Prediction for Event Extraction

论文：2211.01577.pdf (53yu.com)

代码：yzjiao/RolePred: Source code for EMNLP findings paper “Open-Vocabulary Argument Role Prediction for Event Extraction” (github.com)

期刊/会议：EMNLP 2022

摘要

事件抽取中的论元角色是指事件和参与事件的论元之间的关系。尽管事件抽取取得了巨大进展，但现有研究仍然依赖于领域专家预定义的角色。这些研究在扩展到新兴事件类型或没有可用角色的新领域时暴露出明显的弱点。因此，需要更多的注意力和精力来自动定制论元角色。在本文中，我们定义了这一基本但尚未探索的任务：开放词汇论元角色预测。此任务的目标是为给定的事件类型推断一组论元角色。为此，我们提出了一种新的无监督框架ROLEPRED。具体来说，我们将角色预测问题表述为一个填充任务，并为预训练的语言模型构建提示以生成候选角色。通过抽取和分析候选论元，进一步合并和选择特定事件的角色。为了规范这项任务的研究，我们从WikiPpedia收集了一个新的事件抽取数据集，包括142个具有丰富语义的自定义论元角色。在这个数据集上，ROLEPRED大大优于现有方法。

1、简介

近年来，事件抽取取得了很大进展，但大多数现有研究仍然依赖于手工构建的本体（Grishman和Sundheim，1996；Ji和Grishman，2008；Lin等人，2020；Du和Cardie，2020b；Liu等人，2020）；Zhou等人，2021；Li等人，2021b）。Propbank（Kingsbury和Palmer，2003）和FrameNet（Baker等人，1998）等事件本体需要数年甚至数十年才能构建。在这种本体论的中心是论元角色，论元角色捕捉了事件和所参与论元的关系。例如，Transport事件类型有5个角色：Agent、Artifact、Vehicle、Origin和Destination。这些角色通常特定于事件类型，语义上有意义的角色名称可以直接提高论元抽取质量。虽然人工构建的本体对于封闭域应用程序来说已经足够了，但它需要额外的人力来扩展到新兴的事件类型或新域。为了克服这一困难，一些研究试图自动诱导给定事件类型的论元角色（Huang等人，2016；Y uan等人，2018；Liu等人，2019a）。这些方法通常定义一个词汇表，包括具有通用语义的可能角色名称，如Time、Place和Value，然后选择一个子集作为论元角色。由于角色名称仅限于有限的词汇，它们不能反映事件类型的独特性，例如地震Magnitude或仪式Host。因此，从开放词汇表中预测角色名称对于广泛覆盖事件语义是必要的。

在本文中，我们介绍了事件抽取的一项基本但尚未探索的任务：开放词汇论元角色预测。此任务旨在为给定事件类型推断一组论元角色名称，以描述事件类型与其论元之间的关键关系。如图1所示，对于Earthquake事件类型，给定一些相关文档，我们希望输出关键论元角色名称，如magnitude、intensity、depth、deaths和injuries。这些语义上有意义的角色可以直接用于下游事件抽取任务（Huang等人，2018；Liu等人，2020；Lyu等人，2021）。然而，这项任务提出了新的挑战：（1）将论元角色预测与论元抽取分离：对于事件抽取，角色和论元是密切相互依存的，其中一个对确定另一个至关重要，预测未知论元的论元角色是一个紧迫的问题；以及（2）从开放词汇表自定义论元角色：为了覆盖各领域，我们需要超越预定义的候选词汇表，并且生成的角色应该针对每个事件类型进行个性化，以便它们能够反映不同事件类型的独特特征。

为了应对这些挑战，我们提出了一种新的无监督框架ROLEPRED。给定一个事件类型和一组文档，ROLEPRED通过三个组件预测论元角色，包括候选角色预测、候选论元抽取和论元角色选择。具体来说，为了将角色与未知论元解耦，我们假设命名实体更可能是论元。基于这一假设，我们将文本中的命名实体视为可能的论元。然后，我们通过将其作为基于填充任务的提示来预测他们的候选角色名称（Raffel等人，2020）。注意，我们允许预训练的模型（Raffel等人，2020）填充可变长度的掩码跨度，而不是一个单独的掩码。然而，这些产生的角色仍然是嘈杂的。因此，考虑到角色和论元之间的相互依赖性，我们使用QA模型抽取论元，以便进一步选择和合并角色。最后，获得特定于事件的角色以用于事件抽取。通过这种方式，生成的角色具有足够的细粒度和事件特定性。

现有的事件抽取数据集对事件类型的覆盖范围有限，对论元角色的细化不够（Grishman和Sundheim，1996；Li等人，2021b；Ebner等人，2020）。因此，为了支持论元角色预测的研究，我们从维基百科收集了一个名为RoleEE的新事件抽取数据集。在统计数据中，我们的数据集包含50个事件类型和142个论元角色类型，远远超过现有数据集中的论元角色数量（MUC-4中的5个（Dodington等人，2004）和RAMS中的65个（Ebner等人，2020））。除了一般角色（如日期和位置）之外，每种事件类型都有个性化角色，如Fire事件的Accelerator和Earthquake事件的Magnitude，它们具有丰富的语义，有助于抽取事件中的详细论元。此外，我们的数据集专注于抽取每个文档中的主要事件，即每个文档一个事件。此设置放弃了事件论元存在于多个连续句子中的限制。散布在整个长文档中的论元将符合实际应用程序，并为事件抽取模型带来更多挑战。我们在此数据集上使用ROLEPRED设置了基准性能，并为未来的工作提供了见解。

2、相关工作

事件本体构建：事件本体是事件发现和抽取的关键前提。在先前的研究中，已经付出了巨大的努力来构建几个高质量的本体，例如FrameNet（Baker等人，1998）、Propbank（Kingsbury和Palmer，2003）和VerbNet（Kipper等人，2008）。然而，构建手工构建的本体是昂贵且耗时的。一些研究人员开始探索自动本体构建。具体而言，在描述不同事件之间关系的事件模式归纳方面取得了很大进展（Cheung等人，2013；Peng和Roth，2016；Li等人，2020；Kwon等人，2020年；Li et al，2021a）。此外，最近的几项研究试图从原始文本中发现新的事件类型（Shen等人，2021；Edwards和Ji，2022）。然而，作为事件本体论的中心，论元角色预测一直是一项未被充分探索的任务。相关研究（Y uan等人，2018年；Liu等人，2019a）将角色名称限制在有限的词汇范围内，从而无法反映不同事件类型的独特特征。因此，在本文中，我们研究了一项重要但具有挑战性的任务：开放式词汇论元角色预测。

事件抽取：句子级事件抽取、文档级事件抽取。

3、方法

ROLEPRED包含三个核心组件：候选角色生成、候选论元抽取和论元角色选择（见图2）。下面阐述了论证角色预测的任务，然后依次描述了每个组成部分。

3.1 任务定义

形式上，给定一个事件类型和一组文档 $D$ ，每个文档 $d \in D$ 主要描述一个相同类型的事件实例 $e$ 。论元角色预测的任务旨在预测一组特定于事件的角色 $R$ 。每个角色 $r \in R$ 是一个短语或具有相似语义的短语集群。

3.2 论元角色生成

实体通常是事件的参与者。因此，在缺少可用论元的情况下，我们引入命名实体来生成论元角色的一些候选对象。具体来说，给定事件类型，对于每个文档 $d$ ，我们使用现成的命名实体识别工具（Honnibal和Montani，2017）从文本中识别所有实体 $A$ 。然后，我们将这些实体视为可能的论元，并尝试预测它们的角色。该候选角色生成过程被制定为掩码填充任务。对于每个实体 $a \in A$ ，我们构造一个带有mask词的提示，以输入到预训练的语言模型中。因此，模型通过解码其内部语义知识，将这些mask推断为该实体的角色名称。这种提示的构造如下：

Context. According to this, the < MASK SPAN> of this Event Type is Entity.

这里Context是指从源文档中提到实体的段落。它提供了事件和实体的详细背景描述。请注意，为了避免误导信息，删除实体后的不相关句子。然后，后面是包含< Entity >和< Event Type >占位符的自然语言模板。在推断过程中，这些占位符被具体的事件类型和实体替换。< MASK SPAN >表示长度可变的mask跨度。例如，给定地震的事件类型和下午5:36的实体，构建的提示如下：

The 1964 Alaskan earthquake, also known as the Great Alaskan earthquake, occurred at 5:36 PM AKST on Good Friday, March 27. According to this, the < MASK SPAN> of this earthquake is 5:36 PM.

在这种情况下，hMASK SPANi预计将填充时间，或开始时间作为参数角色。

此外，考虑到实体的一般语义类型：person、location、number或其他，我们稍微改变了提示结构，以流畅自然地支持揭开论元角色的过程。详情见表1。

构建的提示被输入到编码器语言模型T5（Raffel等人，2020）中，用于候选角色生成。生成过程对给定先前token和编码器输入的选择新令牌的条件概率进行建模。注意，< MASK SPAN >的长度对于模型填充不是固定的。受SpanBERT（Joshi等人，2020）启发，T5从泊松分布（λ=3）中采样文本跨度数。每个跨度都用一个token替换。通过填充标记文本，该模型可以预测一个跨度中缺少多少token。因此，语言模型生成的角色是根据构建的提示的语义定制的不同长度的短语。与使用单个通用词作为角色名称的现有工作不同（Huang et al，2016；Y uan et al，2018；Liu et al，2019a），我们的角色更细粒度，并且包含更多的语义信息。这支持后续任务，即论元抽取，从文本中抽取事件的更多参与者。最后，语言模型为每个实体生成10个可能的论元角色。对于每个文档，我们集成所有实体的候选角色名称以供进一步选择。

3.3 候选论元抽取

对于事件类型，其显著的论元角色通常由大多数事件实例共享。例如，每一次地震都有震级，但不一定会引发海啸。因此，这给候选词留下了确定相关和突出角色的挑战。直观地说，考虑到论元与事件角色的强烈相互依赖性，论元提供了一个可行的解决方案。按照这些思路，我们首先从每个文档中抽取所有候选角色的候选论元，然后使用这些论元进行角色选择（下一节将详细介绍）。

受一些现有论元抽取工作的启发（Lyu等人，2021），我们将此问题转化为一个问题回答任务。给定事件类型和候选角色，我们构建一个问题，并将其与文档一起输入到标准的双向预训练Transformer（BERT Devlin等人（2018），RoBERTa Liu等人（2019b））。QA模型用于识别每个源文档中的候选事件论元（文本跨度）。关于输入序列，我们遵循以下标准BERT样式格式：

[CLS] What is the Event Role in this Event Type event? [SEP] Document [SEP]

[CLS]是BERT的特殊分类token，[SEP]是分隔符，Document指的是输入文档的上下文token。例如，考虑到大流行的事件类型、伤亡的事件角色以及COVID19的文件，输入序列如下：

[CLS] What is the casualty in this pandemic event? [SEP] The COVID-19 pandemic is an ongoing global pandemic of coronavirus disease. It’s estimated that the worldwide total number of deaths has exceeded five million … [SEP]

在这种情况下，这个论元预计为five million。注意，对于某些角色，给定的文档可能不会提及其论元。也就是说，上述构建的问题可能没有答案。因此，对于每个抽取的答案，我们从QA模型中设置其概率阈值，以过滤掉一些不可靠的结果。此外，由于我们的数据集专注于每个文档的一个主要事件，与句子级事件抽取的相关工作不同（Huang和Ji，2020；Liu等人，2020；Ma等人，2022），我们需要在整个文档中搜索论点。这项任务更具挑战性，值得进一步探索。

到目前为止，在每个文档中，对于每个候选角色，都抽取了一个候选论元。因此，这些论元-角色对可以组成每个文档的一个事件实例。

3.4 论元角色选择

从每个文档中抽取主事件实例后，主要通过两个步骤选择候选角色：论元角色筛选和合并。具体而言，对于一种事件类型，其不同的事件实例可以呈现不同的属性。然而，这些例子通常有几个共同的和重要的论元角色（例如，地震事件的强度和颁奖典礼的主持人）。因此，我们通过涉及相同类型的多个事件实例来判断论元角色的显著性。假设只有当大多数事件实例都有其关联的论元时，角色名称才属于事件类型。

关于论元角色合并，不同的角色可以表示相似的语义，并在事件中共享相同的论元。例如，日期、正式日期和原始日期通常指烟花活动的同一天。通过合并相似的角色名称，我们可以在减少其数量的同时增加其特定性，从而提高后续论元抽取步骤的效率。沿着这条线，我们基于两个角色在事件实例中共享相同论元的频率来确定两个角色的语义相似性。例如，给定暴风雪事件的10个实例，如果两个角色、数据和正式日期在5个实例中与它们的论元相同，则它们的相似度为0.5。我们设置了一个阈值来选择语义上相似的论元角色并合并它们。

4、数据集构建

4.1 数据收集

在新闻界的热门话题中，我们精心挑选了50种具有影响力的事件类型，如地震、内乱和军事占领。为了扩大领域覆盖范围，这些活动类型涵盖了许多领域，包括政治、学术、艺术、体育、军事、天文学和经济学。由于这些事件通常包含丰富的论元角色，因此需要多个句子来描述。因此，它更适合于文档级事件抽取。

论元角色设计：为了构建事件特定的论元角色，我们利用维基百科中的事件列表。这样的列表显示了同一类型的多个事件实例的关键属性。例如，图3显示维基百科列出了最近的大地震。它们的属性可以被视为事件类型的原型论元，例如year、magnitude、location和depth。基于这一观察，我们为每种事件类型搜索一个wiki列表，并将属性用作基本的论元角色集。然后，我们手动处理这些论元角色：（1）将缩写更改为通用全名，如MMI更改为Magnitude，（2）将事件名称更改为触发词（维基百科列表中的名称或事件通常指事件实例的名称，可以视为触发词），以及（3）删除注释，该注释为事件实例添加了额外的细节，但不适合作为论元角色。通过维基百科中的手动标注，我们为每种事件类型设计了自定义的论元角色。

实践论元标注：对于每种事件类型，维基百科列表通常包含多个事件实例。列表中的每一行都显示有关一个事件的信息。每行的值可以被视为事件的论元。例如，“1960 Agadir earyhquake”的震级为5.8级。对事件实例进行进一步清理以确保质量：删除论元不完整（例如，空值或明显错误）的事件实例，删除源文档不可访问的事件实例（文档获取将在下一节介绍）。对于合格的事件，其论元会经过仔细的手工修改：（1）仅保存所选角色的论元，（2）删除论元中的特殊符号或引用，仅保留关键信息，以及（3）丢弃相应文档中未提及的论元（因为它们可能来自其他来源，无法从我们的文档中抽取）。最后，对于每个事件类型，我们获得多个事件实例。

源文件采集。对于每个事件实例，我们采用其维基百科文章作为标注事件论元的源文档。具体来说，维基百科列表通常会提到事件名称，并提供相应维基百科文章的URL。例如，如图3所示，第一次地震事件与维基百科1960年阿加迪尔地震的文章有关。这些文档描述了一个主要事件，通常会提到维基百科列表中的大多数事件论元。否则，这些论元将被清除。我们确保每个事件实例都有一个源文档。此外，删除了少于4句的文件。

4.2 数据分析

5、实验

6、总结

本文研究了一项具有挑战性但至关重要的任务：开放式词汇论元角色预测，并提出了一种新的无监督框架ROLEPRED，作为未来工作的强大基线和精心设计的事件抽取数据集。

限制

然而，尽管非实体论元相对较少，但它们在许多事件中也扮演着重要的语义角色。我们的框架在预测此类非实体论点的角色时可能会受到阻碍。因此，我们的下一步是更广泛地涵盖不同类型论元的角色。

此外，我们的框架将一组相关文档作为输入。它需要足够的事件实例来选择重要角色。此外，生成的论元角色的质量在很大程度上取决于文档选择。因此，对于给定的事件类型，检索有限数量的代表性文档可以被认为是论元角色预测的有趣主题。

此外，大多数现有工作为事件类型而不是单个事件实例定义论元角色。这些论元角色由同一类型的多个事件实例共享。然而，不同的事件实例可以具有个性化特征。例如，震级是所有地震的共同论点，但造成的滑坡数量可能是某些地震的特定作用。这些特定角色可以帮助确定事件提取的指定和重要论元。因此，我们希望在未来的工作中为一个事件实例定制角色。

最近工作

自然语言处理和计算机视觉相关论文总结_Trouble…的博客-CSDN博客

Vue的ubus emit/on使用搞个项目前端 vue.js 前端 javascript
这段代码是Vue.js组件中的mounted生命周期钩子函数，主要作用是监听一个名为“macSelectData”的全局事件。具体行为如下：分步解释：mounted()生命周期钩子当组件被挂载到DOM后，Vue会自动调用mounted()方法。这里常用于初始化操作，比如数据请求、事件监听等。this.$bus.on("macSelectData",this.open)this.$bus：通常指通过
【深度学习】softmax 回归的从零开始实现与简洁实现 Douglassssssss 深度学习深度学习回归人工智能 softmax回归交叉熵损失函数
前言小时候听过一个小孩练琴的故事，老师让他先弹最简单的第一小节，小孩练了两天后弹不出。接着，老师让他直接去练更难的第二小节，小孩练习了几天后还是弹不出，开始感觉到挫败和烦躁了。小孩以为老师之后会让他从简单的开始练，谁知老师直接让他开始练最难的一小节。小孩不干了，问老师是不是故意刁难他。老师笑笑，让他现在弹弹第一小节试试。神奇的是，小孩竟然发现自己已经能完整弹出来了。这有点像我现在的学习状况，前些天
数据集标准化:软件2.0的基石工程 AI大模型应用之禅 java python javascript kotlin golang 架构人工智能
数据集标准化,软件工程,数据质量,机器学习,人工智能,数据治理,数据可信度1.背景介绍在当今数据爆炸的时代，数据已成为企业和组织的核心资产。然而，海量的原始数据往往杂乱无章，格式不统一，质量参差不齐，这严重阻碍了数据价值的挖掘和应用。数据标准化作为解决这一问题的关键技术，已成为软件2.0时代不可或缺的基石工程。软件2.0时代，人工智能、机器学习等技术蓬勃发展，对数据质量提出了更高的要求。传统的软件
李开复：AI 2.0 时代的意义 AI大模型应用之禅 java python javascript kotlin golang 架构人工智能
人工智能，深度学习，Transformer，大模型，通用人工智能，AI2.0，伦理问题，未来趋势1.背景介绍人工智能（AI）技术近年来发展迅速，从最初的局限于特定领域的应用，逐渐发展到能够处理更复杂的任务，甚至展现出一些类似人类智能的能力。2010年以来，深度学习技术的兴起，特别是Transformer模型的出现，为AI发展带来了新的突破。这些模型能够处理海量数据，学习复杂的模式，并在自然语言处理
Django基础(五)———模板结构
前言上篇文章给大家介绍了模板常用过滤器这篇文章将讲述DTL模板中的模板结构一、模板结构1.include模板有时候一些代码是在许多模版中都用到的。如果我们每次都重复的去拷贝代码那肯定不符合项目的规范。一般我们可以把这些重复性的代码抽取出来，就类似于Pvthon中的的数一样，以后想要使用这些代码的时候，就通过inc1ude包含进来。这个标签就是include。编写视图函数#app应用views.py
一切偏见都源于无知我的文学梦
01关于“盲人摸象”的故事，想必很多人都听过：从前，有几个盲人很想知道大象是什么样子，可他们看不见，只好用手摸。摸到大象鼻子的人说像很粗的管子，摸到大象耳朵的人说像大扇子，摸到大象身体的人说像一堵墙，摸到大象尾巴的人说像一根粗绳子。盲人们坚持己见，争吵不休，都说自己摸到的才是大象真正的样子。而实际上呢？他们一个也没说对。一个事件，其实就是一面镜子。围观者多是看到冰山一角，就急于发表感言，折射出的其
Python 现代时间序列预测第二版（五）绝不原创的飞龙默认分类默认分类
原文：annas-archive.org/md5/22eab741fce9c15dfad894ecf37bdd51译者：飞龙协议：CCBY-NC-SA4.0第十七章：概率预测及更多在整本书中，我们学习了生成预测的不同技术，包括一些经典方法，使用机器学习以及一些深度学习架构。但我们一直在关注一种典型的预测问题——为连续时间序列生成点预测，并且没有层级关系且历史数据足够丰富。我们之所以这样做，是因为这
人的价值就是能让别人生活得更有价值——读荆志强老师的书有感花婆婆
最近读了荆志强老师的专著《快乐地做教育》，前言就提到：教育的本真，就是通过激励为学生赋能，帮助学生产生足够的“自我效能感”，让学生主动获取知识技能、培育情感态度；帮助学生建立自主深度学习的能力。荆志强老师倡导的“赋能教育”主要从两个方面建构：激励型课堂、自主化管理。其中，他还谈到生本教育的学习观：学习是生命成长的过程，它是人自身的一种需要，而不是外在压力的结果。教育的一切行为都应该是为了满足儿童的
2021-09-18铭记历史勿忘国耻努力奋进自我超越茗森谈感悟
九·一八事变，又称奉天事变、柳条湖事件。是1931年9月18日日本驻中国东北地区的关东军突然袭击沈阳，以武力侵占东北的事件。九·一八事变是由日本蓄意制造并发动的侵华战争，是日本帝国主义企图以武力征服中国的开端，是中国抗日战争的起点，标志着中国局部抗战的开始，揭开了第二次世界大战东方战场的序幕。我们作为中国人一定要铭记这段历史，勿忘国耻。从另一个角度看，落后就会挨打。我们国人整体上是非常勤奋，自力更
RAG 助力教育个性化：重塑学习体验的科技引擎 hy098543 学习科技
一、引言1.1研究背景与动机随着自然语言处理（NLP）技术的飞速发展，大语言模型（LLM）在众多任务中展现出了强大的能力，如文本生成、问答系统和机器翻译等。然而，传统的大语言模型在知识存储和更新方面存在一定的局限性。一方面，模型的知识主要依赖于预训练阶段所接触的数据，这导致其知识更新滞后，难以应对快速变化的现实世界信息。例如，对于一些新出现的事件、技术或研究成果，模型可能无法及时给出准确的信息。另
ChatGPT 之后的下一步是什么？四个迫在眉睫的进步 iCloudEnd
OpenAI的文本生成器ChatGPT进入公共领域已经两个半月了，该机器人令人印象深刻且深思熟虑的答案已经引起了1300万日常用户的注意，他们已经将其用于一般问题、开发想法和写作全长文章。尽管ChatGPT存在重大缺陷（例如一些事实不准确），但许多人担心这可能对劳动力、学校、新闻业等产生影响。然而，我们可能正处于一场巨大的人工智能革命的开端。OpenAI总裁兼联合创始人GregBrockman于1
喜爱购有什么新消息？如何打造百城万店氧惠好物
自2020年10月起，西安喜爱购商贸商贸股份有限公司全力打造的“百城万店”新零售商业模式应运而生。在探索新零售的道路上,通过互联网、大数据、云计算、人工智能等新技术,重构“人、货、场”商业元素,秉持“舍利差赚服务”经营理念,在全国至少一百个城市的“一千户以上的中高端社区”,打造至少两万家“一区一店”社区生活超市。大家好！我是氧惠最大团队&联合创始人氧惠达人导师。氧惠佣金更高，模式更好，终端用户不流
verilator如何实现RTL的仿真(腾讯混元)
Verilator是一个用于将Verilog或SystemVerilogRTL（寄存器传输级）代码转换为C++或SystemC模型的工具，主要用于高性能的功能仿真和验证。它不是像ModelSim或VCS那样的传统事件驱动仿真器，而是通过静态编译的方式将RTL转换为可执行的C++代码，从而实现高效仿真。下面详细介绍Verilator实现RTL仿真的流程与实现细节。一、Verilator的基本工作流程
AI 驱动自动化运维平台架构与实现大富大贵7 程序员知识储备1 程序员知识储备2 程序员知识储备3 算法机器学习人工智能决策树大数据
摘要：随着云计算、容器化和大规模分布式系统的普及，传统人工运维方法已难以满足现代IT环境中海量指标、日志和拓扑关系的实时分析与故障响应需求。AI驱动的自动化运维（AIOps）平台通过融合机器学习、深度学习、图分析以及强化学习等多学科技术，实现对海量运维数据的智能感知、预测、诊断和自动化修复。本文深入探讨AI驱动自动化运维平台的整体架构设计与核心技术实现，涵盖数据采集与预处理、AI引擎设计、自动化执
读书记（105）《四月在愚人船》——正常的无知闲人无稽
这本书的寓言性质让人感到扑面而来，有点难以招架。内容非常简单易懂，一群被正常人定义为疯子的船员，在一艘不太正常的船上的故事。主人公是一位叫四月的小孩，通过小孩的观察，叙述一系列怪异、神奇、超乎常理的事件。从书名开始就让读者感到作者的野心，四月在愚人船。四月有愚人节。所以暗示这一切都是荒诞，充满反抗世俗理论的。船员上有各种怪人和疯子，用作者在书中写明白的语言，就是各种病人，现代学定义下的病人。这样的
冒充顺华文庭内部群胜天半子毛顺华就是骗子，中粮仓智慧农业虚拟盘及早远离切勿被套！昌龙律法
人到老年，就怕手头没钱。一些不法分子利用老年人信息闭塞、认知较弱等特点瞄准了老年人的“钱袋子”花样百出实施诈骗老年人损失财产的同时还饱受精神打击不能忍！这些套路，应该让爸妈知道智慧农业，低碳环保双探交易市场，数字体育，人工智能十选五就是骗局我们曾曝光了无数种金融骗局，不知道能有多少人看到，能帮一个是一个，再次曝光一种炒股诱导做慈善参加数字经济的骗局，相信作为股民，大家都会经常接到一下分析个股，或者
人工智能真的能编程吗？研究勾勒出自主软件工程的障碍 WSSWWWSSW 人工智能软件工程
想象一下这样一个未来：人工智能悄然承担起软件开发的繁重工作：重构杂乱无章的代码、迁移遗留系统以及排查竞态条件，这样人类工程师就可以专注于架构、设计以及那些机器仍然无法解决的真正新颖的问题。最近的进展似乎让这个未来近在咫尺，但麻省理工学院计算机科学与人工智能实验室（CSAIL）以及其他几家合作机构的研究人员发表的一篇新论文指出，要实现这个潜在的未来，需要认真审视当前面临的挑战。这篇题为《面向软件工程
Uniapp 微信小程序，实现页面滚动Tab悬停吸顶，点击tab内容跟随滚动
Uniapp微信小程序，实现页面滚动Tab悬停吸顶，点击tab内容跟随滚动页面股东tab悬停原理：运用uniapp原生提供方法uni.createSelectorQuery()获取滚动对应节点的信息，即节点距离页面顶部的距离，再通过uniapp原生监听页面滚动事件onPageScroll，获取页面内容滚动的高度，二者相加即定位到对应节点的滚动距离。1.页面template结构data(){retu
1.7分钟了解启禾科技app被骗事件，被骗了怎么追回最新曝光36
1.启禾科技APP在平台不能提现怎么办？2.启禾科技APP这个软件靠谱可信吗？3.启禾科技APP在软件做任务被骗？4.启禾科技APP软件app无法登录?5.启禾科技APP平台是真的吗？6.启禾科技APP被骗无法提现，操作失误！7.启禾科技APP平台是騙局吗？8.启禾科技APP被骗无法出金如何维护自己的合法权益!希望看到这篇文章的人可以及时止损；请及时联系为你提供解决方案，要想讨回损害资产务必阅读以
GPU 之后，IMU 登场：AI 发展的下一次飞跃
你早晨醒来，手机上的大模型帮你写完邮件、翻译合同，却依旧不能帮你把厨房里洒掉的牛奶擦干。你戴上的AR眼镜知道“那里有杯子”，却抓不到它——AI会说不会做。是不是哪里少了一截？人工智能（AI）的发展历程中，我们见证了从简单的数据处理到复杂的语言生成能力的飞跃。然而，尽管AI在虚拟世界中表现出色，它在物理世界中的表现却相对滞后。为了填补这一空白，AI正在进入一个新的发展阶段：行动驱动时代。在本文中，我
Systemd：现代 Linux 系统服务管理的核心嵌入式Jerry Linux+内核应用程序 linux 物联网系统架构服务器网络 git
Systemd：现代Linux系统服务管理的核心引言Systemd是一种现代的系统和服务管理器，用于在Linux系统启动时初始化用户空间，并通过服务管理和资源控制实现系统的自动化管理。自发布以来，Systemd已逐渐取代传统的SysVinit和Upstart，成为主流Linux发行版的默认初始化系统。它通过并行化启动、服务依赖管理、事件驱动的服务监控、日志管理等功能，为Linux系统带来了更高效和
正念冥想实修10.2 宝茱名吉的一止今心
1愉悦事件2正念静坐40分钟3慈心冥想15分钟4正念行走20分钟愉悦事件：看到学生们在操场上跳着新体操舞的视频，活力、阳光、充满朝气，回想到我学生时代，好像我也在他们其中，那样的朝气蓬勃。正念静坐40分钟：前20分钟昏沉，身体在不停的晃动，向前倾。对呼吸和身体都不能专注。感觉明显的就是听到外面鸟叫的声音和风轻柔吹在树上，树叶哗哗的声音，还有微风吹向身体带来一丝凉意舒服的感觉。一个来电打破了昏沉的状
YOLOv13_SSOD：基于超图关联增强的半监督目标检测框架（原创创新算法）
YOLOv13_SSOD：基于超图关联增强的半监督目标检测框架项目背景随着深度学习技术的快速发展，目标检测在各个领域都取得了显著的进展。然而，现有的监督学习方法在实际应用中面临着标注数据稀缺、泛化能力不足等挑战。特别是在火灾烟雾检测、工业质检等特定场景中，获取大量高质量标注数据的成本极高。为了解决这一问题，本项目基于最新发布的YOLOv13架构，结合EfficientTeacher半监督学习框架，
USB串口通信、握手协议、深度学习等技术要点深度学习教程, 深度学习人工智能网络协议
基于OpenMV的智能车牌识别系统：从硬件到算法的完整实现前言本文将详细介绍一个基于OpenMV微控制器的智能车牌识别系统的设计与实现。该系统集成了嵌入式视觉处理、串口通信协议、深度学习OCR识别等多种技术，实现了从图像采集到车牌识别的完整流程。系统架构概述整体设计思路该车牌识别系统采用分布式架构设计，将计算密集型任务与嵌入式控制分离：┌─────────────┐USB串口通信┌────────
python学习路线（从菜鸟到起飞）突突突然不会编了 python 学习开发语言
以下是基于2025年最新技术趋势的Python学习路线，综合多个权威资源整理而成，涵盖从零基础到进阶应用的全流程，适合不同学习目标（如Web开发、数据分析、人工智能等）的学习者。路线分为基础、进阶、实战、高级、方向拓展五个阶段，并附学习资源推荐：一、基础阶段（1-2个月）目标：掌握Python核心语法与编程思维，熟悉开发环境。环境搭建安装Python3.10+，配置PyCharm或VSCode开发
语音识别开源项目推荐：GitHub热门仓库盘点 AGI大模型与大数据研究院 AI大模型应用开发实战语音识别开源 github ai
2024年必看！GitHub热门语音识别开源项目全解析：从入门到实战关键词语音识别(ASR)、开源项目、GitHub、Whisper、FunASR、PaddleSpeech、深度学习摘要想象一下：开车时只需说一句话就能自动发消息，听英文演讲时实时获得中文翻译，给视障人士读文本时精准转换——这些场景的背后，语音识别（AutomaticSpeechRecognition,ASR）技术正在改变我们与机器
JAVA面试宝典 -《DDD实战：从贫血模型到领域事件》
DDD实战：从贫血模型到领域事件引言：为什么从三层架构转向DDD？在传统的三层架构中，我们习惯将系统划分为Controller、Service和Repository层，关注点更多落在“技术职责”而非“业务语义”。然而，随着系统复杂度提高，贫血模型、重复逻辑、脆弱耦合等问题层出不穷。领域驱动设计（DDD）正是为了解决这些问题而生。它强调以业务为中心建模，将“业务行为”作为核心驱动软件设计，帮助系统在
《Spring核心容器源码解密：IOC与事件驱动模型》
Spring核心容器源码解密：IOC与事件驱动模型引言：Spring容器的核心职责Spring框架的核心容器是其基石，承担着两大关键职责：控制反转(IOC)：管理对象生命周期与依赖关系事件驱动模型：实现组件间解耦通信这两大机制共同构建了Spring"高内聚、低耦合"的架构哲学。本文将深入源码层面，揭示IOC容器与事>件模型如何协同工作，并通过实战展示如何构建解耦的业务系统。Spring容器IOC控
Linux-系统日志简介兔子王cool Linux基础 linux 服务器运维
Linux-系统日志简介1、日志的介绍日志文件记录了时间，地点，人物，事件四大信息，故系统出现故障时，可以查询日志文件。系统的日志文件默认都集中放置到/var/log/目录内，其中又以message记录的信息最多。2、日志的重要性体现日志文件的重要性主要体现在以下三方面：解决系统方面的错误解决网络服务的问题过往事件记录日志文件的权限通常是设置为root能够读取而已。由于日志文件可以记载系统很多的详
Linux日志-message日志 dessler Linux进阶 #Linux日志 linux 服务器 java
作者介绍：简历上没有一个精通的运维工程师。希望大家多多关注作者，下面的思维导图也是预计更新的内容和当前进度(不定时更新)。Linux进阶部分又分了很多小的部分,我们刚讲完了Linux基础软件，下面是Linux日志。Linux系统中的日志是记录系统活动和事件的重要工具，它们可以帮助管理员监视系统状态、调查问题以及了解系统运行状况。主要涉及到系统日志，登录日志，定时任务日志，监控日志，崩溃日志，二进制
插入表主键冲突做更新 a-john
有以下场景：用户下了一个订单，订单内的内容较多，且来自多表，首次下单的时候，内容可能会不全（部分内容不是必须，出现有些表根本就没有没有该订单的值）。在以后更改订单时，有些内容会更改，有些内容会新增。问题：如果在sql语句中执行update操作，在没有数据的表中会出错。如果在逻辑代码中先做查询，查询结果有做更新，没有做插入，这样会将代码复杂化。解决： mysql中提供了一个sql语
Android xml资源文件中@、@android:type、@*、？、@+含义和区别 Cb123456 @+@?@*
一.@代表引用资源 1.引用自定义资源。格式：@[package:]type/name android：text="@string/hello" 2.引用系统资源。格式：@android:type/name android:textColor="@android:color/opaque_red"
数据结构的基本介绍天子之骄数据结构散列表树、图线性结构价格标签
数据结构的基本介绍数据结构就是数据的组织形式，用一种提前设计好的框架去存取数据，以便更方便，高效的对数据进行增删查改。正确选择合适的数据结构，对软件程序的高效执行的影响作用不亚于算法的设计。此外，在计算机系统中数据结构的作用也是非同小可。例如常常在编程语言中听到的栈，堆等，就是经典的数据结构。经典的数据结构大致如下：一：线性数据结构 (1)：列表 a
通过二维码开放平台的API快速生成二维码一炮送你回车库 api
现在很多网站都有通过扫二维码用手机连接的功能，联图网(http://www.liantu.com/pingtai/)的二维码开放平台开放了一个生成二维码图片的Api,挺方便使用的。闲着无聊，写了个前台快速生成二维码的方法。 html代码如下:(二维码将生成在这div下) ? 1 &nbs
ImageIO读取一张图片改变大小 3213213333332132 java IO image BufferedImage
package com.demo; import java.awt.image.BufferedImage; import java.io.File; import java.io.IOException; import javax.imageio.ImageIO; /** * @Description 读取一张图片改变大小 * @author FuJianyon
myeclipse集成svn（一针见血） 7454103 eclipse SVN MyEclipse
&n
装箱与拆箱----autoboxing和unboxing darkranger J2SE
4.2　自动装箱和拆箱基本数据(Primitive)类型的自动装箱(autoboxing)、拆箱(unboxing)是自J2SE 5.0开始提供的功能。虽然为您打包基本数据类型提供了方便，但提供方便的同时表示隐藏了细节，建议在能够区分基本数据类型与对象的差别时再使用。 4.2.1　autoboxing和unboxing 在Java中，所有要处理的东西几乎都是对象(Object)
ajax传统的方式制作ajax aijuans Ajax
//这是前台的代码 <%@ page language="java" import="java.util.*" pageEncoding="UTF-8"%> <% String path = request.getContextPath(); String basePath = request.getScheme()+
只用jre的eclipse是怎么编译java源文件的？ avords java eclipse jdk tomcat
eclipse只需要jre就可以运行开发java程序了，也能自动编译java源代码，但是jre不是java的运行环境么，难道jre中也带有编译工具？还是eclipse自己实现的？谁能给解释一下呢问题补充：假设系统中没有安装jdk or jre，只在eclipse的目录中有一个jre，那么eclipse会采用该jre，问题是eclipse照样可以编译java源文件，为什么呢？ &nb
前端模块化 bee1314 模块化
背景：前端JavaScript模块化，其实已经不是什么新鲜事了。但是很多的项目还没有真正的使用起来，还处于刀耕火种的野蛮生长阶段。 JavaScript一直缺乏有效的包管理机制，造成了大量的全局变量，大量的方法冲突。我们多么渴望有天能像Java（import），Python (import)，Ruby(require)那样写代码。在没有包管理机制的年代，我们是怎么避免所
处理百万级以上的数据处理 bijian1013 oracle sql 数据库大数据查询
一.处理百万级以上的数据提高查询速度的方法： 1.应尽量避免在 where 子句中使用!=或<>操作符，否则将引擎放弃使用索引而进行全表扫描。 2.对查询进行优化，应尽量避免全表扫描，首先应考虑在 where 及 o
mac 卸载 java 1.7 或更高版本征客丶 java OS
卸载 java 1.7 或更高 sudo rm -rf /Library/Internet\ Plug-Ins/JavaAppletPlugin.plugin 成功执行此命令后，还可以执行 java 与 javac 命令 sudo rm -rf /Library/PreferencePanes/JavaControlPanel.prefPane 成功执行此命令后，还可以执行 java
【Spark六十一】Spark Streaming结合Flume、Kafka进行日志分析 bit1129 Stream
第一步，Flume和Kakfa对接，Flume抓取日志，写到Kafka中第二部，Spark Streaming读取Kafka中的数据，进行实时分析本文首先使用Kakfa自带的消息处理（脚本）来获取消息，走通Flume和Kafka的对接 1. Flume配置 1. 下载Flume和Kafka集成的插件，下载地址：https://github.com/beyondj2ee/f
Erlang vs TNSDL bookjovi erlang
TNSDL是Nokia内部用于开发电信交换软件的私有语言，是在SDL语言的基础上加以修改而成，TNSDL需翻译成C语言得以编译执行，TNSDL语言中实现了异步并行的特点，当然要完整实现异步并行还需要运行时动态库的支持，异步并行类似于Erlang的process（轻量级进程），TNSDL中则称之为hand，Erlang是基于vm(beam)开发，
非常希望有一个预防疲劳的java软件, 预防过劳死和眼睛疲劳,大家一起努力搞一个 ljy325 企业应用
　非常希望有一个预防疲劳的java软件，我看新闻和网站，国防科技大学的科学家累死了，太疲劳，老是加班，不休息，经常吃药，吃药根本就没用，根本原因是疲劳过度。我以前做java,那会公司垃圾，老想赶快学习到东西跳槽离开，搞得超负荷，不明理。深圳做软件开发经常累死人，总有不明理的人，有个软件提醒限制很好，可以挽救很多人的生命。相关新闻：（1）IT行业成五大疾病重灾区：过劳死平均37.9岁
读《研磨设计模式》-代码笔记-原型模式 bylijinnan java 设计模式
声明：本文只为方便我个人查阅和理解，详细的分析以及源代码请移步原作者的博客http://chjavach.iteye.com/ /** * Effective Java 建议使用copy constructor or copy factory来代替clone()方法： * 1.public Product copy(Product p){} * 2.publi
配置管理---svn工具之权限配置 chenyu19891124 SVN
今天花了大半天的功夫，终于弄懂svn权限配置。下面是今天收获的战绩。安装完svn后就是在svn中建立版本库，比如我本地的是版本库路径是C:\Repositories\pepos。pepos是我的版本库。在pepos的目录结构 pepos component webapps 在conf里面的auth里赋予的权限配置为 [groups]
浅谈程序员的数学修养 comsci 设计模式编程算法面试招聘
浅谈程序员的数学修养
批量执行 bulk collect与forall用法 daizj oracle sql bulk collect forall
BULK COLLECT 子句会批量检索结果，即一次性将结果集绑定到一个集合变量中，并从SQL引擎发送到PL/SQL引擎。通常可以在SELECT INTO、 FETCH INTO以及RETURNING INTO子句中使用BULK COLLECT。本文将逐一描述BULK COLLECT在这几种情形下的用法。有关FORALL语句的用法请参考：批量SQL之 F
Linux下使用rsync最快速删除海量文件的方法 dongwei_6688 OS
1、先安装rsync：yum install rsync 2、建立一个空的文件夹：mkdir /tmp/test 3、用rsync删除目标目录：rsync --delete-before -a -H -v --progress --stats /tmp/test/ log/这样我们要删除的log目录就会被清空了，删除的速度会非常快。rsync实际上用的是替换原理，处理数十万个文件也是秒删。
Yii CModel中rules验证规格 dcj3sjt126com rules yii validate
Yii cValidator主要用法分析： yii验证rulesit 分类： Yii yii的rules验证 cValidator主要属性 attributes ,builtInValidators,enableClientValidation,message,on,safe,skipOnError
基于vagrant的redis主从实验 dcj3sjt126com vagrant
平台: Mac 工具: Vagrant 系统: Centos6.5 实验目的: Redis主从实现思路制作一个基于sentos6.5, 已经安装好reids的box, 添加一个脚本配置从机, 然后作为后面主机从机的基础box 制作sentos6.5+redis的box mkdir vagrant_redis cd vagrant_
Memcached(二)、Centos安装Memcached服务器 frank1234 centos memcached
一、安装gcc rpm和yum安装memcached服务器连接没有找到，所以我使用的是make的方式安装，由于make依赖于gcc，所以要先安装gcc 开始安装，命令如下，[color=red][b]顺序一定不能出错[/b][/color]：建议可以先切换到root用户，不然可能会遇到权限问题：su root 输入密码...... rpm -ivh kernel-head
Remove Duplicates from Sorted List hcx2013 remove
Given a sorted linked list, delete all duplicates such that each element appear only once. For example,Given 1->1->2, return 1->2.Given 1->1->2->3->3, return&
Spring4新特性——JSR310日期时间API的支持 jinnianshilongnian spring4
Spring4新特性——泛型限定式依赖注入 Spring4新特性——核心容器的其他改进 Spring4新特性——Web开发的增强 Spring4新特性——集成Bean Validation 1.1(JSR-349)到SpringMVC Spring4新特性——Groovy Bean定义DSL Spring4新特性——更好的Java泛型操作API Spring4新
浅谈enum与单例设计模式 247687009 java 单例
在JDK1.5之前的单例实现方式有两种(懒汉式和饿汉式并无设计上的区别故看做一种)，两者同是私有构造器，导出静态成员变量，以便调用者访问。第一种 package singleton; public class Singleton { //导出全局成员 public final static Singleton INSTANCE = new S
使用switch条件语句需要注意的几点 openwrt c break switch
1. 当满足条件的case中没有break，程序将依次执行其后的每种条件（包括default）直到遇到break跳出 int main() { int n = 1; switch(n) { case 1: printf("--1--\n"); default: printf("defa
配置Spring Mybatis JUnit测试环境的应用上下文 schnell18 spring mybatis JUnit
Spring-test模块中的应用上下文和web及spring boot的有很大差异。主要试下来差异有：单元测试的app context不支持从外部properties文件注入属性 @Value注解不能解析带通配符的路径字符串解决第一个问题可以配置一个PropertyPlaceholderConfigurer的bean。第二个问题的具体实例是：
Java 定时任务总结一 tuoni java spring timer quartz timertask
Java定时任务总结一.从技术上分类大概分为以下三种方式： 1.Java自带的java.util.Timer类，这个类允许你调度一个java.util.TimerTask任务; 说明： java.util.Timer定时器，实际上是个线程，定时执行TimerTask类 &
一种防止用户生成内容站点出现商业广告以及非法有害等垃圾信息的方法 yangshangchuan rank 相似度计算文本相似度词袋模型余弦相似度
本文描述了一种在ITEYE博客频道上面出现的新型的商业广告形式及其应对方法，对于其他的用户生成内容站点类型也具有同样的适用性。最近在ITEYE博客频道上面出现了一种新型的商业广告形式，方法如下： 1、注册多个账号（一般10个以上）。 2、从多个账号中选择一个账号，发表1-2篇博文