南有芙蕖

论文阅读：DuEE:A Large-Scale Dataset for Chinese Event Extraction in Real-World Scenarios（附数据集地址）

论文阅读：DuEE:A Large-Scale Dataset for Chinese Event Extraction in Real-World Scenarios 基于现实场景的大规模中文事件抽取数据集

论文阅读：DuEE:A Large-Scale Dataset for Chinese Event Extraction in Real-World Scenarios 基于现实场景的大规模中文事件抽取数据集
- Abstract-摘要
- Keywords-关键词
- 1 Introduction-引言
- 2 Dataset Construction-数据集构建
- - 2.1 Event Schema Construction-事件模式构建
  - 2.2 Data Collection and Filtering-数据收集和过滤
  - 2.3 Data Annotation-数据标注
- 3 Dataset Statistics-数据集统计
- 4 Evaluation on DuEE-对DuEE的评价
- - 4.1 Shared Competition-共享竞争
  - 4.2 Results and Analysis-结果分析
- 5 Conclusion-结论

Abstract-摘要

本文介绍了一种新的现实场景下的中文事件抽取数据集。与以前的EE数据集相比，DuEE有几个优势。(1)规模：DuEE由19,640个事件组成，分为65种事件类型，以及映射到121个论元角色的41,520个事件论元，据我们所知，这是迄今为止最大的中国EE数据集。(2)质量：所有数据均采用众包评审人工标注，确保标注准确率高于95%。(3)真实：该模式涵盖了百度搜索的热门话题，数据来自百家号新闻。该任务也接近于现实场景，例如，单个实例被允许包含多个事件，不同的事件论元被允许共享相同的论元角色，并且一个论元被允许扮演不同的角色。为了推进中国环境工程的研究，我们向开源社区发布了环境工程和基线系统。我们还在DuEE的基础上组织了一场共享竞赛，吸引了1206名参与者。我们分析了表现最好的系统的结果，并希望进一步改进。

Keywords-关键词

事件抽取，数据集，性能评估

1 Introduction-引言

事件抽取是自然语言理解中一项重要而又具有挑战性的任务。给定一个事件提及，事件抽取系统应该识别具有特定事件类型的事件触发器，以及它们具有特定论元角色的相应论元。表1给出了EE任务的一个例子。

尽管很重要，但只有少数EE数据集对开源社区公开可用。ACE 2005是EE最具影响力的标杆，大多数研究人员在那里进行实验。这是一个多语言语料库，包含英语、阿拉伯语和中文数据。2016年和2017年TAC KBP活动轨迹也为EE提供了多语言基准，包括英语、西班牙语和中文数据。然而，这两个数据集的规模都很小，对中国电子工程的影响很小。中文突发事件语料库(CEC) 是专门为中文EE设计的。它也是一个小数据集，仅涵盖五种不同紧急情况的事件类型。大规模数据集的缺乏极大地阻碍了EE技术的发展。

本文介绍了一个大规模的数据集，它是专门为现实场景中的中国电子工程而设计的。DuEE有以下优点：

规模：DuEE由19,640个事件组成，分为65种事件类型，以及映射到121个论元角色的41,520个事件论元，据我们所知，这是迄今为止最大的中国EE数据集。表2强调了DuEE在规模方面优于以前的数据集。

质量：DuEE提供了丰富的标注，包括触发器、事件类型、事件论元以及它们各自的论元角色。都是人工用众包审核标注的，保证标注准确率高于95%。
真实：该模式涵盖了百度搜索的热门话题，数据是从百家号的新闻中收集的。这些设置也接近真实世界的场景，即：

① 单个实例可以包含多个事件，例如，表1中的实例提到了两个事件，一个是类型“人生.结婚(Life.Marrige)”，另一个是类型“人生.生子/女(Life.Delivery)”。
② 允许不同的事件论元共享相同的论元角色，例如，在第一个事件中“余文乐(Wenle Yu)” 和“王棠云(Tangyun Wang)”共享相同的角色“结婚双方(Married Person)”。
③ 一个论元可以扮演不同的角色，例如，“王棠云(Tangyun Wang)”在第一个事件中的角色是“结婚双方(Married Person)”，而在第二个事件中的角色是“产子者(Puerpera)”。

这些设置使EE在DuEE上成为一项更具挑战性的任务。

我们向开源社区发布了数据工程和基线系统，以推进中国数据工程的研究。我们还在DuEE的基础上组织了一场共享竞赛，吸引了来自世界各地的1,206名参与者。我们分析了表现最好的系统的结果，并希望进一步改进。

本文的其余部分内容如下：第2节描述了DuEE的构建过程，第3节给出了它的统计数据，之后第4节介绍了分享赛，以及分析了顶尖赛组的成绩，第5节是结束语。

2 Dataset Construction-数据集构建

与电子工程任务相比，此类任务的语料库构建过程也是一项具有挑战性的工作。如图1所示，我们在几个步骤中进行了该过程。事件模式构建旨在收集现实世界中最常见的事件类型和每个事件类型的论元角色。数据收集和过滤生成要标注的大规模数据集。在标注过程中，我们将进行一个标注评审循环，直到正确性满足预定义的标准。

2.1 Event Schema Construction-事件模式构建

对于EE任务，所有信息都将根据预定义的模式进行抽取。因此，模式构建对事件抽取语料库的质量至关重要。事件模式可以解释为一组模板，每个模板都应该包含一个事件类型和该事件类型下的几个对应的论元角色：

为了收集现实世界中最常见的事件类型，我们首先从百度搜索中收集了3600个趋势主题。之后，我们对每个主题的事件类型进行了分析，最终选出了9个最常出现的事件类型，其中包括65个子类型。

对于每种事件类型，将定义相关的论元角色。论元角色主要是组织等实体和价格等数字。此外，很少出现的角色将被排除在外。最后，我们为所有事件类型收集了121种不同的论元角色。对于每个事件类型，平均有3.2个论元角色。表3展示了一些事件类型及其论元角色的例子。

2.2 Data Collection and Filtering-数据收集和过滤

在本文中，我们使用百度提供的创作平台百家号的新闻作为原始文档来源。我们对2019年1月1日至2019年10月30日这五个月份发布的新闻进行了抽样调查在数据库中作为初始候选新闻，最终获得80多万条新闻。之后，进行两级过滤，进一步选择更值得标注的新闻。

首先进行基于规则的过滤。一般来说，我们对标题相同的新闻进行重复数据消除，以减少重复。但是还是有相当多的新闻没有提到任何事件。因此，进行基于分类的过滤以识别包含事件的潜在新闻。我们使用我们的预分类模型来识别一条新闻是否包含任何事件。为了防止错过有价值的新闻，我们只把大概率的新闻作为无事件新闻过滤掉。在两级过滤过程之后，我们总共获得了200,000条新闻，因为文档将进行标注。

2.3 Data Annotation-数据标注

为了获得高质量的语料库，采用了文档标注和众包评审两种方法对所有选择的文档进行标注。

文档标注。标注是在事件标注平台上进行的，标注过程实际上包含几个步骤，如图2所示。标注者应该首先识别文档是否包含任何可以被分类为预定义事件类型之一的事件。只有包含相应事件的文档才会继续后面的标注过程。对于一个文档，包含至少一个特定事件的句子应该首先被选为实例。之后，标注者将其进行触发器提取，通常是动词或名词化，它们从实例中最直接地描述事件的发生。对于每个触发器，它所指示的事件类型也应该同时得到澄清。只要为事件触发器确定了事件类型，所有要标注的论元角色都会被自动确认。因此，标注者会被要求提取事件论元，并以类似的方式为每个提取的论元分配特定的论元角色。

此外，一个实例中可能有多个事件触发器，一个事件触发器可以分配给不同的事件类型，因为它可能指示具有不同类型的多个事件的发生。通常，并非所有预定义的论元角色都可以在一个事件中找到，有时，可能不存在任何必需的事件论元。因此，我们不限制事件中的角色数量。一个论元可以在一个实例中扮演不同的角色，多个事件论元也可以分配给同一个论元角色。在表1中可以观察到一个例子。此外，我们还为测试数据集中的每个论元标注了可能的别名，以防某些别名以相同的方式指示目标论元。

众包评审。另一组标注者被要求在众包平台上检查每个标注的论元是否正确。为了降低复习难度，同时提高效率，我们根据正式文档标注的结果构造了判断题。判断问题是按事件分组的，这意味着如果提取几个论点，一个事件将有多个问题需要审查。图3给出了一个评审实例的例子。对于判断为错误的问题，我们会重新标注相应的实例，直到正确率达到95%。

3 Dataset Statistics-数据集统计

根据上面介绍的构建过程，我们构建了最大的中文事件抽取数据集DuEE，它包含19,640个事件，这些事件被分类为65种不同的预定义事件类型，41,520个事件论元被映射到121个唯一的预定义论元角色。与现有的数据集不同，我们在句子层面提供数据集。总共有16,956个实例，每个实例可能包含几个句子，因为有时描述一个事件需要几个句子。

如表4所示，DuEE数据集分为三部分，一个训练集、一个验证集和一个测试集，这三个集之间没有重叠。目前，训练集和验证集可供下载。

我们进一步分别分析了事件类型和论元角色的数据分布，相应的结果如图4和图5所示。我们可以看到论元角色的分布与事件类型的分布密切相关。而事件类型“Competition.Result”占所有事件的15%，我们可以看到相关的论证角色也占据了所有论证的很大一部分，如“Winner”和“Loser”。像“Time”和“Location”这样的论点角色通常出现在大多数事件中，因此出现频率很高。

4 Evaluation on DuEE-对DuEE的评价

4.1 Shared Competition-共享竞争

在2020年语言和智能挑战中，我们举办了一个基于DuEE数据集的EE任务。给定预定义的模式和由句子组成的实例，该任务旨在为每个实例识别可能的预定义事件类型，并提取扮演特定角色的事件论元。本次比赛将参与者系统的输出与手动标注的结果进行匹配，并根据匹配的F1进行评分。

对于每个预测的论元，我们使用标记级别的标注结果计算其匹配分数，并且匹配过程不区分大小写。如果一个论点有多个标注提及，将使用匹配分数最高的提及。我们假设每个论元的匹配分数为mi(0 ≤ mi≤ 1)，mi的计算方法如下：

第I个预测论元和所选标注结果之间的公共字符数的距离。Lpi和Lai分别是预测论元和标注论元的长度。而Metand marin分别表示相关事件类型和论元角色的正确性，两者都是0或1。给定mi，最终F1分数的计算如下：

其中，n代表所有预测论元的数量，n代表所有标注论元的数量。最终结果根据F1成绩排名。

4.2 Results and Analysis-结果分析

总的比赛结果公布在比赛网站上。表5列出了顶级参与者系统的性能，结果按其F1分数排序。为了进一步理解我们的数据集和相关的EE技术，我们想提供一个对性能最好的系统的输出的详细分析。

预测结果的错误类型。我们收集了10个表现最好的系统的预测结果，并分析了错误预测论元的错误类型，表6显示了最终结果。当错误预测事件类型的名称和文本之间存在共同字符时，很容易出现“事件类型错误”。它揭示了EE系统实际上需要对上下文有很好的理解。最常见的错误类型是“不存在的角色错误”，具体来说，提取的短语有时实际上可能不是一个实体，在其他情况下，提取的实体不会在相应的事件中起作用。这是因为总共有121个角色，这增加了论元提取。当提取的论元与澄清角色的任何标注结果完全不匹配时，我们称之为“完全不匹配的论元错误”。错误提取的论元通常与带标注的论元具有相同的实体类型。这表明EE系统应该善于分析文本中的语义角色。对于“论元边界错误”，在大多数情况下，预测论元的长度比标注论元的长度短。这表明在DuEE中很难捕捉关于论元的完整描述，有时，不完整的预测结果实际上不能指示目标论元。

单值与多值问题。如表5所示，我们可以知道，与精确分数相比，表现最好的系统往往具有较低的召回分数，因此我们对此进行了详细的分析。首先，我们发现具有多个事件的实例的召回性能比单事件实例低14.4%，如表7所示，并且具有多个事件的实例在测试数据集中占19.5%。一个实例中的事件通常是相互关联的，并且可以共享相同的论元，如表1所示。之后，我们还发现，当一个特定的角色有多个论元需要预测时，召回率会降低13.1%，如表7所示。我们进一步对具有多论元角色的实例进行了采样，并发现我们可以根据多个论元是否彼此相邻将这些样本分为两种类型。我们如果两个论元通过一个简单的分隔符连接，也将它们视为相邻的。两种类型的实例和相应的召回如表8所示。我们知道，对于多论元抽取问题，特别是当论元彼此相邻时，实现高召回率将是一个巨大的挑战。

5 Conclusion-结论

本文介绍了由真实世界热点话题和新闻构建的最大的高质量中文事件抽取数据集DuEE数据集，并详细描述了其构建过程。我们引入了基于DuEE的技术评估，并分析了表现最佳的系统的输出。实验结果不仅表明，该方法有助于中文电子工程技术的进一步研究，而且为提出的语料库提供了坚实的基础。最后，分析表明多值事件抽取问题还需要进一步研究，包括多事件检测和多论元抽取。与此同时，更多的研究还应该集中在事件抽取系统上，该系统可以在有限的样本量下在更多的事件类型上表现良好，这对于现实问题来说是一项伟大的工作。

大语言模型学习路线：从入门到实战大模型官方资料语言模型学习人工智能产品经理自然语言处理搜索引擎
大语言模型学习路线：从入门到实战在人工智能领域，大语言模型（LargeLanguageModels,LLMs）正迅速成为一个热点话题。本学习路线旨在为有基本Python编程和深度学习基础的学习者提供一个清晰、系统的大模型学习指南，帮助你在这一领域快速成长。本学习路线更新至2024年02月，后期部分内容或工具可能需要更新。适应人群已掌握Python基础具备基本的深度学习知识学习步骤本路线将通过四个核
深度学习与目标检测系列(六) 本文约(4.5万字) | 全面解读复现ResNet | Pytorch | 小酒馆燃着灯深度学习目标检测 pytorch 人工智能 ResNet 残差连接残差网络
文章目录解读Abstract—摘要翻译精读主要内容Introduction—介绍翻译精读背景RelatedWork—相关工作ResidualRepresentations—残差表达翻译精读主要内容ShortcutConnections—短路连接翻译精读主要内容DeepResidualLearning—深度残差学习ResidualLearning—残差学习翻译精读ResNet目的以前方法本文改进本质
深度学习与目标检测系列(三) 本文约(4万字) | 全面解读复现AlexNet | Pytorch | 小酒馆燃着灯深度学习目标检测 pytorch AlexNet 人工智能
文章目录解读Abstract-摘要翻译精读主要内容1.Introduction—前言翻译精读主要内容：本文主要贡献：2.TheDataset-数据集翻译精读主要内容：ImageNet简介：图像处理方法：3.TheArchitecture—网络结构3.1ReLUNonlinearity—非线性激活函数ReLU翻译精读传统方法及不足本文改进方法本文的改进结果3.2TrainingonMultipleG
使用 Milvus 进行向量数据库管理与实践 qahaj milvus 数据库 python
技术背景介绍在当今的AI与机器学习应用中，处理和管理大量的嵌入向量是一个常见的需求。Milvus是一个开源向量数据库，专门用于存储、索引和管理深度神经网络以及其他机器学习模型生成的大规模嵌入向量。它的高性能和易用性使其成为处理向量数据的理想选择。核心原理解析Milvus的核心功能体现在其强大的向量索引和搜索能力。它支持多种索引算法，包括IVF、HNSW等，使其能够高效地进行大规模向量的相似性搜索操
建模中的特征衍生技巧总结（含各类常用衍生函数）爱学习的uu pandas 机器学习人工智能数据挖掘决策树 python 算法
本文总结了有哪些特征衍生方法，函数是什么，用在什么场景，具体步骤如下：数据集探索：1.ID有无重复：tcc['customerID'].nunique()==tcc.shape[0]2.有无缺失值：tcc.isnull().sum()另外需注意空格的情况，离散型变量查看函数为：forfeatureintcc[category_cols]:print(f'{feature}:{tcc[feature
【IT大学生必会的】 10 种图表线性回归 .Boss. 深度学习开发语言人工智能机器学习算法
这段时间，不少同学提到了一些图表的问题。每次在使用matplotlib画图，运用这些图表说明问题的时候，很多时候是模糊的，比如说什么时候画什么图合适？其实这个根据你自己的需求，自己的想法来就行。今天的话，我这里举例在线性回归中，最常用的一些图表，应该可以cover绝大多数情况了。其他算法模型适用的图表，咱们在后面再给大家进行总结~至于数据集，表现方式，大家可以根据我给出的代码继续调整即可！那么，在
物理学不存在了？诺贝尔物理学奖颁给了人工智能资讯新鲜事人工智能
2024年10月8日，瑞典皇家科学院宣布，将2024年诺贝尔物理学奖授予美国普林斯顿大学教授约翰·J·霍普菲尔德（JohnJ.Hopfield）和加拿大多伦多大学教授杰弗里·E·辛顿（GeoffreyE.Hinton），以表彰他们“在人工神经网络机器学习方面的基础性发现和发明”。辛顿在接受电话采访时表示：“完全没想到”。实话实说，在结果出来前，大家也都没想到。因为在外界预测里，今年的诺贝尔物理学奖
今日行情明日机会——20250321 人大博士的交易之路人工智能区块链数学建模数据挖掘分类涨停回马枪大数据
后续投资机会分析结合2025年3月21日盘面数据（涨停56家，跌停31家），市场呈现结构性分化行情，海洋经济成为绝对主线，机器人概念局部活跃，人工智能表现较弱。以下是具体方向与策略建议：1.海洋经济（核心主线，政策+事件驱动）核心逻辑：板块23家涨停，梯队完整（七板至一板），神开股份（七板）打开高度，叠加海洋资源开发、碳中和政策（如海上风电、深海装备）催化，资金深度介入。大连重工（三板，海洋工程装
人工智能革命：技术演进图谱与人类文明重构路径 A达峰绮人工智能重构经验分享图形绘制数据处理 AI
当GPT-4在2023年3月通过注册会计师考试时，其财务分析模块展现的推理能力已超越85%的人类考生。这个标志性事件背后，折射出人工智能正在突破认知型工作的最后防线。我们正在见证的，不仅是技术迭代，更是人类文明范式的根本性转变。一、算力奇点降临：AI基础设施的指数级进化量子计算与神经形态芯片的融合正在重塑算力边界。IBM最新数据显示，其量子体积（QuantumVolume）从2020年的64跃升至
Matplotlib| scatter函数漂亮_大男孩 matplotlib
1.简介Matplotlib库中的scatter函数用于在坐标轴上创建散点图。这种图表显示了两个变量之间的关系，每个点代表了数据集中的一个观测值。scatter函数通常用于探索数据，特别是要查看两个变量是否存在某种相关性或模式。基本用法是scatter(x,y)，其中x和y是长度相同的数组或列表，分别代表散点图中点的横坐标和纵坐标。此外，scatter函数还提供了多种可选参数来定制散点图的外观，例
【Q&A】QT事件处理流程是怎么样的？浅慕Antonio Q&A qt 数据库开发语言
Qt事件流程详解1.事件流程概述在Qt中，事件处理是实现用户交互和系统响应的核心机制。整个事件流程从事件产生开始，经过事件队列的管理、事件分发，最终到达目标对象进行处理，若未处理还会进行事件传播。2.详细流程步骤及代码示例2.1事件产生事件可以由多种方式产生，包括用户输入、系统消息和程序主动发送自定义事件。用户输入事件示例：#include#include#includeintmain(intar
探索Astra DB与LangChain的集成：从向量存储到对话历史 eahba 数据库 langchain python
技术背景介绍AstraDB是DataStax推出的一款无服务器的向量数据库，基于ApacheCassandra®构建，并通过易于使用的JSONAPI提供服务。AstraDB的独特之处在于其强大的向量存储能力，这在处理自然语言处理任务时尤为突出。LangChain与AstraDB的集成为开发者提供了强大的工具链，从数据存储到语义缓存，再到自查询检索，帮助简化复杂的数据操作。核心原理解析LangCha
计算机视觉技术探索：美颜SDK如何利用深度学习优化美颜、滤镜功能？美狐美颜sdk 美颜SDK 美颜API 直播美颜SDK 计算机视觉深度学习直播美颜SDK 美颜sdk 第三方美颜sdk 美颜api
时下，计算机视觉+深度学习正在重塑美颜技术，通过智能人脸检测、AI滤镜、深度美肤、实时优化等方式，让美颜效果更加自然、精准、个性化。那么，美颜SDK如何结合深度学习来优化美颜和滤镜功能？本文将深入解析AI在美颜技术中的应用，并探讨其未来发展趋势。一、深度学习如何赋能美颜SDK？1.AI人脸检测与关键点识别：精准捕捉五官在美颜过程中，首先需要精准检测人脸位置和五官特征点，确保美颜效果不会失真。深度学
uniapp特有生命周期钩子浪裡遊 uniapp uni-app vue.js 前端
生命周期钩子在UniApp中，页面的生命周期与Vue的生命周期钩子紧密相关，并且针对小程序平台，UniApp还扩展了一些额外的生命周期钩子。以下是重要的页面生命周期钩子及其简要说明：基础的Vue生命周期钩子beforeCreate在实例初始化之后，数据观测(dataobserver)和event/watcher事件配置之前被调用。created实例已经创建完成之后被调用。此时已完成数据观测，属性和
emit作用肉肉不吃肉 vue.js javascript 前端
emit是Vue3中用于子组件向父组件传递事件和数据的机制。它允许子组件触发一个自定义事件，父组件可以监听这个事件并执行相应的逻辑。emit的作用子组件向父组件通信：子组件通过emit触发一个自定义事件，父组件监听这个事件并执行相应的逻辑。传递数据：子组件可以通过emit向父组件传递数据，父组件可以在事件处理函数中接收这些数据。解耦组件逻辑：子组件不需要知道父组件的具体实现，只需要触发事件，父组件
PHP 爬虫实战：爬取淘宝商品详情数据 EcomDataMiner php 爬虫开发语言
随着互联网技术的发展，数据爬取越来越成为了数据分析、机器学习等领域的重要前置技能。而在这其中，爬虫技术更是不可或缺。php作为一门广泛使用的后端编程语言，其在爬虫领域同样也有着广泛应用和优势。本文将以爬取斗鱼直播数据为例，介绍php爬虫的实战应用。准备工作在开始爬虫之前，我们需要做一些准备工作。首先，需要搭建一个本地服务器环境，推荐使用WAMP、XAMPP等集成化工具，方便部署PHP环境。其次，我
《颠覆传统，用Web3.0技术手撸一个去中心化微博（含完整代码）》煜bart web3 人工智能区块链
一、为什么你的下一个项目必须拥抱Web3.0？传统互联网正面临三大致命伤：-用户数据被巨头垄断（某浪删帖事件频发）-单点故障导致服务瘫痪（某云宕机损失过亿）-创作者收益被平台榨取（某音抽成高达70%）**Web3.0的破局方案：**-✅数据永久存储在IPFS/Arweave-✅智能合约自动分配收益-✅抗审查的链上内容存证---###二、核心技术栈揭秘（附对比图表）|技术|传统方案|Web3.0方案
深度学习模型性能全景评估与优化指南 niuTaylor 深度学习人工智能
深度学习模型性能全景评估与优化指南一、算力性能指标体系1.核心算力指标对比指标计算方式适用场景硬件限制TOPS(TeraOperationsPerSecond)每秒万亿次整数运算量化模型推理NVIDIAJetsonNano仅支持FP16/FP32TFLOPS(TeraFLoating-pointOPerationsperSecond)TFLOPS=Cores×FLOPs/Cycle×Frequen
QT中的closeEvent方法 vegetablesssss QT qt
该方法是QWidget中的一个虚函数，可以通过重写该函数来达到控制窗体关闭的目的。virtualvoidcloseEvent(QCloseEvent*event)override;可以通过参数event来控制是否让窗体关闭。QT官方文档对该函数的解释为：当Qt从窗口系统收到对顶级窗体的关闭请求时，将使用给定事件调用此事件处理程序。默认情况下，事件被接受并且部件关闭。您可以重新实现此功能，以更改小部
探究Three.js中模型移动与旋转的交互逻辑 Front_Yue 3D技术实践指南 javascript three.js 3d
前言Three.js作为一个功能强大的JavaScript3D库，极大地简化了在网页上创建和展示3D图形的过程。它在游戏开发、产品展示、虚拟现实等众多领域都被广泛应用。通过Three.js，开发者能够轻松创建出复杂的三维场景和交互性强的3D应用，为用户带来沉浸式的体验。一、模型移动的交互逻辑实现（一）键盘控制模型移动利用键盘事件来控制模型在三维空间中的位置移动，是一种常见且便捷的交互方式。以下为具
从零开始：使用原生JS打造简易飞机大战游戏西域情歌
本文还有配套的精品资源，点击获取简介：在本教程中，我们将探讨如何利用原生JavaScript的特性，包括事件处理、DOM操作、定时器和音频处理，来构建一个基础的“飞机大战”游戏。该游戏的核心元素包括玩家飞机、敌机、子弹和碰撞检测，它们通过HTML和CSS展现在页面上。通过编写JavaScript脚本，我们实现游戏对象的创建与状态管理，响应用户的键盘和点击事件，更新游戏内容，并通过定时器维护游戏循环
【图像预处理】瞬间记忆深度学习 python
(4条消息)图像预处理方法总结_AI强仔的博客-CSDN博客对图像进行预处理的一些常见方法包括：调整图像大小和分辨率，以便适应模型的输入要求。对图像进行裁剪或填充，以使其大小和比例符合要求。调整图像的亮度、对比度和饱和度等图像属性。进行图像平滑或锐化操作，以去除噪声或增强图像特征。进行图像归一化或标准化，以确保各个特征在相同的尺度上。应用数据增强技术，如旋转、平移、缩放、翻转等，以扩大数据集，提高
利用Python和深度学习方法实现手写数字识别的高精度解决方案——从数据预处理到模型优化的全流程解析快撑死的鱼 Python算法精解 python 深度学习开发语言
利用Python和深度学习方法实现手写数字识别的高精度解决方案——从数据预处理到模型优化的全流程解析在人工智能的众多应用领域中，手写数字识别是一项经典且具有重要实际应用价值的任务。随着深度学习技术的飞速发展，通过构建和训练神经网络模型，手写数字识别的精度已经可以达到99%以上。本文将以Python为主要编程语言，结合深度学习的核心技术，详细解析手写数字识别的实现过程，并探讨如何进一步优化模型以提高
强化学习中的深度卷积神经网络设计与应用实例数字扫地僧计算机视觉 cnn 人工智能神经网络
I.引言强化学习（ReinforcementLearning，RL）是机器学习的一个重要分支，通过与环境的交互来学习最优策略。深度学习，特别是深度卷积神经网络（DeepConvolutionalNeuralNetworks，DCNNs）的引入，为强化学习在处理高维度数据方面提供了强大工具。本文将探讨强化学习中深度卷积神经网络的设计原则及其在不同应用场景中的实例。II.深度卷积神经网络在强化学习中的
Netty源码—3.Reactor线程模型四东阳马生架构 Netty应用与源码 Netty Reactor线程模型
大纲5.NioEventLoop的执行总体框架6.Reactor线程执行一次事件轮询7.Reactor线程处理产生IO事件的Channel8.Reactor线程处理任务队列之添加任务9.Reactor线程处理任务队列之执行任务10.NioEventLoop总结8.Reactor线程处理任务队列之添加任务(1)Reactor线程执行一次事件轮询的过程(2)任务的分类和添加说明(3)普通任务的添加(4
Netty源码分析之Reactor线程模型详解 Java-进阶架构师 java java编程 java 后端 java-ee
在分析源码之前，我们先分析，哪些地方用到了EventLoop？NioServerSocketChannel的连接监听注册NioSocketChannel的IO事件注册NioServerSocketChannel连接监听在AbstractBootstrap类的initAndRegister()方法中，当NioServerSocketChannel初始化完成后，会调用case标记位置的代码进行注册。f
腾讯云大模型知识引擎与DeepSeek：打造懒人专属的谷歌浏览器翻译插件大富大贵7 程序员知识储备1 程序员知识储备2 程序员知识储备3 腾讯云云计算
摘要：随着人工智能技术的飞速发展，越来越多的前沿技术和工具已走入日常生活。翻译工具作为跨语言沟通的桥梁，一直处于技术创新的风口浪尖。本文探讨了腾讯云大模型知识引擎与DeepSeek结合谷歌浏览器插件的可能性，旨在为用户提供一种便捷、高效的翻译体验。通过应用深度学习、自然语言处理和知识图谱技术，该插件不仅能实时翻译网页内容，还能根据上下文进行智能推荐，实现精准的语境转换。本文将详细阐述其设计思路、技
模拟退火算法：原理、应用与优化策略尹清雅算法
摘要模拟退火算法是一种基于物理退火过程的随机搜索算法，在解决复杂优化问题上表现出独特优势。本文详细阐述模拟退火算法的原理，深入分析其核心要素，通过案例展示在函数优化、旅行商问题中的应用，并探讨算法的优化策略与拓展方向，为解决复杂优化问题提供全面的理论与实践指导，助力该算法在多领域的高效应用与创新发展。一、引言在现代科学与工程领域，复杂优化问题无处不在，如资源分配、路径规划、机器学习模型参数调优等。
PyTorch深度学习框架60天进阶学习计划 - 第28天：多模态模型实践（二）凡人的AI工具箱深度学习 pytorch 学习 AI编程人工智能 python
PyTorch深度学习框架60天进阶学习计划-第28天：多模态模型实践（二）5.跨模态检索系统应用场景5.1图文匹配系统的实际应用应用领域具体场景优势电子商务商品图像搜索、视觉购物用户可以上传图片查找相似商品或使用文本描述查找商品智能媒体内容推荐、图片库搜索通过内容的语义理解提供更精准的推荐和搜索社交网络基于内容的帖子推荐理解用户兴趣，提供更相关的内容推荐教育技术多模态教学资源检索教师和学生可以更
PyTorch深度学习框架60天进阶学习计划 - 第28天：多模态模型实践（一）凡人的AI工具箱深度学习 pytorch 学习 AI编程人工智能 python
PyTorch深度学习框架60天进阶学习计划-第28天：多模态模型实践（一）引言：跨越感知的边界欢迎来到我们的PyTorch学习旅程第28天！今天我们将步入AI世界中最激动人心的领域之一：多模态学习。想象一下，如果你的模型既能"看"又能"读"，并且能够理解图像与文字之间的联系，这将为我们打开怎样的可能性？今天我们将专注于构建图文匹配系统，学习如何使用CLIP（ContrastiveLanguage
关于旗正规则引擎中的MD5加密问题何必如此 jsp MD5 规则加密
一般情况下，为了防止个人隐私的泄露，我们都会对用户登录密码进行加密，使数据库相应字段保存的是加密后的字符串，而非原始密码。在旗正规则引擎中，通过外部调用，可以实现MD5的加密，具体步骤如下： 1.在对象库中选择外部调用，选择“com.flagleader.util.MD5”，在子选项中选择“com.flagleader.util.MD5.getMD5ofStr({arg1})”； 2.在规
【Spark101】Scala Promise/Future在Spark中的应用 bit1129 Promise
Promise和Future是Scala用于异步调用并实现结果汇集的并发原语，Scala的Future同JUC里面的Future接口含义相同，Promise理解起来就有些绕。等有时间了再仔细的研究下Promise和Future的语义以及应用场景，具体参见Scala在线文档：http://docs.scala-lang.org/sips/completed/futures-promises.html
spark sql 访问hive数据的配置详解 daizj spark sql hive thriftserver
spark sql 能够通过thriftserver 访问hive数据，默认spark编译的版本是不支持访问hive，因为hive依赖比较多，因此打的包中不包含hive和thriftserver,因此需要自己下载源码进行编译，将hive，thriftserver打包进去才能够访问，详细配置步骤如下： 1、下载源码 2、下载Maven,并配置此配置简单，就略过
HTTP 协议通信周凡杨 java httpclient http 通信
一：简介 HTTPCLIENT，通过JAVA基于HTTP协议进行点与点间的通信！二：代码举例测试类： import java
java unix时间戳转换 g21121 java
把java时间戳转换成unix时间戳： Timestamp appointTime=Timestamp.valueOf(new SimpleDateFormat("yyyy-MM-dd HH:mm:ss").format(new Date())) SimpleDateFormat df = new SimpleDateFormat("yyyy-MM-dd hh:m
web报表工具FineReport常用函数的用法总结（报表函数）老A不折腾 web报表 finereport 总结
说明：本次总结中，凡是以tableName或viewName作为参数因子的。函数在调用的时候均按照先从私有数据源中查找，然后再从公有数据源中查找的顺序。 CLASS CLASS(object):返回object对象的所属的类。 CNMONEY CNMONEY(number,unit)返回人民币大写。 number:需要转换的数值型的数。 unit:单位，
java jni调用c++ 代码报错墙头上一根草 java C++jni
# # A fatal error has been detected by the Java Runtime Environment: # # EXCEPTION_ACCESS_VIOLATION (0xc0000005) at pc=0x00000000777c3290, pid=5632, tid=6656 # # JRE version: Java(TM) SE Ru
Spring中事件处理de小技巧 aijuans spring Spring 教程 Spring 实例 Spring 入门 Spring3
Spring 中提供一些Aware相关de接口，BeanFactoryAware、 ApplicationContextAware、ResourceLoaderAware、ServletContextAware等等，其中最常用到de匙ApplicationContextAware.实现ApplicationContextAwaredeBean，在Bean被初始后，将会被注入 Applicati
linux shell ls脚本样例 annan211 linux linux ls源码 linux 源码
#! /bin/sh - #查找输入文件的路径 #在查找路径下寻找一个或多个原始文件或文件模式 # 查找路径由特定的环境变量所定义 #标准输出所产生的结果通常是查找路径下找到的每个文件的第一个实体的完整路径 # 或是filename :not found 的标准错误输出。 #如果文件没有找到则退出码为0 #否则即为找不到的文件个数 #语法 pathfind [--
List,Set,Map遍历方式 (收集的资源,值得看一下) 百合不是茶 list set Map遍历方式
List特点：元素有放入顺序，元素可重复 Map特点：元素按键值对存储，无放入顺序 Set特点：元素无放入顺序，元素不可重复（注意：元素虽然无放入顺序，但是元素在set中的位置是有该元素的HashCode决定的，其位置其实是固定的） List接口有三个实现类：LinkedList，ArrayList，Vector LinkedList：底层基于链表实现，链表内存是散乱的，每一个元素存储本身
解决SimpleDateFormat的线程不安全问题的方法 bijian1013 java thread 线程安全
在Java项目中，我们通常会自己写一个DateUtil类，处理日期和字符串的转换，如下所示： public class DateUtil01 { private SimpleDateFormat dateformat = new SimpleDateFormat("yyyy-MM-dd HH:mm:ss"); public void format(Date d
http请求测试实例（采用fastjson解析） bijian1013 http 测试
在实际开发中，我们经常会去做http请求的开发，下面则是如何请求的单元测试小实例，仅供参考。 import java.util.HashMap; import java.util.Map; import org.apache.commons.httpclient.HttpClient; import
【RPC框架Hessian三】Hessian 异常处理 bit1129 hessian
RPC异常处理概述 RPC异常处理指是，当客户端调用远端的服务，如果服务执行过程中发生异常，这个异常能否序列到客户端？如果服务在执行过程中可能发生异常，那么在服务接口的声明中，就该声明该接口可能抛出的异常。在Hessian中，服务器端发生异常，可以将异常信息从服务器端序列化到客户端，因为Exception本身是实现了Serializable的
【日志分析】日志分析工具 bit1129 日志分析
1. 网站日志实时分析工具 GoAccess http://www.vpsee.com/2014/02/a-real-time-web-log-analyzer-goaccess/ 2. 通过日志监控并收集 Java 应用程序性能数据(Perf4J) http://www.ibm.com/developerworks/cn/java/j-lo-logforperf/ 3.log.io 和
nginx优化加强战斗力及遇到的坑解决 ronin47 nginx 优化
　　　先说遇到个坑，第一个是负载问题，这个问题与架构有关，由于我设计架构多了两层，结果导致会话负载只转向一个。解决这样的问题思路有两个：一是改变负载策略，二是更改架构设计。　　　由于采用动静分离部署，而nginx又设计了静态，结果客户端去读nginx静态，访问量上来，页面加载很慢。解决：二者留其一。最好是保留apache服务器。　　　来以下优化：　　　
java-50-输入两棵二叉树A和B，判断树B是不是A的子结构 bylijinnan java
思路来自： http://zhedahht.blog.163.com/blog/static/25411174201011445550396/ import ljn.help.*; public class HasSubtree { /**Q50. * 输入两棵二叉树A和B，判断树B是不是A的子结构。例如，下图中的两棵树A和B，由于A中有一部分子树的结构和B是一
mongoDB 备份与恢复开窍的石头 mongDB备份与恢复
Mongodb导出与导入 1: 导入/导出可以操作的是本地的mongodb服务器,也可以是远程的. 所以,都有如下通用选项: -h host 主机 --port port 端口 -u username 用户名 -p passwd 密码 2: mongoexport 导出json格式的文件
[网络与通讯]椭圆轨道计算的一些问题 comsci 网络
如果按照中国古代农历的历法，现在应该是某个季节的开始，但是由于农历历法是3000年前的天文观测数据，如果按照现在的天文学记录来进行修正的话，这个季节已经过去一段时间了。。。。。也就是说，还要再等3000年。才有机会了，太阳系的行星的椭圆轨道受到外来天体的干扰，轨道次序发生了变
软件专利如何申请 cuiyadll 软件专利申请
软件技术可以申请软件著作权以保护软件源代码，也可以申请发明专利以保护软件流程中的步骤执行方式。专利保护的是软件解决问题的思想，而软件著作权保护的是软件代码（即软件思想的表达形式）。例如，离线传送文件，那发明专利保护是如何实现离线传送文件。基于相同的软件思想，但实现离线传送的程序代码有千千万万种，每种代码都可以享有各自的软件著作权。申请一个软件发明专利的代理费大概需要5000-8000申请发明专利可
Android学习笔记 darrenzhu android
1.启动一个AVD 2.命令行运行adb shell可连接到AVD,这也就是命令行客户端 3.如何启动一个程序 am start -n package name/.activityName am start -n com.example.helloworld/.MainActivity 启动Android设置工具的命令如下所示： # am start -
apache虚拟机配置，本地多域名访问本地网站 dcj3sjt126com apache
现在假定你有两个目录，一个存在于 /htdocs/a，另一个存在于 /htdocs/b 。现在你想要在本地测试的时候访问 www.freeman.com 对应的目录是 /xampp/htdocs/freeman ,访问 www.duchengjiu.com 对应的目录是 /htdocs/duchengjiu。 1、首先修改C盘WINDOWS\system32\drivers\etc目录下的
yii2 restful web服务[速率限制] dcj3sjt126com PHP yii2
速率限制为防止滥用，你应该考虑增加速率限制到您的API。例如，您可以限制每个用户的API的使用是在10分钟内最多100次的API调用。如果一个用户同一个时间段内太多的请求被接收，将返回响应状态代码 429 (这意味着过多的请求)。要启用速率限制, [[yii\web\User::identityClass|user identity class]] 应该实现 [[yii\filter
Hadoop2.5.2安装——单机模式 eksliang hadoop hadoop单机部署
转载请出自出处：http://eksliang.iteye.com/blog/2185414 一、概述 Hadoop有三种模式单机模式、伪分布模式和完全分布模式，这里先简单介绍单机模式，默认情况下，Hadoop被配置成一个非分布式模式，独立运行JAVA进程，适合开始做调试工作。二、下载地址 Hadoop 网址http:
LoadMoreListView+SwipeRefreshLayout（分页下拉）基本结构 gundumw100 android
一切为了快速迭代 import java.util.ArrayList; import org.json.JSONObject; import android.animation.ObjectAnimator; import android.os.Bundle; import android.support.v4.widget.SwipeRefreshLayo
三道简单的前端HTML/CSS题目 ini html Web 前端 css 题目
使用CSS为多个网页进行相同风格的布局和外观设置时，为了方便对这些网页进行修改，最好使用（）。http://hovertree.com/shortanswer/bjae/7bd72acca3206862.htm 在HTML中加入<table style=”color:red; font-size:10pt”>，此为（）。http://hovertree.com/s
overrided方法编译错误 kane_xie override
问题描述：在实现类中的某一或某几个Override方法发生编译错误如下： Name clash: The method put(String) of type XXXServiceImpl has the same erasure as put(String) of type XXXService but does not override it 当去掉@Over
Java中使用代理IP获取网址内容（防IP被封，做数据爬虫） mcj8089 免费代理IP 代理IP 数据爬虫 JAVA设置代理IP 爬虫封IP
推荐两个代理IP网站： 1. 全网代理IP：http://proxy.goubanjia.com/ 2. 敲代码免费IP：http://ip.qiaodm.com/ Java语言有两种方式使用代理IP访问网址并获取内容，方式一，设置System系统属性 // 设置代理IP System.getProper
Nodejs Express 报错之 listen EADDRINUSE qiaolevip 每天进步一点点学习永无止境 nodejs 纵观千象
当你启动 nodejs服务报错： >node app Express server listening on port 80 events.js:85 throw er; // Unhandled 'error' event ^ Error: listen EADDRINUSE at exports._errnoException (
C++中三种new的用法 _荆棘鸟_ C++new
转载自：http://news.ccidnet.com/art/32855/20100713/2114025_1.html 作者: mt 其一是new operator，也叫new表达式；其二是operator new，也叫new操作符。这两个英文名称起的也太绝了，很容易搞混，那就记中文名称吧。new表达式比较常见，也最常用，例如： string* ps = new string("
Ruby深入研究笔记1 wudixiaotie Ruby
module是可以定义private方法的 module MTest def aaa puts "aaa" private_method end private def private_method puts "this is private_method" end end