倪畅

[中文事件抽取] Doc2EDAG: An End-to-End Document-level Framework for Chinese Financial Event Extraction

EMNLP2019	Doc2EDAG: An End-to-End Document-level Framework for Chinese Financial Event Extraction
Author	Shun Zheng, Wei Cao, Wei Xu, Jiang Bian
url	https://www.aclweb.org/anthology/D19-1032.pdf
Code	https://github.com/dolphin-zs/Doc2EDAG

大多数现有的事件抽取方法只抽取句子范围的事件参数。但是这种句子级别的事件抽取方法难以解决新兴应用（如金融、法律、卫生等）数量激增的文档。它们的事件论元分散在不同的句子中，甚至多个事件实例在同一文档中同时存在。为了解决这些问题，我们提出了一种新的端到端模型Doc2EDAG，它可以生成一个基于实体的有向无环图来有效地实现文档级事件抽取。此外，我们提出了一个无触发词设计的文档级事件抽取任务，以简化文档级事件标注。为了证明模型的有效性，我们构建了一个包含有上述挑战的中国财务公告的大型真实数据集。综合分析的大量实验证明了Doc2EDAG相对于最新方法的优越性。

1 Introduction

鉴于金融领域文档及业务的特殊性，在做事件抽取的过程中存在一些挑战：

事件元素分散（Arguments-scattering）：指事件论元可能在不同的句子（Sentence）中
多事件（Muti-event）：指一个文档中可能包含多个事件

以该图为例，一个文档中有两个股权质押的事件实例，对应Event Table of Equity Pledge表中也就有两条Event record。该事件的角色包括抵押者、抵押的股权量、承押者、开始时间、结束时间、持有股份总数、持有股份占公司股份的比例。
我们以ID作为句子索引，用相应的标记代替实体提及，将关键事件语句范围之外的事件参数颜色显示为红色。则每个事件的论元都可能分布在多个句子中，且大概率是分散分布的。

现如今的研究多是在句子范围内标记事件论元，我们把这类任务称为句子级事件抽取，它显然忽略了我们上面提到的挑战。

在本文中，我们提出了一个新的端到端模型Doc2EDAG，以解决文档级事件抽取（DEE）的独特挑战。该模型的核心思想是将事件表转换为基于实体的有向无环图（EDAG）。EDAG的形式可以将困难的事件表填充任务转换为多个基于实体的顺序路径扩展子任务，这些子任务更容易处理。
为了有效地支持EDAG的生成，Doc2EDAG使用文档级上下文对实体进行编码，并设计了路径扩展的记忆机制。此外，为了简化基于远程监督的文档级事件标注，我们提出了一种新的DEE形式化方法。该方法去除了触发词标注，并将DEE视为直接基于文档填充事件表。这种无触发词设计不依赖任何预定义的触发词集或启发式来过滤多个候选触发词，并且仍然完全符合DEE的最终目标，即将文档映射到底层事件表。

总的来说，本文的贡献在于：

提出了一个新的模型Doc2EDAG，它可以直接基于文档生成事件表，有效地解决DEE的独特挑战。
重新定义了一个没有触发词的DEE任务，以简化基于远程监督的文档级事件标记。
为DEE建立了一个大规模的真实世界数据集，该数据集面临着参数分散和多事件的独特挑战，大量的实验证明了Doc2EDAG的优越性。

2 Preliminaries

我们首先阐明几个基本概念：

entity mention：实体提及是指一个实体对象的文本块
event role：事件角色对应事件表的预定义字段
event argument：事件论元是扮演特定事件角色的实体
event record：事件记录对应于事件表的一条记录，包含多个所需角色的论元

为了更好地阐述和评估我们提出的方法，我们在本文中利用了ChFinAnn数据。ChFinAnn文档包含中国股市上市公司的第一手官方信息，有数百种类型，如年报和盈利预测。在进行这项工作时，我们将重点放在那些与事件相关的，频繁，有影响力且主要由自然语言表达的事件上。

3 文档级事件标注

作为DEE的前提工作，我们首先在文档级别进行基于远程监督的事件标注。更具体地说，我们将表格记录从事件知识库映射到文档文本，然后将较为匹配的记录视为该文档所表示的事件。此外，我们采用了无触发词设计，并相应地重新设计了新的DEE任务，以实现端到端模型设计。

Event Labeling：
为了保证标记质量，我们对匹配的记录设置了两个约束

预定义键的事件角色的论元必须存在
匹配的论元的个数要大于某个阈值

这些约束的配置是特定于事件的。在实践中，我们可以对它们进行优化从而直接确保文档级别的标签质量。我们把满足这两个约束条件的记录视为匹配较好的记录，这些记录充当了受远程监督的基本事实。除了标记事件记录之外，我们将论元的角色分配给匹配的token，作为token-level实体标签。注意，我们没有显式地标记触发词。除了不影响DEE功能之外，这种无触发词的设计的另一个好处是基于远程监督的标注更容易，它不依赖于预定义的触发词词典或者手动引导的启发式方法来过滤多个潜在的触发词。

DEE Task Without Trigger Words：
我们将DEE的一个新任务重新定义为基于文档直接填充事件表，通常需要三个子任务：

实体抽取：抽取实体提及作为候选论元
事件检测：判断一个文档是否触发某个事件类型
事件表填充：将论元填充到触发的事件对应的表中

这种新颖的文档级的事件抽取和传统的句子级事件抽取任务有很大不同，但是和上述基于远程监督的事件标签的简化方法是一样的。

4 模型

Doc2EDAG的核心思想是将表格式的事件记录转换为EDAG，并让模型基于文档级上下文学习生成该EDAG。根据Figure 2中的示例，Figure 3描述了EDAG生成的过程。Figure 4显示了Doc2EDAG的总体工作流程，其中包括两个关键阶段：文档级实体编码和EDAG生成。在详细介绍它们之前，我们首先描述两个预处理模块：输入表示和实体识别。

输入表示：
本文中，我们将文档表示为一系列句子。查找token embedding表 $\in \mathbb{R} ^ {d_w * |V|}$ ，我们把文档表示为句子序列 $s_1;s_2;...;s_{N_s}]$ ，每一个句子 $s_i \in \mathbb{R} ^ {d_w * N_w}$ 都是由token embeddings的序列组成的，如 $w_{i,1},w_{i,2},...,w_{i,N_w}]$ 。其中 $∣ V ∣$ 是词典的大小， $N_s$ 和 $N_w$ 分别是句子序列和token序列的最大长度， $w_{i,j} \in \mathbb{R} ^ {d_w}$ 是第 $i$ 个句子中的第 $j$ 个token的维度大小为 $d_w$ 的嵌入。

实体识别：
实体识别是一项典型的序列标注任务。我们在句子层面执行这项任务，并使用一种经典的方法BI-LSTM-CRF，该方法首先对标记序列进行编码，然后添加一个条件随机场层，以便进行序列标注。唯一的区别是，我们使用Transformer而不是原始的编码器。Transformer通过多头自注意力机制对嵌入序列进行编码，在它们之间交换上下文信息。由于Transformer的优越性能，我们将其作为本文的主要上下文编码器，并将本阶段使用的Transformer模块命名为Transformer-1。
对于每一个句子张量 $s_i \in \mathbb{R} ^ {d_w * N_w}$ ，我们通过 $h_i = Transformer-1(s_i)$ 得到编码结果，其中 $h_i \in \mathbb{R} ^ {d_w * N_w}$ 具有相同的嵌入维度 $d_w$ 和序列长度 $N_w$ 。在训练过程中，我们使用经典的BIO标注体系来对匹配的论元进行实体标注，并用CRF层包装 $h_i$ 得到实体识别的损失函数 $L_{er}$ 。最后使用维特比算法进行解码得到最优的标记序列。

4.1 文档级实体编码

为了有效地解决论元分散的问题，必须利用全局上下文来更好地确定实体是否扮演特定的事件角色。因此，我们使用文档级的实体编码来对这些上下文中提取的实体提及进行编码，并为每个具有不同实体名称的实体提及生成大小为 $d_w$ 的嵌入。

Entity & Sentence Embedding：
由于一个实体提及通常覆盖多个长度可变的token，我们首先通过对其覆盖的token执行最大池化操作，获得每个实体提及的固定大小的嵌入。比如，给定第 $i$ 个句子中覆盖第 $j$ 个到第 $k$ 个token的第 $l$ 个实体提及，我们对 $h_{i,j},...,h_{j,k}]$ 进行最大池化，得到实体提及嵌入 $e_l \in \mathbb{R}^{d_w}$ 。对于每个句子 $s_i$ ，我们也对编码的token序列进行最大池化操作，得到一个嵌入 $c_i \in \mathbb{R}^{d_w}$ 。经过这些操作之后，实体提及和句子都被嵌入到 $d_w$ 维。

Document-level Encoding：
尽管我们得到了所有句子和实体提及的嵌入，但这些嵌入只对语句范围内的局部上下文进行编码。为了实现文档级上下文的感知，我们使用了第二个Transformer模块Transformer-2，以促进所有实体提及和句子之间的信息交换。在将它们输入到Transformer-2之前，我们添加了位置嵌入，以表示句子顺序。经过Transformer编码之后，我们再次使用max-pooling操作将具有相同实体名称的多个实体提及嵌入合并到单个嵌入中。在这一阶段之后，我们得到文档级上下文感知的实体提及 $e^d=[e_1^d,...,e_{N_e}^d]$ 和句子嵌入 $c^d=[e_1^d,...,e_{N_s}^d]$ ，其中 $N_e$ 是不同实体名称的数目。这些汇总的嵌入可用于下一步直接填充事件表。

4.2 EDAG Generation

在文档级实体编码之后，我们可以通过对句子张量 $c^d \in \mathbb{R}^{d_w * N_s}$ 进行最大池化从而获得文档嵌入 $\in \mathbb{R}^{d_w}$ ，并在 $t$ 上堆叠线性分类器来对每种事件类型进行event-triggering classification。接下来，对于每种触发事件类型，我们将学习生成EDAG。

EDAG Building：
模型训练之前，我们需要从表格事件记录中建立EDAG。对于每个事件类型，我们首先手动定义一个事件角色顺序。然后，我们按照此顺序将每个事件记录转换为论元的链接列表，其中每个论元节点要么是实体，要么是特殊的空论元NA。最后，我们通过共享相同的前缀路径将这些链表合并到一个EDAG中。由于EDAG的每个完整路径都对应事件表的一行，因此从给定的EDAG恢复表格式非常简单。

Task Decomposition：
EDAG旨在将困难的表填充任务简化为几个可处理的路径扩展子任务。然后一个自然的问题是任务分解是如何进行的，这可以通过下面的EDAG恢复过程来回答。假设事件触发作为起始节点（初始EDAG），则会出现一系列路径拓展子任务，并遵循预定义的事件角色顺序。当考虑某个角色时，对于当前EDAG的每个叶子节点，都有一个路径拓展子任务，该子任务决定扩展哪些实体。对于要展开的每个实体，我们为当前角色创建该实体的一个新节点，并通过将当前叶子节点连接到新实体节点来展开路径。如果没有实体可用于展开，则创建一个特殊的NA节点。当前的所有子任务完成后，我们移动到下一个角色，重复直到最后一个角色。在这项工作中，我们利用上述逻辑从推断时的路径拓展预测中恢复EDAG，并在训练时为每个子任务设置相关标签。

Memory：
为了更好地完成每个路径扩展子任务，关键是要知道路径中已经包含的实体。因此，我们设计了一种记忆机制，在开始时用句子张量 $c^d$ 初始化记忆张量 $m$ ，并在扩展路径时通过为NA论元附加相关实体嵌入或零填充实体来更新 $m$ 。通过这种设计，每个子任务可以拥有一个不同的记忆张量，对应于唯一的路径历史。

Path Expanding：
每次扩展事件路径时，都对每个实体进行二分类，展开(1)或不展开(0)，即判断某个实体是否对应当前顺序下的event role。如果是就将该实体添加到EDAG中，如果没有任何实体能与当前event role匹配则将NA添加到EDAG中。为了实现对当前路径状态、历史上下文和当前事件角色的感知，我们首先将记忆张量 $m$ 和实体张量 $e^d$ 串联起来，然后添加可训练的event-role-indicator embedding,，并用第三个转换模块Transformer-3进行编码，以便于上下文感知推断。最后，我们从Transformer-3的输出中提取丰富的实体张量 $e^r$ ，并在 $e^r$ 上叠加一个线性分类器进行路径扩展分类。

Optimization：
对于事件触发分类，我们计算交叉熵损失 $L_{tr}$ 。在EDAG生成过程中，我们计算每个路径扩展子任务的交叉熵损失，并将这些损失相加作为最终的EDAG-generation的损失 $L_{dag}$ 。最后，我们将 $L_{tr}$ 、 $L_{dag}$ 和实体识别损失 $L_{er}$ 相加作为最终损失， $L_{all}=λ_1L_{er}+λ_2L_{tr}+λ_3L_{dag}$ ，其中 $λ_1$ 、 $λ_2$ 和 $λ_3$ 为超参数。

Inference：
给定一个文档，Doc2EDAG首先从语句中识别实体提及，然后用文档级上下文对其进行编码，最后通过执行一系列路径扩展子任务为每个触发的事件类型生成一个EDAG。

Practical Tips：
在训练期间，我们可以利用ground-truth实体token和给定的EDAG结构。在推断时，我们需要首先识别出实体，然后根据这些实体的嵌入顺序扩展路径以恢复EDAG。训练和推断之间的这种差距可能会导致严重的错误传播问题。为了缓解此类问题，我们利用计划采样（Bengio等人，2015）将文档级实体编码的输入从ground-truth entity mentions逐步转换为模型识别的提及。此外，对于路径扩展分类，正样本的错误分类比负样本的错误分类更有害，因为前者会导致完全错误的路径。因此，我们可以将 $γ$ （> 1）设置为相关的交叉熵损失的负类权重。

01年实习生被曝负责字节RL核心算法！系字节LLM攻坚小组成员量子位
一个超越DeepSeekGRPO的关键RL算法出现了！用上该算法后，Qwen2.5-32B模型只经过RL训练，不引入蒸馏等其他技术，在AIME2024基准上拿下50分，优于相同setting下使用GRPO算法的DeepSeek-R1-Zero-Qwen，且DAPO使用的训练步数还减少了50%。这个算法名为DAPO，字节、清华AIR联合实验室SIALab出品，现已开源。论文通讯作者和开源项目负责人都
量子位招聘 | DeepSeek帮我们改的招聘启事量子位
关注前沿科技量子位未来同事，你好~这是一则招聘帖。如果你与我们志同道合，对AI大模型、具身智能、终端硬件、AI新媒体编辑感兴趣，我们正在招聘这些领域的原创作者。以下岗位均为全职，工作地点：北京中关村。岗位面向：社招、应届毕业生，所有岗位均可实习——表现出色均可转正加分项：乐于探索AI新工具，善用AI新工具；拥有解读论文的能力，能深入浅出讲解原理；有写代码能力；量子位长期读者。加入我们，你可以获得：
CBNetV2: A Composite Backbone Network Architecture for Object Detection论文阅读 Laughing-q 论文阅读深度学习人工智能目标检测实例分割 transformer
CBNetV2:ACompositeBackboneNetworkArchitectureforObjectDetection论文阅读介绍方法CBNetV2融合方式对Assistant的监督实验与SOTA的比较在主流backbone架构上的通用性与更宽更深的网络比较与可变形卷积的兼容在主流检测器上的模型适用性在SwinTransformer上的模型适用性消融实验paper：https://arxi
毕业论文代码实验（Python\MATLAB）基于K-means聚类的EMD-BiLSTM-Attention光伏功率预测模型清风AI 毕业设计代码实现 python lstm 深度学习神经网络人工智能 matlab pytorch
一、项目背景1.1光伏功率预测意义在能源结构转型背景下（国家能源局2025规划），光伏发电渗透率已超过18%。但受天气突变、云层遮挡等因素影响，光伏出力具有显著波动性，导致：电网调度难度增加（±15%功率波动）电力市场交易风险提升光储协同控制效率降低1.2技术挑战多尺度特征耦合：分钟级辐照度变化与小时级天气模式共存非线性映射关系：气象因素与发电功率呈高阶非线性关系数据模态差异：数值天气预报(NWP
YOLO算法全面改进指南（二） niuTaylor YOLO改进 YOLO 算法
以下是为YOLO系列算法设计的系统性改进框架，结合前沿技术与多领域创新，提供可支持高水平论文发表的详细改进思路。本方案整合了轻量化设计、多模态融合、动态特征优化等创新点，并给出可验证的实验方向。一、多模态提示驱动的开放场景检测系统1.核心创新三模态提示机制：文本提示编码器：基于RepRTA（可重参数化区域文本对齐）构建轻量级文本编码网络，将自然语言描述映射为128维语义向量。视觉提示编码器：采用S
DPO 核心理论推导：参考策略距离约束下的最优策略 + 损失函数设计 iiiiii11 机器学习人工智能论文阅读笔记语言模型深度学习
Rafailov,Rafael,etal.“Directpreferenceoptimization:Yourlanguagemodelissecretlyarewardmodel.”AdvancesinNeuralInformationProcessingSystems36(2023):53728-53741.本文整理了DPO论文中两个核心结论的推导，包括参考策略距离约束下的最优策略的形式，以及
yolov8实战第七天——pyqt5-yolov8实现车牌识别系统（参考论文（约7000字）+环境配置+完整部署代码+代码使用说明+训练好的模型）学术菜鸟小晨 yolov8实战100天 python YOLO pyqt5 车牌识别毕业设计论文
基于pyqt5-yolov8实现车牌识别系统，包括图片车牌识别，视频车牌识别，视频流车牌识别。效果展示（图片检测，检测到的内容添加到历史记录）：效果展示（视频检测，视频车辆只会添加一条记录，下文更多实际应用中的优化策略）：新增功能：批量图片检测（2024/5/7更新代码）
AI进化论：从图灵测试到智能革命的临界点 A达峰绮人工智能数据处理经验分享 AIGC AI人工智能
智能觉醒的起源密码（1943-2010）在曼彻斯特维多利亚大学的实验室里，1948年"Baby"计算机完成人类首个存储程序运行实验时，艾伦·图灵正在构思《计算机器与智能》。这篇划时代论文提出的"模仿游戏"测试，为人工智能奠定了哲学基础。1956年达特茅斯会议上，麦卡锡正式提出"人工智能"概念，当时学界乐观预测"二十年内机器将完成人类所有工作"。神经网络的发展轨迹充满戏剧性：1958年罗森布拉特发明
软考系统架构设计师考试学习和考试的知识点大纲，覆盖所有考试考点 DKPT #系统架构设计师系统架构学习
以下是软考系统架构设计师考试的知识点大纲，覆盖所有官方考点，分为基础知识、核心技术、系统设计、案例分析、论文写作五大模块，帮助系统性学习和备考：一、基础知识模块计算机组成与体系结构计算机硬件组成（CPU、内存、I/O设备）存储系统（Cache、RAID、虚拟内存）指令系统与流水线技术操作系统进程与线程管理（调度算法、死锁）内存管理（分页、分段、虚拟内存）文件系统与磁盘管理数据库系统关系数据库（SQ
量子位招聘 | DeepSeek帮我们改的招聘启事量子位
关注前沿科技量子位未来同事，你好~这是一则招聘帖。如果你与我们志同道合，对AI大模型、具身智能、终端硬件、AI新媒体编辑感兴趣，我们正在招聘这些领域的原创作者。以下岗位均为全职，工作地点：北京中关村。岗位面向：社招、应届毕业生，所有岗位均可实习——表现出色均可转正加分项：乐于探索AI新工具，善用AI新工具；拥有解读论文的能力，能深入浅出讲解原理；有写代码能力；量子位长期读者。加入我们，你可以获得：
不搞花里胡哨！CMU最新开源：极简风格的LiDAR全景分割+跟踪！ 3Ｄ视觉工坊 3D视觉从入门到精通 3D视觉
来源：3D视觉工坊在公众号「3D视觉工坊」后台，回复「原论文」可获取论文pdf、代码链接添加微信：dddvisiona，备注：三维点云，拉你入群。文末附行业细分群1.笔者个人体会激光雷达全景分割（LPS）一般遵循自下而上的以分割为中心的范式，利用聚类获得对象实例来建立语义分割网络。但是最近CMU&Meta等大佬们重新思考了这种方法，并提出了一个简单而有效的检测中心网络，用于LPS和跟踪。这项工作也
【论文解读】DSVP：通过动态扩展实现快速探索的双阶段视点规划器 Travis.X 论文解读自动驾驶动态规划人工智能
标题：DSVP:Dual-StageViewpointPlannerforRapidExplorationbyDynamicExpansion作者：HongbiaoZhu,ChaoCao,YukunXia,SebastianScherer,JiZhang,andWeidongWang来源：https://frc.ri.cmu.edu/~zhangji/publications/IROS_2021.
如何评估一个RAG系统（RAGas评测框架）-下篇写程序的小火箭大语言模型人工智能语言模型 chatgpt langchain gpt
RAGas是一个用于评测RAG系统的评测框架，它支持与不同大语言模型的集成，并与langchain生态打通，能够很方便的构建评测系统。下面是RAGas的一些链接论文：https://arxiv.org/pdf/2309.15217官方文档：Ragashttps://github.com/explodinggradients/ragas官方文档及github对框架的使用介绍的比较详细，本文不会就该方
【论文阅读】PERSONALIZE SEGMENT ANYTHING MODEL WITH ONE SHOT s1ckrain 计算机视觉论文阅读计算机视觉人工智能
PERSONALIZESEGMENTANYTHINGMODELWITHONESHOT原文摘要研究背景与问题：SAM是一个基于大规模数据预训练的强大提示框架，推动了分割领域的发展。尽管SAM具有通用性，但在无需人工提示的情况下，针对特定视觉概念（如自动分割用户宠物狗）的定制化研究尚不充分。方法提出：提出了一种无需训练的SAM个性化方法，称为PerSAM。仅需单次数据（一张带参考掩码的图像），即可在新
AI学习教程DeepSeek使用教程合集免费下载 oneboxai 学习
1.DeepSeek本地部署2.Deepseek搭建个人知识库3.DeepSeek提示词详解4.Deepseek使用技巧大全5.DeepSeek提示词大全6.DeepSeek保姆级新手教程7.DeepSeek各类应用8.Deepseek写小说9.DeepSeekV3部署教程10.DeepseekwordExcel11.Deepseek科研论文12.Deepseek开发游戏13.大模型通用一-A1指
2025年美赛数学建模 ICM 问题 E：为农业腾出空间深度学习&目标检测实战项目数学建模 2025美赛 2025年数学建模美赛思路代码问题 E：为农业腾出空间 2025美赛E题
全部都是公开资料，不代写论文，请勿盲目订阅）2025年数学建模美赛期间，会发布思路和代码，赛前半价，赛前会发布往年美赛的经典案例，赛题会结合最新款的chatgpto1pro分析，会根据赛题难度，选择合适的题目着重分析，没有代写论文服务，只会发布思路和代码，因为赛制要求，不会回复私信。内容可能达不到大家预期，请不要盲目订阅。已开通200美元/月的chatgptpro会员，会充分利用chatgpto1
CVPR2025 | 对抗样本&智能安全方向论文汇总 | 持续更新中~ 四口鲸鱼爱吃盐文献阅读安全 transformer 深度学习对抗样本神经网络视觉语言模型后门攻击
汇总结果来源：CVPR2025AcceptedPapers若文中出现的论文链接和GitHub链接点不开，则说明还未公布，在公布后笔者会及时添加.若笔者未及时添加，欢迎读者告知.文章根据题目关键词搜索，可能会有遗漏.若笔者出现遗漏，欢迎告知.部分文章还未公布正文，只有名称.MindtheGap：通过查询更新分析检测正在进行中的黑盒对抗攻击MindtheGap:DetectingBlack-boxAd
python基于Django的旅游景点数据分析及可视化的设计与实现 7blk7 qq2295116502 python django 数据分析
目录项目介绍技术栈具体实现截图Scrapy爬虫框架关键技术和使用的工具环境等的说明解决的思路开发流程爬虫核心代码展示系统设计论文书写大纲详细视频演示源码获取项目介绍大数据分析是现下比较热门的词汇，通过分析之后可以得到更多深入且有价值的信息。现实的科技手段中，越来越多的应用都会涉及到大数据随着大数据时代的到来，数据挖掘、分析与应用成为多个行业的关键,本课题首先介绍了网络爬虫的基本概念以及技术实现方法
一口气告诉你Deepseek与manus有什么区别？小二爱编程· ai 人工智能
DeepSeek像是个特别聪明的“顾问”，你问他问题，他能给你写论文、改合同、算数学题，甚至能讲冷笑话。但他有个特点：动嘴不动手。比如你说“帮我做个PPT”，他会给你写个特别详细的提纲，但最后你得自己打开电脑动手做。Manus更像是个“动手达人”，你只要说“帮我做个PPT”，他能直接打开软件，自己找模板、排版、插图片，最后把做好的PPT文件甩给你，全程不用你动手。具体区别在哪？擅长的事不一样Dee
HRM：分层多步奖励模型大模型最新论文速读深度学习语言模型人工智能自然语言处理
论文标题TowardsHierarchicalMulti-StepRewardModelsforEnhancedReasoninginLargeLanguageModels论文地址https://arxiv.org/pdf/2503.13551代码地址https://github.com/tengwang0318/hierarchial_reward_model作者背景香港大学，北京大学，新加坡国
GS-SLAM论文阅读笔记-MGSO zenpluck GS论文阅读论文阅读笔记
前言MGSO首字母缩略词是直接稀疏里程计(DSO)，我们建立的光度SLAM系统和高斯飞溅(GS)的混合。这应该是第一个前端用DSO的高斯SLAM，不知道这个系统的组合能不能打得过ORB-SLAM3，以及对DSO会做出怎么样的改进以适应高斯地图，接下来就看一下吧！GishelloG^s_ihelloGishello我是红色文章目录前言1.背景介绍2.关键内容2.1SLAMmodule2.2Dense
论文解读 | 《忍冬桑黄发酵产黄酮类化合物的研究》桑黄研究员健康医疗人工智能
出版日期：2022年发表刊物：《中南林业科技大学》论文作者：朱姝枚桑黄（Sanghuangporus）是一种传统的药用真菌，具有显著的免疫增强和抗肿瘤功效。黄酮类化合物作为桑黄中的高含量次生代谢物，主要存在于其菌丝和子实体中，对人体健康具有重要作用。近年来，随着人们对健康的日益关注，利用食用菌作为原料提取黄酮类化合物的研究逐渐成为营养学领域的重要课题。忍冬桑黄（Sanghuangporusloni
springboot基于java的企业档案管理信息系统 QQ80213251 java spring boot 后端
收藏关注不迷路！！文末获取源码+数据库感兴趣的可以先收藏起来，还有大家在毕设选题（免费咨询指导选题），项目以及论文编写等相关问题都可以给我留言咨询，希望帮助更多的人文章目录前言详细视频演示一、项目介绍二、功能介绍三、核心代码数据库参考四、效果图五、文章目录六、源码获取前言企业档案管理信息系统是一种旨在提高文件资料归档、检索和利用效率的信息化解决方案。该系统通过电子化手段对企业的各类文档和档案进行归
python+flask计算机毕业设计基于Android平台的景区移动端旅游软件系统（程序+开题+论文） Node.js彤彤程序 python flask 课程设计
本系统（程序+源码+数据库+调试部署+开发环境）带论文文档1万字以上，文末可获取，系统界面在最后面。系统程序文件列表开题报告内容研究背景随着移动互联网技术的飞速发展，智能手机已成为人们日常生活中不可或缺的一部分，特别是在旅游领域，移动端应用以其便捷性、实时性和个性化服务的特点，极大地改变了人们的旅游体验方式。当前，旅游市场日益繁荣，游客对于旅游信息获取、行程规划、景点导航、票务预订及个性化服务的需
Marker可以快速且准确地将PDF转换为markdown格式。星霜笔记开源关注简介免费源码 pdf
MarkerMarker可以快速且准确地将PDF转换为markdown格式。支持多种文档类型（针对书籍和科学论文进行了优化）支持所有语言移除页眉/页脚/其他杂质格式化表格和代码块提取并保存图像以及markdown将大多数方程转换为latex支持在GPU、CPU或MPS上运行工作原理Marker是一个由深度学习模型组成的管道：提取文本，必要时进行OCR处理（启发式算法，surya，tesseract
CVPR 2024 | 低分辨率引领方向：通过自监督学习提升超分辨率的泛化能力小白学视觉计算机顶会顶刊论文解读计算机视觉深度学习 CVPR 计算机顶会论文解读
论文信息题目：Low-ResLeadstheWay:ImprovingGeneralizationforSuper-ResolutionbySelf-SupervisedLearning低分辨率引领方向：通过自监督学习提升超分辨率的泛化能力作者：HaoyuChen,WenboLi,JinjinGu,JingjingRen,HaozeSun,XueyiZou,ZhensongZhang,Youlia
数智读书笔记系列021《大数据医疗》：探索医疗行业的智能变革 Allen_Lyb 数智读书笔记大数据健康医疗人工智能 python
一、书籍介绍《大数据医疗》由徐曼、沈江、余海燕合著，由机械工业出版社出版。徐曼是南开大学商学院副教授，在大数据驱动的智能决策研究领域颇有建树，尤其在大数据驱动的医疗与健康决策方面有着深入研究，曾获天津优秀博士论文、教育部博士研究生新人奖。沈江等作者也在相关学术和实践领域有着丰富的经验和深厚的专业知识。这本书系统且深入地探讨了大数据技术在医疗领域的应用与变革，对推动医疗行业的智能化发展具有重要的理论
论文学习11：Boundary-Guided Camouflaged Object Detection zl29 学习目标检测人工智能
代码来源GitHub-thograce/BGNet:Boundary-GuidedCamouflagedObjectDetection模块作用BGNet利用额外的目标相关边缘语义信息来引导COD任务的特征学习，从而强制模型生成能够突出目标结构的特征。这一机制有助于提高目标边界的精准定位，从而提升伪装目标的检测性能。模块结构BGNet的架构基于Res2Net-50，编码器提取多级特征，解码器通过EA
DeepLabv3+改进18:在主干网络中添加REP_BLOCK AICurator 深度学习 python 机器学习 deeplabv3+语义分割
【DeepLabv3+改进专栏！探索语义分割新高度】你是否在为图像分割的精度与效率发愁？本专栏重磅推出：✅独家改进策略：融合注意力机制、轻量化设计与多尺度优化✅即插即用模块：ASPP+升级、解码器PS:订阅专栏提供完整代码论文简介我们提出了一种通用的卷积神经网络（ConvNet）构建模块，可在不增加推理时间成本的情况下提升性能。该模块名为多样化分支块（DBB），通过结合不同尺度和复杂度的多样化分支
【DeepSeek干货总结】对不同类型学术内容进行润色的顶级提示词汇总！ AIWritePaper官方账号 DeepSeek Prompt AIWritePaper AIWritePaper deepseek 深度学习人工智能 AIGC 论文润色
目录1.英文润色2.中文润色3.SCI润色4.润色Prompt汇总连贯性与句子逻辑提示词多参考版本提示词语法矫正提示词润色内容定位提示词修改建议提示词大家好这里是AIWritePaper官方账号！AIWritePaper官网AIWritePaper宝子们在写学术论文的过程中要想让DeepSeek发挥出最佳效能，尤其在进行文本润色时，精确和具体的提示词至关重要。很多宝子们在请求DeepSeek文本润
mysql主从数据同步林鹤霄 mysql主从数据同步
配置mysql5.5主从服务器(转) 教程开始：一、安装MySQL 说明：在两台MySQL服务器192.168.21.169和192.168.21.168上分别进行如下操作，安装MySQL 5.5.22 二、配置MySQL主服务器（192.168.21.169）mysql -uroot -p &nb
oracle学习笔记 caoyong oracle
1、ORACLE的安装 a>、ORACLE的版本 8i,9i : i是internet 10g,11g : grid (网格) 12c : cloud (云计算) b>、10g不支持win7 &
数据库，SQL零基础入门天子之骄 sql 数据库入门基本术语
数据库，SQL零基础入门做网站肯定离不开数据库，本人之前没怎么具体接触SQL，这几天起早贪黑得各种入门，恶补脑洞。一些具体的知识点，可以让小白不再迷茫的术语，拿来与大家分享。数据库，永久数据的一个或多个大型结构化集合，通常与更新和查询数据的软件相关
pom.xml 一炮送你回车库 pom.xml
1、一级元素dependencies是可以被子项目继承的 2、一级元素dependencyManagement是定义该项目群里jar包版本号的，通常和一级元素properties一起使用，既然有继承，也肯定有一级元素modules来定义子元素 3、父项目里的一级元素<modules> <module>lcas-admin-war</module> <
sql查地区省市县 3213213333332132 sql mysql
-- db_yhm_city SELECT * FROM db_yhm_city WHERE class_parent_id = 1 -- 海南 class_id = 9 港、奥、台 class_id = 33、34、35 SELECT * FROM db_yhm_city WHERE class_parent_id =169 SELECT d1.cla
关于监听器那些让人头疼的事宝剑锋梅花香画图板监听器鼠标监听器
本人初学JAVA，对于界面开发我只能说有点蛋疼，用JAVA来做界面的话确实需要一定的耐心（不使用插件，就算使用插件的话也没好多少）既然Java提供了界面开发，老师又要求做，只能硬着头皮上啦。但是监听器还真是个难懂的地方，我是上了几次课才略微搞懂了些。
JAVA的遍历MAP darkranger map
Java Map遍历方式的选择 1. 阐述　　对于Java中Map的遍历方式，很多文章都推荐使用entrySet，认为其比keySet的效率高很多。理由是：entrySet方法一次拿到所有key和value的集合；而keySet拿到的只是key的集合，针对每个key，都要去Map中额外查找一次value，从而降低了总体效率。那么实际情况如何呢？　　为了解遍历性能的真实差距，包括在遍历ke
POJ 2312 Battle City 优先多列+bfs aijuans 搜索
来源：http://poj.org/problem?id=2312 题意：题目背景就是小时候玩的坦克大战，求从起点到终点最少需要多少步。已知S和R是不能走得，E是空的，可以走，B是砖，只有打掉后才可以通过。思路：很容易看出来这是一道广搜的题目，但是因为走E和走B所需要的时间不一样，因此不能用普通的队列存点。因为对于走B来说，要先打掉砖才能通过，所以我们可以理解为走B需要两步，而走E是指需要1
Hibernate与Jpa的关系，终于弄懂 avords java Hibernate 数据库 jpa
我知道Jpa是一种规范，而Hibernate是它的一种实现。除了Hibernate，还有EclipseLink(曾经的toplink)，OpenJPA等可供选择，所以使用Jpa的一个好处是，可以更换实现而不必改动太多代码。在play中定义Model时，使用的是jpa的annotations，比如javax.persistence.Entity, Table, Column, OneToMany
酸爽的console.log bee1314 console
在前端的开发中，console.log那是开发必备啊，简直直观。通过写小函数，组合大功能。更容易测试。但是在打版本时，就要删除console.log，打完版本进入开发状态又要添加，真不够爽。重复劳动太多。所以可以做些简单地封装，方便开发和上线。 /** * log.js hufeng * The safe wrapper for `console.xxx` functions *
哈佛教授：穷人和过于忙碌的人有一个共同思维特质 bijian1013 时间管理励志人生穷人过于忙碌
一个跨学科团队今年完成了一项对资源稀缺状况下人的思维方式的研究，结论是：穷人和过于忙碌的人有一个共同思维特质，即注意力被稀缺资源过分占据，引起认知和判断力的全面下降。这项研究是心理学、行为经济学和政策研究学者协作的典范。　　这个研究源于穆来纳森对自己拖延症的憎恨。他7岁从印度移民美国，很快就如鱼得水，哈佛毕业
other operate 征客丶 OS osx
一、Mac Finder 设置排序方式，预览栏在显示－》查看显示选项中二、有时预览显示时，卡死在那，有可能是一些临时文件夹被删除了，如：/private/tmp[有待验证] -------------------------------------------------------------------- 若有其他凝问或文中有错误，请及时向我指出，我好及时改正，同时也让我们一
【Scala五】分析Spark源代码总结的Scala语法三 bit1129 scala
1. If语句作为表达式 val properties = if (jobIdToActiveJob.contains(jobId)) { jobIdToActiveJob(stage.jobId).properties } else { // this stage will be assigned to "default" po
ZooKeeper 入门 BlueSkator 中间件 zk
ZooKeeper是一个高可用的分布式数据管理与系统协调框架。基于对Paxos算法的实现，使该框架保证了分布式环境中数据的强一致性，也正是基于这样的特性，使得ZooKeeper解决很多分布式问题。网上对ZK的应用场景也有不少介绍，本文将结合作者身边的项目例子，系统地对ZK的应用场景进行一个分门归类的介绍。值得注意的是，ZK并非天生就是为这些应用场景设计的，都是后来众多开发者根据其框架的特性，利
MySQL取得当前时间的函数是什么格式化日期的函数是什么 BreakingBad mysql Date
取得当前时间用 now() 就行。在数据库中格式化时间用DATE_FORMA T(date, format) . 根据格式串format 格式化日期或日期和时间值date，返回结果串。可用DATE_FORMAT( ) 来格式化DATE 或DATETIME 值，以便得到所希望的格式。根据format字符串格式化date值: %S, %s 两位数字形式的秒（ 00,01,
读《研磨设计模式》-代码笔记-组合模式 bylijinnan java 设计模式
声明：本文只为方便我个人查阅和理解，详细的分析以及源代码请移步原作者的博客http://chjavach.iteye.com/ import java.util.ArrayList; import java.util.List; abstract class Component { public abstract void printStruct(Str
4_JAVA+Oracle面试题(有答案) chenke oracle
基础测试题卷面上不能出现任何的涂写文字，所有的答案要求写在答题纸上，考卷不得带走。选择题 1、 What will happen when you attempt to compile and run the following code? （3） public class Static { static { int x = 5; // 在static内有效 } st
新一代工作流系统设计目标 comsci 工作算法脚本
用户只需要给工作流系统制定若干个需求，流程系统根据需求，并结合事先输入的组织机构和权限结构，调用若干算法，在流程展示版面上面显示出系统自动生成的流程图，然后由用户根据实际情况对该流程图进行微调，直到满意为止，流程在运行过程中，系统和用户可以根据情况对流程进行实时的调整，包括拓扑结构的调整，权限的调整，内置脚本的调整。。。。。在这个设计中，最难的地方是系统根据什么来生成流
oracle 行链接与行迁移 daizj oracle 行迁移
表里的一行对于一个数据块太大的情况有二种(一行在一个数据块里放不下) 第一种情况: INSERT的时候，INSERT时候行的大小就超一个块的大小。Oracle把这行的数据存储在一连串的数据块里(Oracle Stores the data for the row in a chain of data blocks)，这种情况称为行链接(Row Chain)，一般不可避免(除非使用更大的数据
[JShop]开源电子商务系统jshop的系统缓存实现 dinguangx jshop 电子商务
前言 jeeshop中通过SystemManager管理了大量的缓存数据，来提升系统的性能，但这些缓存数据全部都是存放于内存中的，无法满足特定场景的数据更新（如集群环境）。JShop对jeeshop的缓存机制进行了扩展，提供CacheProvider来辅助SystemManager管理这些缓存数据，通过CacheProvider,可以把缓存存放在内存,ehcache,redis，memcache
初三全学年难记忆单词 dcj3sjt126com english word
several 儿子；若干 shelf 架子 knowledge 知识；学问 librarian 图书管理员 abroad 到国外，在国外 surf 冲浪 wave 浪；波浪 twice 两次；两倍 describe 描写；叙述 especially 特别；尤其 attract 吸引 prize 奖品；奖赏 competition 比赛；竞争 event 大事；事件 O
sphinx实践 dcj3sjt126com sphinx
安装参考地址:http://briansnelson.com/How_to_install_Sphinx_on_Centos_Server yum install sphinx 如果失败的话使用下面的方式安装 wget http://sphinxsearch.com/files/sphinx-2.2.9-1.rhel6.x86_64.rpm yum loca
JPA之JPQL（三） frank1234 orm jpa JPQL
1 什么是JPQL JPQL是Java Persistence Query Language的简称，可以看成是JPA中的HQL， JPQL支持各种复杂查询。 2 检索单个对象 @Test public void querySingleObject1() { Query query = em.createQuery("sele
Remove Duplicates from Sorted Array II hcx2013 remove
Follow up for "Remove Duplicates":What if duplicates are allowed at most twice? For example,Given sorted array nums = [1,1,1,2,2,3], Your function should return length
Spring4新特性——Groovy Bean定义DSL jinnianshilongnian spring 4
Spring4新特性——泛型限定式依赖注入 Spring4新特性——核心容器的其他改进 Spring4新特性——Web开发的增强 Spring4新特性——集成Bean Validation 1.1(JSR-349)到SpringMVC Spring4新特性——Groovy Bean定义DSL Spring4新特性——更好的Java泛型操作API Spring4新
CentOS安装Mysql5.5 liuxingguome centos
CentOS下以RPM方式安装MySQL5.5 首先卸载系统自带Mysql： yum remove mysql mysql-server mysql-libs compat-mysql51 rm -rf /var/lib/mysql rm /etc/my.cnf 查看是否还有mysql软件： rpm -qa|grep mysql 去http://dev.mysql.c
第14章工具函数（下） onestopweb 函数
index.html <!DOCTYPE html PUBLIC "-//W3C//DTD XHTML 1.0 Transitional//EN" "http://www.w3.org/TR/xhtml1/DTD/xhtml1-transitional.dtd"> <html xmlns="http://www.w3.org/
POJ 1050 SaraWon 二维数组子矩阵最大和
POJ ACM第1050题的详细描述，请参照 http://acm.pku.edu.cn/JudgeOnline/problem?id=1050 题目意思：给定包含有正负整型的二维数组，找出所有子矩阵的和的最大值。如二维数组 0 -2 -7 0 9 2 -6 2 -4 1 -4 1 -1 8 0 -2 中和最大的子矩阵是 9 2 -4 1 -1 8 且最大和是15
Java8全新打造，英语学习supertool yangshangchuan java superword 闭包 java8 函数式编程
superword是一个Java实现的英文单词分析软件，主要研究英语单词音近形似转化规律、前缀后缀规律、词之间的相似性规律等等。Clean code、Fluent style、Java8 feature: Lambdas, Streams and Functional-style Programming。升学考试、工作求职、充电提高，都少不了英语的身影，英语对我们来说实在太重要