qq_42470633

ACL2023：Enhancing Document-level Event Argument Extraction with Contextual Clues and Role Relevance

1. 简介

论文题目：Enhancing Document-level Event Argument Extraction with Contextual Clues and Role Relevance
论文来源：ACL2023 Findings
论文链接：https://aclanthology.org/2023.findings-acl.817
代码链接：https://github.com/LWL-cpu/SCPRG-master

1.1 Motivation

大多数先前的工作都侧重于捕捉每个事件中候选论点与事件触发器之间的关系，忽略了两个关键点：1）非参数上下文线索信息；2）论证参数之间的相关性。

1）非参数上下文线索信息

非参数线索是除目标参数外的上下文文本，可以为预测许多复杂的参数角色提供重要的指导信息。例如，在图1中，对于*“冲突和袭击”事件，非参数线索“被引爆”、“索赔责任”和“恐怖袭击”*可以为识别参数爆炸带和伊斯兰国提供重要的线索信息。同样，对于暴力词汇死亡事件和审判，弗雷迪·格雷和小凯撒·古德森警官分别为预测受害者和凶手的角色提供了重要的指导信息。
然而，以前的许多工作只使用预先训练的基于转换器的编码器来隐式地获取全局上下文信息，而忽略了对于事件中出现的不同自变量，他们应该关注与实体甚至目标高度相关的上下文信息。因此
在本文中，我们设计了一个STCP模块，该模块基于预先训练的模型中的上下文注意力乘积，将每个自变量触发对的非自变量线索的信息合并，用额外的相关上下文信息增强候选自变量的表示。

2）参数角色之间的相关性

一些参数角色具有密切的语义相关性，这有利于参数的提取。例如，在图1中，角色伤害者和\textit{受害者之间存在密切的语义相关性，这可以为这两个角色在目标事件冲突和攻击中的参数提取提供重要的信息指导。此外，许多角色共同出现在多个事件中，这可能具有密切的语义相关性。具体而言，我们统计并可视化了RAMS数据集中15个最常见角色之间的共现频率，如图2所示。例如，角色attender、target 经常同时出现，这表明它们在语义上比其他角色更相关。在本文中，我们提出了一个基于角色的RLIG模块，该模块由角色交互编码和角色信息融合组成。具体来说，我们设计了一个角色交互编码器，将角色添加到输入序列中，其中角色嵌入不仅可以学习角色的潜在语义信息，还可以捕捉角色之间的语义相关性。然后，通过池化和串联操作将潜在的角色嵌入合并到候选参数中，为文档级EAE提供信息指导。

1.2 Contriburion

我们提出了一个基于跨度触发的上下文池模块，该模块自适应地选择和聚合非自变量线索的信息，用相关的上下文信息增强候选自变量的表示。
我们提出了一个基于角色的潜在信息引导模块，该模块提供了包含角色之间语义相关性的潜在角色信息引导。
扩展实验表明SCPRG的性能优于以前的在公共RAMS和WikiEvents数据集上进行了1.13 F1和2.64 F1改进。我们进一步分析了注意力权重和潜在角色表征，这表明了我们模型的可解释性。

2. 方法

SCPRG的主要架构如图3所示。带有角色的输入序列被馈送到角色交互编码器中，上下文表示、角色表示和注意力头作为输出。STCP基于触发器和自变量之间的注意力乘积，将非自变量上下文线索自适应地融合到上下文向量中。RLIG通过角色交互编码构建潜在角色嵌入，并通过池化操作将其融合为潜在角色向量。上下文向量和潜在角色向量被合并到最终跨度表示和分类模块中预测所有候选跨度的参数角色。

3. 实验

3.1 数据集

我们在两个大型公共文件级别上对所提出的模型进行了评估，RAMSv1.0和WikiEvents数据集。其详细数据统计如表1所示。我们报告了RAMS数据集的开发和测试集上的 Span F1和 Head F1。Span
F1要求预测的自变量跨度完全匹配金色的，而Head F1仅根据头部单词\脚注进行评估跨度的头部单词被定义为弧距最小的单词到依赖关系树的根。此外，对于WikiEvents数据集，我们分别报告了自变量识别任务（Arg-IF）和自变量分类任务（Arg-CF）的Head F1和Coref F1在测试集上的得分。Coref F1评估提取的自变量和黄金自变量之间的共引用，并且如果提取的自变量与黄金自变量共引用，则该模型实现Coref F1。

3.2 基线模型选择

我们比较了不同类别的文档级EAE模型，这些模型主要由基于标记的方法组成，如BERT-CRF、BERT-CRF-TCD，以及其他基于生成的方法，如FEAE、BERT-QA和 BART Gen、TSAR 、EAE。此外，我们使用BERT-base和BERT-large作为预训练的基于转换器的编码器。

3.3 基本实验结果

表2显示了RAMS数据集中dev和测试集的实验结果。与以前的基于标记和基于跨度的方法（如BERT-CRF和Two Step）相比，我们的SCPRG配备了BERTbase，在开发/测试集上产生了+8.46/+9.64～+6.36/+7.14的Span F1和+7.68/+9.00～+5.38/+6.40的Head F1的改进，表明我们的SCPR G框架在排除不可能的候选跨度和解决数据分布不平衡问题方面具有优势。值得注意的是，配备RoBERTalarge的SCPRG也优于以前最先进的模型。BART-Genlarge（试验台上为+3.68/+2.34Span/Head F1）和TSALarge（+1.14/+1.13Span/Head F1.）。这些结果证明了我们的模型优越的提取能力，得益于上下文线索信息和具有语义相关性的潜在角色表示的效果。此外，我们在WikiEvents上进一步验证了我们的SCPRG，并在具有基本和大型预训练模型的任务中实现了最先进的性能，如表3所示。我们的SCPRG优于以前的竞争方法，如TSAR和EA2E。与TSALarge相比，我们的SCPRG在测试集上的参数识别方面提高了+0.64/+0.58 Head/Coref F1，在参数分类方面提高了+1.22/+1.29 Head-Coref F1。此外，SCPRG在自变量识别方面也优于最近的基于竞争生成的方法EA2Elarge
（+2.64/+0.33 Head/Coref F1）和参数分类（+2.31/+0.38 Head/Coreff F1）任务。这些实验改进证明了我们的框架与论点事件特定的上下文信息相融合的巨大优势，以及潜在角色信息的有用指导。

3.4 消融实验

为了更好地说明我们组件的功能，我们对RAMS数据集进行了消融研究，如表4所示。我们还提供消融研究表5中的WikiEvents数据集上的结果。首先，当我们删除基于跨度触发的上下文池（STCP）模块时，SCPRGbase/SCPRGlasge的跨度F1和头部F1在测试集中的得分分别下降了1.61/1.43和1.42/2.09，这表明我们的STCP在捕捉对于文档级EAE至关重要的非参数上下文的线索信息。此外，在删除基于角色的潜在信息制导（RLIG）模块5，SCPRGbase/SCPRGlasge在RAMS测试台上的性能急剧下降1.03/1.04跨F1和1.58/1.2头F1。这表明，我们的RLIG模块通过包含角色之间语义相关性的有意义的潜在角色表示来有效地指导论点提取。当移除STCP和RLIG模块时，性能衰减超过移除单个模块时的衰减，这说明我们的两个模块可以协同工作以提高性能。此外，当移除参数不可能跨度排除（ASE）操作时，SCPRGbase和SCPRGlarge都具有性能衰减，这表明排除参数不可能候选跨度消除了噪声信息，并有助于参数提取。焦点丢失有助于平衡正样本和负样本的表示，有助于模型在训练过程中的平滑收敛。但是，这并不能提高模型的性能。

3.5 分析

1）对上下文注意力权重的分析

为了评估STCP在为候选论点捕获有用的上下文信息方面的有效性，我们将上下文权重可视化。如图5所示，我们的STCP对攻击、责任和恐怖袭击，其中最相关的是跨度触发器对（伊斯兰国，受伤）。有趣的是，我们的STCP也给予了相对较高的关注与其他论点中的单词（如爆炸性的、数十个和喀布尔）相比，这意味着这些论点单词为伊斯兰国的角色预测。可视化表明，我们的STCP不仅可以捕获相关的非论证线索信息对候选跨度进行建模，但对事件中相关参数之间的信息交互进行建模。此外，我们还探讨了一个事件中基于不同跨度触发对的注意力权重。在图4中，我们在一个事件中随机选择30个候选跨度，并根据他们的注意力与上下文有关。热图显示，不同的候选自变量关注不同的上下文信息，表明我们的STCP可以根据候选自变量跨度自适应地选择上下文信息。

2）对上下文注意力权重的分析

为了验证我们的模型能够捕捉角色之间的语义相关性，我们可视化了两个潜在角色表示之间的余弦相似性。图6中RAMS数据集中的事件。如图所示，角色来源和目的地、攻击者和目标具有相似的表示，这是一致的。通过它们的语义，证明我们的模型可以捕捉角色之间的语义相关性。此外，为了验证角色表征的有益指导，我们展示了属于两个不同角色的论点的t-SNE（van der Maaten和Hinton，2008）可视化，这两个不同的角色同时出现在5个不同的文档中，以及相应的潜在角色嵌入。如图7a所示，属于不同文档中的角色由于其不同的目标事件和上下文而分散在整个嵌入空间中。值得注意的是，融合了潜在的角色嵌入，在图7b中，属于受害者或地点的论点的表示更为相邻，这说明我们的RLIG提供了有效的社会潜角色信息引导。

3.6 参数量和复杂性分析

SCPRG是文档级EAE的一个简单但有效的框架，其中STCP和RLIG引入的参数很少。具体而言，STCP利用了来自预训练编码器的学习良好的注意力头，并进行乘法和归一化运算，如表4所示，这只引入了约0.28%的新参数。我们的RLIG在角色嵌入层6和特征融合中只引入了约0.3%的新参数层这使得我们的模型的参数量近似于基于变换器的编码器加上MLP分类器。

4. 局限性

尽管我们的实验证明了我们的SCPRG模型的优越性，但它仅适用于具有已知事件触发器的文档级EAE任务，因为STCP和RLIG都计算触发器和候选跨度的注意力乘积。然而，在现实场景中，事件触发器并不总是可用的。针对这个问题，我们有了初步的解决方案，并计划在下一步工作中改进我们的模型。我们方法的核心思想是基于候选论点和目标事件来选择和集成上下文和角色信息。基于这一思想，我们简要地为上述限制提供了两种解决方案。首先，我们可以使模型预测最佳候选触发词。其次，我们可以用特殊的事件标记替换触发词。在接下来的工作中，我们计划将我们的模型扩展到没有触发词的文档级EAE任务，并通过广泛的实验对其进行评估。

5. 结论

在本文中，我们提出了一种新的用于文档级EAE的SCPRG框架，该框架主要由两个紧凑、有效且可移植的模块组成。具体来说，我们的STCP自适应地聚合了非论证线索词的信息，RLIG提供了潜在的作用包含角色之间语义相关性的信息指导。实验结果表明，SCPRG的性能优于现有最先进的EAE模型和进一步的分析表明，我们的方法有效且可解释。对于在未来的工作中，我们希望将SCPRG应用于更多的信息提取任务，例如作为关系提取和多语言提取，其中上下文信息起着重要作用。

语言的钥匙：提示工程的艺术与驾驭AI的智慧田园Coder 人工智能科普人工智能科普
当大型语言模型（LLM）如GPT-4展现出令人惊叹的通用能力，却又伴随着“幻觉”、“黑箱”和“不可控”等阴影时，一个核心问题变得无比迫切：人类如何有效地与这些庞然大物沟通，引导它们可靠、安全、精准地完成任务？答案并非在于重新训练这头计算巨兽（成本高昂且周期漫长），而在于掌握一门新兴的关键技艺——提示工程（PromptEngineering）。提示工程，简而言之，就是精心设计输入给模型的自然语言指令
探索生成式 AI Agent：12类，40+个AI Agent实例应用场景的宝藏库和老莫一起学AI 人工智能产品经理职场和发展面试自然语言处理 ai 大模型
在人工智能的璀璨星空中，生成式AI智能体（GenAIAgents）无疑是最耀眼的星辰之一，正以前所未有的速度改变着我们与技术互动的方式。今天，我将分享GitHub上一个宝藏级的项目——“NirDiamant/GenAI_Agents”，这里汇聚了从基础到高级的各种GenAI智能体技术教程与实现案例，堪称一座智能体开发的知识宝库。1.适合初学者的智能体简单会话智能体概览通过集成语言模型、提示模板和历
VSCode-Copilot的系统提示词 youngqqcn AI vscode copilot ide
title:VSCode-Copilot系统提示词date:2025-07-0211:05categories:技术tags:AI人工智能LLM大语言模型提示词Microsoft开源了VSCodeCopilotChat,以下是其系统提示词的摘录。https://github.com/microsoft/vscode-copilot-chat/blob/main/src/extension/prom
ReBEL模型的本地部署与运行，用于三元组抽取任务（事件抽取、知识抽取）
1.服务器CUDA11.72.依赖condacreate-nrebel_envpython=3.10-ycondaactivaterebel_env#安装PyTorch（建议与CUDA11.7配合）pipinstalltorchtorchvisiontorchaudio--index-urlhttps://download.pytorch.org/whl/cu117#安装Transformers和
pytorch官方文档60分钟入门笔记 xiaodidadada 机器学习
文章目录1.张量（Tensors）定义张量张量操作2.自动求导（autograd）变量Variable3.神经网络4.训练一个分类器载入数据5.数据并行day63参考：官方文档https://blog.csdn.net/u014630987/article/details/786690511.张量（Tensors）tensors和numpy的ndarray类似,但是tensors可以使用GPU加快
微调 || RAG，项目落地怎么选？LLM应用选型指南，适用场景全解析认知超载 AI 人工智能
基本定义微调：是指利用更小、更具针对性的数据集对经过预先训练的大语言模型进一步训练的过程。在这个过程中，模型基于新数据集修改权重和参数，学习特定于任务的模式，同时保留来自最初预训练模型的知识。RAG：即检索增强生成，是将检索大量外部知识的过程与文本生成结合在一起的一种方法。它会从大型外部数据库中检索与输入问题相关的信息，将这些信息作为上下文提供给大语言模型，辅助其生成回答。微调适用场景1.特定领域
百度颠覆了自己，飞算JavaAI造福了中国程序员！飞算JavaAI开发助手百度
在当今这个科技日新月异的时代，企业纷纷寻求技术突破，以期在激烈的市场竞争中脱颖而出。百度，作为中国互联网行业的领军企业之一，凭借其强大的科技实力和创新能力，在人工智能等多个领域取得了显著成就，并正在逐步颠覆自身的传统形象。百度自成立之初，就将技术创新视为企业的生命线。从最初的搜索引擎技术，到如今的深度学习、自然语言处理、计算机视觉等前沿领域，百度始终走在技术革新的前沿。其自主研发的飞桨深度学习平台
【深度学习:进阶篇】--4.2.词嵌入和NLP 西柚小萌新吖(●ˇ∀ˇ●) #深度学习深度学习自然语言处理人工智能
在RNN中词使用one_hot表示的问题假设有10000个词每个词的向量长度都为10000，整体大小太大没能表示出词与词之间的关系例如Apple与Orange会更近一些，Man与Woman会近一些，取任意两个向量计算内积都为0目录1.词嵌入1.1.特点1.3.word2vec介绍1.3.Word2Vec案例1.3.1.训练语料1.3.2.步骤1.3.3.代码2.测试代码1.词嵌入定义：指把一个维数
【深度学习】卷积神经网络(CNN)原理 chaser&upper 深度学习神经网络卷积计算机视觉
【深度学习】卷积神经网络原理1.卷积神经网络的组成2.卷积层2.1卷积运算过程3.padding-零填充3.1ValidandSame卷积3.2奇数维度的过滤器4.stride-步长5.多通道卷积5.1多卷积核（多个Filter）6.卷积总结7.池化层(Pooling)8.全连接层9.总结1.卷积神经网络的组成定义卷积神经网络由一个或多个卷积层、池化层以及全连接层等组成。与其他深度学习结构相比，卷
深度学习学习经验——卷积神经网络（CNN） Linductor 深度学习学习经验深度学习学习 cnn
卷积神经网络卷积神经网络（CNN）1.卷积神经网络的基本组成2.卷积操作3.激活函数（ReLU）4.池化操作5.全连接层6.卷积神经网络的完整实现项目示例项目目标1.加载数据2.卷积层：图像的特征探测器2.1第一个卷积层3.激活函数：增加非线性4.池化层：信息压缩器5.多层卷积和池化：逐层提取更高层次的特征6.全连接层：分类器7.模型训练和测试完整的项目示例代码总结卷积神经网络（CNN）卷积神经网
Python Day53 别勉. python机器学习 python 开发语言
Task：1.对抗生成网络的思想：关注损失从何而来2.生成器、判别器3.nn.sequential容器：适合于按顺序运算的情况，简化前向传播写法4.leakyReLU介绍：避免relu的神经元失活现象1.对抗生成网络的思想：关注损失从何而来这是理解GANs的关键！传统的神经网络训练中，我们通常会直接定义一个损失函数（如均方误差MSE、交叉熵CE），然后通过反向传播来优化这个损失。这个损失的“来源”
零基础起步：基于GpuGeek的文本生成模型实战昊昊该干饭了人工智能 nlp 深度学习 gpu算力 gru
在自然语言处理（NLP）领域，文本生成任务广泛应用于问答系统、智能摘要、内容创作等方向。本文将带领读者使用GpuGeek平台，从注册、上传数据到实例部署与训练，完整构建一个基于GPT2模型的文本生成系统，实战掌握AI模型的云端开发流程。目录一、GpuGeek平台使用流程详解1.注册与登录2.数据上传3.创建训练实例4.启动与使用实例5.关闭实例（手动&自动）二、文本生成实战任务：微调GPT-21.
大模型智能运维详解：技术架构、落地挑战与行业实践 FreeTools FreeAiGuard 运维架构人工智能运维开发科技
大模型智能运维详解：技术架构、落地挑战与行业实践作者：开源大模型智能运维FreeAiOps在数字化转型加速的背景下，企业IT系统复杂度呈指数级增长，传统运维模式面临效率低下、故障定位困难、成本高昂等瓶颈。大模型技术的出现为智能运维提供了突破性解决方案，其通过自然语言处理、多模态数据分析与自动化决策能力，正在重塑运维工作的底层逻辑。本文将从技术原理、落地挑战、行业实践三个维度，系统解析大模型智能运维
大模型-FlashAttention 算法分析清风lsq 大模型推理算法算法大模型推理 LLM flashattention
一、FlashAttention的概述FlashAttention是一种IO感知精确注意力算法。通过感知显存读取/写入，FlashAttention的运行速度比PyTorch标准Attention快了2-4倍，所需内存也仅是其5%-20%。随着Transformer变得越来越大、越来越深，但它在长序列上仍然处理的很慢、且耗费内存。（自注意力时间和显存复杂度与序列长度成二次方），现有近似注意力方法，
LangChain4j在Java企业应用中的实战指南-2 在未来等你大模型应用开发 AI 技术编程 Java Spring
LangChain4j在Java企业应用中的实战指南文章标签langchain4j,JavaAI,RAG系统,智能应用开发,LangChain4j实战,企业级AI应用,Java微服务,检索增强生成文章简述随着大语言模型（LLM）的广泛应用，企业对智能应用的需求日益增长。LangChain4j作为一款专为Java生态打造的LLM集成框架，正在成为构建RAG（检索增强生成）系统和智能应用的重要工具。本
深度学习之分类手写数字的网络 newyork major 卷积神经网络CNN 深度学习人工智能
面临的问题定义神经⽹络后，我们回到⼿写识别上来。我们可以把识别⼿写数字问题分成两个⼦问题：把包含许多数字的图像分成⼀系列单独的图像，每个包含单个数字；也就是把图像，分成6个单独的图像分类单独的数字我们将专注于编程解决第⼆个问题，分类单独的数字。这样是因为，⼀旦你有分类单独数字的有效⽅法，分割问题是不难解决的。⼀种⽅法是尝试不同的分割⽅式，⽤数字分类器对每⼀个切分⽚段打分；如果数字分类器对每⼀个⽚段
LangChain4j在Java企业应用中的实战指南-3 在未来等你大模型应用开发 AI 技术编程 Java Spring
【LangChain4j在Java企业应用中的实战指南】文章标签langchain4j,JavaAI,RAG系统,智能应用开发,LangChain4j实战,企业级AI应用,Java微服务,检索增强生成文章简述随着大语言模型（LLM）的广泛应用，企业对智能应用的需求日益增长。LangChain4j作为一款专为Java生态打造的LLM集成框架，正在成为构建RAG（检索增强生成）系统和智能应用的重要工具
推荐文章：探索深度学习的不确定性边界 —— SDE-Net 开源项目解析史多苹Thomas
推荐文章：探索深度学习的不确定性边界——SDE-Net开源项目解析SDE-NetCodeforpaper:SDE-Net:EquippingDeepNeuralnetworkwithUncertaintyEstimates项目地址:https://gitcode.com/gh_mirrors/sd/SDE-Net在当今的人工智能领域，深度神经网络(DNN)已经成为推动技术创新的基石。然而，其预测的
【Java】已解决java.sql.SQLRecoverableException异常屿小夏 java 开发语言
个人简介：某不知名博主，致力于全栈领域的优质博客分享|用最优质的内容带来最舒适的阅读体验！文末获取免费IT学习资料！文末获取更多信息精彩专栏推荐订阅收藏专栏系列直达链接相关介绍书籍分享点我跳转书籍作为获取知识的重要途径，对于IT从业者来说更是不可或缺的资源。不定期更新IT图书，并在评论区抽取随机粉丝，书籍免费包邮到家AI前沿点我跳转探讨人工智能技术领域的最新发展和创新，涵盖机器学习、深度学习、自然
深度学习流体力学【干货】人工智能交叉前沿技术，人工智能深度学习 python 机器学习
深度学习作为一种新兴的机器学习技术，为流体科学的研究提供了新的思路和方法。通过对大量数据的学习和分析，深度学习模型可以自动提取特征和模式，为流体科学中的复杂问题提供解决方案。然而，深度学习在流体科学中的应用还面临一些挑战，需要进一步研究和探索。未来，深度学习与传统流体力学方法的结合将成为流体科学研究的重要方向，多模态数据的融合、模型的可解释性、实时预测和控制等将是深度学习在流体科学中发展的重点。相
机器学习中为什么要用混合精度训练十子木机器学习机器学习人工智能
目录FP16与显存占用关系机器学习中一般使用混合精度训练：FP16计算+FP32存储关键变量。FP16与显存占用关系显存（VideoRAM，简称VRAM）是显卡（GPU）专用的内存。FP32（单精度浮点）：传统深度学习默认使用32位浮点数每个参数占用`4字节`例如：1亿参数的模型→约400MB显存FP16（半精度浮点）：每个参数占用`2字节`（直接减半）相同模型→约200MB显存双精度浮点（FP6
【大模型学习 | BLIP2原理】九年义务漏网鲨鱼人工智能深度学习语言模型多模态大模型
BLIP-2:BootstrappingLanguage-ImagePre-trainingwithFrozenImageEncodersandLargeLanguageModels目前（2023）的图文模型都是基于端到端训练方式，大规模的模型和数据集导致了在预训练过程需要的大量计算。作者提出一种从离线、梯度冻结的图像、语言模型中提升图文的预训练模型。为了联系两个不同模态预训练模型，作者提出一种使
大模型学习（Datawhale_Happy-LLM）笔记7: Encoder-Decoder PLM lxltom 学习笔记 language model 自然语言处理神经网络人工智能深度学习
大模型学习（Datawhale_Happy-LLM）笔记7:Encoder-DecoderPLM1.Encoder-Decoder架构概述1.1架构基础Encoder-DecoderPLM是基于原始Transformer架构的完整实现，它同时保留了编码器（Encoder）和解码器（Decoder）两个核心组件。这种设计使得模型能够兼具文本理解和生成的双重能力，特别适合处理序列到序列（Seq2Seq
[AI笔记]-LLM中的3种架构:Encoder-Only、Decoder-Only、Encoder-Decoder Micheal超 AI笔记人工智能笔记架构
一、概述架构描述特点案例Encoder-Only仅包含编码器部分这类模型主要专注输入数据中提取特征或上下文信息，通常不需要生成新内容、只需要理解输入的任务，如：分类(文本分类、情感分析等)、信息抽取、序列标注等。在这种架构中，所有的注意力机制和网络层都集中在编码输入数据上，其输出通常是关于输入的复杂语义表示。谷歌的BERT、智谱AI发布的第四代基座大语言模型GLM4Decoder-Only也被称为
成像光谱遥感技术中的AI革命：ChatGPT在遥感领域中的应用科研的力量人工智能 ChatGPT chatgpt 人工智能
课程将最新的人工智能技术与实际的遥感应用相结合，提供不仅是理论上的，而且是适用和可靠的工具和方法。无论你是经验丰富的研究人员还是好奇的从业者，本课程都将为分析和解释遥感数据开辟新的、有效的方法，使你的工作更具影响力和前沿性。遥感技术主要通过卫星和飞机从远处观察和测量我们的环境，是理解和监测地球物理、化学和生物系统的基石。ChatGPT是由OpenAI开发的最先进的语言模型，在理解和生成人类语言方面
为 Agentic AI 的黎明构建地基人工智能
在技术领域，我们常常被那些闪耀的、可见的成果所吸引。今天，这个焦点无疑是大语言模型技术。它们的流畅对话、惊人的创造力，让我们得以一窥未来的轮廓。然而，作为在企业一线构建、部署和维护复杂系统的实践者，我们深知，一个卓越的模型，本身并不能构成一个成功的企业级解决方案。它就像一座精心设计的摩天大楼的塔尖，倘若没有深植于地下的坚实地基，再璀璨的光芒也终将是昙花一现。真正的挑战，也是真正的价值所在，在于构建
Prompt Engineering 指南教程班磊闯Andrea
PromptEngineering指南教程Prompt-Engineering-Guidedair-ai/Prompt-Engineering-Guide:是一个用于指导对话人工智能开发的文档。适合用于学习对话人工智能开发和自然语言处理。特点是提供了详细的指南和参考资料，涵盖了多种对话人工智能技术和算法，并且可以自定义学习路径和行为。项目地址:https://gitcode.com/gh_mirr
电子词典开源项目源代码完全解析
本文还有配套的精品资源，点击获取简介：电子词典作为数字化学习工具，已由传统硬件发展为可定制的开源软件应用。本源代码提供深入理解其工作机制的机会，包括用户界面设计、词典数据库、查询引擎、翻译算法等。源代码通常由主流编程语言编写，涉及到数据结构与算法、UI设计、数据库管理、自然语言处理、本地化与多语言支持、版本控制、软件工程、API接口以及开源社区的协作和交流。1.电子词典工作原理和定制功能电子词典工
提示技术系列——主动提示 AIGC包拥它提示技术人工智能 prompt python langchain
什么是提示技术？提示技术是实现提示工程目标的具体技术手段，是提示工程中的“工具库”。什么又是提示工程？提示工程是指通过设计、优化和迭代输入到大语言模型（LLM）的提示（Prompt），系统性提升模型输出质量（如相关性、准确性、可控性）的实践领域。它是一个覆盖全流程的方法论，包括：明确目标任务（如生成教学内容、问答、翻译）；设计提示结构（如指令、上下文、示例）；选择模型与参数（如温度、top_p）；
SOTA是什么意思？有奇妙能力吗 AI 知识分享自然语言处理人工智能 ai
最近看到一篇关于Transformer模型的论文，谷歌推出的BERT模型在11项NLP（naturallanguageprocessing）任务中夺得SOTA结果，引爆了整个NLP界。而Transformer是BERT取得成功的一个关键因素。谷歌的Transformer模型最早用于机器翻译任务，当时达到了SOTA效果。那么文中的SOTA效果，SOTA结果是什么意思呢?这里就来简单介绍一下定义：SO
java杨辉三角 3213213333332132 java基础
package com.algorithm; /** * @Description 杨辉三角 * @author FuJianyong * 2015-1-22上午10:10:59 */ public class YangHui { public static void main(String[] args) { //初始化二维数组长度 int[][] y
《大话重构》之大布局的辛酸历史白糖_ 重构
《大话重构》中提到“大布局你伤不起”，如果企图重构一个陈旧的大型系统是有非常大的风险，重构不是想象中那么简单。我目前所在公司正好对产品做了一次“大布局重构”，下面我就分享这个“大布局”项目经验给大家。背景公司专注于企业级管理产品软件，企业有大中小之分，在2000年初公司用JSP/Servlet开发了一套针对中
电驴链接在线视频播放源码 dubinwei 源码电驴播放器视频 ed2k
本项目是个搜索电驴（ed2k）链接的应用,借助于磁力视频播放器（官网： http://loveandroid.duapp.com/ 开放平台），可以实现在线播放视频，也可以用迅雷或者其他下载工具下载。项目源码： http://git.oschina.net/svo/Emule,动态更新。也可从附件中下载。项目源码依赖于两个库项目，库项目一链接： http://git.oschina.
Javascript中函数的toString()方法周凡杨 JavaScript js toString function object
简述 The toString() method returns a string representing the source code of the function. 简译之，Javascript的toString()方法返回一个代表函数源代码的字符串。句法 function.
struts处理自定义异常 g21121 struts
很多时候我们会用到自定义异常来表示特定的错误情况，自定义异常比较简单，只要分清是运行时异常还是非运行时异常即可，运行时异常不需要捕获，继承自RuntimeException，是由容器自己抛出，例如空指针异常。非运行时异常继承自Exception，在抛出后需要捕获，例如文件未找到异常。此处我们用的是非运行时异常，首先定义一个异常LoginException: /** * 类描述：登录相
Linux中find常见用法示例 510888780 linux
Linux中find常见用法示例 ·find path -option [ -print ] [ -exec -ok command ] {} \; find命令的参数；
SpringMVC的各种参数绑定方式 Harry642 springMVC 绑定表单
1. 基本数据类型(以int为例，其他类似)： Controller代码： @RequestMapping("saysth.do") public void test(int count) { } 表单代码： <form action="saysth.do" method="post&q
Java 获取Oracle ROWID aijuans java oracle
A ROWID is an identification tag unique for each row of an Oracle Database table. The ROWID can be thought of as a virtual column, containing the ID for each row. The oracle.sql.ROWID class i
java获取方法的参数名 antlove java jdk parameter method reflect
reflect.ClassInformationUtil.java package reflect; import javassist.ClassPool; import javassist.CtClass; import javassist.CtMethod; import javassist.Modifier; import javassist.bytecode.CodeAtt
JAVA正则表达式匹配查找替换提取操作百合不是茶 java 正则表达式替换提取查找
正则表达式的查找;主要是用到String类中的split(); String str; str.split();方法中传入按照什么规则截取,返回一个String数组常见的截取规则: str.split("\\.")按照.来截取 str.
Java中equals()与hashCode()方法详解 bijian1013 java set equals()hashCode()
一.equals()方法详解 equals()方法在object类中定义如下： public boolean equals(Object obj) { return (this == obj); } 很明显是对两个对象的地址值进行的比较（即比较引用是否相同）。但是我们知道，String 、Math、I
精通Oracle10编程SQL(4)使用SQL语句 bijian1013 oracle 数据库 plsql
--工资级别表 create table SALGRADE ( GRADE NUMBER(10), LOSAL NUMBER(10,2), HISAL NUMBER(10,2) ) insert into SALGRADE values(1,0,100); insert into SALGRADE values(2,100,200); inser
【Nginx二】Nginx作为静态文件HTTP服务器 bit1129 HTTP服务器
Nginx作为静态文件HTTP服务器在本地系统中创建/data/www目录，存放html文件(包括index.html) 创建/data/images目录，存放imags图片在主配置文件中添加http指令 http { server { listen 80; server_name
kafka获得最新partition offset blackproof kafka partition offset 最新
kafka获得partition下标，需要用到kafka的simpleconsumer import java.util.ArrayList; import java.util.Collections; import java.util.Date; import java.util.HashMap; import java.util.List; import java.
centos 7安装docker两种方式 ronin47
第一种是采用yum 方式 yum install -y docker
java-60-在O(1)时间删除链表结点 bylijinnan java
public class DeleteNode_O1_Time { /** * Q 60 在O(1)时间删除链表结点 * 给定链表的头指针和一个结点指针(!!)，在O(1)时间删除该结点 * * Assume the list is: * head->...->nodeToDelete->mNode->nNode->..
nginx利用proxy_cache来缓存文件 cfyme cache
user zhangy users; worker_processes 10; error_log /var/vlogs/nginx_error.log crit; pid /var/vlogs/nginx.pid; #Specifies the value for ma
[JWFD开源工作流]JWFD嵌入式语法分析器负号的使用问题 comsci 嵌入式
假如我们需要用JWFD的语法分析模块定义一个带负号的方程式，直接在方程式之前添加负号是不正确的，而必须这样做： string str01 = "a=3.14;b=2.71;c=0;c-((a*a)+(b*b))" 定义一个0整数c,然后用这个整数c去
如何集成支付宝官方文档 dai_lm android
官方文档下载地址 https://b.alipay.com/order/productDetail.htm?productId=2012120700377310&tabId=4#ps-tabinfo-hash 集成的必要条件 1. 需要有自己的Server接收支付宝的消息 2. 需要先制作app，然后提交支付宝审核，通过后才能集成调试的时候估计会真的扣款，请注意
应该在什么时候使用Hadoop datamachine hadoop
原帖地址：http://blog.chinaunix.net/uid-301743-id-3925358.html 存档，某些观点与我不谋而合，过度技术化不可取，且hadoop并非万能。 --------------------------------------------万能的分割线-------------------------------- 有人问我，“你在大数据和Hado
在GridView中对于有外键的字段使用关联模型进行搜索和排序 dcj3sjt126com yii
在GridView中使用关联模型进行搜索和排序首先我们有两个模型它们直接有关联: class Author extends CActiveRecord { ... } class Post extends CActiveRecord { ... function relations() { return array( '
使用NSString 的格式化大全 dcj3sjt126com Objective-C
格式定义The format specifiers supported by the NSString formatting methods and CFString formatting functions follow the IEEE printf specification; the specifiers are summarized in Table 1. Note that you c
使用activeX插件对象object滚动有重影蕃薯耀 activeX插件滚动有重影
使用activeX插件对象object滚动有重影 <object style="width:0;" id="abc" classid="CLSID:D3E3970F-2927-9680-BBB4-5D0889909DF6" codebase="activex/OAX339.CAB#
SpringMVC4零配置 hanqunfeng springmvc4
基于Servlet3.0规范和SpringMVC4注解式配置方式，实现零xml配置，弄了个小demo，供交流讨论。项目说明如下： 1.db.sql是项目中用到的表，数据库使用的是oracle11g 2.该项目使用mvn进行管理，私服为自搭建nexus,项目只用到一个第三方 jar，就是oracle的驱动； 3.默认项目为零配置启动，如果需要更改启动方式，请
《开源框架那点事儿16》：缓存相关代码的演变 j2eetop 开源框架
问题引入上次我参与某个大型项目的优化工作，由于系统要求有比较高的TPS，因此就免不了要使用缓冲。该项目中用的缓冲比较多，有MemCache，有Redis，有的还需要提供二级缓冲，也就是说应用服务器这层也可以设置一些缓冲。当然去看相关实现代代码的时候，大致是下面的样子。 [java] view plain copy print ? public vo
AngularJS浅析 kvhur JavaScript
概念 AngularJS is a structural framework for dynamic web apps. 了解更多详情请见原文链接：http://www.gbtags.com/gb/share/5726.htm Directive 扩展html，给html添加声明语句，以便实现自己的需求。对于页面中html元素以ng为前缀的属性名称，ng是angular的命名空间
架构师之jdk的bug排查(一)---------------split的点号陷阱 nannan408 split
1.前言. jdk1.6的lang包的split方法是有bug的,它不能有效识别A.b.c这种类型,导致截取长度始终是0.而对于其他字符,则无此问题.不知道官方有没有修复这个bug. 2.代码 String[] paths = "object.object2.prop11".split("'"); System.ou
如何对10亿数据量级的mongoDB作高效的全表扫描 quentinXXZ mongodb
本文链接: http://quentinXXZ.iteye.com/blog/2149440 一、正常情况下，不应该有这种需求首先，大家应该有个概念，标题中的这个问题，在大多情况下是一个伪命题，不应该被提出来。要知道，对于一般较大数据量的数据库，全表查询，这种操作一般情况下是不应该出现的，在做正常查询的时候，如果是范围查询，你至少应该要加上limit。说一下，
C语言算法之水仙花数 qiufeihu c 算法
/** * 水仙花数 */ #include <stdio.h> #define N 10 int main() { int x,y,z; for(x=1;x<=N;x++) for(y=0;y<=N;y++) for(z=0;z<=N;z++) if(x*100+y*10+z == x*x*x
JSP指令 wyzuomumu jsp
jsp指令的一般语法格式： <%@ 指令名属性 =”值 ” %> 常用的三种指令： page,include,taglib page指令语法形式： <%@ page 属性 1=”值 1” 属性 2=”值 2”%> include指令语法形式： <%@include file=”relative url”%> (jsp可以通过 include