yuyuyu_xxx

NLP论文阅读记录-EMNLP 2023 | 12 Improving Consistency for Text Summarization with Energy Functions

文章目录

前言
0、论文摘要
一、Introduction
- 1.1目标问题
- 1.2相关的尝试
- 1.3本文贡献
二.相关工作
三.本文方法
- 3.1 背景：基于能量的模型
- 3.2 一致性能量函数
- 3.3训练损失
- 3.4 联合推理
四实验效果
- 4.1数据集 4.2 对比模型
- 4.3实施细节
- 4.4评估指标
- 4.5 实验结果
五总结
- 局限性

前言

使用能量函数提高文本摘要的一致性（2310）

code项目没有放出代码
paper

0、论文摘要

当前的抽象摘要模型经常生成不一致的内容，即不能从源文档直接推断出的文本、与世界知识不一致或自相矛盾的文本。

这些不一致激发了一种新的一致性分类法，我们将其定义为忠实性、事实性和自立性。

然而，最近关于减少文档摘要不一致的工作只关注忠实度检测和纠正，而忽略了其他不一致现象，这限制了模型的可扩展性。

为了提高总体一致性，我们引入了 EnergySum，其中我们通过设计反映每种一致性类型的能量评分器来应用基于剩余能量的模型。这些能量分数用于在采样过程中对候选者重新排名。

XSUM 和 CNN/DM 数据集上的实验表明 EnergySum 减轻了准确性和一致性之间的权衡。

一、Introduction

1.1目标问题

虽然在 ROUGE (Lin, 2004) 和 BERTScore (Zhang et al., 2020) 等基于重叠的指标方面表现良好，但由于固有的噪声数据集和基于最大似然估计的训练目标之间的差异，当前的抽象摘要方法经常生成不一致的内容和一致性测量。抽象概括中的不一致内容有不同的解释，包括不能从源文档直接推断的文本、不符合世界知识和常识的事实或自相矛盾的文本。

1.2相关的尝试

我们将一致性正式分类为忠实性、事实性和自立性。表 1 说明了不同类型的一致性错误。以前的大多数方法通过过滤掉噪声训练样本（Kang 和 Hashimoto，2020）、应用对比学习（Cao 和 Wang，2021）、后期编辑（Cao 等人，2020）等来提高文档摘要的一致性。忠诚度一致性的范围有限。然而，仅仅从忠诚度的角度解决不一致问题是不够的。与提取方法不同，抽象摘要在摘要中引入了新内容，这些内容不是直接从源文档复制的，也不一定是不相关的。因此，检测和减轻不一致需要在源文档旁边引入更大的参考语料库。事实性将生成的内容与世界知识进行比较，而自我支持性则验证生成的句子是否与其前一个一致。此外，一致性是在整个预测序列上衡量的，而现有的汇总目标评估单个标记的条件分布，并且缺乏对预测的全局控制。

1.3本文贡献

这些促使我们将基于剩余能量的模型（REBM）（Deng et al., 2020）框架应用于文档摘要，该框架联合训练摘要器和判别器，学习将高分分配给一致的摘要，将低分分配给不一致的摘要。基于能量的方法（He et al., 2021）的优点是它们同时对整个输入进行评分并避免局部归一化陷阱，为解决这个问题提供了一个自然的解决方案。因此，我们引入了采用REBM框架的EnergySum来提高一致性。我们设计的能量函数反映了每种类型的一致性，并且与汇总模型实例无关。我们提出了联合推理，其中能量评分器在候选重新排序步骤中与解码搜索策略合作。

总之，我们的贡献如下：

我们将文档摘要的一致性分类形式化为完整性、事实性和自我支持性。
我们提出EnergySum 框架，其中包括一致性约束的能量评分器和联合推理。我们是第一个引入基于能量的方法来进行一致的文档摘要的人。
我们在XSUM 和CNN/DM 数据集上进行实验，以验证EnergySum 的有效性。

二.相关工作

最近在一致抽象概括方面的工作一直在研究减少基于实体的幻觉。聂等人。 (2019) 通过将用于数据细化的语言理解模块与自我训练迭代相结合来减少幻觉。赵等人。（2020）通过验证数量实体和推广更少的幻觉摘要来减少数量幻觉。 Kang 和 Hashimoto（2020）提出了一种损失截断训练算法，可以过滤掉可能导致幻觉的噪声训练样本。曹等人。（2022）根据预训练和微调的掩蔽语言模型，利用实体的先验概率和后验概率来检测事实幻觉，并将其用作强化学习中的奖励信号。
迪克西特等人。 (2023)提出了一种用于对比摘要训练的候选摘要重新排序技术，以提高忠实度和摘要质量。张等人。 （2023）以多任务训练方式使用信息提取（IE）来提高多文档摘要的事实一致性。
**与我们最相关的工作是 CLIFF（Cao 和 Wang，2021），它通过设计负样本生成策略来模拟最先进的摘要模型常见的错误，将对比学习应用于抽象摘要。**尽管两者都是在具有 NCE 损失的解码器之上训练判别器，但我们的工作在判别器的结构、训练损失和推理过程方面有所不同。
提出了基于校正的方法来减轻一致性改进和基于 ROUGE 的准确度测量下降之间的权衡。曹等人。（2020）提出了一种在合成示例上进行训练的后期编辑校正器模块，其中启发式转换的灵感来自对参考摘要的错误分析。 Span-Fact（Dong et al., 2020）是一种事实校正模型，它利用从问答模型中学到的知识，通过跨度选择对系统生成的摘要进行校正。朱等人。 (2021) 提出了一种事实感知摘要模型，将事实关系集成到摘要生成过程中，并提出了一种采用微调去噪自动编码器形式的事实校正器模型。
自动一致性评估模型大致可以分为基于蕴涵的方法和基于QA的方法。基于蕴涵的指标（Kryscinski et al., 2020；Laban et al., 2022；Ribeiro et al., 2022）训练分类模型来预测摘要是否包含在源文档中。同时，基于 QA 的指标（Fabbri et al., 2022; Scialom et al., 2021; Durmus et al., 2020）根据输入摘要和文档生成问题，然后应用 QA 模型来回答问题并比较答案计算忠诚度分数。陈等人。 (2023)提出了一种基于语义角色标签的多标签分类模型，以预测摘要中的忠实性错误类型。拉达克等人。（2022）用忠实性-抽象性权衡曲线评估摘要系统的有效忠实性。郑等人。 (2023) 评估和分析预先训练的摘要模型对动态演变数据的忠实度。

三.本文方法

3.1 背景：基于能量的模型

基于能量的模型 (EBM)（LeCun 等人，2006）是一种通用学习框架，可为任何给定输入分配非标准化能量分数。 EBM 已应用于机器翻译，以解决训练目标（最大似然估计）和任务度量（BLEU）之间的差异（Bhattacharyya 等人，2021），以及改善自然语言理解的校准（He 等人， 2021）。
基于残余能量的模型（REBM）（Deng et al., 2020）被引入文本生成，它使用 EBM 从自回归生成器的残余误差中学习，以减少模型和数据分布之间的差距：Pθ ∝ PLM (x) exp(−Eθ(x)) ，其中 PLM 是局部标准化语言模型，Eθ 是能量函数。李等人。 (2021)进一步将R-EMB应用于端到端语音识别。
能量函数也被用作文本生成中的约束。 COLD 解码框架（Qin 等人，2022）通过能量函数指定约束来统一约束生成，然后通过基于梯度的采样对约束执行有效的可微分推理。

3.2 一致性能量函数

能量函数解决了基于 MLE 的训练目标和一致性测量之间的差异。通用能量函数设计通常与最后一个编码器/解码器层逻辑的均值池一样简单。为了提高一致性，我们提出了三个能量函数，并使用它们的加权和作为噪声对比估计损失中的最终能量函数。

其中 x 是输入文档，y 是参考摘要，^ y 是生成的摘要。
忠诚。
继秦等人之后。（2022）我们使用 EISL（编辑不变序列损失）（Liu 等人，2022）作为相似性度量。这个 n 元语法匹配函数可以看作是 BLEU-n 度量的可微近似。它的计算本质上是使用目标 n-gram 作为内核对候选序列进行卷积运算。

在训练过程中，我们使用参考摘要来衡量稳定和高效训练的忠实度。然而，它无法避免注释中的数据集噪声，因为它基于参考摘要正确的假设。此外，黄金摘要在推理过程中不可用。

事实性。曹等人。（2022）建议根据预训练和微调的掩码语言模型作为分类器输入，利用实体的先验概率和后验概率来检测事实幻觉。这两种分布如何协同作用以产生事实幻觉仍在探索中。为了应用此措施，我们首先启动并冻结预训练的 BARTlarge 模型作为先前模型。分类器 γ 将先验模型和后验模型的输出串联作为其输入。

自立能力。解码器输出顶部的非线性层 φ 检测生成的摘要中的自我支持性。

3.3训练损失

使用交叉熵损失 LCE 对预训练语言模型进行微调：

为了稳定有效地训练鉴别器，我们结合了两个平方铰链损失 LE (Liu et al., 2020) 和基于相似性的 NCE 损失 Lsim (Cao and Wang, 2021)。

m1 和 m2 是边缘超参数，损失函数用它们来惩罚能量为 ˆ E ∈ [m1, m2] 的样本。

上述损失中，P和N分别为正样本集和负样本集，yi，yj ∈ P，yj ̸= yi，yk ∈ P ∪ N，yk ̸= yi。 hi、hj、hk 是摘要 yi、yj、yk 的表示，sim(·,·) 计算摘要表示之间的余弦相似度。最终的训练损失是上述损失的组合：

3.4 联合推理

之前的工作（Deng 等人，2020）表明样本重采样过程类似于从联合分布中精确采样。因此，我们通过将能量分数插入候选重新排序步骤来修改采样过程。
在解码过程中，会生成一批候选句子并为每个输入进行评分。我们用候选者的能量分数替换生成概率分数，并重新对批次进行排序。由于集束搜索更有可能生成相似的结果，而重新排序的效果较小，因此我们选择多样化集束搜索（Vijayakumar et al., 2016）作为默认搜索策略。

四实验效果

4.1数据集 4.2 对比模型

我们在 XSUM 上将我们的方法与 BARTlarge (Lewis et al., 2020)、LOSSTRUNC (Kang and Hashimoto, 2020)、FASUM 及其变体 FASUM+FC (Zhu et al., 2021) 和 CLIFF (Cao and Wang, 2021) 进行比较（Narayan 等人，2018）和 CNN/DM（Nallapati 等人，2016）数据集。人类基线是指人类编写的参考摘要。

4.3实施细节

我们使用预训练的 BARTlarge 模型实例化 EnergySum 和 Losstrunc。 LE 中的边际超参数 m1 = −10、m2 = −5 根据开发集上的性能进行选择。对于 FASUM，我们评估提供的预测文件，因为代码不公开。请注意，他们提供的测试集文件与标准测试集拆分略有不同。对于所有其他实验，每个模型训练 15000 步骤，学习率设置为 1e − 3，一批中的最大标记设置为 4096，更新频率为 16，优化器为 Adam，预热步骤为 500 。 Losstrunc中的超参数c设置为0.3。为了保持数值一致性，所有实验结果均在三次随机运行中取平均值。**使用配备 40GB DRAM 的 Tesla A100 GPU 训练模型平均需要大约 10 个小时。**由于在整个测试集上评估 FEQA 的时间成本很高，因此我们随机抽取 500 个文档摘要对来计算分数。

4.4评估指标

我们使用 ROUGE（Lin 和 Hovy，2003）和 BERTScore（Zhang 等人，2020）评估准确性。对于忠实性和真实性，我们分别使用 FEQA（Durmus 等人，2020）和 ENTFA（Cao 等人，2022）来衡量。由于没有现有的自我支持性指标，我们提出了 DAESS，它将多句子摘要进行拆分并采用 DAE（Goyal 和 Durrett，2021）来比较一个摘要中的每一对句子。 XSUM 数据集中的摘要通常是一句话，因此我们仅在 CNN/DM 数据集上评估 DAESS。

4.5 实验结果

表 2 显示，与 BARTlarge 相比，EnergySum 在 XSUM 和 CNN/DM 上提高了可信度，并具有相当的准确度性能。所有一致性改进基线的基于重叠的准确率都低于 BARTlarge，这显示了基于 MLE 的训练和一致性训练之间的权衡。尽管如此，我们的方法从这种权衡中受到的伤害较小，并且仍然具有相当的准确性性能。人工编写的黄金摘要通常代表性能的上限。然而，人类基线的 FEQA（忠实度）性能较低，表明数据集中存在噪声。自支持性得分均接近 100%，这意味着自支持性对于当前的摘要系统来说并不是一个具有挑战性的问题，也需要更细粒度的评估指标。采样方法选择和整体性能之间还存在权衡。联合推理只能应用于搜索候选多样化的搜索策略，通常比常规波束搜索表现更差。

五总结

我们建议将残差 EBM 框架与能量评分器和联合推理一起应用，以提高文档摘要的一致性。 XSUM 和 CNN/DM 数据集上的实验表明 EnergySum 减轻了准确性和一致性之间的权衡。这项工作的直接扩展包括提出更细粒度的数据增强策略以及研究预测确定性和能量分数之间的关系。

局限性

这项关于一致文档摘要的工作在数据范围和任务配置方面存在局限性。首先，EnergySum 从数据增强策略模拟的常见错误中学习，这可能会限制其在更多样化的环境中的应用。其次，EnergySum 预测句子级别分数，因此无法检测跨度级别错误或预测错误类型。

【优秀文章】7月优秀文章推荐
优秀文章智能自主运动体与人工智能技术——环境感知、SLAM定位、路径规划、运动控制、多智能体协同作者：fpga和matlabC++之红黑树认识与实现作者：zzh_zao【手把手带你刷好题】–C语言基础编程题(十)作者：草莓熊Lotso飞算JavaAI：从“码农”到“代码指挥官”的终极进化论作者：可涵不会debug前端网页开发学习（HTML+CSS+JS）有这一篇就够！作者：一颗小谷粒
【学习】搭建个人Hexo博客网站程序员
一、准备环境1、安装node访问Node.js官网：https://nodejs.org/下载LTS(长期支持版本)安装时保持默认选项即可安装完成后，打开命令提示符验证安装：node-v2、安装npmnpm已包含在Node.js安装包中，安装Node.js时会自动安装打开命令提示符验证安装：npm-v更新npm到最新版本（可选）：npminstall-gnpm3、安装hexo打开命令提示符，以管理
【心灵鸡汤】深度学习技能形成树：从零基础到AI专家的成长路径全解析智算菩萨人工智能深度学习
引言：技能树的生长哲学在这个人工智能浪潮汹涌的时代，深度学习犹如一棵参天大树，其根系深深扎入数学与计算科学的沃土，主干挺拔地承载着机器学习的核心理念，而枝叶则繁茂地延伸至计算机视觉、自然语言处理、强化学习等各个应用领域。对于初入此领域的新手而言，理解这棵技能树的生长规律，掌握其形成过程中的关键节点和发展阶段，将直接决定其在人工智能道路上能够走多远、攀多高。技能树的概念源于游戏设计，但在学习深度学习
自然语言处理-基于预训练模型的方法-笔记
自然语言处理-基于预训练模型的方法-笔记【下载地址】自然语言处理-基于预训练模型的方法-笔记《自然语言处理-基于预训练模型的方法》由哈尔滨工业大学出版，深入探讨了NLP领域的前沿技术与预训练模型的应用。本书系统介绍了预训练模型的基本概念、发展历程及常见模型的原理，并通过丰富的实践案例与代码实现，帮助读者掌握这些技术在自然语言处理任务中的实际应用。无论是初学者、研发人员，还是希望提升NLP能力的研究
Flutter UI 测试 2401_89317650 flutter ui
在Flutter中，UI测试被称作集成测试。Flutter集成测试类似iOS的XCUITest或Android的Expresso一样来执行UI自动化测试。Flutter的集成测试在一个单独的环境运行，可以运行在真实的设备或者模拟器上面。Flutter提供了一个flutter_driver包来编写UI测试。Flutter应用程序的UI测试是如何执行UI测试:FlutterUI测试作为黑盒运行，与主应
Visual Studio 代码折叠快捷键（摘要）简单的绿竹 Visual Studio visual studio ide
https://www.likecs.com/show-205302341.html#sc=365.3333435058594代码编辑器的展开和折叠代码确实很方便和实用。以下是展开代码和折叠代码所用到的快捷键，很常用：Ctrl+M+O:折叠所有方法Ctrl+M+M:折叠或者展开当前方法Ctrl+M+L:展开所有方法工具箱的的不见的问题：按快捷键Ctrl+Alt+X全屏：Shift+Alt+Ente
WebService SendTimeout 超时问题 SKY徐 webservice binding behavior security wcf .net
System.TimeoutException:请求通道在等待00:01:00以后答复时超时。增加传递给请求调用的超时值，或者增加绑定上的SendTimeout值。分配给此操作的时间可能是更长超时的一部分。WCF中解决方案:1)首先保证客户端每次建立的连接在使用完成后进行关闭.即调用Close()方法,否则此连接会在设置的会话(一般为10分钟)后才自动关闭.期间任何客户端也无法使用此服务.2)如果
Python——pyautogui打地鼠游戏自动化脚本（基于图片定位）
以4399小游戏为例：4399游戏网importpyautoguiimportkeyboardimporttimeimportrandomimportloggingfromPILimportImageGrabimportos#配置日志logging.basicConfig(level=logging.INFO,format='%(asctime)s-%(levelname)s-%(message)
WebService SendTimeout 超时 weixin_30827565
System.TimeoutException:请求通道在等待00:01:00以后答复时超时。增加传递给请求调用的超时值，或者增加绑定上的SendTimeout值。分配给此操作的时间可能是更长超时的一部分。WCF中解决方案:1)首先保证客户端每次建立的连接在使用完成后进行关闭.即调用Close()方法,否则此连接会在设置的会话(一般为10分钟)后才自动关闭.期间任何客户端也无法使用此服务.2)如果
Python高频面试题（四） Irene-HQ 测试 python 自动化测试 python 开发语言面试测试工具 github pycharm
以下是Python研发和自动化测试面试中‌更高阶的专项考点及典型问题‌一、并发与异步编程（高级）‌GIL全局解释器锁的应对策略‌问题：GIL如何影响Python多线程性能？如何绕过GIL限制？答案：GIL使同一时刻仅一个线程执行字节码，CPU密集型任务性能受限绕过方案：使用多进程（multiprocessing）、C扩展（如Cython）、异步IO（asyncio）‌46‌协程异步调用示例‌问题：
SQLite 数据库与其他数据库的对比分析数据库管理艺术数据库专家之路大数据AI人工智能 MCP&Agent 数据库 sqlite ai
SQLite数据库与其他数据库的对比分析关键词：SQLite数据库、其他数据库、对比分析、数据库特性、应用场景摘要：本文旨在对SQLite数据库与其他常见数据库进行全面的对比分析。首先介绍了数据库对比分析的背景和目的，让读者了解为何需要进行这样的对比。接着详细阐述了SQLite以及其他具有代表性数据库（如MySQL、Oracle、PostgreSQL等）的核心概念和架构，通过Mermaid流程图展
C# 上位机开发指南：高效学习建议 IT趣编程学习
C#作为一种编程语言，以其强大的功能、易学易用等特点，在工业自动化领域得到了广泛应用。特别是在上位机软件开发中，C#语言在.NET框架的强大生态系统，能够快速构建出高效、稳定的工业控制系统。本文将介绍C#在上位机开发中的应用并提供一些学习建议，希望通过本指南，能够帮助大家更好的学习上位机开发。前言上位机概念基础知识1、C#语言基础2、.NET框架3、桌面应用开发4、设备通信5、数据操作6、多线程和
C# OPC UA 客户端开发实战：与PLC的数据交互仰望尾迹云
本文还有配套的精品资源，点击获取简介：本压缩包提供了一个利用C#与OPCUA和KepServerEX实现与PLC数据交互的项目案例。介绍了OPCUA协议的工业通信标准、KepServerEX的使用、C#在工业自动化中的应用、OPCUA客户端API的基本功能，以及相关的DLL文件和工具，旨在简化OPCUA客户端的开发流程，帮助开发者快速创建能够与PLC进行数据交互的C#应用程序。1.OPCUA（OP
ViP-LLaVA: 使大型多模态模型理解任意视觉提示 AI专题精讲 Paper阅读多模态人工智能 AI
摘要现有的大型视觉-语言多模态模型主要关注整体图像理解，但在实现区域特定的理解方面仍存在显著差距。目前，使用文本坐标或空间编码的方法通常无法为视觉提示提供用户友好的接口。为了解决这个问题，我们提出了一种新颖的多模态模型，能够解码任意（自由形式）视觉提示。这使得用户可以通过自然提示（如“红色边框”或“指向箭头”）直观地标记图像并与模型互动。我们的简单设计直接将视觉标记叠加在RGB图像上，避免了复杂的
Aider：27.6K Star！这个终端AI编程神器能用语音改代码，自动生成Git记录并提交，接入DeepSeek斩获编程基准最高分蚝油菜花每日 AI 项目与应用实例 AI编程 git 人工智能开源
❤️如果你也关注AI的发展现状，且对AI应用开发感兴趣，我会每日分享大模型与AI领域的开源项目和应用，提供运行实例和实用教程，帮助你快速上手AI技术！AI在线答疑->智能检索历史文章和开源项目->尽在微信公众号->搜一搜：蚝油菜花⌨️“每个CLI爱好者都该试试的AI编程革命：对着终端说话自动生成Gitcommit是怎样的体验？”大家好，我是蚝油菜花。如果你也经历过——在vim里卡了半小时，只为给函
2025年渗透测试面试题总结-2025年HW(护网面试) 31（题目+回答）独行soc 2025年护网面试职场和发展安全 linux 护网渗透测试
安全领域各种资源，学习文档，以及工具分享、前沿信息分享、POC、EXP分享。不定期分享各种好玩的项目及好用的工具，欢迎关注。目录2025年HW(护网面试)311.自我介绍2.渗透测试流程（五阶段模型）3.技术栈与开发经历4.自动化挖洞实践5.信息搜集方法论6.深度漏洞挖掘案例8.SQL注入实战技巧9.AWVS扫描与防御10.CSRFvsSSRF核心差异11.SSRF正则绕过技术12.虚拟主机识别原
MongoDB + Voyage AI 详解：重塑数据库与AI的协同范式 csdn_tom_168 NoSQL 数据库 mongodb 人工智能 AI
MongoDB+VoyageAI详解：重塑数据库与AI的协同范式2025年2月，MongoDB官方宣布收购VoyageAI，这一举措标志着数据库与人工智能技术的深度融合迈入新阶段。通过整合VoyageAI的先进AI检索与嵌入模型能力，MongoDB旨在重新定义AI时代的数据库架构，为企业构建智能应用提供端到端的数据基础设施。一、收购背景与技术战略1.行业趋势驱动AI数据挑战：随着生成式AI与大语言
HarmonyOS5.0仓颉引擎与盘古大模型：个性化作业批改系统架构设计与实现 H老师带你学鸿蒙系统架构 HarmonyOS5.0 鸿蒙华为仓颉教育
人工智能与边缘计算的融合正在重塑教育评价体系。本文将展示如何基于HarmonyOS5.0仓颉并发引擎和盘古大模型，构建新一代智能作业批改系统。系统架构全景graphTDA[学生端设备]-->|提交作业|B[仓颉边缘处理]B-->C[盘古大模型分析]C-->D[个性化反馈生成]D-->E[学生终端]D-->F[教师仪表盘]subgraphHarmonyOS分布式系统B-->|设备协同|G[教室平板集
Java 中 Maven 依赖冲突的解决策略 Java大师兄学大数据AI应用开发 AI实战 AI人工智能与大数据应用开发 java maven 网络 ai
Java中Maven依赖冲突的解决策略关键词：Java、Maven、依赖冲突、解决策略、依赖分析摘要：在Java开发中，Maven作为强大的项目管理和构建工具，极大地提高了开发效率。然而，依赖冲突是使用Maven时常见且棘手的问题，它可能导致项目编译失败、运行时出现异常等情况。本文将深入探讨Maven依赖冲突的产生原因、表现形式，并详细介绍多种有效的解决策略。通过实际案例和代码分析，帮助开发者更好
DeepSeek在智能教育评估中的应用：试题检索 AIGC应用创新大全 AI大模型与大数据技术 AI人工智能与大数据应用开发 MCP&Agent 云算力网络 easyui 前端 javascript ai
DeepSeek在智能教育评估中的应用：试题检索关键词：DeepSeek、智能教育、试题检索、自然语言处理、知识图谱、个性化学习、评估系统摘要：本文探讨了DeepSeek大模型在智能教育评估系统中的试题检索应用。我们将深入分析如何利用先进的自然语言处理技术和知识图谱构建高效的试题检索系统，实现个性化学习路径推荐和精准评估。文章将从核心概念、技术原理到实际应用场景，全面解析这一创新教育技术解决方案。
知识图谱的个性化智能教学推荐系统(论文+源码) 毕设工作室_wlzytw python论文项目知识图谱人工智能
目录摘要Abstract目录第1章绪论1.1研究背景及意义1.2国内外研究现状1.2.1知识图谱1.2.2个性化推荐系统1.3本文研究内容及创新点1.4全文组织结构第2章相关理论与技术概述2.1知识图谱2.1.1知识图谱的介绍与发展2.1.2知识图谱的构建2.3协同过滤推荐算法2.2.1推荐算法概述2.2.2Pearson相关系数2.2.3Spearman相关系数2.4Bert模型和Albert模
MCP协议：开发者生态系统的未来基石？ Echo_Wish Python 进阶人工智能大数据
MCP协议：开发者生态系统的未来基石？近年来，随着物联网（IoT）、工业自动化、智能设备互联的爆发式增长，通信协议的标准化成了关键。而MCP（MessageCommunicationProtocol）协议正逐步成为开发者生态的重要成员，它提供了高效、灵活、可扩展的消息通信机制，使得不同设备、服务和系统可以无缝协作。那么，MCP协议究竟有什么优势？开发者应该如何利用它？以及它在当前技术环境中的实际应
A1126LLHLX-T Allegro霍尔效应锁存器，5kHz+推挽输出，汽车级转速检测专家！深圳市尚想信息技术有限公司霍尔效应锁存器汽车工业消费电子
A1126LLHLX-T（Allegro）产品解析一、产品定位A1126LLHLX-T是AllegroMicroSystems推出的全极性霍尔效应锁存器，采用超薄SOT-23W封装（1mm厚度），专为高可靠性位置检测与转速测量设计，具有低功耗、高抗干扰特性，适用于汽车、工业和消费电子领域。二、核心功能与参数特性参数/性能工作模式全极性锁存（南北磁极均可触发，保持输出状态）工作电压3V~24V（宽压
阿里云瑶池数据库 Data Agent for Meta 正式发布，让 AI 更懂你的业务！数据库观点资讯人工智能
背景随着生成式人工智能（GenerativeAI）从概念验证迈向规模化商业落地，AIAgent已成为企业核心业务流程的重要组成部分。然而，当模型调用日益便捷时，核心痛点已不再是模型本身，而是集中在一个关键要素上：数据。AIAgent的落地瓶颈已从技术能力转向高质量、高相关性、安全合规的数据供给。企业面临的核心挑战在于：数据孤岛导致知识库分散，通用大模型难以理解专业业务传统数据管理依赖人工开发维护，
Python-selenium爬取藏在歌词里 python selenium 开发语言
selenium前言使用python的requests模块还是存在很大的局限性，例如：只发一次请求；针对ajax动态加载的网页则无法获取数据等等问题。特此，本章节将通过selenium模拟浏览器来完成更高级的爬虫抓取任务。什么是seleniumSelenium是一个用于自动化Web应用程序测试的开源工具集。它提供了一组API和工具，可以与多种编程语言一起使用，如Java、Python、C#等，用于
【PaddleOCR】OCR文本检测与文本识别数据集整理，持续更新......
博主简介：曾任某智慧城市类企业算法总监，目前在美国市场的物流公司从事高级算法工程师一职，深耕人工智能领域，精通python数据挖掘、可视化、机器学习等，发表过AI相关的专利并多次在AI类比赛中获奖。CSDN人工智能领域的优质创作者，提供AI相关的技术咨询、项目开发和个性化解决方案等服务，如有需要请站内私信或者联系任意文章底部的的VX名片（ID：xf982831907）博主粉丝群介绍：①群内初中生、
多模态大模型的技术应用与未来展望：重构AI交互范式的新引擎 zhaoyi_he 重构人工智能
一、引言：为什么多模态是AI发展的下一场革命？过去十年，深度学习推动了计算机视觉和自然语言处理的飞跃，但两者的发展路径长期割裂。随着生成式AI和大模型时代的到来，**多模态大模型（MultimodalFoundationModels）**以统一的建模方式处理图像、文本、音频、视频等多源数据，重塑了“感知-认知-决策”链条，为AGI迈出关键一步。OpenAI的GPT-4o、Google的Gemini
善用关系网络：开源AI大模型、AI智能名片与S2B2C商城小程序赋能下的成功新路径
摘要：本文聚焦于关系在个人成功中的关键作用，指出关系即财富，善用关系、拓展人脉是成功的重要途径。在此基础上，引入开源AI大模型、AI智能名片以及S2B2C商城小程序等新兴技术工具，探讨它们如何助力个体在复杂的关系网络中更高效地挖掘和利用资源，提升处理关系的能力，从而为事业成功开拓新道路，揭示这些技术元素在当代成功路径中的创新应用与重要意义。关键词：关系网络；开源AI大模型；AI智能名片；S2B2C
人间生存小故事是泡沫呀瞎聊经验分享程序人生笔记生活职场和发展
知道吗，实现财富自由以后，那才是生活而在人间，每天为了不让自己饿死，那叫生存我会一直更新，记录一个个生存的故事，看看人们是怎么生存的1.地铁乘务员站岗坐标：深圳，车公庙地铁站，23年5月那天我19点下班，走到了地铁站，当我下楼梯时，大概距离地铁那扇门还有20米的样子，我一眼就看见了他------地铁乘务员他穿着一套黑色的制服，挺着一个大大的肚子，在那个列车小屏幕下站着，身体稍微的向前倾斜，就他一个
Modbus 安全机制：加密通信与权限管理（二）计算机毕设定制辅导-无忧 #Moudus 安全服务器网络
Modbus权限管理机制（一）权限管理的意义在Modbus系统中，权限管理就像是一把精细的“安全锁”，起着至关重要的作用。它主要用于限制不同用户或设备对Modbus资源的访问，确保系统的安全性、稳定性和数据的完整性。在一个大型的工业自动化生产线上，涉及众多的Modbus设备和大量的数据交互。如果没有有效的权限管理，任何人员或设备都可以随意访问和操作这些资源，那么生产线的运行将陷入混乱。未授权的人员
强大的销售团队背后竟然是大数据分析的身影蓝儿唯美数据分析
Mark Roberge是HubSpot的首席财务官，在招聘销售职位时使用了大量数据分析。但是科技并没有挤走直觉。大家都知道数理学家实际上已经渗透到了各行各业。这些热衷数据的人们通过处理数据理解商业流程的各个方面，以重组弱点，增强优势。 Mark Roberge是美国HubSpot公司的首席财务官，HubSpot公司在构架集客营销现象方面出过一份力——因此他也是一位数理学家。他使用数据分析
Haproxy+Keepalived高可用双机单活 bylijinnan 负载均衡 keepalived haproxy 高可用
我们的应用MyApp不支持集群，但要求双机单活（两台机器：master和slave）： 1.正常情况下，只有master启动MyApp并提供服务 2.当master发生故障时，slave自动启动本机的MyApp，同时虚拟IP漂移至slave，保持对外提供服务的IP和端口不变 F5据说也能满足上面的需求，但F5的通常用法都是双机双活，单活的话还没研究过服务器资源 10.7
eclipse编辑器中文乱码问题解决 0624chenhong eclipse乱码
使用Eclipse编辑文件经常出现中文乱码或者文件中有中文不能保存的问题，Eclipse提供了灵活的设置文件编码格式的选项，我们可以通过设置编码格式解决乱码问题。在Eclipse可以从几个层面设置编码格式：Workspace、Project、Content Type、File 本文以Eclipse 3.3（英文）为例加以说明： 1. 设置Workspace的编码格式： Windows-&g
基础篇--resources资源不懂事的小屁孩 android
最近一直在做java开发，偶尔敲点android代码，突然发现有些基础给忘记了，今天用半天时间温顾一下resources的资源。 String.xml 字符串资源涉及国际化问题 http://www.2cto.com/kf/201302/190394.html string-array
接上篇补上window平台自动上传证书文件的批处理问卷酷的飞上天空 window
@echo off : host=服务器证书域名或ip，需要和部署时服务器的域名或ip一致 ou=公司名称, o=公司名称 set host=localhost set ou=localhost set o=localhost set password=123456 set validity=3650 set salias=s
企业物联网大潮涌动：如何做好准备？蓝儿唯美企业
物联网的可能性也许是无限的。要找出架构师可以做好准备的领域然后利用日益连接的世界。尽管物联网（IoT）还很新，企业架构师现在也应该为一个连接更加紧密的未来做好计划，而不是跟上闸门被打开后的集成挑战。“问题不在于物联网正在进入哪些领域，而是哪些地方物联网没有在企业推进，” Gartner研究总监Mike Walker说。 Gartner预测到2020年物联网设备安装量将达260亿，这些设备在全
spring学习——数据库（mybatis持久化框架配置） a-john mybatis
Spring提供了一组数据访问框架，集成了多种数据访问技术。无论是JDBC，iBATIS(mybatis)还是Hibernate，Spring都能够帮助消除持久化代码中单调枯燥的数据访问逻辑。可以依赖Spring来处理底层的数据访问。 mybatis是一种Spring持久化框架，要使用mybatis，就要做好相应的配置： 1，配置数据源。有很多数据源可以选择，如：DBCP，JDBC，aliba
Java静态代理、动态代理实例 aijuans Java静态代理
采用Java代理模式，代理类通过调用委托类对象的方法，来提供特定的服务。委托类需要实现一个业务接口，代理类返回委托类的实例接口对象。按照代理类的创建时期，可以分为：静态代理和动态代理。所谓静态代理：　指程序员创建好代理类，编译时直接生成代理类的字节码文件。所谓动态代理：　在程序运行时，通过反射机制动态生成代理类。一、静态代理类实例： 1、Serivce.ja
Struts1与Struts2的12点区别 asia007 Struts1与Struts2
1) 在Action实现类方面的对比：Struts 1要求Action类继承一个抽象基类；Struts 1的一个具体问题是使用抽象类编程而不是接口。Struts 2 Action类可以实现一个Action接口，也可以实现其他接口，使可选和定制的服务成为可能。Struts 2提供一个ActionSupport基类去实现常用的接口。即使Action接口不是必须实现的，只有一个包含execute方法的P
初学者要多看看帮助文档不要用js来写Jquery的代码百合不是茶 jquery js
解析json数据的时候需要将解析的数据写到文本框中, 出现了用js来写Jquery代码的问题; 1, JQuery的赋值有问题代码如下: data.username 表示的是: 网易 $("#use
经理怎么和员工搞好关系和信任 bijian1013 团队项目管理管理
产品经理应该有坚实的专业基础，这里的基础包括产品方向和产品策略的把握，包括设计，也包括对技术的理解和见识，对运营和市场的敏感，以及良好的沟通和协作能力。换言之，既然是产品经理，整个产品的方方面面都应该能摸得出门道。这也不懂那也不懂，如何让人信服？如何让自己懂？就是不断学习，不仅仅从书本中，更从平时和各种角色的沟通
如何为rich:tree不同类型节点设置右键菜单 sunjing contextMenu tree Richfaces
组合使用target和targetSelector就可以啦，如下： <rich:tree id="ruleTree" value="#{treeAction.ruleTree}" var="node" nodeType="#{node.type}" selectionChangeListener=&qu
【Redis二】Redis2.8.17搭建主从复制环境 bit1129 redis
开始使用Redis2.8.17 Redis第一篇在Redis2.4.5上搭建主从复制环境，对它的主从复制的工作机制，真正的惊呆了。不知道Redis2.8.17的主从复制机制是怎样的，Redis到了2.4.5这个版本，主从复制还做成那样，Impossible is nothing! 本篇把主从复制环境再搭一遍看看效果，这次在Unbuntu上用官方支持的版本。 Ubuntu上安装Red
JSONObject转换JSON--将Date转换为指定格式白糖_ JSONObject
项目中，经常会用JSONObject插件将JavaBean或List<JavaBean>转换为JSON格式的字符串，而JavaBean的属性有时候会有java.util.Date这个类型的时间对象，这时JSONObject默认会将Date属性转换成这样的格式： {"nanos":0,"time":-27076233600000,
JavaScript语言精粹读书笔记 braveCS JavaScript
【经典用法】： //①定义新方法 Function .prototype.method=function(name, func){ this.prototype[name]=func; return this; } //②给Object增加一个create方法，这个方法创建一个使用原对
编程之美-找符合条件的整数用字符串来表示大整数避免溢出 bylijinnan 编程之美
import java.util.LinkedList; public class FindInteger { /** * 编程之美找符合条件的整数用字符串来表示大整数避免溢出 * 题目：任意给定一个正整数N，求一个最小的正整数M(M>1)，使得N*M的十进制表示形式里只含有1和0 * * 假设当前正在搜索由0，1组成的K位十进制数
读书笔记 chengxuyuancsdn 读书笔记
1、Struts访问资源 2、把静态参数传递给一个动作 3、<result>type属性 4、s:iterator、s:if c:forEach 5、StringBuilder和StringBuffer 6、spring配置拦截器 1、访问资源 (1)通过ServletActionContext对象和实现ServletContextAware,ServletReque
[通讯与电力]光网城市建设的一些问题 comsci 问题
信号防护的问题,前面已经说过了,这里要说光网交换机与市电保障的关系我们过去用的ADSL线路,因为是电话线,在小区和街道电力中断的情况下,只要在家里用笔记本电脑+蓄电池,连接ADSL,同样可以上网........
oracle 空间RESUMABLE daizj oracle 空间不足 RESUMABLE 错误挂起
空间RESUMABLE操作转 Oracle从9i开始引入这个功能，当出现空间不足等相关的错误时，Oracle可以不是马上返回错误信息，并回滚当前的操作，而是将操作挂起，直到挂起时间超过RESUMABLE TIMEOUT，或者空间不足的错误被解决。这一篇简单介绍空间RESUMABLE的例子。第一次碰到这个特性是在一次安装9i数据库的过程中，在利用D
重构第一次写的线程池 dieslrae 线程池 python
最近没有什么学习欲望,修改之前的线程池的计划一直搁置,这几天比较闲,还是做了一次重构,由之前的2个类拆分为现在的4个类. 1、首先是工作线程类:TaskThread,此类为一个工作线程,用于完成一个工作任务,提供等待(wait),继续(proceed),绑定任务(bindTask)等方法 #!/usr/bin/env python # -*- coding:utf8 -*-
C语言学习六指针 dcj3sjt126com c
初识指针，简单示例程序： /* 指针就是地址，地址就是指针地址就是内存单元的编号指针变量是存放地址的变量指针和指针变量是两个不同的概念但是要注意：通常我们叙述时会把指针变量简称为指针，实际它们含义并不一样 */ # include <stdio.h> int main(void) { int * p; // p是变量的名字， int *
yii2 beforeSave afterSave beforeDelete dcj3sjt126com delete
public function afterSave($insert, $changedAttributes) { parent::afterSave($insert, $changedAttributes); if($insert) { //这里是新增数据 } else { //这里是更新数据 } }
timertask shuizhaosi888 timertask
java.util.Timer timer = new java.util.Timer(true); // true 说明这个timer以daemon方式运行（优先级低， // 程序结束timer也自动结束），注意，javax.swing // 包中也有一个Timer类，如果import中用到swing包， // 要注意名字的冲突。 TimerTask task = new
Spring Security（13）——session管理 234390216 session Spring Security 攻击保护超时
session管理目录 1.1 检测session超时 1.2 concurrency-control 1.3 session 固定攻击保护
公司项目NODEJS实践0.3[ mongo / session ...] 逐行分析JS源代码 mongodb session nodejs
http://www.upopen.cn 一、前言书接上回，我们搭建了WEB服务端路由、模板等功能，完成了register 通过ajax与后端的通信，今天主要完成数据与mongodb的存取，实现注册 / 登录 /
pojo.vo.po.domain区别 LiaoJuncai java VO POJO javabean domain
　　POJO = "Plain Old Java Object"，是MartinFowler等发明的一个术语，用来表示普通的Java对象，不是JavaBean, EntityBean 或者 SessionBean。POJO不但当任何特殊的角色，也不实现任何特殊的Java框架的接口如，EJB， JDBC等等。　　　　即POJO是一个简单的普通的Java对象，它包含业务逻辑
Windows Error Code OhMyCC windows
0 操作成功完成. 1 功能错误. 2 系统找不到指定的文件. 3 系统找不到指定的路径. 4 系统无法打开文件. 5 拒绝访问. 6 句柄无效. 7 存储控制块被损坏. 8 存储空间不足, 无法处理此命令. 9 存储控制块地址无效. 10 环境错误. 11 试图加载格式错误的程序. 12 访问码无效. 13 数据无效. 14 存储器不足, 无法完成此操作. 15 系
在storm集群环境下发布Topology roadrunners 集群 storm topology spout bolt
storm的topology设计和开发就略过了。本章主要来说说如何在storm的集群环境中，通过storm的管理命令来发布和管理集群中的topology。 1、打包打包插件是使用maven提供的maven-shade-plugin，详细见maven-shade-plugin。 <plugin> <groupId>org.apache.maven.
为什么不允许代码里出现“魔数” tomcat_oracle java
　　在一个新项目中，我最先做的事情之一，就是建立使用诸如Checkstyle和Findbugs之类工具的准则。目的是制定一些代码规范，以及避免通过静态代码分析就能够检测到的bug。　　迟早会有人给出案例说这样太离谱了。其中的一个案例是Checkstyle的魔数检查。它会对任何没有定义常量就使用的数字字面量给出警告，除了-1、0、1和2。　　很多开发者在这个检查方面都有问题，这可以从结果
zoj 3511 Cake Robbery(线段树) 阿尔萨斯线段树
题目链接：zoj 3511 Cake Robbery 题目大意：就是有一个N边形的蛋糕，切M刀，从中挑选一块边数最多的，保证没有两条边重叠。解题思路：有多少个顶点即为有多少条边，所以直接按照切刀切掉点的个数排序，然后用线段树维护剩下的还有哪些点。 #include <cstdio> #include <cstring> #include <vector&