yuyuyu_xxx

NLP论文阅读记录-ACL 2023 | 09 Improving Factuality of Abstractive Summarization without Sacrificing Summar

文章目录

前言
0、论文摘要
一、Introduction
- 1.1目标问题
- 1.2相关的尝试
- 1.3本文贡献
二.相关工作
三.本文方法
- 3.1 候选集生成
- 3.2 排名策略
四实验效果
- 4.1数据集
- 4.2 对比模型
- 4.3实施细节
- 4.4评估指标
- 4.5 实验结果
- - 真实性与抽象性的权衡
  - 消融研究
  - - 候选人选择过程。
    - 双重评分技术
五总结
- 局限性

前言

在不牺牲摘要质量的情况下提高抽象摘要的真实性（2305）

code
paper

0、论文摘要

提高抽象概括的事实一致性一直是一个广泛研究的话题。然而，大多数先前关于训练事实感知模型的工作都忽略了它对摘要质量的负面影响。我们提出了 EFACTSUM（即有效事实摘要），这是一种候选摘要生成和排名技术，可在不牺牲摘要质量的情况下提高摘要事实性。
我们表明，使用对比学习框架和我们完善的候选人摘要可以在事实性和基于相似性的指标上带来显着的收益。具体来说，我们提出了一种排名策略，其中我们有效地结合了两个指标，从而防止训练期间出现任何冲突。
使用我们的方法训练的模型在 XSUM 上的 FactCC 上比基本模型绝对提高了 6 点，在 CNN/DM 上提高了 11 点，并且不会对基于相似性的指标或抽象性产生负面影响。1

一、Introduction

1.1目标问题

尽管最近的方法在抽象概括方面取得了显着的进步（Lewis et al., 2020；Raffel et al., 2020；Zhang et al., 2020），但它们仍然缺乏一个非常关键的组成部分——事实一致性。最近的研究（Cao et al., 2020；Kryscinski et al., 2019；Maynez et al., 2020）表明，大多数模型生成的摘要都是不忠实的，并且存在多种幻觉（Tang et al., 2020）。，2022）。使摘要模型事实上一致对于其在实际应用中的可信度至关重要。

1.2相关的尝试

最近的研究已经做出了一些尝试，通过修改最大似然估计（MLE）训练目标来提高抽象概括的真实性（Cao 和 Wang，2021；Goyal 和 Durrett，2021），使用强化学习直接优化事实性指标（Cao 等人，2022）或提高训练数据的质量（Goyal 和 Durrett，2021；Nan 等人，2021a）。然而，大多数这些著作都报告了事实一致性和摘要质量之间的负相关关系2。例如，Goyal 和 Durrett（2021）以 ROUGE-L 下降 6 个点为代价提高了真实性，Wan 和 Bansal（2022）也观察到 ROUGE-L 下降了 2 个点。先前的方法也以抽象性为代价优化了事实性（Ladhak 等人，2022）。
这就引出了一个关键问题：我们能否在不牺牲摘要质量的情况下提高摘要的真实性？

1.3本文贡献

为此，我们提出了EFACTSUM（即有效事实摘要）：一种用于对比摘要训练的候选摘要生成和排序技术（图1），它不仅在抽象摘要的真实性方面取得了显着的进步，而且还提高了摘要的准确性。与之前的作品不同，之前的作品常常为了提高忠实度而牺牲摘要质量，我们采取另一种方法来提高忠实度和摘要质量。
我们利用 Liu 等人的微调策略。（2022）并对排名过程进行重大修改。
如图 1 所示，我们首先使用现有的微调模型生成许多候选摘要。使用这些摘要，我们通过有效组合两个不同标准的两个评估指标（§2）来选择一个子集，从而避免以牺牲另一个为代价来优化一个子集。与简单优化一个指标的方法相比，该技术有助于获得收益（第 3.4 节）。
EFACTSUM 在 XSUM 和 CNN/DM 上取得的有希望的结果表明，在两个方面都比强大的基线有了持续的改进，证明在不牺牲质量的情况下有效增强了摘要的真实性。

二.相关工作

抽象概括中的事实一致性最近引起了广泛关注（Goyal 和 Durrett，2020；Zhu 等，2021）。现有的工作分别探索了在微调、推理和预训练阶段提高事实一致性。对于事实微调，作品应用了对比学习（Cao 和 Wang，2021；Nan 等人，2021b）、强化学习（Gunasekara 等人，2021）或知识整合（Zhu 等人，2021）来教授模型识别高度事实一致性的摘要，而 Wan 和 Bansal (2022) 修改预训练过程以引入事实意识。一些作品还通过推理中的后处理提高了摘要事实性，例如纠正错误和按事实分数重新排名（Cao et al., 2020; Dong et al., 2020; Balachandran et al., 2022; Chen et al., 2021；朱等人，2021）。
我们的工作与上述工作不同，因为我们提高了事实性和摘要质量，这与其他方法不同，后者经常牺牲一种方法。

三.本文方法

给定文档 (D)，摘要任务旨在生成满足某些条件（如事实性、连贯性等）的摘要 (S)。标准微调过程涉及使用最大似然估计 (MLE)。受到刘等人的启发。（2022），除了交叉熵损失之外，我们还引入了对比损失，鼓励模型为更真实的摘要提供更高的概率质量。形式上，对于每个训练文档 D 和最可能的候选摘要的排名列表 [S1，S2，. 。。 Sn]，模型学习根据事实分数对摘要进行排序。为了实现这一目标，我们利用以下损失：

其中 Si 和 Sj 是两个不同的候选摘要，Si 的排名高于 Sj，λij = (j−i)*λ 是基于排名的余量，f (.) 是按长度归一化的估计对数概率：

3.1 候选集生成

为了生成候选摘要集 {Si}，我们利用现有模型和使用波束搜索的样本摘要（Vijayakumar 等人，2018）。我们观察到，仅仅使用交叉熵训练的模型就会导致生成许多不忠实的摘要。为了生成更忠实的摘要，我们使用经过事实改进的模型。

3.2 排名策略

由于我们的主要目标是在不不利地影响摘要质量的情况下优化事实性，因此我们在决定理想排名时需要考虑两个指标。为了衡量 Si 的真实性，我们选择 FactCC (Kryscinski et al., 2020)，因为它与人类对忠诚度的判断有很好的相关性 (Pagnoni et al., 2021)，而且它在计算上也比其他基于问答的方法更高效指标（Scialom 等人，2021）。为了衡量摘要质量，我们使用流行的 ROUGE 指标（Lin，2004）。现在，在已被评分为忠实的候选摘要集中，我们进一步选择具有最高 ROUGE 分数的前 m 个摘要。我们以与选择 ROUGE 分数最低的 m 个摘要相同的方式选择一组不忠实摘要。这种结合两个评估指标的技术有助于克服固有的冲突（Chaudhury 等人，2022）。我们强调了第 3.4 节中提议的步骤的重要性。最后，这 2m 个摘要用于为训练集中的每篇文章创建候选摘要的排名列表。这种方法背后的直觉是，由于 FactCC 分数不是置信度分数，因此仅来自一组的摘要无法提供足够的监督信号。相反，使用两组的平衡摘要来训练模型将是有益的。
最后，我们的训练目标结合了交叉熵损失和对比损失

其中 γ 是对比损失的权重。

四实验效果

4.1数据集

为了了解 EFACTSUM 的有效性，我们使用了两个广泛使用的新闻摘要数据集：XSUM（Narayan 等人，2018）和 CNN/DM（Hermann 等人，2015）。

4.2 对比模型

除了使用交叉熵和竞争性微调技术进行微调的模型：BRIO（Liu et al., 2022）之外，我们还将 EFACTSUM 与之前修改微调过程以提高真实性的作品进行比较，包括
（1） CLIFF（Cao 和 Wang，2021）使用对比学习来训练摘要模型，以区分一致摘要和幻觉摘要；
（2）FASum（Zhu 等人，2021）通过合并知识图来修改 Transformer 架构以实现事实一致性；
以及(3) DAE（Goyal 和 Durrett，2021）在训练期间掩盖非事实标记。此比较仅适用于 XSUM 数据集。

4.3实施细节

我们使用 CLIFF 和交叉熵训练模型来生成候选摘要集（S1、S2、…、Sn）。我们使用 n = 6，并且仅保留那些包含至少 2 个事实和非事实候选人摘要的训练文章。使用这个新的训练数据子集，我们对 CNN/DM 上的 BART-Large（Lewis 等人，2020）和 XSUM 上的 PEGASUS（Zhang 等人，2020）进行微调。更多详细信息请参见附录。 §A。

4.4评估指标

为了评估事实性，我们使用 FactCC（Kryscinski 等人，2020），这是一种流行的指标，它使用基于 BERT 的指标来衡量生成的输出是否忠实。我们还考虑 DAE（Goyal 和 Durrett，2020），这是一种基于文本蕴含的度量，与人类对事实的判断密切相关（Tang 等人，2022）。它使用弧蕴涵模型来评估摘要的真实性。我们利用标记级分数来补充 FactCC 的句子级分数。
对于质量评估，我们使用 ROUGE（Lin，2004）和 BERTScore（Zhang 等人，2019）根据参考来评估摘要。

所有实验均使用 4 个 24GB NVIDIA RTX A5000 GPU 进行实验是使用私人基础设施进行的，其碳效率为 0.432 kgCO2eq/kWh。总排放量估计为 4.84 kgCO2eq，其中 0% 被直接抵消。使用 (Lacoste et al., 2019) 中介绍的机器学习影响计算器进行估计。

4.5 实验结果

我们在表中报告了使用我们的方法微调模型的结果。 1. 使用我们的策略微调的模型的输出如表 1 所示。 2 和附录。 §C。总的来说，我们可以观察到所提出的 EFACTSUM 可以改善事实性指标，同时保留或改善基于参考的相似性指标的性能。

对于 XSUM，与 PEGASUS 相比，EFACTSUM 在 FactCC 上实现了 25% 的相对增益，在 DAE（代币）上实现了 3% 的显着相对增益，同时在 ROUGE 和 BERTScore 上显示了不小的增益。尽管 EFACTSUM 经过训练来优化 FactCC，但它在其他评估指标上也表现良好，因此指出训练过程不会利用与评估指标相关的任何偏差。应该注意的是，尽管 CLIFF 在 DAE 上做得更好，但它牺牲了摘要质量。
CNN/DM 的情况也类似，EFACTSUM 在 FactCC 和 DAE 上分别实现了 20% 和 16% 的相对增益。与之前的一些作品不同，这种事实性的提高并没有以牺牲摘要质量或抽象性为代价（第 3.3 节）。尽管 BRIO 在 ROUGE 和 BERTScore 上的表现优于我们的方法，但它大大降低了事实性得分，这是不可取的。我们的方法旨在在事实性和摘要质量之间取得平衡。

真实性与抽象性的权衡

拉达克等人。（2022）表明，通过增加提取性（减少抽象性）来增加生成摘要的真实性是天真的可能的。因此，我们分析生成的摘要的提取水平，以了解我们的方法是否受到这种权衡的影响。除了提取性分数（Grusky 等人，2018）之外，我们还计算 MINT（生成文本的词汇独立性度量）分数和抽象性调整后的度量分数（Dreyer 等人，2023）。图 2 描述了各种摘要系统的提取水平。分数是也在Appx中提出。 §B。我们可以观察到我们的模型 (EFACTSUM) 的提取性得分低于其他模型；它还获得了更高的 MINT 分数（表 3），该分数衡量摘要的抽象性。此外，EFACTSUM 在两个数据集的抽象性校准 FactCC 指标 (μFactCC) 上显示出更高的分数。这澄清了事实性的额外收益并不以抽象性为代价。

消融研究

为了证明 EFACTSUM 候选排序过程中所做修改的合理性，我们计算了突出每个单独组件重要性的基线。我们使用在 XSUM 上微调的 PEGASUS 进行以下研究。

候选人选择过程。

我们限制候选人摘要的数量，以保持班级平衡。我们通过使用 FactCC 对所有候选摘要进行简单评分来放宽这一限制。这由 EFACTSUM-w/o select 表示。在选项卡中。 4. 我们可以观察到，这个过程提高了模型的真实性，但仍与主要方法相差 4 个点。因此强调了专注于生成高质量训练数据的优势。

双重评分技术

为了理解使用 ROUGE 从事实和非事实集中选择最佳候选者的重要性，我们通过使用 FactCC 本身选择最佳事实和非事实摘要来省略此步骤。这在选项卡中标记为 EFACTSUM- w/o ROUGE。 4. 虽然该模型在事实性方面的收益与 EFACTSUM 几乎相同，但它对 ROUGE 分数产生负面影响。

五总结

我们提出了 EFACTSUM（有效事实摘要），这是一种用于对比摘要训练的候选摘要生成和排名技术，有助于使模型更加忠实，而不会对摘要质量产生不利影响。结果表明，这种简单而有效的方法可以在事实性和基于相似性的指标上获得一致的收益，而不会对抽象程度产生负面影响。我们希望我们的研究结果能够鼓励未来对事实一致摘要的研究，更多地关注摘要质量和事实性之间的权衡。

局限性

虽然我们的方法有助于训练事实感知摘要模型，但它需要额外的计算成本。与普通交叉熵模型相比，训练时间增加了 3 倍。
**为训练数据集中的每篇文章生成和评分候选摘要也会产生额外的计算开销，**但我们相信这些收益证明了额外的计算成本是合理的。提高摘要模型的忠实度是一项具有挑战性的任务。
尽管我们通过提高事实性指标来改进之前的工作，就像比较之前的工作一样，但我们的工作并没有关注数字一致性。这可能是后续工作一个有意义的研究方向。

开源模型应用落地-OpenAI Agents SDK-集成MCP与Qwen3-8B模型的创新应用探索（七）开源技术探险家开源模型-实际应用落地开源 python ai 人工智能
一、前言在人工智能技术飞速发展的今天，如何将先进的模型和技术无缝结合，成为推动行业变革的关键。OpenAIAgents通过集成模型上下文协议（MCP）和阿里巴巴推出的Qwen3-8B模型，正开启一场智能应用的革命。这种创新的结合不仅提升了AI代理与外部工具之间的通信能力，还在多模态任务处理、个性化服务等领域展现出巨大潜力。本文将深入探讨这一技术组合的实际应用场景，揭示其在改善客户体验和提升运营效率
开源模型应用落地-OpenAI Agents SDK-集成Qwen3-8B-探索output_guardrail的创意应用（六）开源技术探险家开源模型-实际应用落地开源 python ai 人工智能
一、前言随着人工智能技术的迅猛发展，大语言模型（LLM）在各行各业的应用日益广泛。然而，模型生成的内容是否安全、合规、符合用户预期，成为开发者和企业不可忽视的问题。为此，OutputGuardrail应运而生，作为一种关键的安全机制，它在模型生成结果之后进行内容审核与过滤，确保输出不偏离道德、法律和业务规范。通过检测不当的内容，不仅提升了AI系统的可信度，也为构建更加稳健和负责任的人工智能应用提供
KafkaAdminClient 技术详解：Python 操作 Kafka 集群的管理接口佑瞻 python工程化 python kafka
一、KafkaAdminClient基础概念KafkaAdminClient是kafka-python客户端提供的集群管理类，用于通过编程方式管理Kafka集群资源。其核心定位是为开发者提供一套标准化接口，实现对主题、分区、ACL、消费者组等资源的全生命周期管理。核心特性说明：接口定位：专门用于集群资源管理，区别于KafkaConsumer/KafkaProducer的数据读写功能版本要求：要求B
开源模型应用落地-让AI更懂你的每一次交互-Mem0集成Qdrant、Neo4j与Streamlit的创新实践（四）开源技术探险家开源模型-实际应用落地 neo4j 开源人工智能语言模型
一、前言在人工智能迅速发展的今天，如何让AI系统更懂“你”？答案或许藏在个性化的记忆管理之中。Mem0作为一个开源的记忆管理系统，正致力于为AI赋予长期记忆与个性化服务能力。通过结合高性能向量数据库Qdrant、图数据库Neo4j的强大关系分析能力以及Streamlit的高效可视化交互，我们可以打造出一个既能存储用户历史行为、又能实时推理并展示结果的智能记忆助手。本文将带您一步步探索这一技术组合的
【云原生篇】微服务革命：解锁Istio与Service Mesh 林木森^~^ 云原生云原生微服务 istio
ServiceMeshServiceMesh是一种用于处理服务间通信的基础设施层，它以轻量级的网络代理的形式实现，这些代理与应用程序的微服务一同部署。ServiceMesh的核心目的是将网络通信的复杂性从应用程序代码中抽象出来，从而使开发人员可以专注于业务逻辑的开发，而不是通信的细节和问题。主要特点和功能服务发现：自动管理服务间的发现，使得各服务可以相互识别并进行通信。负载均衡：智能地将请求流量分
【优秀文章】7月优秀文章推荐
优秀文章智能自主运动体与人工智能技术——环境感知、SLAM定位、路径规划、运动控制、多智能体协同作者：fpga和matlabC++之红黑树认识与实现作者：zzh_zao【手把手带你刷好题】–C语言基础编程题(十)作者：草莓熊Lotso飞算JavaAI：从“码农”到“代码指挥官”的终极进化论作者：可涵不会debug前端网页开发学习（HTML+CSS+JS）有这一篇就够！作者：一颗小谷粒
【学习】搭建个人Hexo博客网站程序员
一、准备环境1、安装node访问Node.js官网：https://nodejs.org/下载LTS(长期支持版本)安装时保持默认选项即可安装完成后，打开命令提示符验证安装：node-v2、安装npmnpm已包含在Node.js安装包中，安装Node.js时会自动安装打开命令提示符验证安装：npm-v更新npm到最新版本（可选）：npminstall-gnpm3、安装hexo打开命令提示符，以管理
【心灵鸡汤】深度学习技能形成树：从零基础到AI专家的成长路径全解析智算菩萨人工智能深度学习
引言：技能树的生长哲学在这个人工智能浪潮汹涌的时代，深度学习犹如一棵参天大树，其根系深深扎入数学与计算科学的沃土，主干挺拔地承载着机器学习的核心理念，而枝叶则繁茂地延伸至计算机视觉、自然语言处理、强化学习等各个应用领域。对于初入此领域的新手而言，理解这棵技能树的生长规律，掌握其形成过程中的关键节点和发展阶段，将直接决定其在人工智能道路上能够走多远、攀多高。技能树的概念源于游戏设计，但在学习深度学习
自然语言处理-基于预训练模型的方法-笔记
自然语言处理-基于预训练模型的方法-笔记【下载地址】自然语言处理-基于预训练模型的方法-笔记《自然语言处理-基于预训练模型的方法》由哈尔滨工业大学出版，深入探讨了NLP领域的前沿技术与预训练模型的应用。本书系统介绍了预训练模型的基本概念、发展历程及常见模型的原理，并通过丰富的实践案例与代码实现，帮助读者掌握这些技术在自然语言处理任务中的实际应用。无论是初学者、研发人员，还是希望提升NLP能力的研究
Flutter UI 测试 2401_89317650 flutter ui
在Flutter中，UI测试被称作集成测试。Flutter集成测试类似iOS的XCUITest或Android的Expresso一样来执行UI自动化测试。Flutter的集成测试在一个单独的环境运行，可以运行在真实的设备或者模拟器上面。Flutter提供了一个flutter_driver包来编写UI测试。Flutter应用程序的UI测试是如何执行UI测试:FlutterUI测试作为黑盒运行，与主应
Visual Studio 代码折叠快捷键（摘要）简单的绿竹 Visual Studio visual studio ide
https://www.likecs.com/show-205302341.html#sc=365.3333435058594代码编辑器的展开和折叠代码确实很方便和实用。以下是展开代码和折叠代码所用到的快捷键，很常用：Ctrl+M+O:折叠所有方法Ctrl+M+M:折叠或者展开当前方法Ctrl+M+L:展开所有方法工具箱的的不见的问题：按快捷键Ctrl+Alt+X全屏：Shift+Alt+Ente
WebService SendTimeout 超时问题 SKY徐 webservice binding behavior security wcf .net
System.TimeoutException:请求通道在等待00:01:00以后答复时超时。增加传递给请求调用的超时值，或者增加绑定上的SendTimeout值。分配给此操作的时间可能是更长超时的一部分。WCF中解决方案:1)首先保证客户端每次建立的连接在使用完成后进行关闭.即调用Close()方法,否则此连接会在设置的会话(一般为10分钟)后才自动关闭.期间任何客户端也无法使用此服务.2)如果
Python——pyautogui打地鼠游戏自动化脚本（基于图片定位）
以4399小游戏为例：4399游戏网importpyautoguiimportkeyboardimporttimeimportrandomimportloggingfromPILimportImageGrabimportos#配置日志logging.basicConfig(level=logging.INFO,format='%(asctime)s-%(levelname)s-%(message)
WebService SendTimeout 超时 weixin_30827565
System.TimeoutException:请求通道在等待00:01:00以后答复时超时。增加传递给请求调用的超时值，或者增加绑定上的SendTimeout值。分配给此操作的时间可能是更长超时的一部分。WCF中解决方案:1)首先保证客户端每次建立的连接在使用完成后进行关闭.即调用Close()方法,否则此连接会在设置的会话(一般为10分钟)后才自动关闭.期间任何客户端也无法使用此服务.2)如果
undo tablespace的恢复， database能不关闭最好不要关闭 jnrjian oracle 数据库
Appliesto:EnterpriseManagerforOracleDatabase-Version9.2.0.1to11.2.0.4Informationinthisdocumentappliestoanyplatform.PurposeProblemDescription:====================Thisisarecoveryscenarioinwhichadatafile
Oracle 12C 在线移动datafile 不需要归档模式！只要在线就行
非归档模式也可以！！！GoalInthisrelease,adatafilecannowbemovedonlinewhileitisopenandbeingaccessed,evenfordatafilesinsystemtablespace.Beingabletomoveadatafileonlinemeansthatmanymaintenanceoperations,suchasmovingd
Oracle 查看需要recover的datafile v$recover_file 需要哪些归档日志 jnrjian 数据库 oracle
Toeasilyandquicklyfindoutiftheonlineredologfilescanbeusedtorecoveradatabase.ScopeThisdocumentisaddressedtoDBAsthatwanttoquicklyfindthebestrecoverysolutionincaseofadatabasecrash.DetailsManydatabasestod
Python高频面试题（四） Irene-HQ 测试 python 自动化测试 python 开发语言面试测试工具 github pycharm
以下是Python研发和自动化测试面试中‌更高阶的专项考点及典型问题‌一、并发与异步编程（高级）‌GIL全局解释器锁的应对策略‌问题：GIL如何影响Python多线程性能？如何绕过GIL限制？答案：GIL使同一时刻仅一个线程执行字节码，CPU密集型任务性能受限绕过方案：使用多进程（multiprocessing）、C扩展（如Cython）、异步IO（asyncio）‌46‌协程异步调用示例‌问题：
SQLite 数据库与其他数据库的对比分析数据库管理艺术数据库专家之路大数据AI人工智能 MCP&Agent 数据库 sqlite ai
SQLite数据库与其他数据库的对比分析关键词：SQLite数据库、其他数据库、对比分析、数据库特性、应用场景摘要：本文旨在对SQLite数据库与其他常见数据库进行全面的对比分析。首先介绍了数据库对比分析的背景和目的，让读者了解为何需要进行这样的对比。接着详细阐述了SQLite以及其他具有代表性数据库（如MySQL、Oracle、PostgreSQL等）的核心概念和架构，通过Mermaid流程图展
C# 上位机开发指南：高效学习建议 IT趣编程学习
C#作为一种编程语言，以其强大的功能、易学易用等特点，在工业自动化领域得到了广泛应用。特别是在上位机软件开发中，C#语言在.NET框架的强大生态系统，能够快速构建出高效、稳定的工业控制系统。本文将介绍C#在上位机开发中的应用并提供一些学习建议，希望通过本指南，能够帮助大家更好的学习上位机开发。前言上位机概念基础知识1、C#语言基础2、.NET框架3、桌面应用开发4、设备通信5、数据操作6、多线程和
C# OPC UA 客户端开发实战：与PLC的数据交互仰望尾迹云
本文还有配套的精品资源，点击获取简介：本压缩包提供了一个利用C#与OPCUA和KepServerEX实现与PLC数据交互的项目案例。介绍了OPCUA协议的工业通信标准、KepServerEX的使用、C#在工业自动化中的应用、OPCUA客户端API的基本功能，以及相关的DLL文件和工具，旨在简化OPCUA客户端的开发流程，帮助开发者快速创建能够与PLC进行数据交互的C#应用程序。1.OPCUA（OP
ViP-LLaVA: 使大型多模态模型理解任意视觉提示 AI专题精讲 Paper阅读多模态人工智能 AI
摘要现有的大型视觉-语言多模态模型主要关注整体图像理解，但在实现区域特定的理解方面仍存在显著差距。目前，使用文本坐标或空间编码的方法通常无法为视觉提示提供用户友好的接口。为了解决这个问题，我们提出了一种新颖的多模态模型，能够解码任意（自由形式）视觉提示。这使得用户可以通过自然提示（如“红色边框”或“指向箭头”）直观地标记图像并与模型互动。我们的简单设计直接将视觉标记叠加在RGB图像上，避免了复杂的
Aider：27.6K Star！这个终端AI编程神器能用语音改代码，自动生成Git记录并提交，接入DeepSeek斩获编程基准最高分蚝油菜花每日 AI 项目与应用实例 AI编程 git 人工智能开源
❤️如果你也关注AI的发展现状，且对AI应用开发感兴趣，我会每日分享大模型与AI领域的开源项目和应用，提供运行实例和实用教程，帮助你快速上手AI技术！AI在线答疑->智能检索历史文章和开源项目->尽在微信公众号->搜一搜：蚝油菜花⌨️“每个CLI爱好者都该试试的AI编程革命：对着终端说话自动生成Gitcommit是怎样的体验？”大家好，我是蚝油菜花。如果你也经历过——在vim里卡了半小时，只为给函
2025年渗透测试面试题总结-2025年HW(护网面试) 31（题目+回答）独行soc 2025年护网面试职场和发展安全 linux 护网渗透测试
安全领域各种资源，学习文档，以及工具分享、前沿信息分享、POC、EXP分享。不定期分享各种好玩的项目及好用的工具，欢迎关注。目录2025年HW(护网面试)311.自我介绍2.渗透测试流程（五阶段模型）3.技术栈与开发经历4.自动化挖洞实践5.信息搜集方法论6.深度漏洞挖掘案例8.SQL注入实战技巧9.AWVS扫描与防御10.CSRFvsSSRF核心差异11.SSRF正则绕过技术12.虚拟主机识别原
从入门到精通，超详细的程序员Java学习路线指南憨小萌 java 数据库编程语言软件开发人工智能
说明最近也有很多人来向我"请教"，他们大都是一些刚入门的新手，还不了解这个行业，也不知道从何学起，开始的时候非常迷茫，实在是每天回复很多人也很麻烦，所以在这里统一作个回复吧。Java学习路线当然，这里我只是说Java学习路线，因为自己就是学Java的，对Java理当很熟悉，对于其它方面，我也不是很了解。基础阶段首先是基础阶段，在基础阶段，我们必须掌握Java基础，Mysql数据库，Oracle数据
MongoDB + Voyage AI 详解：重塑数据库与AI的协同范式 csdn_tom_168 NoSQL 数据库 mongodb 人工智能 AI
MongoDB+VoyageAI详解：重塑数据库与AI的协同范式2025年2月，MongoDB官方宣布收购VoyageAI，这一举措标志着数据库与人工智能技术的深度融合迈入新阶段。通过整合VoyageAI的先进AI检索与嵌入模型能力，MongoDB旨在重新定义AI时代的数据库架构，为企业构建智能应用提供端到端的数据基础设施。一、收购背景与技术战略1.行业趋势驱动AI数据挑战：随着生成式AI与大语言
HarmonyOS5.0仓颉引擎与盘古大模型：个性化作业批改系统架构设计与实现 H老师带你学鸿蒙系统架构 HarmonyOS5.0 鸿蒙华为仓颉教育
人工智能与边缘计算的融合正在重塑教育评价体系。本文将展示如何基于HarmonyOS5.0仓颉并发引擎和盘古大模型，构建新一代智能作业批改系统。系统架构全景graphTDA[学生端设备]-->|提交作业|B[仓颉边缘处理]B-->C[盘古大模型分析]C-->D[个性化反馈生成]D-->E[学生终端]D-->F[教师仪表盘]subgraphHarmonyOS分布式系统B-->|设备协同|G[教室平板集
Java 中 Maven 依赖冲突的解决策略 Java大师兄学大数据AI应用开发 AI实战 AI人工智能与大数据应用开发 java maven 网络 ai
Java中Maven依赖冲突的解决策略关键词：Java、Maven、依赖冲突、解决策略、依赖分析摘要：在Java开发中，Maven作为强大的项目管理和构建工具，极大地提高了开发效率。然而，依赖冲突是使用Maven时常见且棘手的问题，它可能导致项目编译失败、运行时出现异常等情况。本文将深入探讨Maven依赖冲突的产生原因、表现形式，并详细介绍多种有效的解决策略。通过实际案例和代码分析，帮助开发者更好
DeepSeek在智能教育评估中的应用：试题检索 AIGC应用创新大全 AI大模型与大数据技术 AI人工智能与大数据应用开发 MCP&Agent 云算力网络 easyui 前端 javascript ai
DeepSeek在智能教育评估中的应用：试题检索关键词：DeepSeek、智能教育、试题检索、自然语言处理、知识图谱、个性化学习、评估系统摘要：本文探讨了DeepSeek大模型在智能教育评估系统中的试题检索应用。我们将深入分析如何利用先进的自然语言处理技术和知识图谱构建高效的试题检索系统，实现个性化学习路径推荐和精准评估。文章将从核心概念、技术原理到实际应用场景，全面解析这一创新教育技术解决方案。
知识图谱的个性化智能教学推荐系统(论文+源码) 毕设工作室_wlzytw python论文项目知识图谱人工智能
目录摘要Abstract目录第1章绪论1.1研究背景及意义1.2国内外研究现状1.2.1知识图谱1.2.2个性化推荐系统1.3本文研究内容及创新点1.4全文组织结构第2章相关理论与技术概述2.1知识图谱2.1.1知识图谱的介绍与发展2.1.2知识图谱的构建2.3协同过滤推荐算法2.2.1推荐算法概述2.2.2Pearson相关系数2.2.3Spearman相关系数2.4Bert模型和Albert模
Java实现的基于模板的网页结构化信息精准抽取组件：HtmlExtractor yangshangchuan 信息抽取 HtmlExtractor 精准抽取信息采集
HtmlExtractor是一个Java实现的基于模板的网页结构化信息精准抽取组件，本身并不包含爬虫功能，但可被爬虫或其他程序调用以便更精准地对网页结构化信息进行抽取。 HtmlExtractor是为大规模分布式环境设计的，采用主从架构，主节点负责维护抽取规则，从节点向主节点请求抽取规则，当抽取规则发生变化，主节点主动通知从节点，从而能实现抽取规则变化之后的实时动态生效。如
java编程思想 -- 多态百合不是茶 java 多态详解
一: 向上转型和向下转型面向对象中的转型只会发生在有继承关系的子类和父类中（接口的实现也包括在这里）。父类：人子类：男人向上转型： Person p = new Man() ; //向上转型不需要强制类型转化向下转型： Man man =
[自动数据处理]稳扎稳打,逐步形成自有ADP系统体系 comsci dp
对于国内的IT行业来讲,虽然我们已经有了"两弹一星",在局部领域形成了自己独有的技术特征,并初步摆脱了国外的控制...但是前面的路还很长.... 首先是我们的自动数据处理系统还无法处理很多高级工程...中等规模的拓扑分析系统也没有完成,更加复杂的
storm 自定义日志文件商人shang storm cluster logback
Storm中的日志级级别默认为INFO，并且，日志文件是根据worker号来进行区分的，这样，同一个log文件中的信息不一定是一个业务的，这样就会有以下两个需求出现： 1. 想要进行一些调试信息的输出 2. 调试信息或者业务日志信息想要输出到一些固定的文件中不要怕，不要烦恼，其实Storm已经提供了这样的支持，可以通过自定义logback 下的 cluster.xml 来输
Extjs3 SpringMVC使用 @RequestBody 标签问题记录 21jhf
springMVC使用 @RequestBody(required = false) UserVO userInfo 传递json对象数据，往往会出现http 415，400,500等错误，总结一下需要使用ajax提交json数据才行，ajax提交使用proxy，参数为jsonData，不能为params；另外，需要设置Content-type属性为json，代码如下：（由于使用了父类aaa
一些排错方法文强chu 方法
1、java.lang.IllegalStateException: Class invariant violation at org.apache.log4j.LogManager.getLoggerRepository(LogManager.java:199)at org.apache.log4j.LogManager.getLogger(LogManager.java:228) at o
Swing中文件恢复我觉得很难小桔子 swing
我那个草了！老大怎么回事，怎么做项目评估的？只会说相信你可以做的，试一下，有的是时间！用java开发一个图文处理工具，类似word，任意位置插入、拖动、删除图片以及文本等。文本框、流程图等，数据保存数据库，其余可保存pdf格式。ok,姐姐千辛万苦，
php 文件操作 aichenglong PHP 读取文件写入文件
1 写入文件 @$fp=fopen("$DOCUMENT_ROOT/order.txt", "ab"); if(!$fp){ echo "open file error" ; exit; } $outputstring="date:"." \t tire:".$tire."
MySQL的btree索引和hash索引的区别 AILIKES 数据结构 mysql 算法
Hash 索引结构的特殊性，其检索效率非常高，索引的检索可以一次定位，不像B-Tree 索引需要从根节点到枝节点，最后才能访问到页节点这样多次的IO访问，所以 Hash 索引的查询效率要远高于 B-Tree 索引。可能很多人又有疑问了，既然 Hash 索引的效率要比 B-Tree 高很多，为什么大家不都用 Hash 索引而还要使用 B-Tree 索引呢
JAVA的抽象--- 接口 --实现百合不是茶
抽象接口实现接口 //抽象类 ,方法 //定义一个公共抽象的类 ,并在类中定义一个抽象的方法体抽象的定义使用abstract abstract class A 定义一个抽象类例如： //定义一个基类 public abstract class A{ //抽象类不能用来实例化，只能用来继承 //
JS变量作用域实例 bijian1013 作用域
<script> var scope='hello'; function a(){ console.log(scope); //undefined var scope='world'; console.log(scope); //world console.log(b);
TDD实践（二） bijian1013 java TDD
实践题目：分解质因数 Step1：单元测试： package com.bijian.study.factor.test; import java.util.Arrays; import junit.framework.Assert; import org.junit.Before; import org.junit.Test; import com.bijian.
[MongoDB学习笔记一]MongoDB主从复制 bit1129 mongodb
MongoDB称为分布式数据库，主要原因是1.基于副本集的数据备份， 2.基于切片的数据扩容。副本集解决数据的读写性能问题，切片解决了MongoDB的数据扩容问题。事实上，MongoDB提供了主从复制和副本复制两种备份方式，在MongoDB的主从复制和副本复制集群环境中，只有一台作为主服务器，另外一台或者多台服务器作为从服务器。本文介绍MongoDB的主从复制模式，需要指明
【HBase五】Java API操作HBase bit1129 hbase
import java.io.IOException; import org.apache.hadoop.conf.Configuration; import org.apache.hadoop.hbase.HBaseConfiguration; import org.apache.hadoop.hbase.HColumnDescriptor; import org.apache.ha
python调用zabbix api接口实时展示数据 ronin47
zabbix api接口来进行展示。经过思考之后，计划获取如下内容： 1、获得认证密钥 2、获取zabbix所有的主机组 3、获取单个组下的所有主机 4、获取某个主机下的所有监控项
jsp取得绝对路径 byalias 绝对路径
在JavaWeb开发中，常使用绝对路径的方式来引入JavaScript和CSS文件，这样可以避免因为目录变动导致引入文件找不到的情况，常用的做法如下：一、使用${pageContext.request.contextPath} 　　代码” ${pageContext.request.contextPath}”的作用是取出部署的应用程序名，这样不管如何部署，所用路径都是正确的。
Java定时任务调度：用ExecutorService取代Timer bylijinnan java
《Java并发编程实战》一书提到的用ExecutorService取代Java Timer有几个理由，我认为其中最重要的理由是：如果TimerTask抛出未检查的异常，Timer将会产生无法预料的行为。Timer线程并不捕获异常，所以 TimerTask抛出的未检查的异常会终止timer线程。这种情况下，Timer也不会再重新恢复线程的执行了;它错误的认为整个Timer都被取消了。此时，已经被
SQL 优化原则 chicony sql
一、问题的提出　在应用系统开发初期，由于开发数据库数据比较少，对于查询SQL语句，复杂视图的的编写等体会不出SQL语句各种写法的性能优劣，但是如果将应用系统提交实际应用后，随着数据库中数据的增加，系统的响应速度就成为目前系统需要解决的最主要的问题之一。系统优化中一个很重要的方面就是SQL语句的优化。对于海量数据，劣质SQL语句和优质SQL语句之间的速度差别可以达到上百倍，可见对于一个系统
java 线程弹球小游戏 CrazyMizzz java 游戏
最近java学到线程，于是做了一个线程弹球的小游戏，不过还没完善这里是提纲 1.线程弹球游戏实现 1.实现界面需要使用哪些API类 JFrame JPanel JButton FlowLayout Graphics2D Thread Color ActionListener ActionEvent MouseListener Mouse
hadoop jps出现process information unavailable提示解决办法 daizj hadoop jps
hadoop jps出现process information unavailable提示解决办法 jps时出现如下信息： 3019 -- process information unavailable3053 -- process information unavailable2985 -- process information unavailable2917 --
PHP图片水印缩放类实现 dcj3sjt126com PHP
<?php class Image{ private $path; function __construct($path='./'){ $this->path=rtrim($path,'/').'/'; } //水印函数，参数：背景图，水印图，位置，前缀,TMD透明度 public function water($b,$l,$pos
IOS控件学习：UILabel常用属性与用法 dcj3sjt126com ios UILabel
参考网站： http://shijue.me/show_text/521c396a8ddf876566000007 http://www.tuicool.com/articles/zquENb http://blog.csdn.net/a451493485/article/details/9454695 http://wiki.eoe.cn/page/iOS_pptl_artile_281
完全手动建立maven骨架 eksliang java eclipse Web
建一个 JAVA 项目： mvn archetype:create -DgroupId=com.demo -DartifactId=App [-Dversion=0.0.1-SNAPSHOT] [-Dpackaging=jar] 建一个 web 项目： mvn archetype:create -DgroupId=com.demo -DartifactId=web-a
配置清单 gengzg 配置
1、修改grub启动的内核版本 vi /boot/grub/grub.conf 将default 0改为1 拷贝mt7601Usta.ko到/lib文件夹拷贝RT2870STA.dat到 /etc/Wireless/RT2870STA/文件夹拷贝wifiscan到bin文件夹，chmod 775 /bin/wifiscan 拷贝wifiget.sh到bin文件夹，chm
Windows端口被占用处理方法 huqiji windows
以下文章主要以80端口号为例，如果想知道其他的端口号也可以使用该方法..........................1、在windows下如何查看80端口占用情况?是被哪个进程占用?如何终止等. 这里主要是用到windows下的DOS工具,点击"开始"--"运行",输入&
开源ckplayer 网页播放器，跨平台(html5, mobile)，flv, f4v, mp4, rtmp协议. webm, ogg, m3u8 ！天梯梦 mobile
CKplayer，其全称为超酷flv播放器，它是一款用于网页上播放视频的软件，支持的格式有：http协议上的flv,f4v,mp4格式，同时支持rtmp视频流格式播放，此播放器的特点在于用户可以自己定义播放器的风格，诸如播放/暂停按钮，静音按钮，全屏按钮都是以外部图片接口形式调用，用户根据自己的需要制作出播放器风格所需要使用的各个按钮图片然后替换掉原始风格里相应的图片就可以制作出自己的风格了，
简单工厂设计模式 hm4123660 java 工厂设计模式简单工厂模式
简单工厂模式（Simple Factory Pattern）属于类的创新型模式，又叫静态工厂方法模式。是通过专门定义一个类来负责创建其他类的实例，被创建的实例通常都具有共同的父类。简单工厂模式是由一个工厂对象决定创建出哪一种产品类的实例。简单工厂模式是工厂模式家族中最简单实用的模式，可以理解为是不同工厂模式的一个特殊实现。
maven笔记 zhb8015 maven
跳过测试阶段： mvn package -DskipTests 临时性跳过测试代码的编译： mvn package -Dmaven.test.skip=true maven.test.skip同时控制maven-compiler-plugin和maven-surefire-plugin两个插件的行为，即跳过编译，又跳过测试。指定测试类 mvn test
非mapreduce生成Hfile，然后导入hbase当中 Stark_Summer map hbase reduce Hfile path实例
最近一个群友的boss让研究hbase，让hbase的入库速度达到5w+/s，这可愁死了，4台个人电脑组成的集群，多线程入库调了好久，速度也才1w左右，都没有达到理想的那种速度，然后就想到了这种方式，但是网上多是用mapreduce来实现入库，而现在的需求是实时入库，不生成文件了，所以就只能自己用代码实现了，但是网上查了很多资料都没有查到，最后在一个网友的指引下，看了源码，最后找到了生成Hfile
jsp web tomcat 编码问题王新春 tomcat jsp pageEncode
今天配置jsp项目在tomcat上，windows上正常，而linux上显示乱码，最后定位原因为tomcat 的server.xml 文件的配置，添加 URIEncoding 属性： <Connector port="8080" protocol="HTTP/1.1" connectionTi