yuyuyu_xxx

NLP论文阅读记录-EMNLP 2023 | 03 Citance-Contextualized Summarization of Scientific Papers

文章目录

前言
0、论文摘要
一、Introduction
- 1.1 目标问题
- 1.2相关的工作
- - 1.2.1概括总结Generic Summarization
  - - Abstract-based summarization
    - TL;DR summarization
    - Comprehensive summarization
  - 1.2.2基于引文的摘要Citation-based Summarization
- 1.3本文贡献
二.本文方法
- 3.1 情境总结
- - 3.1.1引文上下文的提取
  - 3.1.2引文语境检索
  - 3.1.3 引文语境概括
- 3.2 WEBIS-CONTEXT-SCISUMM-2023：用于科学论文情境化概括的大型语料库
- - 3.2.1Data Source and Preprocessing
  - 3.2.2引文上下文和检索模型
  - 3.2.3语料库统计
  - 3.2.4抽象概括
  - - Prompt Formulation
三实验效果
- 实验结果
- - 内容检索评估
  - Summarization Evaluation
  - - **Evaluation Data**
    - **Automatic Evaluation**
    - **Human Evaluation**
    - **IAA and Results**
四总结
- 局限性

前言

科学论文的引用语境摘要 （2311）

code
paper

0、论文摘要

当前科学论文自动摘要的方法以摘要的形式生成信息丰富的摘要。
然而，摘要并不旨在显示论文与其中引用的参考文献之间的关系。
我们提出了一种新的情境化摘要方法，可以根据包含参考文献引用（所谓的“引用”）的给定句子生成内容丰富的摘要。
此摘要概述了与引用位置相关的被引用论文的内容。
因此，我们的方法提取论文的引用并对其进行建模，从引用的论文中检索相关段落，并生成针对每个引用的抽象摘要。我们使用 WEBIS-CONTEXT-SCISUMM-2023 评估我们的方法，这是一个包含 54 万篇计算机科学论文和 460 万次引用的新数据集。

一、Introduction

1.1 目标问题

自动摘要的最初任务是科学论文的摘要，这是计算机科学中最早研究的任务之一（Luhn，1958；Baxendale，1958）。自动生成的摘要用于为特定科学领域创建“索引卷”，以帮助研究人员获取数量不断增加的出版物。如今，论文作者通常自己撰写摘要。然而，作者生成的摘要通常提供不完整或有偏见的科学论文覆盖（Elkiss 等，2008）。因此，自动论文摘要的目的已经演变为生成信息更丰富的摘要，通常使用抽象摘要方法（Cohan 等人，2018 年；Cachola 等人，2020 年；Mao 等人，2022 年）。
生成摘要的一个实际应用是增强论文阅读。例如，Rachatasumrit 等人的 CITEREAD。 (2022) 是 Allen AI 语义阅读器 (Lo et al., 2023) 的一部分，可按需显示摘要，作为正在阅读的论文中引用论文的摘要。
虽然这些摘要提供了被引用论文的简明和一般性概述，但它们不能满足读者试图理解论文在其引用背景下的相关性的信息需求。生成的摘要不适合引用上下文，让读者直接查阅引用的作品。

1.2相关的工作

1.2.1概括总结Generic Summarization

科学论文的通用摘要方法基于各种真实摘要，包括摘要（Luhn，1958；Cohan 等人，2018）、作者撰写的亮点（Collins 等人，2017）、作者撰写的宣传简介（Chen）等人，2020），以及同行评审摘要的简明版本（Cachola 等人，2020）。

Abstract-based summarization

柯林斯等人。 (2017) 提出了一种基于 10,148 篇计算机科学论文训练的提取摘要监督模型。该模型使用基于 LSTM 的具有词汇特征的神经编码器对值得总结的句子进行分类，其中作者撰写的要点和摘要作为参考。科汉等人。 (2018) 提出了一种话语感知注意力模型，用于对 arXiv 和 PubMed 馆藏中的科学论文进行抽象总结。分层编码器集成部分信息以生成连贯的摘要。古普塔等人。 (2021) 研究了用于提取摘要的预训练和调整基于 BERT 的模型。

TL;DR summarization

超短指示性 TL;DR 摘要简洁，通常是一两句话，旨在突出论文的主要发现。卡乔拉等人。 (2020) 开发了 SCITLDR 语料库，由 3.2K 篇论文组成，并附有来自同行评审和论文作者的手写 TL;DR 摘要（15-25 个单词）。使用控制代码和多任务学习来生成摘要；该模型还使用论文标题作为额外的训练信号。

Comprehensive summarization

LongSumm 是一项任务，旨在生成约 600 个单词的综合摘要，提供足够的信息来代替阅读目标论文，并克服摘要和 TL;DR 摘要的局限性 Chandrasekaran 等人。（2020）。 LongSumm 语料库包含 2236 篇带有抽象和提取摘要的论文。索图德等人。 (2021) 从 arXiv 和 PubMed 创建了两个语料库，分别包含 11,149 和 88,035 个论文摘要对。为了指导长摘要的生成，Sotudeh 和 Goharian（2022）用引言、概述和动机部分的句子扩展了摘要。

1.2.2基于引文的摘要Citation-based Summarization

在基于引文的摘要中，源论文中的引用被用作查询，以从目标论文中提取相关内容，并生成摘要。 Qazvinian 和 Radev (2008) 分析了目标论文的引用网络并收集了不同来源的引用。这些引用被聚集在一起，中心句子被确定为摘录摘要。 Mei and Zhai (2008) 重点关注基于句子的影响摘要，反映论文集中引文的权威性和接近性。目标论文对相关工作的影响是通过引用源论文来确定的。为了提高可读性和连贯性，Abu-Jbara 和 Radev（2011）引入了预处理步骤来过滤掉不相关的文本片段。然后，进行提取阶段，从背景、问题陈述、方法、结果和局限性等部分中选择重要的句子。在后处理步骤中，生成的摘要的整体可读性得到提高，替换了代词并解决了共同引用问题。
与我们的工作密切相关的是，Cohan 和 Goharian（2015）使用了引用上下文，定义为反映源论文引用的目标论文的文本段落。为了总结目标论文，他们首先收集了多个引用上下文，根据 tf-idf 向量的余弦相似度构建了基于它们的内部连接性的图。该图中的句子按其重要性（连接数）进行排名。检索到的句子与目标论文中的话语信息相结合，生成内容丰富的摘要。 Cohan 和 Goharian (2017) 使用词嵌入和领域知识进一步改进了该模型，以增强引文上下文。
我们的工作还侧重于使用引文上下文对引文进行语境化，但有很大不同：我们识别不同类型的引文上下文，并使用它们为给定的引文生成多个上下文相关的摘要。我们不是仅仅依赖文字引用作为查询（它仅代表一种类型的引用上下文），而是使用多个上下文来派生查询。
我们的语料库是最大的一个包含特定引用上下文的科学论文摘要的语料库，包含约 540,000 篇论文和 460 万次引用。相比之下，Mao 等人的 CITESUM 语料库。 (2022) 仅包含 93,000 篇论文，其中引用源论文相关工作部分作为目标论文的超简短摘要。我们的语料库包括源论文所有部分的引用，并包含多种类型的引用上下文，以及每个上下文的多个摘要。因此，我们的语料库为研究科学论文摘要提供了全面且多样化的资源。

1.3本文贡献

在本文中，我们研究了与通用摘要相比专门针对个别引文上下文定制的上下文摘要的适用性。
我们提出了一种通过操作引用上下文来生成上下文摘要的新方法。
图 1 说明了我们的方法，该方法由三个步骤组成（第 3 节）：
（1）从引用文档中提取包含引文（the citance）的句子及其上下文并对其进行建模，
（2）从使用基于这些引用上下文的查询来引用论文，
以及 (3) 生成引用论文的抽象的、引用上下文化的摘要。
为了解决这项新任务，我们创建了 WEBIS-CONTEXT-SCISUMM-2023（Sec-化4），一个大规模、高质量的语料库，由54万篇计算机科学论文和460万次引用组成。在使用我们的语料库进行的广泛比较评估中，我们与引用论文的摘要进行比较，探索了我们方法的不同变体（第 5 节）。我们发现，虽然摘要在覆盖范围和重点方面略有优势，但当引文未能与被引论文的中心主题保持一致时，上下文摘要被证明是比摘要更有利的替代方案。附录 D 中显示了我们的方法的上下文摘要示例以及摘要。

二.本文方法

3.1 情境总结

我们的情境化总结方法涉及在源论文中使用多个引用上下文。除了引文本身（包含引文的单个句子）之外，我们还考虑几种类型的周围上下文。如图 1 所示，我们的方法涉及三个主要步骤：(1) 提取引用，
(2) 从被引用的论文中检索相关内容，
以及 (3) 生成基于引用的上下文的抽象摘要。

3.1.1引文上下文的提取

首先，所有字面上引用其他论文的引用都是从给定的论文中提取的。然后我们考虑引用的两个附加上下文。第一个包括紧接引用之前和之后的句子。第二个包含同一段落中引用的两个语义上最相似的句子。这会产生三个引用上下文：(1) 引用本身，(2) 引用及其邻居，以及 (3) 引用和语义相似的句子。通过考虑这些背景，我们的目标是改进从被引用论文中相关内容的检索。

3.1.2引文语境检索

我们使用上述三个引用上下文作为检索的查询。此外，我们探索使用从每个引用上下文中提取的关键字来改进查询（Carpineto 和 Romano，2012）。对于检索，我们使用浅层和密集检索模型（第 4.2 节）。我们以两个粒度级别检索相关内容：句子和段落。具体来说，我们从引用的论文中提取前 5 个相关句子和前 2 个相关段落。这使得能够评估哪种粒度更适合上下文摘要任务。
前 5 个最相关的句子提供了被引用论文的更广泛覆盖范围，其中包括与引用相关的信息。相反，前 2 个最相关的段落提供了更高程度的关注，其中摘要句子是相互关联的。因此，我们对这两种粒度进行实验，以研究它们在我们的方法中的有效性。在检索过程之后，我们对检索到的内容进行定性评估。该评估有助于我们为后续摘要步骤（第 5.1 节）选择查询和检索模型的最佳组合。

3.1.3 引文语境概括

从引用的论文中检索相关内容后，我们将其用作摘要模型的输入。这确保了生成的摘要与引用的上下文相关，并专门关注被引用论文中与其相关的部分。在我们的方法中，我们探索大型语言模型 (LLM) 的有效性，因为它们具有强大的多任务能力（Bommasani 等人，2021）。我们使用基于提示的指令调整模型，可以理解并执行用户的自然语言指令来完成特定任务。对不同领域的灵活性和适应性使我们的方法有别于特定领域的监督方法。
由于我们对摘要模型有两种输入粒度（前 5 个句子和前 2 个段落），因此我们设计了两个针对这两种粒度的提示。对于前 5 个句子，我们使用释义提示，旨在将句子转化为连贯的摘要。对于前 2 段，我们使用抽象摘要提示来生成连贯的摘要。有关提示的更多详细信息，请参阅第 4.4 节。

3.2 WEBIS-CONTEXT-SCISUMM-2023：用于科学论文情境化概括的大型语料库

以前用于总结科学论文的数据集没有考虑不同类型的引用上下文，也没有评估用于提取相关内容的多个检索模型（第 2 节）。因此，这些数据集不适合研究引文语境化摘要。为了解决这一差距，我们引入了 WEBIS-CONTEXT-SCISUMM-2023，这是一个使用我们第 3 节中描述的方法创建的新的大型数据集。

3.2.1Data Source and Preprocessing

我们使用公开的语义学者开放研究语料库 (S2ORC)（Lo 等人，2020）。3 该语料库包含 1.36 亿份科学文档，其中 1200 万份提供全文。我们重点关注计算机科学领域的 870,000 份文档的子集（第 5.2 节）。删除没有引用的文件后，剩下约 540,000 份文件。然后，我们通过识别每个文档中包含引文的句子来提取引文。总共有 460 万次引用。与毛等人不同。（2022）只考虑了相关工作部分的引用，我们考虑了所有论文部分的引用，从而产生了更加多样化的集合。

3.2.2引文上下文和检索模型

如第 3.1 节所述，我们使用三种类型的引用上下文作为查询来从被引用的论文中检索相关内容。直接提取引用和邻居上下文。对于相似的上下文，SciBERT（Beltagy 等人，2019）的上下文嵌入用于使用余弦相似度来识别引用中两个语义上最相似的句子。4我们还使用 KeyBERT（Grootendorst）从上下文中提取关键字作为查询，2020）。
作为检索模型，我们使用 **BM25（**Robertson 等人，1994）5 以及查询（引文上下文）和文档（被引论文的句子或段落）之间 SciBERT 嵌入的余弦相似度来对比浅层检索范式和密集检索范式。三种类型的查询（包括关键字变体）和两种检索模型的组合总共产生了 12 个检索设置，如表 3 所示，以及我们内部评估的平均 NDCG@5 分数（第 5.1 节）。我们索引了 1.51 亿个句子和 4000 万个段落，以分别检索每个查询的前 5 个句子和前 2 个段落。对于关键词查询，我们使用加权聚合来融合个体排名：每个排名的权重对应于查询与其引用的余弦相似度；由此产生的排名通过加权总和进行合并。

3.2.3语料库统计

编译的语料库包含 537,155 篇计算机科学论文，总共引用了 4,619,552 次。平均每篇论文被引用 8.6 次。引用的平均长度为 31 个标记，中位数为 27 个标记。此外，该语料库包含 346,450 篇论文，这些论文多次引用同一目标论文，促进了情境化摘要方法的研究。表 1 将我们的语料库与其他数据集进行了比较。

3.2.4抽象概括

使用从被引用论文中检索到的内容，我们使用表 2 中列出的基于提示的指令调整的LLM对每个引用进行抽象总结。对于检索内容的两种粒度（前 5 个句子和前 2 个段落），我们使用零样本设置中的模型生成单独的摘要。对于前 5 个句子，我们将它们解释为连贯的文本，因为它们已经作为提取摘要。对于前 2 段，我们进行了抽象总结。在整个任务中，我们尝试了不同的指令和提示公式。

Prompt Formulation

为了根据特定指令生成文本，上述模型需要定制提示。我们用不同的指令和提示表述进行了实验以进行释义并总结。手动评估所有模型的 10 个示例生成的摘要。基于此评估，为每个模型选择了最佳的说明和提示配方组合。图 2 显示了所选的组合，附录 A 提供了更多详细信息。

三实验效果

实验结果

内容检索评估

表 3 中所示的 12 种检索设置是通过对从被引论文检索的内容与施引论文相应的引用上下文（查询）进行手动相关性评估来进行评估的。使用 10 个查询来检索 12 个设置中每一个被引论文的前 5 个句子，总共得到 600 个句子。句子相关性按分级等级进行评估：相关、有些相关和不相关。表 3 显示了 NDCG@5 的结果（Järvelin 和 Kekäläinen，2002）。基于它们，我们选择了类似的上下文作为 BM25 的查询，将 citance 上下文作为 SciBERT 的查询作为浅层和密集检索的最佳设置，以评估后续的摘要步骤。前者使用与引文语义最相似的前 2 个句子（以及引文本身）作为查询，而后者仅使用引文。

Summarization Evaluation

使用定量和定性方法对第 4.4 节中列出的模型的上下文摘要进行了评估。对于定量评估，我们使用了 ROUGE (Lin, 2004) 和 BERTScore (Zhang et al., 2020) 指标。对于定性评估，我们手动对覆盖率和焦点方面排名前两位的模型进行评分。

Evaluation Data

从 2016 年至 2020 年发表的 ACL 文集中选取了 15 篇文章。我们从这些文章中提取了 363 次引用，并随机选择了其中 25 篇。使用被引论文全文和表3中排名前2的检索模型，检索排名前5的句子和排名前2的段落，总共得到100篇文本。为了创建真实的参考摘要，我们在零样本设置中使用 GPT4（Bubeck 等人，2023），使用图 2 中所示的提示来解释/总结这些文本。然后手动审核每个摘要，以确保准确性和准确性。以排除幻觉或事实错误。我们的参考文献集包含 100 个摘要（= 25 个引用 × 2 个检索模型 × 2 个摘要类型）。

Automatic Evaluation

参考摘要用于自动评估生成的上下文摘要。结果如表4所示。根据 ROUGE 的说法，Vicuna 的表演在总结前 2 个段落方面表现最好，而 LLaMA-CoT 在将前 5 个句子解释为摘要方面表现最好。此外，它还在 top-2 段落设置中实现了最高的 BERTScore。因此，我们手动评估了它的覆盖范围和焦点。

Human Evaluation

招募了三名领域专家，包括两名学生和一名博士后，来评估摘要的有用性。注释者被要求对两个标准的覆盖范围和重点的摘要进行评分。评级采用李克特 5 分制，1 表示最差，5 表示最好。覆盖范围反映了摘要如何很好地捕获与特定引用相关的被引用论文中的基本信息，而焦点则指摘要中句子的连贯性和衔接性。总共评估了 25 篇被引论文的 125 篇摘要。每个样本都包含显示在左侧的引文（及其上下文）
右侧有五个摘要：被引论文的摘要、两个参考摘要（前 5 个句子和前 2 个段落）以及由两个最佳模型为前 5 个句子和前 2 个段落生成的摘要。 2段。摘要的顺序是随机的，以减轻顺序效应（Mathur 等人，2017）。

IAA and Results

注释者一致性是使用 Cohen 加权 kappa 计算的（Cohen，1960）。我们获得的覆盖范围和焦点的 κ 值分别为 0.42 和 0.40。虽然这些结果表明注释者之间存在一定的一致性，但它们也暗示了该注释任务固有的主观性。评估摘要的有用性受到几个上下文因素的影响，例如注释者审阅引文的目标、他们对被引用论文的先验知识以及摘要的呈现（Jones，2007）。
在未来的工作中，我们计划进一步研究这些因素。如表 5 所示，摘要作为摘要获得了最高的覆盖率得分 (3.67)，紧随其后的是 Vicuna 生成的摘要 (3.01)。摘要也被评为最佳焦点摘要（4.50），而 GPT4 的参考摘要仅排名第二（3.83）。
就检索内容的粒度而言，基于前 2 个段落的摘要在覆盖范围和焦点方面均优于基于前 5 个句子的摘要。然而，尽管人们普遍偏爱摘要而不是生成的上下文摘要，但注释者提供的反馈表明，当引文不明确且与论文的整体思想无关时，我们的摘要会更有效。在这种情况下，他们更喜欢我们基于检索的摘要胜于摘要。表 6 显示了独立和模糊引用以及注释者偏好的示例。为了证实这一结果，我们计划在未来的工作中将我们的评估扩展到更多的引用。

LLM-based Evaluation
为了调查使用LLM评估摘要质量的可靠性，我们使用了 G-Eval (Liu et al., 2023)，它使用 GPT4 根据某些标准评估摘要质量。我们使用提示来评估覆盖率、连贯性和相关性，并从 1 到 5 打分。G-Eval 首先让底层模型生成一系列思想，以确保它理解任务。图 3 说明了评估说明以及每个标准的（手动）校正思路。表 5 显示了结果，表明 G-Eval 反映了对顶级模型的人类评估，对排名较低的模型略有偏差那些。值得注意的是，GPT4 的参考摘要在相关性方面与摘要的得分相似。

四总结

我们研究了通用论文摘要与定制的上下文摘要的使用情况，以提高读者对个别论文引用相关性的理解。为此，我们开发了一种新的摘要方法来生成引用上下文摘要。通过WEBIS-CONTEXT-SCISUMM-2023，我们编制了一个大型语料库来促进这一方向的研究。使用法学硕士进行的零样本摘要实验表明，在覆盖范围和焦点方面，摘要略优于上下文摘要，而当引用不涉及论文的主要贡献时，使用我们的方法生成的摘要更受青睐。

局限性

我们提出的科学论文情境化总结方法基于标准检索模型和法学硕士。应该指出的是，与引用相关的内容是主观的，取决于读者对被引用论文的先验知识。因此，检索模型可能并不总是检索到最相关的上下文，这可能会影响后续摘要的质量。这可以解释为什么旨在为广大受众提供信息的摘要在人类评估中比上下文摘要得分更高。
我们的方法依赖于研究界不断改进的法学硕士。我们的实验结果可能会随着新法学硕士的引入而有所不同。然而，底层方法本身很直观，并且可以很容易地适应新的法学硕士（当它们可用时）。同样重要的是要认识到任何摘要技术的一个重要但经常被忽视的局限性，即鉴于其目的，缺乏对什么构成良好摘要的明确定义。在我们的例子中，摘要的目的是帮助读者理解引文的相关性，而无需查找被引用的论文。虽然我们使用摘要作为比较的参考，但我们的评估方法并没有引发与此目的相关的真实信息需求。这使得摘要和上下文摘要之间的公平比较变得困难。此外，专家注释者的可用性迫使我们集中精力在 NLP 领域，这意味着我们的结果可能无法推广到其他领域的科学论文。我们希望我们的工作能够鼓励研究界针对不同类型摘要的具体目的开发更强大的摘要评估方法。

LangChain组件Tools/Toolkits详解（5）——返回产出artifact 龙焰智能 langchain artifact ToolCall BaseTool 工具产物 ToolMessages
LangChain组件Tools/Toolkits详解（5）——返回产出artifact本篇摘要14.LangChain组件Tools/Toolkits详解14.5返回产出artifact14.5.1定义工具14.5.2使用ToolCall调用工具14.5.3与模型一起使用14.5.4从子例化BaseTool返回参考文献本章目录如下：《LangChain组件Tools/Toolkits详解（1）—
weixin089校园综合服务小程序+ssm(文档+源码)_kaic 开心毕设小程序微信小程序旅游微信 php
摘要随着我国经济迅速发展，人们对手机的需求越来越大，各种手机软件也都在被广泛应用，但是对于手机进行数据信息管理，对于手机的各种软件也是备受用户的喜爱，校园综合服务被用户普遍使用，为方便用户能够可以随时进行校园综合服务小程序的数据信息管理，特开发了基于校园综合服务小程序的管理系统。校园综合服务小程序的设计主要是对系统所要实现的功能进行详细考虑，确定所要实现的功能后进行界面的设计，在这中间还要考虑如何
Android一个APP里面最少有几个线程积跬步DEV Android 开发实战大全 Android
Android应用启动时，默认会创建一个进程，该进程中最少包含5个系统自动创建的线程，具体如下：Main线程（主线程/UI线程）负责处理用户交互、UI更新等核心操作，所有与界面相关的逻辑必须在此线程执行。若在此线程执行耗时操作（如网络请求），会导致界面卡顿甚至触发ANR（应用无响应）。FinalizerDaemon线程（终结者守护线程）当对象重写了finalize()方法时，该线程负责将这些对象放
Python UV - 安装、升级、卸载云客Coder python uv 开发语言
文章目录安装检查升级设置自动补全卸载UV命令官方文档详见：https://docs.astral.sh/uv/getting-started/installation/安装pipinstalluv检查安装后可运行下面命令，查看是否安装成功uv--version%uv--versionuv0.6.3(a0b9f22a22025-02-24)升级uvselfupdate将重新运行安装程序并可能修改您的
Python自动登陆、登出南京理工大学NJUST校园网程序 JimesMz python 开发语言
本文程序针对南京理工大学NJUST和NJUST-FREE校园网开发，其他学校无法使用。文章目录开发目的使用说明参考资料开发目的今天突然想要用代码实现一下自动登陆校园网，上网搜寻了一下。知乎有一些教程，CSDN也有一些完整的代码，但是我跟随教程或者直接运行现有代码都没有能够成功登陆，且NJUST校园网付费，我想要一个“登出”功能，借助Kimi自己写了一下。本人技术不精，以实现功能为主。使用说明请确保
《当人工智能遇上广域网：跨越地理距离的通信变革》程序猿阿伟人工智能
在数字化时代，广域网作为连接全球信息的纽带，让数据能够在不同地区的网络之间流动。然而，地理距离给广域网数据传输带来诸多挑战，如高延迟、低带宽、信号衰减和不稳定等问题。幸运的是，飞速发展的人工智能技术为解决这些难题提供了新的方向，开启了广域网传输的新篇章。广域网传输面临的地理挑战广域网覆盖范围极为广泛，可连接不同城市、国家甚至跨越洲际，这使得数据传输要跨越漫长的地理距离。以跨国公司的广域网为例，其总
Python实现微信自动发送消息热心市民小汪 python 微信开发语言
实现需求：Python定时发送微信消息importpyautoguiaspgimportpyperclipaspcfromapscheduler.schedulers.blockingimportBlockingScheduler"""实现定时自动发送消息"""#操作间隔为1秒pg.PAUSE=1name='Hello~'msg='是时候点餐啦！！'defmain():#打开微信pg.hotkey
【论文阅读】Persistent Homology Captures the Generalization of Neural Networks Without A Validation Set 开心星人论文阅读论文阅读
将神经网络表征为加权的无环图，直接根据模型的权重矩阵构造PD。计算相邻batch的权重矩阵PD之间的距离。比较同调收敛性与神经网络的验证精度变化趋势摘要机器学习从业者通常通过监控模型的某些指标来估计其泛化误差，并在训练数值收敛之前停止训练，以防止过拟合。通常，这种误差度量或任务相关的指标是通过一个验证集（holdoutset）来计算的。因为这些数据没有直接用于更新模型参数，通常假设模型在验证集上的
【论文阅读】实时全能分割模型万里守约论文阅读论文阅读图像分割图像处理计算机视觉
文章目录导言1、论文简介2、论文主要方法3、论文针对的问题4、论文创新点总结导言在最近的计算机视觉领域，针对实时多任务分割的需求日益增长，特别是在交互式分割、全景分割和视频实例分割等多种应用场景中。为了解决这些挑战，本文介绍了一种新方法——RMP-SAM（Real-TimeMulti-PurposeSegmentAnything），旨在实现实时的多功能分割。RMP-SAM结合了动态卷积与高效的模型
weixin089校园综合服务小程序+ssm(文档+源码)_kaic 开心毕设kaic_kaic 小程序 rabbitmq memcache big data postgresql
摘要随着我国经济迅速发展，人们对手机的需求越来越大，各种手机软件也都在被广泛应用，但是对于手机进行数据信息管理，对于手机的各种软件也是备受用户的喜爱，校园综合服务被用户普遍使用，为方便用户能够可以随时进行校园综合服务小程序的数据信息管理，特开发了基于校园综合服务小程序的管理系统。校园综合服务小程序的设计主要是对系统所要实现的功能进行详细考虑，确定所要实现的功能后进行界面的设计，在这中间还要考虑如何
【软考论文】论软件系统架构评估罗小爬EX 软考（系统架构师）软考系统架构师论文
目录一、题目二、论文2.1摘要2.2正文三、扩展3.1基础知识3.2评估方式综合对比3.3SAAM基于场景的架构分析方法3.4ATAM架构权衡分析方法3.5质量属性一、题目对于软件系统，尤其是大规模的复杂软件系统来说，软件的系统架构对于确保最终系统的质量具有十分重要的意义，不恰当的系统架构将给项目带来高昂的代价和难以避免的灾难。对一个系统架构进行评估，是为了：分析现有架构存在的风险，检验设计中提出
论文阅读：2023 arxiv Multiscale Positive-Unlabeled Detection of AI-Generated Texts CSPhD-winston-杨帆论文阅读论文阅读人工智能
总目录大模型安全相关研究：https://blog.csdn.net/WhiffeYF/article/details/142132328MultiscalePositive-UnlabeledDetectionofAI-GeneratedTextshttps://arxiv.org/abs/2305.18149https://www.doubao.com/chat/211427064915225
论文阅读笔记——MAGICDRIVE: STREET VIEW GENERATION WITH DIVERSE 3D GEOMETRY CONTROL 寻丶幽风论文阅读笔记论文阅读笔记 3d 人工智能自动驾驶
MagicDrive论文MagicDrive通过对3D数据和文本数据的多模态条件融合和隐式视角转换，实现了高质量、多视角一致的3D场景生成。几何条件编码Cross-attention：针对顺序数据，适合处理文本标记和边界框等可变长度输入。Additiveencoderbranch：对于地图等网络状规则数据，能够有效保留空间结构。对于文本按照模版构建：“Adrivingsceneat{locatio
【论文阅读】Availability Attacks Create Shortcuts 开心星人论文阅读论文阅读
还得重复读这一篇论文，有些地方理解不够透彻可用性攻击通过在训练数据中添加难以察觉的扰动，使数据无法被机器学习算法利用，从而防止数据被未经授权地使用。例如，一家私人公司未经用户同意就收集了超过30亿张人脸图像，用于构建商业人脸识别模型。为解决这些担忧，许多数据投毒攻击被提出，以防止数据被未经授权的深度模型学习。它们通过在训练数据中添加难以察觉的扰动，使模型无法从数据中学习太多信息，从而导致模型在未见
NLP高频面试题（十）——目前常见的几种大模型架构是啥样的 Chaos_Wang_ NLP常见面试题自然语言处理架构人工智能
深入浅出：目前常见的几种大模型架构解析随着Transformer模型的提出与发展，语言大模型迅速崛起，已经成为人工智能领域最为关注的热点之一。本文将为大家详细解析几种目前常见的大模型架构，帮助读者理解其核心差异及适用场景。1.什么是LLM（大语言模型）？LLM通常指参数量巨大、能够捕捉丰富语义信息的Transformer模型，它们通过海量的文本数据训练而成，能够实现高度逼真的文本生成、复杂的语言理
最新智能优化算法：贪婪个体优化算法（Greedy Man Optimization Algorithm，GMOA）求解23个经典函数测试集，MATLAB代码 IT猿手 MATLAB 智能优化算法算法 matlab 开发语言人工智能智能优化算法
一、贪婪个体优化算法贪婪个体优化算法（GreedyManOptimizationAlgorithm，GMOA）是HamedNozari与HosseinAbdi于2024年提出的一种新型受生物启发的元启发式算法，它模拟了抵抗变化的竞争个体的行为。GMOA引入了两个独特的机制：MMO抵抗机制，防止过早替换解；周期性寄生虫清除机制，促进多样性并避免停滞。该算法旨在解决传统优化算法中的过早收敛和缺乏多样性
基于AWS Endpoint Security（EPS）的自动化安全基线部署 weixin_30777913 云计算 aws python 安全架构
设计AWS云架构方案实现基于AWSEndpointSecurity(EPS)的自动化安全基线部署，AMSAdvanced（AWS托管服务）环境会为所有新部署的资源自动安装EPS监控客户端，无需人工干预即可建立统一的安全基线。这种自动化机制特别适用于动态扩缩的云环境，确保新启动的EC2实例、容器等终端设备从初始状态即受保护，以及具体实现的详细步骤和关键代码。以下是基于AWSEndpointSecur
2025最新智能优化算法：改进型雪雁算法（Improved Snow Geese Algorithm, ISGA）求解23个经典函数测试集荣华富贵8 程序员的知识储备1 程序员的知识储备2 程序员的知识储备3 经验分享
摘要随着智能优化算法的不断发展，解决高维、复杂的优化问题已成为研究的重要课题。雪雁算法（SnowGeeseAlgorithm,SGA）作为一种新兴的自然启发式优化算法，以其高效的全局搜索能力受到了广泛关注。然而，雪雁算法在处理多峰、多约束和高维复杂问题时，仍面临收敛速度较慢和易陷入局部最优解的问题。为此，本文提出了一种改进型雪雁算法（ISGA），通过引入自适应权重调整机制和混合局部搜索策略，增强了
机器学习 Day01人工智能概述山北雨夜漫步机器学习人工智能
1.什么样的程序适合在gpu上运行计算密集型的程序：此类程序主要运算集中在寄存器，寄存器读写速度快，而GPU拥有强大的计算能力，能高效处理大量的寄存器运算，因此适合在GPU上运行。像科学计算中的数值模拟、密码破解等场景的程序，都属于计算密集型，在GPU上运行可大幅提升运算速度。易于并行的程序：GPU采用SIMD架构，有众多核心，同一时间每个核心适合做相同的事。易于并行的程序能充分利用GPU这一特性
23、nc文件快速切片与索引爱转呼啦圈的小兔子气象数据处理与可视化 python 气象气象可视化气候变化
1前言在气象、海洋学和环境科学等领域，.nc（NetCDF）格式文件是存储和共享多维科学数据的常用格式。这些数据文件通常包含大量的经度、纬度、时间和垂直层次数据。在处理这些数据时，研究人员常常需要根据特定的地理和时间范围提取数据，以便进行深入分析。为此，我们开发了一个名为nc_slice的Python函数，用于从一个或多个.nc格式文件中高效地筛选和提取数据。nc_slice函数提供了一种简洁而灵
Java24的新特性 hello_ejb3 redis 数据库 java
Java语言特性系列Java5的新特性Java6的新特性Java7的新特性Java8的新特性Java9的新特性Java10的新特性Java11的新特性Java12的新特性Java13的新特性Java14的新特性Java15的新特性Java16的新特性Java17的新特性Java18的新特性Java19的新特性Java20的新特性Java21的新特性Java22的新特性Java23的新特性Java2
SAP-ABAP：ABAP内存使用详细说明爱喝水的鱼丶 ABAP开发之必须知道的 VIP详情查看专栏 SAP-ABAP开发基础详解 SAP 运维 ABAP 开发语言 ERP
在SAPABAP中，ABAP内存（ABAPMemory）是一种临时存储机制，用于在同一内部会话（InternalSession）中共享数据。ABAP内存的数据生命周期与当前程序及其调用的子程序相关，程序结束后数据会自动清除。以下是关于ABAP内存的详细说明：—##1.ABAP内存的特点-作用范围:仅在当前内部会话中有效。-生命周期:数据在当前程序及其调用的子程序中有效，程序结束后数据丢失。-共享范
《今日AI-人工智能-编程日报》-源自2025年3月20日小亦编辑部每日AI-人工智能-编程日报人工智能大数据
一、AI行业动态英伟达新一代AI芯片Rubin发布计划英伟达宣布其新一代AI芯片Rubin将于2026年下半年推出，下下一代AI芯片架构命名为Feynman，计划于2028年登场。同时，英伟达还推出了RTXPRO6000系列Blackwell专业卡，拥有24064核心、96GB显存和最高600W功耗。OpenAI星际之门数据中心建设进展OpenAI的首个数据中心“星际之门”预计于2026年中在德克
UV - Python 包管理丽英y Python uv python 开发语言
文章目录创建uv项目已有项目已有uv项目创建uv项目#创建项目uvinitm3#创建环境cdm3uvvenv--python3.11#激活环境source.venv/bin/activate#添加库uvaddflask如果创建项目后，给库取别的名字，add的时候，会自动创建.venv文件夹>uvvenv--python3.12e312[0]UsingCPython3.12.8interpreter
PyTorch核心基础知识点 niuTaylor 编程区 pytorch 人工智能 python
PyTorch核心基础知识点，结合最新特性与工业级实践，按优先级和逻辑关系分层解析：▍核心基石：张量编程（TensorProgramming）1.张量创建（8种生产级初始化）#设备自动选择（2024最佳实践）device="cuda"iftorch.cuda.is_available()else"mps"iftorch.backends.mps.is_available()else"cpu"#关键
Python新手入门 python流程控制基础1——条件语句if~~else；if~elif~else；不爱纸片人 python
提示：文章写完后，目录可以自动生成，如何生成可参考右边的帮助文档文章目录一、条件语句是什么？二、语句使用方法1.if.....2.if.......elif......3.if.......elif......else.......总结一、条件语句是什么？在Python中，条件语句用于根据不同的条件执行不同的代码块二、语句使用方法一共有三种if…if’…elif…if…elif…else…1.if
机器学习：让计算机学会思考的艺术平凡而伟大. 机器学习机器学习人工智能
目录什么是机器学习？机器学习的基本步骤常见的机器学习算法机器学习的实际应用如何入门机器学习？结语在当今数字化时代，机器学习（MachineLearning,ML）已经成为一个炙手可热的话题。从推荐系统到自动驾驶汽车，再到语音助手，机器学习的应用无处不在。然而，对于许多人来说，机器学习仍然是一个神秘而复杂的领域。本文将用通俗易懂的语言，带你走进机器学习的世界，了解它的基本原理和应用。什么是机器学习？
一文讲清楚深度学习和机器学习平凡而伟大. 机器学习人工智能深度学习机器学习人工智能
目录1.定义机器学习（MachineLearning,ML）深度学习（DeepLearning,DL）2.工作原理机器学习深度学习3.应用场景机器学习深度学习4.主要区别5.为什么选择深度学习？6.总结深度学习和机器学习是人工智能（AI）领域中两个密切相关但有所区别的概念。要清楚地解释它们之间的关系，我们可以从定义、工作原理、应用场景以及两者的主要区别等方面进行探讨。1.定义机器学习（Machin
AIOps：解决企业IT挑战的智能利器雅菲奥朗认证培训 AIOps SRE 可观测性
前言：在当今数字化的时代，企业IT基础设施和应用程序规模不断扩大，面临着日益复杂的挑战。在这种情况下，AIOps人工智能运维成为解决企业IT运维困境的智能利器。AIOps与可观测性密切相关，可观测性是实现AIOps的基础。通过收集、监视和理解系统数据，AIOps能够自动化运维任务、实时监控系统状态、预测潜在问题，从而提高效率和稳定性。AIOps尤其适用于IT运维部门，这是一个迫切需要此类技术的群体
autojs之乐旅商城自动报名自动约恶猫 javascript 前端开发语言 autojs 安卓脚本
之前用的。现在能不能用不知道了啊。自己测试吧。//一键亮屏device.wakeUp();device.wakeUpIfNeeded();sleep(1000);//滑开swipe(device.width/2,device.height*0.8,device.width/2,device.height*0.1,2000);sleep(2000);//一键开微信launchApp("微信");sl
js动画html标签（持续更新中） 843977358 html js 动画 media opacity
1.jQuery 效果 - animate() 方法改变 "div" 元素的高度： $(".btn1").click(function(){ $("#box").animate({height:"300px
springMVC学习笔记 caoyong springMVC
1、搭建开发环境 a>、添加jar文件，在ioc所需jar包的基础上添加spring-web.jar,spring-webmvc.jar b>、在web.xml中配置前端控制器 <servlet> &nbs
POI中设置Excel单元格格式 107x poi style 列宽合并单元格自动换行
引用：http://apps.hi.baidu.com/share/detail/17249059 POI中可能会用到一些需要设置EXCEL单元格格式的操作小结：先获取工作薄对象: HSSFWorkbook wb = new HSSFWorkbook(); HSSFSheet sheet = wb.createSheet(); HSSFCellStyle setBorder = wb.
jquery 获取A href 触发js方法的this参数无效的情况一炮送你回车库 jquery
html如下： <td class=\"bord-r-n bord-l-n c-333\"> <a class=\"table-icon edit\" onclick=\"editTrValues(this);\">修改</a> </td>" j
md5 3213213333332132 MD5
import java.security.MessageDigest; import java.security.NoSuchAlgorithmException; public class MDFive { public static void main(String[] args) { String md5Str = "cq
完全卸载干净Oracle11g sophia天雪 orale数据库卸载干净清理注册表
完全卸载干净Oracle11g A、存在OUI卸载工具的情况下：第一步：停用所有Oracle相关的已启动的服务；第二步：找到OUI卸载工具：在“开始”菜单中找到“oracle_OraDb11g_home”文件夹中 &
apache 的access.log 日志文件太大如何解决 darkranger apache
CustomLog logs/access.log common 此写法导致日志数据一致自增变大。直接注释上面的语法 #CustomLog logs/access.log common 增加： CustomLog "|bin/rotatelogs.exe -l logs/access-%Y-%m-d.log
Hadoop单机模式环境搭建关键步骤 aijuans 分布式
Hadoop环境需要sshd服务一直开启，故，在服务器上需要按照ssh服务，以Ubuntu Linux为例，按照ssh服务如下： sudo apt-get install ssh sudo apt-get install rsync 编辑HADOOP_HOME/conf/hadoop-env.sh文件，将JAVA_HOME设置为Java
PL/SQL DEVELOPER 使用的一些技巧 atongyeye java sql
1 记住密码这是个有争议的功能，因为记住密码会给带来数据安全的问题。但假如是开发用的库，密码甚至可以和用户名相同，每次输入密码实在没什么意义，可以考虑让PLSQL Developer记住密码。位置：Tools菜单－－Preferences－－Oracle－－Logon HIstory－－Store with password 2 特殊Copy 在SQL Window
PHP：在对象上动态添加一个新的方法 bardo 方法动态添加闭包
有关在一个对象上动态添加方法，如果你来自Ruby语言或您熟悉这门语言，你已经知道它是什么...... Ruby提供给你一种方式来获得一个instancied对象，并给这个对象添加一个额外的方法。好！不说Ruby了，让我们来谈谈PHP PHP未提供一个“标准的方式”做这样的事情，这也是没有核心的一部分... 但无论如何，它并没有说我们不能做这样
ThreadLocal与线程安全 bijian1013 java java多线程 threadLocal
首先来看一下线程安全问题产生的两个前提条件： 1.数据共享，多个线程访问同样的数据。 2.共享数据是可变的，多个线程对访问的共享数据作出了修改。实例：定义一个共享数据： public static int a = 0;
Tomcat 架包冲突解决征客丶 tomcat Web
环境： Tomcat 7.0.6 win7 x64 错误表象：【我的冲突的架包是：catalina.jar 与 tomcat-catalina-7.0.61.jar 冲突，不知道其他架包冲突时是不是也报这个错误】严重: End event threw exception java.lang.NoSuchMethodException: org.apache.catalina.dep
【Scala三】分析Spark源代码总结的Scala语法一 bit1129 scala
Scala语法 1. classOf运算符 Scala中的classOf[T]是一个class对象，等价于Java的T.class,比如classOf[TextInputFormat]等价于TextInputFormat.class 2. 方法默认值 defaultMinPartitions就是一个默认值，类似C++的方法默认值
java 线程池管理机制 BlueSkator java线程池管理机制
编辑 Add Tools jdk线程池一、引言第一：降低资源消耗。通过重复利用已创建的线程降低线程创建和销毁造成的消耗。第二：提高响应速度。当任务到达时，任务可以不需要等到线程创建就能立即执行。第三：提高线程的可管理性。线程是稀缺资源，如果无限制的创建，不仅会消耗系统资源，还会降低系统的稳定性，使用线程池可以进行统一的分配，调优和监控。
关于hql中使用本地sql函数的问题（问-答） BreakingBad HQL 存储函数
转自于：http://www.iteye.com/problems/23775 问：我在开发过程中，使用hql进行查询（mysql5）使用到了mysql自带的函数find_in_set()这个函数作为匹配字符串的来讲效率非常好，但是我直接把它写在hql语句里面（from ForumMemberInfo fm,ForumArea fa where find_in_set(fm.userId,f
读《研磨设计模式》-代码笔记-迭代器模式-Iterator bylijinnan java 设计模式
声明：本文只为方便我个人查阅和理解，详细的分析以及源代码请移步原作者的博客http://chjavach.iteye.com/ import java.util.Arrays; import java.util.List; /** * Iterator模式提供一种方法顺序访问一个聚合对象中各个元素，而又不暴露该对象内部表示 * * 个人觉得，为了不暴露该
常用SQL chenjunt3 oracle sql C++c C#
--NC建库 CREATE TABLESPACE NNC_DATA01 DATAFILE 'E:\oracle\product\10.2.0\oradata\orcl\nnc_data01.dbf' SIZE 500M AUTOEXTEND ON NEXT 50M EXTENT MANAGEMENT LOCAL UNIFORM SIZE 256K ; CREATE TABLESPA
数学是科学技术的语言 comsci 工作活动领域模型
从小学到大学都在学习数学，从小学开始了解数字的概念和背诵九九表到大学学习复变函数和离散数学，看起来好像掌握了这些数学知识，但是在工作中却很少真正用到这些知识，为什么？最近在研究一种开源软件-CARROT2的源代码的时候，又一次感觉到数学在计算机技术中的不可动摇的基础作用，CARROT2是一种用于自动语言分类（聚类）的工具性软件，用JAVA语言编写，它
Linux系统手动安装rzsz 软件包 daizj linux sz rz
1、下载软件 rzsz-3.34.tar.gz。登录linux，用命令 wget http://freeware.sgi.com/source/rzsz/rzsz-3.48.tar.gz下载。 2、解压 tar zxvf rzsz-3.34.tar.gz 3、安装 cd rzsz-3.34 ; make posix 。注意：这个软件安装与常规的GNU软件不
读源码之:ArrayBlockingQueue dieslrae java
ArrayBlockingQueue是concurrent包提供的一个线程安全的队列,由一个数组来保存队列元素.通过 takeIndex和 putIndex来分别记录出队列和入队列的下标,以保证在出队列时不进行元素移动. //在出队列或者入队列的时候对takeIndex或者putIndex进行累加,如果已经到了数组末尾就又从0开始,保证数
C语言学习九枚举的定义和应用 dcj3sjt126com c
枚举的定义 # include <stdio.h> enum WeekDay { MonDay, TuesDay, WednesDay, ThursDay, FriDay, SaturDay, SunDay }; int main(void) { //int day; //day定义成int类型不合适 enum WeekDay day = Wedne
Vagrant 三种网络配置详解 dcj3sjt126com vagrant
Forwarded port Private network Public network Vagrant 中一共有三种网络配置，下面我们将会详解三种网络配置各自优缺点。端口映射(Forwarded port)，顾名思义是指把宿主计算机的端口映射到虚拟机的某一个端口上，访问宿主计算机端口时，请求实际是被转发到虚拟机上指定端口的。Vagrantfile中设定语法为： c
16.性能优化-完结 frank1234 性能优化
性能调优是一个宏大的工程，需要从宏观架构(比如拆分，冗余，读写分离，集群，缓存等)，软件设计（比如多线程并行化，选择合适的数据结构），数据库设计层面（合理的表设计，汇总表，索引，分区，拆分，冗余等）以及微观（软件的配置，SQL语句的编写，操作系统配置等）根据软件的应用场景做综合的考虑和权衡，并经验实际测试验证才能达到最优。性能水很深，笔者经验尚浅，赶脚也就了解了点皮毛而已，我觉得
Word Search hcx2013 search
Given a 2D board and a word, find if the word exists in the grid. The word can be constructed from letters of sequentially adjacent cell, where "adjacent" cells are those horizontally or ve
Spring4新特性——Web开发的增强 jinnianshilongnian spring spring mvc spring4
Spring4新特性——泛型限定式依赖注入 Spring4新特性——核心容器的其他改进 Spring4新特性——Web开发的增强 Spring4新特性——集成Bean Validation 1.1(JSR-349)到SpringMVC Spring4新特性——Groovy Bean定义DSL Spring4新特性——更好的Java泛型操作API Spring4新
CentOS安装配置tengine并设置开机启动 liuxingguome centos
yum install gcc-c++ yum install pcre pcre-devel yum install zlib zlib-devel yum install openssl openssl-devel Ubuntu上可以这样安装 sudo aptitude install libdmalloc-dev libcurl4-opens
第14章工具函数（上） onestopweb 函数
index.html <!DOCTYPE html PUBLIC "-//W3C//DTD XHTML 1.0 Transitional//EN" "http://www.w3.org/TR/xhtml1/DTD/xhtml1-transitional.dtd"> <html xmlns="http://www.w3.org/
Xelsius 2008 and SAP BW at a glance blueoxygen BO Xelsius
Xelsius提供了丰富多样的数据连接方式，其中为SAP BW专属提供的是BICS。那么Xelsius的各种连接的优缺点比较以及Xelsius是如何直接连接到BEx Query的呢？以下Wiki文章应该提供了全面的概览。 http://wiki.sdn.sap.com/wiki/display/BOBJ/Xcelsius+2008+and+SAP+NetWeaver+BW+Co
oracle表空间相关 tongsh6 oracle
在oracle数据库中，一个用户对应一个表空间，当表空间不足时，可以采用增加表空间的数据文件容量，也可以增加数据文件，方法有如下几种： 1.给表空间增加数据文件 ALTER TABLESPACE "表空间的名字" ADD DATAFILE '表空间的数据文件路径' SIZE 50M; &nb
.Net framework4.0安装失败 yangjuanjava .net windows
上午的.net framework 4.0，各种失败，查了好多答案，各种不靠谱，最后终于找到答案了和Windows Update有关系，给目录名重命名一下再次安装，即安装成功了！下载地址：http://www.microsoft.com/en-us/download/details.aspx?id=17113 方法： 1.运行cmd，输入net stop WuAuServ 2.点击开