user_kay

论文阅读《API2Com: On the Improvement of Automatically Generated Code Comments Using API Documentations》

第一篇论文笔记，感觉还是有点偏向于全文翻译+个人想法
文章链接：https://ieeexplore.ieee.org/document/9463033
笔记原链接：https://shimo.im/docs/dPkpKnywe6FMmJqO

Abstract

代码注释可以帮助理解程序，并且被认为是帮助开发人员进行软件维护的重要构件。然而，这些评论大多缺失或过时，特别是在复杂的软件项目中。

在本文中，作者提出了API2Com模型，这是一个利用应用程序编程接口文档（API Docs）作为注释生成知识资源的模型。API文档包含更详细的方法描述，因此可以注释。

作者将该模型应用于超过130000种方法的大型Java数据集，并使用Transformer和RNNbase架构对其进行评估。有趣的是，当使用API文档时，性能的提高可以忽略不计。因此，作者进行了不同的实验来解释结果。对于只包含一个API的方法，添加API文档会使结果平均提高4%的BLEU分数（BLEU分数是机器翻译中使用的自动评估指标）。然而，随着方法中使用的API数量的增加，由于输入中使用的文档较长，模型在生成注释时的性能会降低。作者的结果证实，API文档可以用于生成更好的评论，但是，需要新的技术来识别方法中信息量最大的文档，而不是同时使用所有文档。

索引术语：代码注释生成、API文档、外部知识源

I. Introduction

作者首先简述了代码注释对程序员的作用，其次作者提到了近年来主要的一个趋势是使用神经网络进行生成。而在此基础上，如果引入外部知识，将会对评论的质量有进一步的提高。

为此，作者提出了一个简单的例子，就以创建和写入json文件常用的FileWriter.write和FileWriter.flush这两个方法为例子，如果把他们的api文档的含义一并写出，那么他们生成的注释将会更客观。

具体的，作者举了两个例子如下：

这里的注释是从作者所使用的dataset里的，作者通过对比API文件与dataset中获取的注释综合考虑，认为如果结合API文档中的信息，注释将会更加客观。

尽管API的名称已在以前的工作中使用[21]，但尚未对API的描述进行探讨。仅使用API名称可能无法正确交付代码的功能。相比之下，API文档基于自然语言，并包含更多细节，这对于生成全面的评论非常有用。因此，作者开发了API2Com，这是一个利用API文档丰富生成评论的模型。在该模型中，作者使用API文档、AST和源代码作为三编码器架构的输入。AST捕获了代码的结构表示，并在之前的一些相关研究中使用[11，16，17，18，19，22]。API文档与代码序列一起作为另一种资源添加，以生成注释。作者最初利用Transformer架构[23]来学习代码的语义表示。

第二节解释了选择Transformer而非其他架构的原因。作者对一个包含Husain等人[24]收集的137007条记录的大型Java数据集进行了研究，并进行了几个实验，以了解将API文档添加到模型后的效果

有趣的是，尽管作者使用了外部知识源，但作者的结果表明，性能的提高是微不足道的。因此，作者进行了更多的实验来分析结果，并在本文中报告作者的发现。作者发现，随着方法中使用的API数量的增加，API文档的价值会降低。这主要是因为当使用更多的API文档时，会向模型输入长文本。然而，评论和API文档之间的常用词数量极低。

当API文档的数量超过三个时，这会导致API文档增加噪声。作者使用门控递归单元（GRU）架构获得了类似的结果，虽然GRU比其他门控机制方法LSTM更有效[25]。

这些发现表明，API文档有助于改进评论，但应开发新技术仅包含信息性内容来进行处理。这些结果和作者的见解可能会使研究人员避免采用相同的方法，同时为集成API文档以生成评论开辟新的研究途径。

作者在本研究的贡献总结如下：

提出了一个Transformer模型，该模型将API文档与源代码和AST相结合，以生成注释。为此，作者提取代码段中使用的API的所有相应注释。
除了将API2Com与其他baseline进行比较之外，作者还进行了一些实验，以了解添加API文档的效果。

本文的其余部分组织如下。在第二节中，作者解释了其方法的细节，然后是第三节和第四节中的实验和结果。第五节对第四节中的结果进行一个系统性的讨论。第六节提到了对实验结果有效性的威胁。第七节总结了相关研究，第八节总结了本文。

II. Proposed Approach

A Overview

在该模块中，作者绘制出API2Com架构如下图2所示。API2Com由三个编码器组成，分别使用code tokens, AST traversal sequence（AST遍历序列）, and a list of API documentations（API文档列表）作为三个不同编码器的输入。其中，AST表示代码的语法结构，并通过树遍历将其变平，以提供给模型；API文档是自然语言，是代码语义的补充。

在该模型中，源代码能够表示语法和语义表示，而加入AST和API文档丰富了这两种表示。这三个编码器具有相似的架构，这三个encoder的结果将会被连接并传递给解码器以生成注释。

B Transformer

基于RNN的神经网络主要利用编码器-解码器架构，其中编码器将输入序列映射到矢量，解码器使用编码器的矢量一次生成一个字的输出序列。在本文的工作中，transformer被用于编码器和解码器，它利用了多头自注意力multi-headed self-attention mechanism和位置编码positional encoding。具体的详细说明如下：

Encoder

编码器组合了多个相同的层，其中每个层由两个子层组成[23]。第一个子层包含多头自注意力机制，而另一个子层是全连接层。两个子层之后是另一层，该层会对每个子层的输出结果进行归一化处理

Decoder

与Encoder结构相似，但是Decoder在Encoder堆叠的子层之外，额外增加了一个子层对输出进行多头注意力机制处理

Multi-head attention mechanism

就是很普通的多头自注意力机制，作者没有在这部分进行改进，所以我在这里不过多赘述
可以看这个视频进行了解：https://www.bilibili.com/video/BV1sN4y1g768/?spm_id_from=333.337.search-card.all.click&vd_source=e7e66988b2137e8db93279ffe39c55e7

Positional Encoding

鉴于该模型不包括重复，需要考虑tokens的相对位置和绝对位置的一些信息，作者在这里使用了positional Encoding的技术。作者在这部分没有进行过多的改进，所以我在这里不过多赘述。

C API documentation

作者从JDK参考文档中提取每个方法中使用的每个API的API文档知识。JDK参考文档包含各种级别的文档，包括包、类和方法，但作者在API2Com模型中仅使用包含方法的文档。

在这里，作者以图1中左边的例子为例（如下图）

如图所示，该程序段包含了被列在 java.lang.reflect.Executable class的JDK文档下的api方法isSynthetic()。在该class的文档中包含两个方面：1）修饰符与类型 2）方法以及方法的描述。在这里，作者仅提取了方法及其描述方面的内容。以上图为例，作者提取了API文档中“Returns true if… returns false otrherwise.”这一部分的内容。

在此基础上，作者提取了方法中所有API中关于方法描述的内容（与上述例子异曲同工），并在拼接后用作模型的第一个编码器的输入使用。

III. Experiments

A. Dataset and Preprocessing

作者使用由Husain等人[24]引入的CodeSearchNet数据集的Java部分来训练和测试API2Com。该数据集在最近的研究中用于各种软件工程任务，包括注释生成[19，33]，质量较高。具体而言，CodeSearchNet是一组数据集，最初是在Libraries.io的帮助下通过抓取开源GitHub存储库收集的。在此基础上，作者剔除了数据集中所有少于三行标记的注释和少于三行的代码，以确保数据集的质量。除此之外，作者将构造函数、扩展方法和名称中带有“test”的方法、重复项和自动生成的方法也一并从数据集中删除。

与Feng等人的工作类似[33]，作者还将代码和注释的最大长度分别设置为256和64。由于无法为截断的代码生成AST，并且可能会导致有价值的信息丢失，因此作者必须排除代码或注释长度大于256或64的记录。由于某些模型使用AST，因此需要在所有模型之间进行公平比较。
表I显示了数据集的统计信息。数据集分为训练集、验证集和测试集，比例分别为8/1/1。作者使用训练集和验证集来训练模型，测试集用于评估。继之前的工作[16]之后，作者在训练之前进一步预处理数据集，将tokens分为使用CamelCase或Snakecase的tokens；并将所有tokens转换为小写；以及从代码中删除标点符号。

B. API Documentation Extraction

作者开发了一个scraper工具（scraper是一款网站数据提取工具,类似于爬虫,但不需要像python爬虫那样编写代码,使用门槛较低,适用于轻度的数据爬取）来下载JDK参考文档中每个模块和类中的所有API及其相应描述。为了从数据集中的方法中提取API名称，作者使用了srcML工具（来源：https://www.srcml.org/），它可以从源代码构建AST树，并将结果显示为XML标记。通过这样的表示方法，它能够表示出tokens的信息。就比如，如果它正在调用另一个函数，则可以将标记标记为“methodCall”。使用这些信息，作者可以通过遍历AST树来提取所有API名称。然后，作者将每个方法中使用的API名称与收集的数据集相匹配，以检索它们的描述。对于重载函数，则使用参数的数量来提取正确的文档。如果JDK参考文档中多次出现相同的API和不同的API文档，则使用频率最高的文档。

C. Model Training

为了训练模型，作者在第一个编码器中使用API Docs，第二个编码器使用扁平AST（flatten ast），最后一个编码器使用预处理的源代码。这三个编码器的结果被级联以作为单个输入传递给解码器。

D. Experiment setting

作者使用PyTorch框架进行模型的开发，将编码器和解码器层的数量设置为6，多头自注意力子层中的数量设置为8，使用初始速率为0.1的随机梯度下降优化器。

作者用UNK替换了词表外的tokens，隐藏状态和批次大小的维度分别设置为512和32。为了减少过度拟合的概率，作者使用值为0.1的丢弃率。训练共执行100个epoch，但如果学习率下降到 $ 10^{-7} $ ，训练就会停止，并基于验证数据集的损失函数值选择最佳epoch。

执行模型的设备：搭建NVIDIA Tesla V100 GPU和32 GB内存的Linux服务器。

E. Evaluation Metrics

与先前在代码注释生成中的研究类似[12，18，27]，作者基于以下指标评估性能：BLEU[34]，ROUGE-L[35]和METEOR[36]，并给出了各指标的含义。

BLEU-n分数在简短惩罚[34]的帮助下量化了参考句子和预测句子之间的平均n-gram准确性，并报告了n∈ [1, 4]. ROUGE-L使用F分数，该分数被计算为通过查找文本的最长公共序列获得的召回和精度值的加权调和平均值[35]。METEOR是一种基于回忆的度量，它衡量模型在捕获参考句子内容方面的表现，并基于参考文本和预测文本之间相同的n-gram的数量[36]。

F . Baselines

在该模块中，作者使用处理后的CodeSearchNet数据集对AST-Attendgru、TL-CodeSum、Rencos、TransformerBased，以及API2COM的多个变体模型对API2COM模型进行测试。

在这里，个人认为需要对TransformerBased和API2COM的变体这两个模型进行一个具体的阐述。

TransformerBased模型：最早利用Transformer生成评论的研究之一。Ahmad等人[27]研究了transformer模型生成代码注释的有效性，并进一步将相对位置编码和注意力机制结合到transformer中，以提高生成评论的质量。

Variations of API2Com模型：在这里，作者使用API2Com的变体来比较其组件的有效性。

其中，API2COMbase是不使用AST和API Docs的Transformer架构模型，

API2COMast使用两个编码器来编码AST和输入代码，而不使用API Docs。

类似地，API2COMapi仅使用输入代码和API文档。

最后，API2COMfull是使用所有三个输入的模型，也就是下图所示的完整API2COM模型

IV. RESULTS

A. Research Questions

RQ1: How does our proposed approach perform compared to the baselines?

表2（如下图）展示了在测试集下各baseline各指标下的得分情况。

从下表中可以看出，Transformer-based模型在所有模型中表现最好，由于作者采用的是原始的transformer模型，而不是Transformer-based模型中改良过的版本，所以作者在后续也计划尝试将Transformer-based中的模型与本文中的方法结合起来。

其次，使用RNN架构的baseline效果对比起transformer效果较差，这也说明了transformer在处理这类任务效果更好。但有趣的是，作者将AST作为输入信息加入到transformer模型后，指标得分将会有轻微的降低（可以详细对比表中API2COMast和API2COMbase的数据）作者在这里给出的理由是：transformer架构具有能够捕获各tokens之间的关系的优势，所以加入AST会降低transformer的分析效果。

对于除ROUGE-L之外的所有指标，第二好的结果属于API2COMapi，其次是Rencos，AST-Attendgru和TL-CodeSum。

RQ2: What is the effect of each component of API2Com in generating comments?

为了研究API2COM的方法，作者也将各部分组件进行了测试并将数据放在了表2。除此之外，作者还将该方法应用在了GRU模型（替换transformer模型）上，从而进一步查看该方法的效果，并将其命名为API2COMS模型，在这部分的实验中，作者也采用了同样的方法对模型进行拆分，查看各部分的一个效果，并记录在了表3（如下所示）中。

通过对比可以证明，在两种架构中，如果结合AST都会在一定程度上降低模型的性能，而结合API文档则会提高指标下的得分。然而，通过数据的对比，作者可以发现这种变化都是比较不明显的。就算使用完整模型也只会在所有分数中有轻微的变化。值得注意的是，API2ComS的结果还略低于TL CodeSum。
综上所述，由于AST会在一定程度上降低模型的性能，所以在本文的其余部分，作者仅对API2COMbase和API2COMapi进行了实验。

RQ3: What is the effect of number of APIs on the performance of API2Com?

在这个研究问题中，作者研究了API2COMapi在数据集的不同子集中的性能：当一个方法具有一个API、两个API、三个API和四个或更多个API时。每一个方法都有可能利用1个到多个api来实现它的功能。

在API2Com中，作者在拼接后用作模型的第一个编码器的输入使用，这样的方式会导致多行的文档变得彼此相邻，并且可能会给注释添加噪声。这可能也是导致API2COM模型效果提升不明显的原因。

按我的理解的话，就比如在一个method中，同时调用了isSynthetic和setDefaultButton这两个api，而由于训练的时候没有划分各api数量的数据集，所以这两个api的名字和描述堆在一起，在生成的时候效果就会变差。

出于此原因，作者根据方法中使用的API的频率分割数据集来进行实验，表V显示了每次拆分中注释和API文档的平均长度。

在此基础上，作者在新分离的数据集上训练和测试API2COMbase和API2COMapi模型。
结果列于表四。

表的最后一列显示了所有指标的改进得分的平均值。结果证实，添加API文档是有效的，尽管提升的效果很小。然而，随着API数量的增加，这种影响变得更小。

从表中可以看出，如果method中只使用一个api，那么在数据上平均能提高3.72%，两个API的性能能提高2.42%，三个API仅能提高1.09%。

不过这种影响可能与添加到输入中的API文档的长度有关，如表V所示。当使用一个API时，api文档的长度与代码注释的长度大致相同，而随着method中使用api数量的增多，api文档的长度将会远远长于代码注释的长度，这也会导致一定的负面效果。而由于数据集中使用三个以上API的methods占整个测试数据集的25%以上。这一较大比例会对RQ1和RQ2中报告的结果产生负面影响，所以综合数据上看,API2COMbase相比，API2COMapi的结果改善微不足道。

B：Human Evaluation

作者通过进行定性分析来评估结果。在这个实验中，作者随机抽取了100条记录，使得RQ3每个API都有相同数量的记录。每个样本由3名随机受试者进行评估，最后计算相同数量API的每组平均得分。总共有43名评估人员参加了这项调查。评估人员被要求与参考文本相比，对API2Comapi和API2ComBase每个生成的评论给出1到5之间的相似性评分。其中，1表示最低相似度，5表示最高相似度。API2Comapi和API2ComBase得到的分数分别为2.99和3.16，该结果证实，API2Comapi虽然能够改进了生成的评论，但改进效果一般。

如果将结果按API的数量进行划分，结果也与RQ3中的推论一致，当使用一个API时，两个模型之间的差异更大，API2Comapi将分数从3.08提高到3.39，而添加更多的API会降低效果。

但是与使用指标进行度量的结果相反，当使用3个以上API时，API2Comapi的人工评估平均得分为3.17，高于API2ComBase的2.73分。原因可能取决于这样一个事实，即在该模块中，该模型不基于API频率进行分离，但在RQ3中，模型是针对包含不同数量API的每个数据集单独训练的。作者出于对 API2Comapi的总体评估感兴趣并没有在这里分离模型进行单独训练。

V. DISCUSSIONS

Number of API Docs

作者在上述部分讨论了添加API文档可以改善生成的评论，只要链接的文档数量少于三个即可。

图3显示了四种方法及其来自数据集的参考注释、API2ComBase和API2COMapi生成的注释、每个方法中使用的API名称以及连接的API文档。

最顶上的方法只有一个API，API Doc能够帮助API2COMapi在注释中生成Returns true，效果较好。

左中方法有两个API。尽管第一个API（lastIndexOf）的文档有助于生成更好的注释，但第二个文档并没有让API2COMapi添加任何信息。

右中间的方法包含三个API，在这种情况下，API文档似乎给模型增加了噪音，因此无法帮助生成更好的注释。

最后，底部方法有六个API，这促使模型生成错误的注释。API2ComBase正在生成了正确的代码注释，而API2ComAPI被API文档误导，导致产生错误短语“xml文档”，效果较差。

API categories

为了探究API种类对结果的影响，作者随机选择了368种方法，使用Sample Size Calculator工具（https://www.surveysystem.com/sscalc.htm）制作了置信水平为95%，置信区间为5的具有代表性样本数量的测试集。

首先，作者选择了100个并不常见的随机样本，由两位在Java开发方面有三年经验的作者独立阅读了100种方法并定义了进行将要进行分类的类别（类别由Hu[37]等人的研究以及作者的探究结合得出），并按照讨论的类别将368种方法进行分类。分类结束后，再由一位有5年开发经验的人员对分号的类别进行检查，最终得到数据统计如表6所示。

对于每一个类别，作者进行了试验并分别计算了它们的BLEU分数，最后一组类别和每个类别中方法的数量如表VI所示。从表中可以看出，设置更新和算法这一类api的注释得分会增加，而对象创建/检索、字符串处理和文件操作的得分会降低。这种变化可能与每个类别中的文档有关，在某些类别中有所帮助，而在其他类别中信息较少。
作者通过手动研究样本的方式打算找到特定的模式，目的是确定增加特定类别中的API数量是否有助于改进结果。然而，当添加更多的API样本有助于生成更好的评论时，发现得分并没有像希望的那样越来越好。
作者将这种差异与两个原因联系起来。首先，仅依靠指标进行评分不是100%可靠的，因为它们并没有考虑文本的语义相似性[38]。其次，API文档在生成更好的注释方面的重要性很可能取决于该方法的功能性。

Low frequency words

通过观察，虽然API2Com的设计目的不是解决低频词的问题，但是作者发现添加api文档作为输入可以提高注释中出现低频词的次数，并列出了具体的相关数据，具体如下表所示。

Adverse effect

由于API的数量越多会降低模型的性能，因此需要设计一种仅检索关键信息的API的策略可能是一种更有效的方法，否则api数量的增多只会增加噪声，影响代码的生成。

VI. THREAT TO VALIDITY

Internal validity（内部有效性）

首先，作者的模型没有检查API之间的差异，而是考虑方法中使用的所有API的API文档，这可能导致发送到API编码器的数据重复性较高，从而进一步导致在生成使用三个以上的API的方法时注释效果的不佳。然而在实际操作的过程中，作者检查后发现在该情况下API2COMapi的效果并没有收到影响。
其次，作者考虑到在生成路径的过程中，并没有使用有助于调查不同的路径并产生更好的评论的beam search等搜索方法（https://zhuanlan.zhihu.com/p/82829880），这也可能会导致生成大量的重复词语进而导致得分的下降，但是作者经过手动检查后发现这样的情况并没有发生。
除此之外，作者还考虑到了baselines执行结果方面的问题，作者已经仔细检查了代码的正确性。为了运行基线，作者使用了模型的公开库，并使用了原作者建议的最佳参数来减轻baseline带来的影响。

External validity（外部有效性）

在该模型中，作者使用了大型高质量数据集来提高Java结果的有效性。然而，结果可能无法推广到其他编程语言。尽管如此，API2Com可以应用于其他语言，因为它不是仅针对JAVA语言来实现的，其他语言同样适用。

Construct Validity

在模型的评估中，作者不仅使用了BLEU, METEOR, and ROUGE-L作为指标对模型和baselines进行分析，而且还针对用户进行了定性分析，这能确保baselines和模型之间对比结果的准确性。

VII. RELATED WORKS

提了一些相关工作，这里直接进行翻译，不过多赘述。

VIII. CONCLUSION AND FUTURE WORKS

作者认为目前结果总体上并不乐观，但当一个方法中的API数量少于3个时，API文档可能会很有用。这些结果可以为新技术的研究开辟道路，以将API文档用于注释生成，例如为API类别添加权重或在方法中识别信息丰富的API。

2025年第二届机器学习与神经网络国际学术会议(MLNN 2025) 分享学术科研与论文的禁小默机器学习神经网络人工智能
重要信息官网：www.icmlnn.org时间：2025年4月22-24日地点：中国-重庆简介2025年第二届机器学习与神经网络国际学术会议（MLNN2025）围绕学习系统与神经网络的核心理论、关键技术和应用展开讨论，涵盖深度学习、计算机视觉、自然语言处理、强化学习等多个子领域，通过特邀报告、主题演讲、海报展示等形式，展示相关领域的最新研究成果和技术创新。征稿主题神经网络机器学习深度学习算法及应用
深度学习--概率 fantasy_arch 深度学习人工智能
1基本概率论1.1假设我们掷骰子，想知道1而不是看到另一个数字的概率，如果骰子是公司，那么所有6个结果(1..6),都有相同的可能发生，因此，我们可以说1发生的概率为1/6.然而现实生活中，对于我们从工厂收到的真实骰子，我们需要检查它是否有瑕疵，唯一的办法就是多投掷骰子，对于每个骰子观察到的[1.2...6]的概率随着投掷次数的增加，越来越接近1/6.导入必要的包%matplotlibinline
Open3D 点云DBSCAN聚类算法 MelaCandy 算法聚类 numpy 计算机视觉图像处理 3d
目录一、DBSCAN基本原理二、代码实现2.1关键函数2.2完整代码三、实现效果3.1原始点云3.2聚类后点云Open3D点云算法汇总及实战案例汇总的目录地址：Open3D点云算法与点云深度学习案例汇总（长期更新）-CSDN博客一、DBSCAN基本原理DBSCAN（Density-BasedSpatialClusteringofApplicationswithNoise）是一种基于密度的聚类算法，
目标检测领域总结：从传统方法到 Transformer 时代的革新 DoYangTan 目标检测系列目标检测 transformer 人工智能
目标检测领域总结：从传统方法到Transformer时代的革新目标检测是计算机视觉领域的一个核心任务，它的目标是从输入图像中识别并定位出目标物体。随着深度学习的兴起，目标检测方法已经取得了显著的进展。从最早的传统方法到现如今基于Transformer的先进算法，目标检测的发展经历了多个重要的阶段。本文将详细总结目标检测领域的演进，涵盖传统方法、两阶段检测方法、单阶段检测方法和基于Transform
2024MathorCup数学建模之——MathorCup奖杯”获得者经验思路分享美赛数学建模数学建模
一、经验分享1.工具选择：顺手即可。Matlab和Python都是比较主流的选择，二者的应用场合各有不同。Python在数据分析、深度学习方面的优势愈发明显，而Matlab更适合进行物理仿真和数值计算。不过随着Python社区不断发展，其功能也愈发全面与强大，因此我们比较推荐学有余力的情况下可以更早接触Python。2.模型算法：多多益善。不一定要精通所有的算法，但是手上至少要准备一些常用的算法（
AI人工智能软件开发方案：开启智能时代的创新钥匙广州硅基技术官方人工智能
一、引言：AI浪潮下的软件开发新机遇近年来，人工智能（AI）技术的迅猛发展如同一股汹涌澎湃的浪潮，席卷了全球各个领域。从最初的概念提出到如今的广泛应用，AI历经了漫长的发展历程，终于迎来了属于它的黄金时代。回首过去，AI的发展并非一帆风顺，早期由于计算能力和算法的限制，经历了多次起伏。但随着大数据、云计算、机器学习、深度学习等技术的不断突破，AI迎来了爆发式增长。如今，AI已经深入到人们生活和工作
深度学习框架PyTorch——从入门到精通（6.2）自动微分机制 Fansv587 深度学习 pytorch 人工智能经验分享 python 机器学习
本节自动微分机制是上一节自动微分的扩展内容自动微分是如何记录运算历史的保存张量非可微函数的梯度在本地设置禁用梯度计算设置requires_grad梯度模式（GradModes）默认模式（梯度模式）无梯度模式推理模式评估模式（`nn.Module.eval()`）自动求导中的原地操作原地操作的正确性检查多线程自动求导CPU上的并发不确定性计算图保留自动求导节点的线程安全性C++钩子函数不存在线程安全
Pytorch深度学习教程_9_nn模块构建神经网络 tRNA做科研深度学习保姆教程深度学习 pytorch 神经网络
欢迎来到《深度学习保姆教程》系列的第九篇！在前面的几篇中，我们已经介绍了Python、numpy及pytorch的基本使用，进行了梯度及神经网络的实践并学习了激活函数和激活函数，在上一个教程中我们学习了优化算法。今天，我们将开始使用pytorch构建我们自己的神经网络。欢迎订阅专栏进行系统学习：深度学习保姆教程_tRNA做科研的博客-CSDN博客目录1.理解nn模块：(1)使用nn.Sequent
Radiance Fields from VGGSfM和Mast3r:两种先进3D重建方法的比较与分析 2401_87458718 3d
VGGSfM和Mast3r:3D场景重建的新方向在计算机视觉和3D重建领域,如何从2D图像重建3D场景一直是一个充满挑战的研究课题。近年来,随着深度学习技术的发展,一些新的方法被提出并取得了显著的进展。本文将重点介绍两种最新的基于深度学习的3D重建方法:VGGSfM和Mast3r,并通过GaussianSplatting技术对它们的性能进行全面比较和分析。VGGSfM:基于视觉几何的深度结构运动恢
基于 PyTorch 的 MNIST 手写数字分类模型欣然～ pytorch 分类人工智能
一、概述本代码使用PyTorch框架构建了一个简单的神经网络模型，用于解决MNIST手写数字分类任务。代码主要包括数据的加载与预处理、神经网络模型的构建、损失函数和优化器的定义、模型的训练、评估以及最终模型的保存等步骤。二、依赖库torch：PyTorch深度学习框架的核心库，提供了张量操作、自动求导等功能。torch.nn：PyTorch的神经网络模块，包含了各种神经网络层、损失函数等。torc
高效快速教你DeepSeek如何进行本地部署并且可视化对话大富大贵7 程序员知识储备1 程序员知识储备2 程序员知识储备3 经验分享
科技文章：高效快速教你DeepSeek如何进行本地部署并且可视化对话摘要：随着自然语言处理（NLP）技术的进步，DeepSeek作为一款基于深度学习的语义搜索技术，广泛应用于文本理解、对话系统及信息检索等多个领域。本文将探讨如何高效快速地在本地部署DeepSeek，并结合可视化工具实现对话过程的监控与分析。通过详尽的步骤、案例分析与代码示例，帮助开发者更好地理解和应用DeepSeek技术。同时，本
Python基于深度学习的动物图片识别技术的研究与实现 Java老徐 Python 毕业设计 python 深度学习开发语言深度学习的动物图片识别技术 Python动物图片识别技术
博主介绍：✌程序员徐师兄、7年大厂程序员经历。全网粉丝12w+、csdn博客专家、掘金/华为云/阿里云/InfoQ等平台优质作者、专注于Java技术领域和毕业项目实战✌文末获取源码联系精彩专栏推荐订阅不然下次找不到哟2022-2024年最全的计算机软件毕业设计选题大全：1000个热门选题推荐✅Java项目精品实战案例《100套》Java微信小程序项目实战《100套》感兴趣的可以先收藏起来，还有大家
【深度学习与大模型基础】第7章-特征分解与奇异值分解 lynn-66 深度学习与大模型基础算法机器学习人工智能
一、特征分解特征分解（EigenDecomposition）是线性代数中的一种重要方法，广泛应用于计算机行业的多个领域，如机器学习、图像处理和数据分析等。特征分解将一个方阵分解为特征值和特征向量的形式，帮助我们理解矩阵的结构和性质。1.特征分解的定义对于一个n×n的方阵A，如果存在一个非零向量v和一个标量λ，使得：则称λ为矩阵A的特征值，v为对应的特征向量。特征分解将矩阵A分解为：其中：Q是由特征
【论文阅读】Persistent Homology Captures the Generalization of Neural Networks Without A Validation Set 开心星人论文阅读论文阅读
将神经网络表征为加权的无环图，直接根据模型的权重矩阵构造PD。计算相邻batch的权重矩阵PD之间的距离。比较同调收敛性与神经网络的验证精度变化趋势摘要机器学习从业者通常通过监控模型的某些指标来估计其泛化误差，并在训练数值收敛之前停止训练，以防止过拟合。通常，这种误差度量或任务相关的指标是通过一个验证集（holdoutset）来计算的。因为这些数据没有直接用于更新模型参数，通常假设模型在验证集上的
【论文阅读】实时全能分割模型万里守约论文阅读论文阅读图像分割图像处理计算机视觉
文章目录导言1、论文简介2、论文主要方法3、论文针对的问题4、论文创新点总结导言在最近的计算机视觉领域，针对实时多任务分割的需求日益增长，特别是在交互式分割、全景分割和视频实例分割等多种应用场景中。为了解决这些挑战，本文介绍了一种新方法——RMP-SAM（Real-TimeMulti-PurposeSegmentAnything），旨在实现实时的多功能分割。RMP-SAM结合了动态卷积与高效的模型
论文阅读：2023 arxiv Multiscale Positive-Unlabeled Detection of AI-Generated Texts CSPhD-winston-杨帆论文阅读论文阅读人工智能
总目录大模型安全相关研究：https://blog.csdn.net/WhiffeYF/article/details/142132328MultiscalePositive-UnlabeledDetectionofAI-GeneratedTextshttps://arxiv.org/abs/2305.18149https://www.doubao.com/chat/211427064915225
论文阅读笔记——MAGICDRIVE: STREET VIEW GENERATION WITH DIVERSE 3D GEOMETRY CONTROL 寻丶幽风论文阅读笔记论文阅读笔记 3d 人工智能自动驾驶
MagicDrive论文MagicDrive通过对3D数据和文本数据的多模态条件融合和隐式视角转换，实现了高质量、多视角一致的3D场景生成。几何条件编码Cross-attention：针对顺序数据，适合处理文本标记和边界框等可变长度输入。Additiveencoderbranch：对于地图等网络状规则数据，能够有效保留空间结构。对于文本按照模版构建：“Adrivingsceneat{locatio
震惊！ “深度学习”都在学习什么扉间798 深度学习学习人工智能
常见的机器学习分类算法俗话说三个臭皮匠胜过诸葛亮这里面集成学习就是将单一的算法弱弱结合算法融合用投票给特征值加权重AdaBoost集成学习算法通过迭代训练一系列弱分类器，给予分类错误样本更高权重，使得后续弱分类器更关注这些样本，然后将这些弱分类器线性组合成强分类器，提高整体分类性能。（一）投票机制投票是一种直观且常用的算法融合策略。在多分类问题中，假设有多个分类器对同一数据进行分类判断。每个分类器
【论文阅读】Availability Attacks Create Shortcuts 开心星人论文阅读论文阅读
还得重复读这一篇论文，有些地方理解不够透彻可用性攻击通过在训练数据中添加难以察觉的扰动，使数据无法被机器学习算法利用，从而防止数据被未经授权地使用。例如，一家私人公司未经用户同意就收集了超过30亿张人脸图像，用于构建商业人脸识别模型。为解决这些担忧，许多数据投毒攻击被提出，以防止数据被未经授权的深度模型学习。它们通过在训练数据中添加难以察觉的扰动，使模型无法从数据中学习太多信息，从而导致模型在未见
深度学习 | pytorch + torchvision + python 版本对应及环境安装 zfgfdgbhs 深度学习 python pytorch
目录一、版本对应二、安装命令（pip）1.版本（1）v2.5.1~v2.0.0（2）v1.13.1~v1.11.0（3）v1.10.1~v1.7.02.安装全过程（1）选择版本（2）安装结果参考文章一、版本对应下表来自pytorch的github官方文档：pytorch/vision:Datasets,TransformsandModelsspecifictoComputerVisionpytor
一文讲清楚深度学习和机器学习平凡而伟大. 机器学习人工智能深度学习机器学习人工智能
目录1.定义机器学习（MachineLearning,ML）深度学习（DeepLearning,DL）2.工作原理机器学习深度学习3.应用场景机器学习深度学习4.主要区别5.为什么选择深度学习？6.总结深度学习和机器学习是人工智能（AI）领域中两个密切相关但有所区别的概念。要清楚地解释它们之间的关系，我们可以从定义、工作原理、应用场景以及两者的主要区别等方面进行探讨。1.定义机器学习（Machin
DeepSeek：智能搜索与分析的新纪元 XRC2231 学习
在人工智能浪潮席卷全球的今天，DeepSeek如同一颗璀璨的新星，以其独特的魅力和强大的功能，在AI领域脱颖而出。DeepSeek，这一基于深度学习和数据挖掘技术的智能搜索与分析系统，不仅重新定义了搜索引擎的边界，更以其卓越的性能和广泛的应用场景，为全球用户带来了前所未有的智能体验。本文将从DeepSeek的定义、特点、应用场景、优势等方面进行全面而深入的介绍，带您领略这一新兴技术的独特魅力。一、
Description of a Poisson Imagery Super Resolution Algorithm 论文阅读青铜锁00 论文阅读 Radar 论文阅读
DescriptionofaPoissonImagerySuperResolutionAlgorithm1.研究目标与意义1.1研究目标1.2实际意义2.创新方法与模型2.1核心思路2.2关键公式与推导2.2.1贝叶斯框架与概率模型2.2.2MAP估计的优化目标2.2.3超分辨率参数α2.3对比传统方法的优势3.实验验证与结果3.1实验设计3.2关键结果4.未来研究方向（实波束雷达领域）4.1挑战
AI模型技术演进与行业应用图谱智能计算研究中心其他
内容概要当前AI模型技术正经历从基础架构到行业落地的系统性革新。主流深度学习框架如TensorFlow和PyTorch持续优化动态计算图与分布式训练能力，而MXNet凭借高效的异构计算支持在边缘场景崭露头角。与此同时，模型压缩技术通过量化和知识蒸馏将参数量降低60%-80%，联邦学习则通过加密梯度交换实现多机构数据协同训练。在应用层面，医疗诊断模型通过迁移学习在CT影像分类任务中达到98.2%的准
使用Jupyter Notebook进行深度学习编程 - 深度学习教程 shandianfk_com ChatGPT AI jupyter 深度学习 ide
大家好，今天我们要聊聊如何使用JupyterNotebook进行深度学习编程。深度学习是人工智能领域中的一项重要技术，通过模仿人脑神经网络的方式进行学习和分析。JupyterNotebook作为一个强大的工具，可以帮助我们轻松地进行深度学习编程，尤其适合初学者和研究人员。本文将带领大家一步步了解如何在JupyterNotebook中开展深度学习项目。一、什么是JupyterNotebook？Jup
深度学习 Deep Learning 第8章深度学习优化 odoo中国 AI编程人工智能深度学习人工智能优化
深度学习第8章深度学习的优化章节概述本章深入探讨了深度学习中的优化技术，旨在解决模型训练过程中面临的各种挑战。优化是深度学习的核心环节，直接关系到模型的训练效率和最终性能。本章首先介绍了优化在深度学习中的特殊性，然后详细讨论了多种优化算法，包括随机梯度下降（SGD）、动量法、Nesterov动量法、AdaGrad、RMSProp和Adam等。此外，还探讨了参数初始化策略、自适应学习率方法以及二阶优
景联文科技提供高质量文本标注服务，驱动AI技术发展景联文科技科技人工智能
文本标注是指在原始文本数据上添加标签的过程，这些标签可以用来指示特定的实体、关系、事件等信息，以帮助计算机理解和处理这些数据。文本标注是自然语言处理（NLP）领域的一个重要环节，它通过为文本的不同部分提供具体的含义和上下文信息，增强机器学习和深度学习模型对文本内容的理解能力。标注类型情感分析情感极性：确定文本表达的情感倾向，如正面、负面或中立。强度评估：衡量情感的强烈程度，从轻微到极端不等。命名实
深度学习篇---对角矩阵&矩阵的秩&奇异矩阵 Ronin-Lotus 程序代码篇深度学习篇深度学习矩阵人工智能线性代数
文章目录前言一、对角矩阵（DiagonalMatrix）1.1定义1.2特性行列式运算简化1.3应用领域深度学习信号处理量子力学经济学二、矩阵的秩（RankofaMatrix）2.1定义2.2特性满秩降秩影响2.3应用领域深度学习图像压缩推荐系统控制理论三、奇异矩阵（SingularMatrix）3.1定义3.2特性秩不足行列式为零3.3应用领域深度学习正则化损失函数结构工程统计学数值计算四、跨领
DeepSeek、Grok 与 ChatGPT 三巨头：技术架构与应用场景的全方位解析云策量化 Deepseek chatgpt deepseek grok
前言在当今人工智能领域，DeepSeek、Grok和ChatGPT作为语言模型的三巨头，各自凭借独特的技术架构和广泛的应用场景，在自然语言处理领域占据着重要地位。本文将对这三款模型的技术架构和应用场景进行全方位解析，以期为读者提供深入的了解和有价值的参考。一、技术架构（一）DeepSeekDeepSeek是由DeepSeek团队开发的一款大型语言模型，其技术架构基于深度学习中的Transforme
OpenCV 4.2.0与扩展模块安装与应用指南土城三富
本文还有配套的精品资源，点击获取简介：OpenCV4.2.0是一个先进的计算机视觉库，包含了图像处理、计算机视觉和机器学习算法。本压缩包包含OpenCV核心库和扩展模块（opencv_contrib），版本均为4.2.0。该版本引入了性能增强、API优化以及对深度学习框架和硬件加速技术的更新支持。扩展模块提供了额外的实验性算法和功能，有助于研究和开发新算法。指南详细介绍了如何安装和配置这些库，并提
面向对象面向过程 3213213333332132 java
面向对象：把要完成的一件事，通过对象间的协作实现。面向过程：把要完成的一件事，通过循序依次调用各个模块实现。我把大象装进冰箱这件事为例，用面向对象和面向过程实现，都是用java代码完成。 1、面向对象 package bigDemo.ObjectOriented; /** * 大象类 * * @Description * @author FuJian
Java Hotspot: Remove the Permanent Generation bookjovi HotSpot
openjdk上关于hotspot将移除永久带的描述非常详细，http://openjdk.java.net/jeps/122 JEP 122: Remove the Permanent Generation Author Jon Masamitsu Organization Oracle Created 2010/8/15 Updated 2011/
正则表达式向前查找向后查找,环绕或零宽断言 dcj3sjt126com 正则表达式
向前查找和向后查找 1. 向前查找：根据要匹配的字符序列后面存在一个特定的字符序列(肯定式向前查找)或不存在一个特定的序列(否定式向前查找)来决定是否匹配。.NET将向前查找称之为零宽度向前查找断言。对于向前查找，出现在指定项之后的字符序列不会被正则表达式引擎返回。 2. 向后查找：一个要匹配的字符序列前面有或者没有指定的
BaseDao 171815164 seda
import java.sql.Connection; import java.sql.DriverManager; import java.sql.SQLException; import java.sql.PreparedStatement; import java.sql.ResultSet; public class BaseDao { public Conn
Ant标签详解--Java命令 g21121 Java命令
这一篇主要介绍与java相关标签的使用终于开始重头戏了，Java部分是我们关注的重点也是项目中用处最多的部分。 1
[简单]代码片段_电梯数字排列 53873039oycg 代码
今天看电梯数字排列是9 18 26这样呈倒N排列的,写了个类似的打印例子，如下: import java.util.Arrays; public class 电梯数字排列_S3_Test { public static void main(S
Hessian原理云端月影 hessian原理
Hessian 原理分析一．远程通讯协议的基本原理网络通信需要做的就是将流从一台计算机传输到另外一台计算机，基于传输协议和网络 IO 来实现，其中传输协议比较出名的有 http 、 tcp 、 udp 等等， http 、 tcp 、 udp 都是在基于 Socket 概念上为某类应用场景而扩展出的传输协
区分Activity的四种加载模式----以及Intent的setFlags aijuans android
在多Activity开发中，有可能是自己应用之间的Activity跳转，或者夹带其他应用的可复用Activity。可能会希望跳转到原来某个Activity实例，而不是产生大量重复的Activity。这需要为Activity配置特定的加载模式，而不是使用默认的加载模式。加载模式分类及在哪里配置 Activity有四种加载模式： standard singleTop
hibernate几个核心API及其查询分析 antonyup_2006 html .net Hibernate xml 配置管理
(一) org.hibernate.cfg.Configuration类读取配置文件并创建唯一的SessionFactory对象.(一般,程序初始化hibernate时创建.) Configuration co
PL/SQL的流程控制百合不是茶 oracle PL/SQL编程循环控制
PL/SQL也是一门高级语言,所以流程控制是必须要有的,oracle数据库的pl/sql比sqlserver数据库要难,很多pl/sql中有的sqlserver里面没有流程控制; 分支语句 if 条件 then 结果 else 结果 end if ; 条件语句 case when 条件 then 结果; 循环语句 loop
强大的Mockito测试框架 bijian1013 mockito 单元测试
一.自动生成Mock类在需要Mock的属性上标记@Mock注解，然后@RunWith中配置Mockito的TestRunner或者在setUp()方法中显示调用MockitoAnnotations.initMocks(this);生成Mock类即可。二.自动注入Mock类到被测试类 &nbs
精通Oracle10编程SQL(11)开发子程序 bijian1013 oracle 数据库 plsql
/* *开发子程序 */ --子程序目是指被命名的PL/SQL块，这种块可以带有参数，可以在不同应用程序中多次调用 --PL/SQL有两种类型的子程序：过程和函数 --开发过程 --建立过程：不带任何参数 CREATE OR REPLACE PROCEDURE out_time IS BEGIN DBMS_OUTPUT.put_line(systimestamp); E
【EhCache一】EhCache版Hello World bit1129 Hello world
本篇是EhCache系列的第一篇，总体介绍使用EhCache缓存进行CRUD的API的基本使用，更细节的内容包括EhCache源代码和设计、实现原理在接下来的文章中进行介绍环境准备 1.新建Maven项目 2.添加EhCache的Maven依赖 <dependency> <groupId>ne
学习EJB3基础知识笔记白糖_ bean Hibernate jboss webservice ejb
最近项目进入系统测试阶段，全赖袁大虾领导有力，保持一周零bug记录，这也让自己腾出不少时间补充知识。花了两天时间把“传智播客EJB3.0”看完了，EJB基本的知识也有些了解，在这记录下EJB的部分知识，以供自己以后复习使用。 EJB是sun的服务器端组件模型，最大的用处是部署分布式应用程序。EJB (Enterprise JavaBean)是J2EE的一部分，定义了一个用于开发基
angular.bootstrap boyitech AngularJS AngularJS API angular中文api
angular.bootstrap 描述：手动初始化angular。这个函数会自动检测创建的module有没有被加载多次，如果有则会在浏览器的控制台打出警告日志，并且不会再次加载。这样可以避免在程序运行过程中许多奇怪的问题发生。使用方法： angular .
java-谷歌面试题-给定一个固定长度的数组，将递增整数序列写入这个数组。当写到数组尾部时，返回数组开始重新写，并覆盖先前写过的数 bylijinnan java
public class SearchInShiftedArray { /** * 题目：给定一个固定长度的数组，将递增整数序列写入这个数组。当写到数组尾部时，返回数组开始重新写，并覆盖先前写过的数。 * 请在这个特殊数组中找出给定的整数。 * 解答： * 其实就是“旋转数组”。旋转数组的最小元素见http://bylijinnan.iteye.com/bl
天使还是魔鬼？都是我们制造 ducklsl 生活教育情感
----------------------------剧透请原谅，有兴趣的朋友可以自己看看电影，互相讨论哦！！！从厦门回来的动车上，无意中瞟到了书中推荐的几部关于儿童的电影。当然，这几部电影可能会另大家失望，并不是类似小鬼当家的电影，而是关于“坏小孩”的电影！自己挑了两部先看了看，但是发现看完之后，心里久久不能平
[机器智能与生物]研究生物智能的问题 comsci 生物
我想,人的神经网络和苍蝇的神经网络,并没有本质的区别...就是大规模拓扑系统和中小规模拓扑分析的区别.... 但是,如果去研究活体人类的神经网络和脑系统,可能会受到一些法律和道德方面的限制,而且研究结果也不一定可靠,那么希望从事生物神经网络研究的朋友,不如把
获取Android Device的信息 dai_lm android
String phoneInfo = "PRODUCT: " + android.os.Build.PRODUCT; phoneInfo += ", CPU_ABI: " + android.os.Build.CPU_ABI; phoneInfo += ", TAGS: " + android.os.Build.TAGS; ph
最佳字符串匹配算法（Damerau-Levenshtein距离算法）的Java实现 datamachine java 算法字符串匹配
原文：http://www.javacodegeeks.com/2013/11/java-implementation-of-optimal-string-alignment.html------------------------------------------------------------------------------------------------------------
小学5年级英语单词背诵第一课 dcj3sjt126com english word
long 长的 show 给...看，出示 mouth 口，嘴 write 写 use 用，使用 take 拿，带来 hand 手 clever 聪明的 often 经常 wash 洗 slow 慢的 house 房子 water 水 clean 清洁的 supper 晚餐 out 在外 face 脸，
macvim的使用实战 dcj3sjt126com mac vim
macvim用的是mac里面的vim, 只不过是一个GUI的APP, 相当于一个壳 1. 下载macvim https://code.google.com/p/macvim/ 2. 了解macvim :h vim的使用帮助信息 :h macvim
java二分法查找蕃薯耀 java二分法查找二分法 java二分法
java二分法查找 >>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>> 蕃薯耀 2015年6月23日 11:40:03 星期二 http:/
Spring Cache注解+Memcached hanqunfeng spring memcached
Spring3.1 Cache注解依赖jar包：  <dependency> <groupId>com.google.code.simple-spring-memcached</groupId> <artifactId>simple-s
apache commons io包快速入门 jackyrong apache commons
原文参考 http://www.javacodegeeks.com/2014/10/apache-commons-io-tutorial.html Apache Commons IO 包绝对是好东西，地址在http://commons.apache.org/proper/commons-io/，下面用例子分别介绍： 1）工具类 2
如何学习编程 lampcy java 编程 C++c
首先,我想说一下学习思想.学编程其实跟网络游戏有着类似的效果.开始的时候,你会对那些代码,函数等产生很大的兴趣,尤其是刚接触编程的人,刚学习第一种语言的人.可是,当你一步步深入的时候,你会发现你没有了以前那种斗志.就好象你在玩韩国泡菜网游似的,玩到一定程度,每天就是练级练级,完全是一个想冲到高级别的意志力在支持着你.而学编程就更难了,学了两个月后,总是觉得你好象全都学会了,却又什么都做不了,又没有
架构师之spring-----spring3.0新特性的bean加载控制@DependsOn和@Lazy nannan408 Spring3
1.前言。如题。 2.描述。 @DependsOn用于强制初始化其他Bean。可以修饰Bean类或方法，使用该Annotation时可以指定一个字符串数组作为参数，每个数组元素对应于一个强制初始化的Bean。 @DependsOn({"steelAxe","abc"}) @Comp
Spring4+quartz2的配置和代码方式调度 Everyday都不同代码配置 spring4 quartz2.x 定时任务
前言：这些天简直被quartz虐哭。。因为quartz 2.x版本相比quartz1.x版本的API改动太多，所以，只好自己去查阅底层API…… quartz定时任务必须搞清楚几个概念： JobDetail——处理类 Trigger——触发器，指定触发时间，必须要有JobDetail属性，即触发对象 Scheduler——调度器，组织处理类和触发器，配置方式一般只需指定触发
Hibernate入门 tntxia Hibernate
前言使用面向对象的语言和关系型的数据库，开发起来很繁琐，费时。由于现在流行的数据库都不面向对象。Hibernate 是一个Java的ORM（Object/Relational Mapping）解决方案。 Hibernte不仅关心把Java对象对应到数据库的表中，而且提供了请求和检索的方法。简化了手工进行JDBC操作的流程。如
Math类 xiaoxing598 Math
一、Java中的数字（Math）类是final类，不可继承。 1、常数 PI：double圆周率 E：double自然对数 2、截取（注意方法的返回类型） double ceil(double d) 返回不小于d的最小整数 double floor(double d) 返回不大于d的整最大数 int round(float f) 返回四舍五入后的整数 long round