落啦啦

【论文笔记】Summarizing source code through heterogeneous feature fusion and extraction

Summarizing source code through heterogeneous feature fusion and extraction

- Abstract
- 1. Introduction
- 2. HCG construction
- - 2.1 Source code to AST
  - 2.2 AST pruning
  - 2.3 Feature fusion with heterogeneous edges
- 3. HetCoS model
- - 3.1. Overview
  - 3.2. HCG encoder
  - 3.3. Decoder with copying mechanism
- 4. Experimental results
- 5. Discussion
- - 5.1 Strengths of HetCoS
  - 5.2 Limitations
- 6. Conclusion

Abstract

在 HetSum 的和基础上，提出 HetCoS 通过探索源代码固有的异构性来提取源代码的语法和顺序特征以进行代码摘要。具体来说，我们首先构建一个异构代码图（HCG），它将语法结构和代码序列与图节点之间设计的八种类型的边/关系融合在一起。此外，我们提出了一种异构图神经网络来捕获 HCG 中的不同关系。然后将表示的 HCG 输入 Transformer 解码器，然后采用基于多头注意力的复制机制来支持高质量摘要生成。

1. Introduction

现有的代码摘要研究仍然存在两个主要局限性：

较少关注代码语法结构的异构性。边缘同质性影响了 AST 的结构独特性，这削弱了 GNN 识别 AST 节点之间不同关系的学习能力。
基于原始 AST 的语法结构通常很深。在之前的工作中，AST底部的节点与顶部的节点进行通信更加困难，这可能会影响编码过程中的结构特征提取。

为了解决上述限制，我们通过引入八种类型的有向边，在修剪后的 AST 上构建异构代码图（HCG）。

为了减少 HCG 的深度，我们考虑到源代码的布局和语法信息，删除了 AST 中的一些非叶节点（例如图 1 中的节点“block”和“expression_statement”）。删除节点后，其子节点将重新连接到其父节点以保持层次结构。保留的非叶节点可以是表示值或名称的叶节点的父节点（例如，节点“标识符”），也可以是 AST 中最深的节点（例如系节点‘‘augmented_assignment’’和‘‘if_statement’’，他们将一整行或多行源代码标记作为其后代）。直观上，图 1 中代码片段 A 前两行的 HCG 将仅由四个节点层组成。
为了增强 HCG 表示，我们还引入了异构边，将数据流图 (DFG)、兄弟关系以及明文代码序列集成到修剪后的 AST 中。特别地，HCG中设计了八种类型的有向边来将HCG节点连接到它们的各种邻居，包括它们的父/子节点、右/左兄弟节点、下一个/上一个DFG节点以及下一个/上一个叶节点。请注意，叶子之间的有向边可以表示明文代码序列，因为 HCG 中的叶子对应于源代码标记。边异构性可以有效地融合HCG节点之间的各种关系，同时基于指定的边类型很好地保留了HCG的结构唯一性。
为了利用 HCG 进行代码摘要，本文提出了一种新颖的基于编码器-解码器的方法 HetCoS。特别是，我们将广泛使用的 GraphSAGE 扩展为异构代码图神经网络（HCGNN），用于融合 HCG 特征提取。
在摘要生成过程中，考虑到摘要和源代码中都存在许多标记，例如变量和函数名称，HetCoS 在 Transformer 解码器和 HCG 编码器之上引入了基于多头注意力的复制机制。复制机制允许从摘要词汇表中选择摘要令牌并从HCG节点复制，从而有利于产生更高质量的代码注释。

2. HCG construction

源代码的 HCG 构建过程如图所示。

2.1 Source code to AST

给定一个代码片段，我们首先将其解析为 AST，它携带了源代码的基本层次语法特征，并且在代码理解方面取得了优异的性能。根据先前的研究，我们将连接的标识符名称（例如“snake_case”和“CamelCase”）拆分为小写的子标记（例如“snake case”和“”CamelCase’'）并将它们视为单独的 AST 节点。如图所示，“bool_tag”被拆分为“bool”和“tag”作为 AST 中的两个节点。

2.2 AST pruning

根据我们的调查，代码的 AST 总是很深。这使得很难将消息从 AST 中的底部节点传播到 GNN 邻域聚合中的顶部节点。为此，我们在代码布局的指导下通过剪掉一些非叶子节点来对 AST 进行剪枝，同时保留代码的结构信息。保留的非叶节点要么是表示值或名称的叶节点的父节点，要么是 AST 中具有一整行或多行源代码标记作为其后代的最深节点。更具体地说，满足下面四个条件之一的非叶节点会被保留：

它在 AST 中具有最大深度并且所有叶节点都作为其后代
它有一个指示其值或名称的叶子节点
它有一个叶子节点，对应于某一源代码行中的第一个标记
它有一个满足第二个和第三个条件的子代。

不满足四个要求之一的节点将被删除。例如，在上图中，节点“if_statement”满足第一个和第三个条件。节点“identifier”和“augmented_assignment”分别满足第二个和第四个条件。由于节点“module”、“block”和“expression_statement”不符合任何上述标准，因此它们在 HCG 中被删除。请注意，如果删除节点，其子节点将连接到其父节点。第一是为了保证代码语法的树状结构。第二是有助于区分用户定义的值/名称（例如，节点“a”）与预定义的关键字（例如，节点“∕=”）。每个满足第三或第四条件的节点都覆盖了一行或多行源代码，直观地描绘了代码布局信息。例如，保留节点“augmented_assignment”以覆盖第二行源代码的信息。删除节点“expression_statement”和“block”后，节点“augmented_assignment”成为节点“if_statement”的子节点，该节点也连接到与第一个代码行相关的节点。

2.3 Feature fusion with heterogeneous edges

我们通过在父子对、兄弟对、DFG 节点对和叶子对之间引入异构有向边进行特征融合，将剪枝后的 AST 改进为 HCG。即，边可以从HCG节点指向其父/子节点、右/左兄弟节点、下一个/上一个DFG节点或下一个/上一个叶节点。父子边表示源代码的基本层次语法结构。兄弟节点之间的边代表HCG中的兄弟关系。 DFG 边指示每个变量来自或去向的位置，这可以进一步获取数据依赖性以实现更好的代码理解。在本研究中，从节点到其下一个（上一个） DFG 节点的边表示该节点的数据流向（来自）其下一个（上一个） DFG 节点。明文代码序列在代码摘要生成中起着至关重要的作用，通过与顺序源代码标记相对应的下一个或前一个叶之间的边集成到 HCG 中。

通过定义八种边，精确指定HCG节点之间的关联关系，将源代码的相应特征融合成统一的图。更重要的是，边异构性可以全面、唯一地保留源代码的句法和顺序信息，从而防止歧义的图表示。

3. HetCoS model

3.1. Overview

本节介绍 HetCoS 使用 HCG 生成代码摘要。如下图所示，HetCoS主要包括HCG编码器和具有复制机制的摘要解码器。给定初始 HCG 嵌入 $E^0_n ∈ R^{l_n×d}$ ，HCGNN 被设计为提取 HCG 中的融合代码特征 $E^{'}_n ∈ R^{l_n×d}$ ，其中 $l_n$ 表示 HCG 节点的数量， $d$ 表示嵌入大小。之后，HetCoS 对嵌入的摘要标记 $E^0_s ∈ R^{l_s×d}$ 和学习的 HCG 表示 $E'_n$ 执行 Transformer 解码器，以生成解码向量 $e'_s ∈ R^d$ ，其中 $l_s$ 表示摘要长度。为了处理同时出现在摘要和源代码中的标记（例如变量和函数名称），我们引入了基于多头注意力的复制机制来根据 $E'_n$ 和 $e'$ 预测后续的摘要标记 $s_m$ 。它允许从摘要词汇表中选择 $s_m$ 并从 HCG 节点复制。每个组件将在以下小节中详细介绍。

3.2. HCG encoder

鉴于 GraphSAGE 在图表示学习方面的成功，我们通过扩展 GraphSAGE 来捕获 HCG 中的异构特征来开发 HCGNN。上图描述了 HCG 编码器由六个不同的 HCGNN 层组成。在第 $k$ 层中，HCG首先由异构的 GraphSAGE 处理。具体来说，对于 HCG 节点 $i$ ，其状态通过其邻居与通向该节点的异构边的两步聚合来更新。

第一步，将具有不同边缘类型的邻居分别聚合到不同的邻居组中。对于边类型 $g$ ，聚合形式化如下：

其中 $\mathcal{N}_g(i)$ 表示节点 $i$ 的边类型为 $g$ 的邻居集合； $e^{k−1}_{g,j} ∈ R^d$ 表示第 $(k - 1)$ 层产生的边类型为 $g$ 的第 $j$ 个邻居向量； $A gg r 1$ 表示聚合运算符。

第二步，对邻居组进行变换和聚合，以更新节点 $i$ 的状态。该过程正式如下：

其中 $e^{k−1}_{i} ∈ R^d$ 表示前一层生成的节点 $i$ 的向量表示； $\mathcal{G}(i)$ 表示指向节点 i 的边的类型； $W_0,W_g ∈ R^{d×d}$ 表示可训练的权重矩阵； $A gg r 2$ 是聚合函数。

所有节点状态更新后，状态向量被连接并发送到 $R e LU$ 激活中进行非线性变换：

随着更多 HCGNN 层的堆叠，节点会从更远的距离收集其邻近信息，提取更多的异构特征。为了减轻多层计算中的梯度消失和过多的向量偏移，我们将残差连接以及图归一化合并到每个HCGNN模块中，其形式化如下：

其中 $E^{k−1}_n ∈ R^{l_n×d}$ 表示第 $(k - 1)$ HCGNN层输出的 HCG 节点状态向量。

3.3. Decoder with copying mechanism

HetCoS 中的解码器设计有八个普通 Transformer 解码层堆栈。每层包含三个子层，包括用于对现有摘要标记进行自注意力编码的屏蔽多头注意力、用于对学习的 HCG 节点进行解码的标准多头注意力以及完全连接的位置式前馈网络（FFN）。所有子层都执行残差连接和层归一化。提供来自第 $(k - 1)$ 层的现有摘要标记的向量 $E^{k−1}_s ∈ R^{l_s×d}$ 和提取的 HCG 表示 $E'_n ∈ R^{l_n×d}$ ，第 $k$ 个 Transformer 层的解码过程形式化如下:

其中 $M a s k A tt$ 和 $A tt$ 分别表示屏蔽多头注意力和标准多头注意力，两者都以查询、键和值向量作为输入来挖掘它们之间的关系。

解码后，HetCoS 在解码器和编码器上实现基于多头注意力的复制机制，以生成后续的摘要令牌。对于第 $m$ 个输出 token，复制机制首先从摘要词汇和 HCG 节点导出两个概率分布 $p_v$ 和 $p_n$ ，然后利用它们来确定 token 的输出概率。为了获得 $p_v$ ，我们对解码后的摘要标记向量 $e'_s ∈ Rd$ 执行线性子层，然后执行 $S o f t ma x$ ，其公式如下：

请注意，如果标记 $w$ 未包含在摘要词汇表中，则 $p_v(w)$ 被分配为 0。

为了计算 $p_n$ ，我们首先在解码向量 $e'_s ∈ Rd$ 以及学习的 HCG 表示 $E'_n ∈ R^{l_n×d}$ 上部署多头注意力子层，其公式如下：

其中 $W^Q_i,W^K_i,W^V_i,W^O$ 表示可训练参数。然后，总结标记 $w$ 的概率 $p_n(w)$ 可以计算如下：

其中 $w_i$ 表示 HCG 中的节点 $i$ 。最终，标记 $w$ 的输出似然，表示为 $p_s(w)$ ，将由概率 $p_v$ 和 $p_n$ 的加权和确定：

其中 $λ_v ∈ [0, 1]$ 是权重值。

4. Experimental results

本节对两个数据集进行消融研究，以研究我们的方法中组件的有用性。为此，我们首先设计了六个变体模型进行比较，每个模型都去除了HetCoS的一个重要组成部分，包括：

丢弃复制机制的R-Copy
去除编码器中残留连接的R-EncRes
忽略HCG中的异质性的R-Het
排除HCG中代码标记（即叶节点）之间的边的R-CodeEdge
排除HCG中兄弟节点之间的边的R-SibEdge HCG
R-DFG，排除HCG中的DFG。

为了进一步验证，我们构建了四个变体：

保留 AST 所有节点进行编码的 V-AST
使用 GCN 覆盖 HCGNN 中使用的 GraphSAGE 的 V-HetGCN
V- HetGAT 引入 GAT 代替 GraphSAGE
V-HetGT 用 Graph Transformer 代替 GraphSAGE。

5. Discussion

5.1 Strengths of HetCoS

HetCoS 有两个优点导致其在代码摘要方面的优越性：

好处之一在于源代码的异构融合图表示。基于修剪后的 AST，所提出的 HCG 将源代码的顺序和句法特征融合成异构结构，同时减少 AST 深度。通过利用八种类型的边，HCG 在保留其结构唯一性的同时精确捕获各种节点到节点的关系。
有效的基于编码器-解码器的神经模型为代码摘要增强提供了进一步的优势。特别是，HetCoS 模型堆叠多个 HCGNN 层来提取 HCG 中的异构代码特征，以实现卓越的代码理解。多头注意力复制机制还有助于生成更高质量的代码注释。

5.2 Limitations

值得一提的是，这项研究仍然存在三个局限性，我们希望在后续工作中克服：

第一个限制涉及 HCG 结构代码表示的能力。在本文中，我们设计了HCG来减少AST深度并融合图节点之间的各种关系。尽管如此，我们建议挖掘源代码中新的异构结构特征并将其融合到 HCG 中，以实现更好的代码理解。
我们的 HetCoS 模型的可扩展性是第二个限制。这项工作旨在挖掘源代码的结构异构性来提升代码摘要生成的性能。因此，它与依赖预训练范式的方法是正交的。即便如此，HetCoS 有潜力通过纳入预训练范式来得到加强，我们将其作为未来研究的重要主题。
第三个限制与本研究的可扩展性有关。具体来说，我们的工作集中在自动代码摘要的任务上。事实上，所提出的HetCoS框架还可以应用或转移到其他相关任务，例如代码完成和编程语言翻译。这些任务的表现需要大量的实验来证明。

6. Conclusion

本文提出了一种基于编码器-解码器的代码摘要架构 HetCoS。给定一个代码片段，HetCoS 首先设计一个具有八种不同类型边的 HCG，以融合源代码的异构特征。同时，提出了HCGNN来对HCG表示进行编码。然后，HetCoS引入了Transformer解码器进行摘要解码，并通过结合基于多头注意的复制机制进一步改进。通过在 Java 和 Python 两个基准上进行的综合实验，结果表明 HetCoS 在代码摘要方面比竞争基准具有更优越的性能。

STM32F407 SPI1源代码 heraldww keil ARM stm32 单片机嵌入式硬件
头文件#ifndef__spi1_PA567_H#define__spi1_PA567_H#include"sys.h"#include"project_config.h"#include"gpio.h"////本程序只供学习使用，未经作者许可，不得用于其它任何用途//ALIENTEKSTM32F407开发板//SPI驱动代码//正点原子@ALIENTEK//技术论坛:www.openedv.co
常用的pdf技术有哪些？--笔记我不是彭于晏灬 pdf 笔记
常用的pdf技术有哪些？1.iTextPDF：iText是著名的开放项目，是用于生成PDF文档的一个java类库。通过iText不仅可以生成PDF或rtf的文档，而且可以将XML、Html文件转化为PDF文件。Openoffice：openoffice是开源软件且能在windows和linux平台下运行，可以灵活的将word或者Excel转化为PDF文档。JasperReport：是一个强大、灵活
基于51单片机设计的呼吸灯鱼弦单片机系统合集 51单片机嵌入式硬件单片机
鱼弦：公众号【红尘灯塔】，CSDN博客专家、内容合伙人、新星导师、全栈领域优质创作者、51CTO(Top红人+专家博主)、github开源爱好者（go-zero源码二次开发、游戏后端架构https://github.com/Peakchen）基于51单片机设计的呼吸灯是一种常见的LED灯效应果，通过控制LED的亮度逐渐增加和减小，模拟人类呼吸的效果。下面将对其原理、应用场景、算法实现、代码实现等进
实现图片压缩功能鸿蒙示例代码
本文原创发布在华为开发者社区。介绍本示例基于imagePackerssApi实现了图片压缩功能，并将压缩后的图片转成base64格式。开发者可将压缩后的图片用于arkui或者H5中进行图片展示。实现图片压缩功能源码链接效果预览使用说明打开应用，展示选择图片并压缩按钮，点击按钮，拉起系统相册，相册里选择图片或者拍照获取图片，选择完毕后点击完成，即可返回应用主页面，展示压缩后的图片。实现思路构造sel
cocos2dx : 解决中文乱码问题 ^随风~~ Cocos2d-x C++乱码
在使用cocos2dx的时候，代码里面使用了中文或者是在cocosstudio编辑器里面使用了中文，显示的时候会出现乱码问题，下面提供几个解决方案：方案一：最前面加上命令:#pragmaexecution_character_set("utf-8")方案二：使用XML文件：问题与解决方法在windows环境下使用visualstudio开发cocos2d-x，由于visualstudio默认编码为
项目经理的“汇报力”修炼：如何快速打造让领导、客户眼前一亮的方案？
在项目管理领域，流传着一句话：“干得好不如说得好，说得好不如呈现得好。”项目经理作为“资源整合者”和“信息枢纽”，70%以上的工作本质是沟通与汇报——向上争取资源，向下传递目标，向外管理客户预期。能否快速产出逻辑清晰、价值聚焦的汇报方案，直接决定了项目的推进效率与个人职业发展天花板。一、项目经理的工作本质：用汇报“撬动”资源项目经理的日常不是埋头写代码或画图纸，而是通过系统性表达解决三类核心问题：
实现图片处理功能鸿蒙示例代码
本文原创发布在华为开发者社区。介绍本项目基于OpenHarmony三方库ImageKnife进行图片处理场景开发使用：支持不同类型的本地与网络图片展示。支持拉起相机拍照展示与图库照片选择展示。支持图片单一种变换效果。支持本地/在线图片格式：JPG、PNG、SVG、GIF、DPG、WEBP、BMP实现图片处理功能源码链接效果预览使用说明下载安装根目录下的oh-package.json5中depend
实现系统分享功能鸿蒙示例代码
本文原创发布在华为开发者社区。介绍本示例基于ShareKit能力实现了宿主应用分享图片的功能。开发者可结合具体业务场景设定目标应用并处理分享内容。实现系统分享功能源码链接效果预览使用说明点击“查看并下载图片”按钮，从网络上下载图片。点击“系统分享”按钮，选择图片，在底部选择shareget可拉起接受方应用，分享图片。实现思路分享图片使用request.downloadFile接口，根据开发者自己设
从代码到蓝图：开发者转型技术型项目经理的破局之路
一、开发者面临的转型临界点技术型职业瓶颈的四个维度案例：某大厂P7工程师年薪突破80万后陷入停滞，发现35岁后晋升通道收窄至3%技术天花板困境当技术深度达到可解决90%业务需求时，剩余10%的突破需要投入指数级增长的时间成本业务理解断层某金融系统开发者耗时3月重构代码，上线后才发现业务方早已变更需求方向沟通能力边际递减技术团队日均处理跨部门沟通耗时2.3小时，其中62%的时间消耗在需求理解错位上职
vite中使用Web Worker 脚本
MDN对WebWorker的说明WebWorker为Web内容在后台线程中运行脚本提供了一种简单的方法。线程可以执行任务而不干扰用户界面。此外，它们可以使用XMLHttpRequest（尽管responseXML和channel属性总是为空）或fetch（没有这些限制）执行I/O。一旦创建，一个worker可以将消息发送到创建它的JavaScript代码，通过将消息发布到该代码指定的事件处理器（反
【java】注解 6<7 java 开发语言
注解什么是注解Annotation（注解）是从JDK5.0开始引入的新技术。Annotation的作用：不是程序本身必需的，但是可以对程序做出解释。可以被其他程序（比如编译器等）读取。Annotation的格式：注解是以“@注释名”在代码中存在的，还可以添加一些参数值，例如：@SuppressWarnings(value=“unchecked”)。Annotation在哪里可以使用?可以附加在pa
用结构体类型实现复数的加、减、乘、除运算，每种运算用函数完成 Stimpay c语言算法
任务描述本关任务：编程实现两个复数的加、减、乘、除运算。相关知识用函数来实现复数之间的加减乘除，有两种方法返回计算结果：使用结构体指针作函数的形参，将函数的计算结果返回；将函数的计算结果作为函数返回值返回。编程要求根据提示，在右侧编辑器补充代码，实现两个复数的加、减、乘、除运算，将函数的计算结果作为函数返回值返回，复数之间的加法、减法、乘法和除法分别用不用的函数来实现。具体要求如下：函数input
如何选择测试管理工具测试工具
选择测试管理工具的关键在于需求匹配、功能全面、易用高效。其中，需求匹配强调企业应明确自身测试流程和目标，选择工具时要确保其功能与实际需求高度契合；功能全面要求测试管理工具具备需求管理、缺陷跟踪、自动化测试集成、报告生成等多项核心功能；易用高效则要求工具操作简单、界面友好，并能与其他系统无缝对接，从而提升整体测试效率和团队协同能力。在软件开发和互联网项目中，测试管理工具扮演着关键角色。随着项目复杂度
深度解析Java中的代码分支策略规划：掌握GitFlow与GitHub Flow的艺术墨夶 Java学习资料2 java github 开发语言
在这个技术日新月异的时代，每一个开发者都在寻找提高效率、减少错误并优化团队协作的方法。而当涉及到代码管理时，选择正确的分支策略至关重要。今天，我们将深入探讨如何在Java项目中应用两种流行的分支策略——GitFlow和GitHubFlow，并通过详尽的示例代码来展示它们的实际运用。1.分支管理策略概览分支管理策略不仅帮助团队成员之间进行有效的沟通，还确保了代码库的健康状态。无论是小型创业公司还是大
【VSCode】VSCode常用快捷键 Ctrl Z. vscode ide 编辑器
！+回车键快速创建html骨架Ctrl+/单行注释（取消）快捷键Alt+Shift+A块注释（取消）快捷键Ctrl+加号代码放大（适合浏览器）Ctrl+减号代码缩小（适合浏览器）Ctrl+Shift+K删除当前行Ctrl+H替换查询下一个/上一个：F3/Shift+F3选中所有出现在查询中的：Alt+EnterCtrl+D匹配当前选中的词汇或者行，再次选中-可操作Shift+Alt+F格式化代码F
【IDEA】IDEA常用快捷键（适应包括xml所有类型文件） Ctrl Z. intellij-idea xml java
IntellijIDEA快速编写代码sout等价于System.out.println();soutp等价于System.out.println(“”);soutv等价于System.out.println(“变量名=”+变量);soutm等价于System.out.println(“当前类名.当前方法”);psvm等价于publicstaticvoidmain(String[]args){}In
【Gitee】error: failed to push some refs to “xxx“ git did not exit cleanly (exit code 1)解决方法 Ctrl Z. gitee git
目录1.本地仓库与远程仓库存在冲突2.权限问题3.网络问题4.远程仓库不存在或地址错误另：有关查看分支的介绍在push时操作失败且返回退出码1通常意味着在推送代码到远程仓库时遇到了问题。以下是几种可能的原因以及对应的解决办法：1.本地仓库与远程仓库存在冲突当远程仓库的代码有更新，而本地仓库没有同步这些更新时，就会产生冲突。需要先拉取远程仓库的最新代码，合并到本地分支后再尝试推送。gitpullor
FPGA——DDS原理及代码实现
FPGA——DDS原理及代码实现一、DDS各参数意义如图，一个量化的32点的正弦波，也就是说一个ROM里存了32个这样的数据，每次读出一个数据要1ms，分别读出1,2,3...30,31,32,共32个点，读取完整的正弦波需要1ms*32=32ms的时间该正弦波参数为>周期T=1ms*32=32ms,>频率为f=1/T=1/(1ms*(32/1))在读出一个数据时间不变（1ms）的情况下，想要让读
【VSCode】VSCode常用插件 Ctrl Z. vscode ide 编辑器
Chinese(Simplified)(简体中文)LanguagePackforVisualStudioCode：简体中文支持插件HTML/CSS/JavaScriptSnippets：支持HTML/CSS/JavaScript快速匹配输入HTMLSnippets：这个插件提供了一系列HTML代码片段，通过简单的缩写就可以快速生成常用的HTML结构。例如，输入!并按下Tab键，就可以快速生成一个完
实现一个完整的计算器（Java）李逍遙️
直接上代码importjava.awt.BorderLayout;importjava.awt.Color;importjava.awt.GridLayout;importjava.awt.event.ActionEvent;importjava.awt.event.ActionListener;importjavax.swing.JButton;importjavax.swing.JFrame;
java word转pdf三种方法（附有需要的jar）李逍遙️ word转pdf java
一.jacob1.jar下载jacob.jar和jacob-1.17-x64.dll下载提取码：01212.在jdk/bin目录下引入.dll文件（64位：jacob-1.17-x64.dll32位：jacob-1.17-x86.dll）3.转换代码importcom.jacob.activeX.ActiveXComponent;importcom.jacob.com.Dispatch;impor
记：应聘北京思特奇信息技术股份有限公司 C++工程师指针的值是地址大四求职 c++敏捷开发
一轮，软件上的笔试题这里记录几个问题。1.构成C语言的基本单位是函数。2.敏捷开发：相对于“非敏捷”，更强调程序员团队与业务专家之间的紧密协作、面对面的沟通（认为比书面的文档更有效）、频繁交付新的软件版本、紧凑而自我组织型的团队、能够很好地适应需求变化的代码编写和团队组织方法，也更注重软件开发过程中人的作用。（来自百度百科）一个通俗的博客另一个。我个人的理解就是以人为中心，尽量以口头交流为主，以尽
一切皆是映射：DQN训练加速技术：分布式训练与GPU并行 AI天才研究院计算 AI大模型企业级应用开发实战 ChatGPT 计算科学神经计算深度学习神经网络大数据人工智能大型语言模型 AI AGI LLM Java Python 架构设计 Agent RPA
1.背景介绍1.1深度强化学习的兴起近年来，深度强化学习（DeepReinforcementLearning，DRL）在游戏、机器人控制、自然语言处理等领域取得了令人瞩目的成就。作为一种结合深度学习和强化学习的强大技术，DRL能够使智能体在与环境交互的过程中学习最优策略，从而实现自主决策和控制。1.2DQN算法及其局限性深度Q网络（DeepQ-Network，DQN）是DRL的一种经典算法，它利用
多种弹窗实现方法鸿蒙示例代码
本文原创发布在华为开发者社区。介绍本示例介绍以下五种常见的弹窗场景化案例。应用启动时的隐私政策和用户协议弹窗网络请求完成的结果提示弹窗应用返回上一级页面的退出确认弹窗个人信息填写的信息弹窗应用使用过程中出现的付费类广告弹窗弹窗场景化源码链接效果预览使用说明进入应用会立马弹出一个隐私协议窗口，点同意关闭该窗口，点不同意退出应用。点击网络请求完成的结果提示弹窗，会弹出一个等待的子窗口弹窗，网络请求完毕
python面试题详解 __wishing__ python
十道经典面试题（python）1.一行代码实现累加1-100之和print(sum(range(1,101)))输出结果：5050分析：利用sum函数进行累加。range控制序列。2.一行代码实现列表去重#声明需要去重的列表list1=[1,1,2,2,3,3,4,4]list1=list(set(list1))</
golang接口用法-代码案例 JavaPub-rodert golang golang 开发语言后端
文章目录Go语言中接口（interface）的含义接口的常见应用场景示例1示例2（Dog和Cat）使用场景-多数据库Go语言中接口（interface）的含义接口在Go语言中是一种类型，它定义了一组方法的集合。一个类型只要实现了接口中定义的所有方法，就认为该类型实现了该接口。接口不关心具体的实现细节，只关心方法的签名（即方法的名称、参数和返回值类型）。接口可以看作是不同类型之间的桥梁，它允许不同类
大规模语言模型从理论到实践分布式训练的集群架构 AI智能涌现深度研究 DeepSeek R1 &大数据AI人工智能 Python入门实战计算科学神经计算深度学习神经网络大数据人工智能大型语言模型 AI AGI LLM Java Python 架构设计 Agent RPA
大规模语言模型从理论到实践分布式训练的集群架构作者：禅与计算机程序设计艺术/ZenandtheArtofComputerProgramming1.背景介绍1.1问题的由来随着深度学习技术的飞速发展，大规模语言模型（LargeLanguageModels,LLMs）在自然语言处理（NaturalLanguageProcessing,NLP）领域取得了突破性进展。LLMs，如BERT、GPT-3等，通
泛型擦除和TypeToken liudachu java
泛型可以让代码更加通用，但同时也可能会导致一些类型信息在运行时丢失，这就是所谓的类型擦除。Guava的TypeToken帮咱们巧妙地解决了这个问题。第1章：泛型编程的挑战先来说说泛型。在Java中，泛型是一种在编译时进行类型检查的机制。它让咱们能在类、接口、方法中使用类型参数，比如List或者Map。这样的好处是代码更安全，更易读，同时还能重用。但是，泛型也有个大问题——类型擦除。听起来有点高深，
numpy学习笔记3：三维数组 np.ones((2, 3, 4)) 的详细解释宁宁可可 #机器学习 #Python基础与进阶 numpy 学习笔记
numpy学习笔记3：三维数组np.ones((2,3,4))的详细解释以下是关于三维数组np.ones((2,3,4))的详细解释：1.三维数组的形状形状(2,3,4)表示：最外层维度：2个“层”（或“块”）；中间维度：每个层有3行；最内层维度：每行有4个元素。可以类比为：2本书（外层），每本书有3页（中间层），每页有4行文字（内层）。2.创建全1三维数组代码示例：importnumpyasnp
python之gmsh划分网格老歌老听老掉牙 python有限元分析 python 开发语言 gmsh 划分网格
Gmsh（GeometryModelingandMeshingSuite）是一个开源的三维有限元网格生成器，它集成了内置的CAD引擎和后处理器。Gmsh的设计目标是提供一个快速、轻量级且用户友好的网格工具，同时具备参数化输入和高级可视化能力。Gmsh围绕几何（geometry）、网格（mesh）、求解器（solver）和后处理（post-processing）四个模块构建，用户可以通过图形用户界面
Spring的注解积累 yijiesuifeng spring 注解
用注解来向Spring容器注册Bean。需要在applicationContext.xml中注册： <context:component-scan base-package=”pagkage1[,pagkage2,…,pagkageN]”/>。如：在base-package指明一个包 <context:component-sc
传感器百合不是茶 android 传感器
android传感器的作用主要就是来获取数据,根据得到的数据来触发某种事件下面就以重力传感器为例; 1,在onCreate中获得传感器服务 private SensorManager sm;// 获得系统的服务 private Sensor sensor;// 创建传感器实例 @Override protected void
[光磁与探测]金吕玉衣的意义 comsci
这是一个古代人的秘密:现在告诉大家信不信由你们: 穿上金律玉衣的人,如果处于灵魂出窍的状态,可以飞到宇宙中去看星星这就是为什么古代
精简的反序打印某个数沐刃青蛟打印
以前看到一些让求反序打印某个数的程序。比如：输入123，输出321。记得以前是告诉你是几位数的，当时就抓耳挠腮，完全没有思路。似乎最后是用到%和/方法解决的。而今突然想到一个简短的方法，就可以实现任意位数的反序打印（但是如果是首位数或者尾位数为0时就没有打印出来了）代码如下： long num, num1=0;
PHP：6种方法获取文件的扩展名 IT独行者 PHP 扩展名
PHP：6种方法获取文件的扩展名 1、字符串查找和截取的方法 1 $extension = substr ( strrchr ( $file , '.' ), 1); 2、字符串查找和截取的方法二 1 $extension = substr
面试111 文强chu 面试
1事务隔离级别有那些，事务特性是什么（问到一次） 2 spring aop 如何管理事务的，如何实现的。动态代理如何实现，jdk怎么实现动态代理的，ioc是怎么实现的，spring是单例还是多例，有那些初始化bean的方式，各有什么区别（经常问） 3 struts默认提供了那些拦截器（一次） 4 过滤器和拦截器的区别（频率也挺高） 5 final，finally final
XML的四种解析方式小桔子 dom jdom dom4j sax
在平时工作中，难免会遇到把 XML 作为数据存储格式。面对目前种类繁多的解决方案，哪个最适合我们呢？在这篇文章中，我对这四种主流方案做一个不完全评测，仅仅针对遍历 XML 这块来测试，因为遍历 XML 是工作中使用最多的（至少我认为）。　　预备　　测试环境：　　AMD 毒龙1.4G OC 1.5G、256M DDR333、Windows2000 Server
wordpress中常见的操作 aichenglong 中文注册 wordpress 移除菜单
1 wordpress中使用中文名注册解决办法 1)使用插件 2)修改wp源代码进入到wp-include/formatting.php文件中找到 function sanitize_user( $username, $strict = false
小飞飞学管理-1 alafqq 管理
项目管理的下午题，其实就在提出问题（挑刺），分析问题，解决问题。今天我随意看下10年上半年的第一题。主要就是项目经理的提拨和培养。结合我自己经历写下心得对于公司选拔和培养项目经理的制度有什么毛病呢？ 1，公司考察，选拔项目经理，只关注技术能力，而很少或没有关注管理方面的经验，能力。 2，公司对项目经理缺乏必要的项目管理知识和技能方面的培训。 3，公司对项目经理的工作缺乏进行指
IO输入输出部分探讨百合不是茶 IO
//文件处理在处理文件输入输出时要引入java.IO这个包； /* 1，运用File类对文件目录和属性进行操作 2，理解流，理解输入输出流的概念 3，使用字节/符流对文件进行读/写操作 4，了解标准的I/O 5，了解对象序列化 */ //1，运用File类对文件目录和属性进行操作 //在工程中线创建一个text.txt
getElementById的用法 bijian1013 element
getElementById是通过Id来设置/返回HTML标签的属性及调用其事件与方法。用这个方法基本上可以控制页面所有标签，条件很简单，就是给每个标签分配一个ID号。返回具有指定ID属性值的第一个对象的一个引用。语法： &n
励志经典语录 bijian1013 励志人生
经典语录1: 哈佛有一个著名的理论：人的差别在于业余时间，而一个人的命运决定于晚上8点到10点之间。每晚抽出2个小时的时间用来阅读、进修、思考或参加有意的演讲、讨论，你会发现，你的人生正在发生改变，坚持数年之后，成功会向你招手。不要每天抱着QQ/MSN/游戏/电影/肥皂剧……奋斗到12点都舍不得休息，看就看一些励志的影视或者文章，不要当作消遣；学会思考人生，学会感悟人生
[MongoDB学习笔记三]MongoDB分片 bit1129 mongodb
MongoDB的副本集(Replica Set)一方面解决了数据的备份和数据的可靠性问题，另一方面也提升了数据的读写性能。MongoDB分片(Sharding)则解决了数据的扩容问题，MongoDB作为云计算时代的分布式数据库，大容量数据存储，高效并发的数据存取，自动容错等是MongoDB的关键指标。本篇介绍MongoDB的切片(Sharding) 1.何时需要分片 &nbs
【Spark八十三】BlockManager在Spark中的使用场景 bit1129 manager
1. Broadcast变量的存储，在HttpBroadcast类中可以知道 2. RDD通过CacheManager存储RDD中的数据，CacheManager也是通过BlockManager进行存储的 3. ShuffleMapTask得到的结果数据，是通过FileShuffleBlockManager进行管理的，而FileShuffleBlockManager最终也是使用BlockMan
yum方式部署zabbix ronin47 yum方式部署zabbix
安装网络yum库#rpm -ivh http://repo.zabbix.com/zabbix/2.4/rhel/6/x86_64/zabbix-release-2.4-1.el6.noarch.rpm 通过yum装mysql和zabbix调用的插件还有agent代理#yum install zabbix-server-mysql zabbix-web-mysql mysql-
Hibernate4和MySQL5.5自动创建表失败问题解决方法 byalias J2EE Hibernate4
今天初学Hibernate4，了解了使用Hibernate的过程。大体分为4个步骤： ①创建hibernate.cfg.xml文件 ②创建持久化对象 ③创建*.hbm.xml映射文件 ④编写hibernate相应代码在第四步中，进行了单元测试，测试预期结果是hibernate自动帮助在数据库中创建数据表，结果JUnit单元测试没有问题，在控制台打印了创建数据表的SQL语句，但在数据库中
Netty源码学习-FrameDecoder bylijinnan java netty
Netty 3.x的user guide里FrameDecoder的例子，有几个疑问： 1.文档说：FrameDecoder calls decode method with an internally maintained cumulative buffer whenever new data is received. 为什么每次有新数据到达时，都会调用decode方法？ 2.Dec
SQL行列转换方法 chicony 行列转换
create table tb(终端名称 varchar(10) , CEI分值 varchar(10) , 终端数量 int) insert into tb values('三星' , '0-5' , 74) insert into tb values('三星' , '10-15' , 83) insert into tb values('苹果' , '0-5' , 93)
中文编码测试 ctrain 编码
循环打印转换编码 String[] codes = { "iso-8859-1", "utf-8", "gbk", "unicode" }; for (int i = 0; i < codes.length; i++) { for (int j
hive 客户端查询报堆内存溢出解决方法 daizj hive 堆内存溢出
hive> select * from t_test where ds=20150323 limit 2; OK Exception in thread "main" java.lang.OutOfMemoryError: Java heap space 问题原因： hive堆内存默认为256M 这个问题的解决方法为：修改/us
人有多大懒，才有多大闲 (评论『卓有成效的程序员』) dcj3sjt126com 程序员
卓有成效的程序员给我的震撼很大，程序员作为特殊的群体，有的人可以这么懒，懒到事情都交给机器去做，而有的人又可以那么勤奋，每天都孜孜不倦得做着重复单调的工作。在看这本书之前，我属于勤奋的人，而看完这本书以后，我要努力变成懒惰的人。不要在去庞大的开始菜单里面一项一项搜索自己的应用程序，也不要在自己的桌面上放置眼花缭乱的快捷图标
Eclipse简单有用的配置 dcj3sjt126com eclipse
1、显示行号 Window -- Prefences -- General -- Editors -- Text Editors -- show line numbers 2、代码提示字符 Window ->Perferences，并依次展开 Java -> Editor -> Content Assist，最下面一栏 auto-Activation
在tomcat上面安装solr4.8.0全过程 eksliang Solr solr4.0后的版本安装 solr4.8.0安装
转载请出自出处： http://eksliang.iteye.com/blog/2096478 首先solr是一个基于java的web的应用，所以安装solr之前必须先安装JDK和tomcat，我这里就先省略安装tomcat和jdk了第一步：当然是下载去官网上下载最新的solr版本，下载地址
Android APP通用型拒绝服务、漏洞分析报告 gg163 漏洞 android APP 分析
点评：记得曾经有段时间很多SRC平台被刷了大量APP本地拒绝服务漏洞，移动安全团队爱内测（ineice.com）发现了一个安卓客户端的通用型拒绝服务漏洞，来看看他们的详细分析吧。 0xr0ot和Xbalien交流所有可能导致应用拒绝服务的异常类型时，发现了一处通用的本地拒绝服务漏洞。该通用型本地拒绝服务可以造成大面积的app拒绝服务。针对序列化对象而出现的拒绝服务主要
HoverTree项目已经实现分层 hvt 编程 .net Web C#ASP.ENT
HoverTree项目已经初步实现分层，源代码已经上传到 http://hovertree.codeplex.com请到SOURCE CODE查看。在本地用SQL Server 2008 数据库测试成功。数据库和表请参考：http://keleyi.com/a/bjae/ue6stb42.htmHoverTree是一个ASP.NET 开源项目，希望对你学习ASP.NET或者C#语言有帮助，如果你对
Google Maps API v3: Remove Markers 移除标记天梯梦 google maps api
Simply do the following: I. Declare a global variable: var markersArray = []; II. Define a function: function clearOverlays() { for (var i = 0; i < markersArray.length; i++ )
jQuery选择器总结 lq38366 jquery 选择器
1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 31 32 33 34 35 36 37 38 39 40
基础数据结构和算法六：Quick sort sunwinner Algorithm Quicksort
Quick sort is probably used more widely than any other. It is popular because it is not difficult to implement, works well for a variety of different kinds of input data, and is substantially faster t
如何让Flash不遮挡HTML div元素的技巧_HTML/Xhtml_网页制作刘星宇 html Web
今天在写一个flash广告代码的时候，因为flash自带的链接，容易被当成弹出广告，所以做了一个div层放到flash上面，这样链接都是a触发的不会被拦截，但发现flash一直处于div层上面，原来flash需要加个参数才可以。让flash置于DIV层之下的方法，让flash不挡住飘浮层或下拉菜单，让Flash不档住浮动对象或层的关键参数：wmode=opaque。方法如下：
Mybatis实用Mapper SQL汇总示例 wdmcygah sql mysql mybatis 实用
Mybatis作为一个非常好用的持久层框架，相关资料真的是少得可怜，所幸的是官方文档还算详细。本博文主要列举一些个人感觉比较常用的场景及相应的Mapper SQL写法，希望能够对大家有所帮助。不少持久层框架对动态SQL的支持不足，在SQL需要动态拼接时非常苦恼，而Mybatis很好地解决了这个问题，算是框架的一大亮点。对于常见的场景，例如：批量插入/更新/删除，模糊查询，多条件查询，联表查询，