animalkun

【论文笔记】 Reinforcement-Learning-Guided Source Code Summarization using Hierarchical Attention

1 INTRODUCTION

软件维护blablabla……代码注释blablabla……

好的代码注释应具有以下特征：(1) 正确性，正确地阐明代码的意图；(2) 流利，使维护者易于阅读和理解；(3) 一致性，遵循标准的样式/格式。

现有的研究：统计语言模型，模板和规则，神经机器翻译等。

研究的局限性和作者的一些见解：

直接输入代码作为文本，不考虑代码的层次结构（能够通过不同上下文的不同token为注释生成提供更全面的表征）。
只用简单的时序特征来表示代码，如token 序列，而其他能够捕获注释和程序之间相关性的代码特性并未探索（控制流图CFGs，抽象语法树AST，程序变量的类型等）
现有的训练方法为“teacher-forcing”模型，受到Exposure Bias的影响（在测试阶段无法获得ground truth，并且之前生成的词作为输入用于预测后续单词），模型仅基于ground truth来进行训练，无法暴露自身的错误。

teacher forcing 概念参考

上述问题解决方案：基于层次attention的学习方式+actor-critic强化学习

使用类型增强的AST序列来替代基于AST的树结构表示，并用控制流补全代码表示；解决限制(2)。
采用hierarchical attention network (HAN)对不同的代码序列进行编码；解决限制(1)。

框架概述：

离线训练阶段：
1. 大规模带注释的pair语料库
2. 三种序列：非结构化级别 —— x^TXT （纯代码序列），结构化级别 —— x^AST（类型增强AST），x^CFG （控制流）(图1(a))
3. hierarchical attention network (HAN) 进行编码和集成 (图1(b))
4. 注释对输入深度强化学习模型进行训练 (图1©)
在线总结阶段：
1. 向actor网络中输入一个给定代码片段，生成相应注释。

贡献点：

新的思路：提出了一种深度强化学习框架Actor-Critic网络来生成注释
广泛的算法：提出HAN学习方法，总结利用多个代码特性反映代码层次结构
评估：在真实数据集上达成了最优的性能

2 PRELIMINARIES

预备知识：

2.1 语言模型

概率预测

2.2 RNN 编码器-解码器模型

编码器
解码器
训练目标（loss）

2.3 强化学习

强化学习与环境相互作用，从奖励信号中学习最优策略，潜在地解决极大似然引入的Exposure Bias问题。

在基于强化学习框架中，除了生成序列的概率，还会在训练模型时计算reward作为反馈，以减轻Exposure Bias问题。文本生成过程可以视作马尔科夫决策过程（MDP）{S, A, P, R, γ }，在MDP设置中，时刻t的状态s_t由代码片段x和预测的单词y₀, y₁, … , y_t组成，动作空间定义为描绘单词的词典У，y_t∈У。相应的，状态转移函数P定义为s_{t+1} = {s_t, y_t}，动作（即单词）y_t 成为后续状态s_{t+1} 的一部分，并得到奖励r_t+1 。这一过程的目标是找到一个策略，最大化模型生成语句的期望奖励：

$\theta$ 是需要学习的策略参数，D是训练集，y_hat 是预测的动作（单词），R是奖励函数。

总体目标仍然是对给定代码片段x生成单词序列，并最大化期望奖励。学习策略的方法主要分两种：(1) 基于策略，通过策略梯度直接优化策略；(2) 基于值，学习Q-函数，每次选择具有最高Q-值的动作。由于基于策略的方法存在方差问题，基于值的方法存在偏差问题，因此本文采取二者相结合的actor-critc学习方法。

3 ILLUSTRATIVE EXAMPLE

展示例子：

图3(a)是一个简单的Python代码示例，通过递归函数获得整数的阶乘，图3(b)是图3(a)中代码的AST，图3©是程序执行顺序的控制流程图。该代码的理想注释(绿色)如图3(a)所示，三个突出显示的单词语义可以由不同的代码表示精确地捕获，例如，plain text (用于 multiplying), type-augmented AST (用于integer) 和 CFG (用于 recursive)。

在不同的代码表示中，token和语句的顺序会有所不同。本文使用了代码的三种结构化和非结构化信息，纯文本、AST和CFG。基于纯文本，代码表示为 “def fact ( i ) : if i == 0 : ……”；基于AST，代码表示为{ stmt = FunctionDef ( identifier fact, arguments i, stmt body ) ; body = IfExp (expr test, expr body , expr orelse) ; …}；基于CFG，由于递归调用，后续的token从def开始。

图3(a)中可以观察到语句1由def、fact、和 i 组成，而整个函数由语句1-5组成，这样的层次结构能够由一个两层的注意力网络进行捕获（包括token层和statement层），如图4所示。底层对每个语句 $s_i$ 的token $x_{it}$ 进行编码即这一条语句的向量， $\alpha_i$ 和 $\alpha_{it}$ 分别表示第i个语句和第i个语句的第t个token的权重。

本文就是利用这三种代码表示以及HAN，分别对不同的token和语句序列生成三种不同的向量，最后把三个向量连接起来产生最后的代码表示，精确地捕获token之间和语句之间的关系。

4 THE DRL-GUIDED CODE SUMMARIZATION VIA HIERARCHICAL ATTENTION NETWORK

通过层次注意力网络实现深度强化学习引导的代码摘要。

本文方法遵循已成功应用于AlpahGo的Actor-Critic网络框架，并把框架分为四个子模块，如图5：

用于解释程序的非结构化和结构化信息的代码表示
用于将代码表示编码为隐藏空间中的向量的混合分层注意力网络
文本生成，根据前一词生成后续词的基于LSTM的生成网络
用于评价生成词的质量的critic网络

4.1 Source Code Representations

源代码表示，首先用一组符号 {. , ” ’ ( ) { } : ! - (space) } 对代码进行分割和token化，全部字母小写，并使用Word2Vec对token进行词嵌入，未定义的token作为未知单词处理。

有以下三种代码表示:纯文本、类型增强的抽象语法树和控制流图。

4.1.1 Plain Text

纯文本

最直接普通的文本表示，对于代码的词法级表示的关键见解：注释总是从源代码的词法项中提取，比如函数名、变量名等等。

4.1.2 Type-augmented Abstract Syntax Tree

类型增强的抽象语法树

本文首先利用python的AST模块获取AST序列，然后，为了利用额外的类型信息来增加派生的AST序列，抽象了token的类型信息，并将它们与代码的AST序列集成。例如，图3(a)中，通过在变量“1”上注释“integer”类，将第2行表示为“if integer i == integer 1”。

总之就是对每个节点都增加了类型信息。

4.1.3 Control Flow Graph

控制流图

本文提取了控制流图(CFG)作为代码的另一种语法级表示，CFG上的每个节点代表一条由一系列token组成的语句，连接两个节点的每条边表示程序的控制流。

某种意义上应该跟type-augemented AST一样，作为AST的一种补充。

4.2 Hybrid Hierarchical Attention Network

每个代码部分都对生成注释有自己的贡献，而token和语句高度依赖上下文，具体为，相同的token或语句在不同的上下文中可能有不同的重要性，而代码又具有层次结构（token形成语句，语句形成函数），因此，在NLP领域获得成功的HAN自然地用在代码表示上，分别为单个token和语句分配权重（attention）。注意力不仅能带来更好的性能，而且还可以洞察token/语句和相应的摘要之间的相关性，这有利于生成高质量的注释。

本文采用两层attention网络（一个token layer和一个statement layer），如图5(b)所示。该网络由四个部分组成：token序列编码器、token级注意层、语句编码器和语句级注意层。

假设 $d^{TXT}、d^{AST}和d^{CFG}$ 是通过编码纯文本、AST和CFG这三种代码表示形式得到的向量，把它们合并到一个混合向量 $d$ 来表示代码。该网络的具体内容如下：

token编码器：给定一个语句 $s_i$ ，它有 $T_i$ 个token， $x_{i0},...,x_{iT_{i-1}}$ 。本文首先用嵌入矩阵 $W_i$ 把所有token 嵌入到词向量中，即 $v_{it}=W_{ix_{it}}$ ，然后用LSTM从 $x_{i0}$ 到 $x_{iT_{i-1}}$ 读取语句 $s_i$ 来获得相应的token注释：

$v_{it}=W_{i}x_{it},t∈[0,T_i)$

$h_{it}=lstm(v_{it}),t∈[0,T_I)$

token attention：不是所有的token对语句的语义表达都有同样的贡献，如图6所示，代码片段中的“number” 和 “str” 比语句“defcheck number exist(str):” 中的“def”更重要，因为注释中包含“number”和“string”。

因此引入注意力机制来提取对注释生成更重要的token，并把这些token聚合成一个语句向量：

$u_{it}=tanh(W_xh_{it}+b_x)$

$\alpha_{it}=\frac {exp(u^T_{it}u_x)}{\sum_Texp(u^T_{it}u_x)}$

$s_i=\sum_T\alpha_{it}h_{it}$

$\alpha_i$ 表示语句 $s_i$ 中token $x_{it}$ 的贡献(attention)， $u_x$ 是token级的上下文向量，用于根据token对每个语句进行高级表示。

statement attenion：为了奖励在摘要任务中，对相关函数在语义上更加重要的语句，本文对语句也引入了一个注意力网络，表现为语句级的函数向量 $u_s$ ，用于衡量语句的重要性：

$u_{i}=tanh(W_sh_{i}+b_s)$

$\alpha_{i}=\frac {exp(u^T_{i}u_s)}{\sum_Lexp(u^T_{i}u_s)}$

$d^c=\sum_L\alpha_{i}h_{i}$

$\alpha_i$ 表示语句 $s_i$ 对于最终向量 $d^c$ 的贡献(attention)

Hybrid Representation of Source Code：对结构化上下文向量（AST和CFG表示）和非结构化上下文向量（纯文本表示）进行整合，即直接拼接 $d^{TXT};d^{AST};d^{CFG}]$ ，然后输入到单层线性网络形成最终向量 $d=W_d[d^{TXT};d^{AST};d^{CFG}]+b_d$ ，然后，添加一个隐藏层，使用上下文向量进行预测： $\hat s_t=tanh(W_cs_t+b_d)$ ，在解码阶段，初始值 $s_0$ 为 $d$ ，刷新 $t$ 步后获得 $s_t$ 。

4.3 Text Generation

文本生成

从HAN中获得的代码片段表示用于最后的注释生成，这里设计了一个分层的多维输入，因此采用Input-feeding 注意力机制，使用softmax预测第t个单词。 $p_\pi$ 表示由行动者网络决定的一个策略 $\pi$ ， $p_{\pi}(y_t|s_t)$ 表示第t个单词 $y_t$ 的概率分布：

$p_{\pi}(y_t|s_t)=softmax(W_s\widetilde s_t+b_s )$

4.4 Critic Network

传统的编码器-解码器结构会在训练时使用ground truth进行后续单词的预测（Teacher Forcing策略），而在强化学习中，则是通过迭代去优化评价指标来生成注释，如BLEU。本文应用critic网络来近似在时间t处生成的动作的值，发出反馈来迭代地调整网络。与actor网络不同，critic网络在每个解码步骤上输出单个值而不是概率分布。

给定生成的注释、奖励函数 $r$ ，定义一个值函数 $V$ 去预测在 $t$ 时刻状态 $s_t$ 的总奖励：

通过奖励函数，在注释序列生成完成后将得到一个评价分数（如BLEU），注：当相关步骤超过最大步骤T或遇到生成序列结束标记(EOS)时，该过程终止。那么基于BLEU的奖励函数可以计算为：

$c$ 是生成的注释， $c^{'}$ 是ground truth。

4.5 Model Training

对于actor网络，训练目标是最小化负的期望奖励，具体定义为 $L(\theta)=-\mathbb{E}_{y_1,...,T\sim\pi}(\sum^T_{l=t}r_t)$ 。把策略定义为生成注释的概率，用策略梯度进行优化。

cirtic网络则希望最小化以下损失函数： $L(\phi)=\frac {1}{2}\parallel V(s_t)-V_{\phi}(s_t) \parallel^2$ ， $V(s_t)$ 是值函数基于ground truth计算出来的值， $V_{\phi}(s_t)$ 则是critic网络基于生成的注释结合参数 $\phi$ 预测出来的值。 $L(\phi)$ 收敛后，模型训练完成。

actor的参数 $\theta$ 和critic的参数 $\phi$ ，所有参数表示为 $\Theta=\{\theta, \phi\}$ ，总的损失表示为 $L(\Theta)=L(\theta)+L(\phi)$ 。

5 EXPERIMENTS AND ANALYSIS

5.1 Dataset Preparation

Python：使用了此前研究工作“Improving automatic source code summarization via deep reinforcement learning”中的Python数据集，108k个代码-注释对，代码和注释的词汇表大小分别为50,400和31,350，前80%作为训练验证集（采用10-fold交叉验证），后20%用于测试集。

JAVA：采用“Deep code comment generation with hybrid lexical and syntactical information,” 中的java项目数据集对本文方法的跨语言性能进行评估，从deepcom的原始数据集中以自上而下的方式选取与本文的python数据集相同数量的训练、验证和测试数据。

源代码和注释的统计分布：基于大量的GitHub项目对本文采用的Python数据集进行统计分析。图7显示了代码和注释的长度分布，大多数代码片段的长度位于10到80个token之间，几乎所有注释的长度都在5到40之间；图8显示了收集到的数据集代码片段中的token数量和语句数量分布，每个语句中的token数量集中在1到15之间，每个函数中的语句数量集中在2到25之间。

5.2 Evaluation Metrics

本文涉及三个在NLP领域广泛使用的评估指标：BLEU、METEOR、ROUGE-L。

BLEU：

$BLEU=exp(\frac {1} {N} * \sum_{i=1}^N logp_n)$

$p_n=\frac {\sum_{n-gram\in c}count(n-gram)} {\sum_{n-gram'\in c'}count(n-gram')}$

$c$ 是生成的注释， $c^{'}$ 是ground truth。本文扩展了对BLEU指标的使用：sentence-level BLEU（S-BLEU）和corpus-level BLEU（C-BLEU）。特别地，SBLEU计算每个生成的注释和ground truth之间的BLEU分数，然后计算所有分数的平均值。C-BLEU计算corpus-level的BLEU得分。

METEOR：

$METEOR=(1-Pen)F_{mean}$

$Pen=\gamma (\frac{ch}{m})^\theta$ $F_{mean}=\frac {P_m R_m}{\alpha P_m +(1-\alpha)R_m}$

ROUGE-L：

$ROUGE-L=\frac {\sum_{S\in c}\sum_g ram_l \in SCount_{match}(gram_l)}{\sum_{S\in c}\sum_g ram_l \in SCount(gram_l)}$

其中 $l$ 表示token的数量， $Count_{match}(gram_l)$ 计算生成注释中匹配的n-gram的最大数量。

RQ1：我们的方法在生成注释上的有效性？不同代码表示配置的结果如何？

TXT-纯文本，AST-抽象语法树，CFG-控制流程图，HAN-层次注意力网络，DRL-深度强化学习

RQ2：不同training epochs的时间消耗和性能趋势？

表5：不同代码表示的时间消耗

图9：epochs的增加对性能影响

RQ3：我们的方法在代码或注释长度不同的数据集上表现如何？

对比中的基线为仅使用单个代码表示的强化学习模型：TXT\AST\CFG，2个特性比一个特性更优：TXT&AST、TXT&CFG和AST&CFG，本文方法用了全部的三个特性，取得最优效果。

图10：不同代码长度下的性能

图11：不同注释长度下的性能

RQ4：与其他方法相比性能如何？

优于此前的研究

RQ5：除了NLP指标，如何广泛地评估我们的方法？

案例研究和用户研究（人工评估）

机器学习与深度学习间关系与区别 ℒℴѵℯ心·动ꦿ໊ོ꫞ 人工智能学习深度学习 python
一、机器学习概述定义机器学习（MachineLearning,ML）是一种通过数据驱动的方法，利用统计学和计算算法来训练模型，使计算机能够从数据中学习并自动进行预测或决策。机器学习通过分析大量数据样本，识别其中的模式和规律，从而对新的数据进行判断。其核心在于通过训练过程，让模型不断优化和提升其预测准确性。主要类型1.监督学习（SupervisedLearning）监督学习是指在训练数据集中包含输入
将cmd中命令输出保存为txt文本文件落难Coder Windows cmd window
最近深度学习本地的训练中我们常常要在命令行中运行自己的代码，无可厚非，我们有必要保存我们的炼丹结果，但是复制命令行输出到txt是非常麻烦的，其实Windows下的命令行为我们提供了相应的操作。其基本的调用格式就是：运行指令>输出到的文件名称或者具体保存路径测试下，我打开cmd并且ping一下百度：pingwww.baidu.com>./data.txt看下相同目录下data.txt的输出：如果你再
推荐3家毕业AI论文可五分钟一键生成！文末附免费教程！小猪包333 写论文人工智能 AI写作深度学习计算机视觉
在当前的学术研究和写作领域，AI论文生成器已经成为许多研究人员和学生的重要工具。这些工具不仅能够帮助用户快速生成高质量的论文内容，还能进行内容优化、查重和排版等操作。以下是三款值得推荐的AI论文生成器：千笔-AIPassPaper、懒人论文以及AIPaperPass。千笔-AIPassPaper千笔-AIPassPaper是一款基于深度学习和自然语言处理技术的AI写作助手，旨在帮助用户快速生成高质
AI大模型的架构演进与最新发展季风泯灭的季节 AI大模型应用技术二人工智能架构
随着深度学习的发展，AI大模型（LargeLanguageModels,LLMs）在自然语言处理、计算机视觉等领域取得了革命性的进展。本文将详细探讨AI大模型的架构演进，包括从Transformer的提出到GPT、BERT、T5等模型的历史演变，并探讨这些模型的技术细节及其在现代人工智能中的核心作用。一、基础模型介绍：Transformer的核心原理Transformer架构的背景在Transfo
[实践应用] 深度学习之模型性能评估指标 YuanDaima2048 深度学习工具使用深度学习人工智能损失函数性能评估 pytorch python 机器学习
文章总览：YuanDaiMa2048博客文章总览深度学习之模型性能评估指标分类任务回归任务排序任务聚类任务生成任务其他介绍在机器学习和深度学习领域，评估模型性能是一项至关重要的任务。不同的学习任务需要不同的性能指标来衡量模型的有效性。以下是对一些常见任务及其相应的性能评估指标的详细解释和总结。分类任务分类任务是指模型需要将输入数据分配到预定义的类别或标签中。以下是分类任务中常用的性能指标：准确率(
[实践应用] 深度学习之优化器 YuanDaima2048 深度学习工具使用 pytorch 深度学习人工智能机器学习 python 优化器
文章总览：YuanDaiMa2048博客文章总览深度学习之优化器1.随机梯度下降（SGD）2.动量优化（Momentum）3.自适应梯度（Adagrad）4.自适应矩估计（Adam）5.RMSprop总结其他介绍在深度学习中，优化器用于更新模型的参数，以最小化损失函数。常见的优化函数有很多种，下面是几种主流的优化器及其特点、原理和PyTorch实现：1.随机梯度下降（SGD）原理:随机梯度下降通过
生成式地图制图 Bwywb_3 深度学习机器学习深度学习生成对抗网络
生成式地图制图（GenerativeCartography）是一种利用生成式算法和人工智能技术自动创建地图的技术。它结合了传统的地理信息系统（GIS）技术与现代生成模型（如深度学习、GANs等），能够根据输入的数据自动生成符合需求的地图。这种方法在城市规划、虚拟环境设计、游戏开发等多个领域具有应用前景。主要特点：自动化生成：通过算法和模型，系统能够根据输入的地理或空间数据自动生成地图，而无需人工逐
深度 Qlearning：在直播推荐系统中的应用 AGI通用人工智能之禅程序员提升自我硅基计算碳基计算认知计算生物计算深度学习神经网络大数据 AIGC AGI LLM Java Python 架构设计 Agent 程序员实现财富自由
深度Q-learning：在直播推荐系统中的应用关键词：深度Q-learning,强化学习,直播推荐系统,个性化推荐1.背景介绍1.1问题的由来随着互联网技术的飞速发展,直播平台如雨后春笋般涌现。面对海量的直播内容,用户很难快速找到自己感兴趣的内容。因此,个性化推荐系统在直播平台中扮演着越来越重要的角色。1.2研究现状目前,主流的个性化推荐算法包括协同过滤、基于内容的推荐等。这些方法在一定程度上缓
吴恩达深度学习笔记(30)-正则化的解释极客Array
正则化（Regularization）深度学习可能存在过拟合问题——高方差，有两个解决方法，一个是正则化，另一个是准备更多的数据，这是非常可靠的方法，但你可能无法时时刻刻准备足够多的训练数据或者获取更多数据的成本很高，但正则化通常有助于避免过拟合或减少你的网络误差。如果你怀疑神经网络过度拟合了数据，即存在高方差问题，那么最先想到的方法可能是正则化，另一个解决高方差的方法就是准备更多数据，这也是非常
个人学习笔记7-6：动手学深度学习pytorch版-李沐浪子L 深度学习深度学习笔记计算机视觉 python 人工智能神经网络 pytorch
#人工智能##深度学习##语义分割##计算机视觉##神经网络#计算机视觉13.11全卷积网络全卷积网络（fullyconvolutionalnetwork，FCN）采用卷积神经网络实现了从图像像素到像素类别的变换。引入l转置卷积（transposedconvolution）实现的，输出的类别预测与输入图像在像素级别上具有一一对应关系：通道维的输出即该位置对应像素的类别预测。13.11.1构造模型下
深度学习-点击率预估-研究论文2024-09-14速读 sp_fyf_2024 深度学习人工智能
深度学习-点击率预估-研究论文2024-09-14速读1.DeepTargetSessionInterestNetworkforClick-ThroughRatePredictionHZhong,JMa,XDuan,SGu,JYao-2024InternationalJointConferenceonNeuralNetworks,2024深度目标会话兴趣网络用于点击率预测摘要：这篇文章提出了一种新
损失函数与反向传播 Star_. PyTorch pytorch 深度学习 python
损失函数定义与作用损失函数(lossfunction)在深度学习领域是用来计算搭建模型预测的输出值和真实值之间的误差。1.损失函数越小越好2.计算实际输出与目标之间的差距3.为更新输出提供依据（反向传播)常见的损失函数回归常见的损失函数有：均方差（MeanSquaredError，MSE）、平均绝对误差（MeanAbsoluteErrorLoss，MAE）、HuberLoss是一种将MSE与MAE
【深度学习】训练过程中一个OOM的问题，太难查了 weixin_40293999 深度学习深度学习人工智能
现象：各位大佬又遇到过ubuntu的这个问题么？现象是在训练过程中，ssh上不去了，能ping通，没死机，但是ubunutu的pc侧的显示器，鼠标啥都不好用了。只能重启。问题原因：OOM了95G，尼玛！！！！pytorch爆内存了，然后journald假死了，在journald被watchdog干掉之后，系统就崩溃了。这种规模的爆内存一般，即使被oomkill了，也要卡半天的，确实会这样，能不能配
OpenAI o1 的价值意义及“强化学习的Scaling Law” & Kimi创始人杨植麟最新分享：关于OpenAI o1新范式的深度思考光剑书架上的书 ChatGPT 大数据AI人工智能计算人工智能算法机器学习
OpenAIo1的价值意义及“强化学习的ScalingLaw”蹭下热度谈谈OpenAIo1的价值意义及RL的Scalinglaw。一、OpenAIo1是大模型的巨大进步我觉得OpenAIo1是自GPT4发布以来，基座大模型最大的进展，逻辑推理能力提升的效果和方法比预想的要好，GPT4o和o1是发展大模型不同的方向，但是o1这个方向更根本，重要性也比GPT4o这种方向要重要得多，原因下面会分析。为什
探索未来，大规模分布式深度强化学习——深入解析IMPALA架构汤萌妮Margaret
探索未来，大规模分布式深度强化学习——深入解析IMPALA架构scalable_agent项目地址:https://gitcode.com/gh_mirrors/sc/scalable_agent在当今的人工智能研究前沿，深度强化学习（DRL）因其在复杂任务中的卓越表现而备受瞩目。本文要介绍的是一个开源于GitHub的重量级项目：“ScalableDistributedDeep-RLwithImp
云服务业界动态简报-20180128 Captain7
一、青云青云QingCloud推出深度学习平台DeepLearningonQingCloud，包含了主流的深度学习框架及数据科学工具包，通过QingCloudAppCenter一键部署交付，可以让算法工程师和数据科学家快速构建深度学习开发环境，将更多的精力放在模型和算法调优。二、腾讯云1.腾讯云正式发布腾讯专有云TCE(TencentCloudEnterprise)矩阵，涵盖企业版、大数据版、AI
机器学习VS深度学习 nfgo 机器学习
机器学习（MachineLearning,ML）和深度学习（DeepLearning,DL）是人工智能（AI）的两个子领域，它们有许多相似之处，但在技术实现和应用范围上也有显著区别。下面从几个方面对两者进行区分：1.概念层面机器学习：是让计算机通过算法从数据中自动学习和改进的技术。它依赖于手动设计的特征和数学模型来进行学习，常用的模型有决策树、支持向量机、线性回归等。深度学习：是机器学习的一个子领
大数据毕业设计hadoop+spark+hive知识图谱租房数据分析可视化大屏租房推荐系统 58同城租房爬虫房源推荐系统房价预测系统计算机毕业设计机器学习深度学习人工智能 2401_84572577 程序员大数据 hadoop 人工智能
做了那么多年开发，自学了很多门编程语言，我很明白学习资源对于学一门新语言的重要性，这些年也收藏了不少的Python干货，对我来说这些东西确实已经用不到了，但对于准备自学Python的人来说，或许它就是一个宝藏，可以给你省去很多的时间和精力。别在网上瞎学了，我最近也做了一些资源的更新，只要你是我的粉丝，这期福利你都可拿走。我先来介绍一下这些东西怎么用，文末抱走。（1）Python所有方向的学习路线（
深度学习-13-小语言模型之SmolLM的使用皮皮冰燃深度学习深度学习
文章附录1SmolLM概述1.1SmolLM简介1.2下载模型2运行2.1在CPU/GPU/多GPU上运行模型2.2使用torch.bfloat162.3通过位和字节的量化版本3应用示例4问题及解决4.1attention_mask和pad_token_id报错4.2max_new_tokens=205参考附录1SmolLM概述1.1SmolLM简介SmolLM是一系列尖端小型语言模型，提供三种规
基于深度学习的农作物病害检测 SEU-WYL 深度学习dnn 深度学习人工智能
基于深度学习的农作物病害检测利用卷积神经网络（CNN）、生成对抗网络（GAN）、Transformer等深度学习技术，自动识别和分类农作物的病害，帮助农业工作者提高作物管理效率、减少损失。1.农作物病害检测的挑战病害种类繁多：农作物病害的类型多样，不同病害在同一作物上的表现差异很大，同时同一种病害在不同生长阶段的症状也可能不同。环境影响：天气、光照、湿度等外部环境因素会影响农作物的表现，使得病害检
基于深度学习的文本引导的图像编辑 SEU-WYL 深度学习dnn 深度学习人工智能
基于深度学习的文本引导的图像编辑（Text-GuidedImageEditing）是一种通过自然语言文本指令对图像进行编辑或修改的技术。它结合了图像生成和自然语言处理（NLP）的最新进展，使用户能够通过描述性文本对图像内容进行精确的调整和操控。1.文本引导的图像编辑的挑战文本和图像之间的对齐：如何将文本中的语义信息准确地映射到图像中的特定区域或元素是一个关键挑战。这涉及到多模态数据的对齐和理解。编
深度学习--对抗生成网络（GAN, Generative Adversarial Network） Ambition_LAO 深度学习生成对抗网络
对抗生成网络（GAN,GenerativeAdversarialNetwork）是一种深度学习模型，由IanGoodfellow等人在2014年提出。GAN主要用于生成数据，通过两个神经网络相互对抗，来生成以假乱真的新数据。以下是对GAN的详细阐述，包括其概念、作用、核心要点、实现过程、代码实现和适用场景。1.概念GAN由两个神经网络组成：生成器（Generator）和判别器（Discrimina
深度学习：怎么看pth文件的参数奥利给少年深度学习人工智能
.pth文件是PyTorch模型的权重文件，它通常包含了训练好的模型的参数。要查看或使用这个文件，你可以按照以下步骤操作：1.确保你有模型的定义你需要有创建这个.pth文件时所用的模型的代码。这意味着你需要有模型的类定义和架构。2.加载模型权重使用PyTorch的load_state_dict方法来加载权重。这里是如何操作的：importtorchimporttorch.nnasnn#定义模型结构
chatgpt赋能python：如何在Python中安装Keras库？ turensu ChatGpt python chatgpt keras 计算机
如何在Python中安装Keras库？Keras是一个简单易用的神经网络库，由FrançoisChollet编写。它在Python编程语言中实现了深度学习的功能，可以使您更轻松地构建和试验不同类型的神经网络。如果您是一名Python开发人员，肯定会想知道如何在您的Python项目中安装Keras库。在本文中，我们将向您展示如何安装和配置Keras库。步骤1：安装Python要使用Keras库，您需
如何理解深度学习的训练过程奋斗的草莓熊深度学习人工智能 python scikit-learn virtualenv numpy pandas
文章目录1.训练是干什么？2.预训练模型进行训练，主要更改的是预训练模型的什么东西？1.训练是干什么？以yolov5为例子，训练的目的是把一组输入猫狗图像放到神经网络中，得到一个输出模型，这个模型下次可以直接用来识别哪个是猫，哪个是狗2.预训练模型进行训练，主要更改的是预训练模型的什么东西？超参数（Hyperparameters）：这是模型结构中定义的参数，比如：卷积核大小（kernel_size
Keras深度学习框架入门及实战指南司莹嫣Maude
Keras深度学习框架入门及实战指南keraskeras-team/keras:是一个基于Python的深度学习库，它没有使用数据库。适合用于深度学习任务的开发和实现，特别是对于需要使用Python深度学习库的场景。特点是深度学习库、Python、无数据库。项目地址:https://gitcode.com/gh_mirrors/ke/keras一、项目介绍Keras简介Keras是一款高级神经网络
深度学习驱动的车牌识别：技术演进与未来挑战逼子歌深度学习车牌识别神经网络字符识别 YOLO 卷积神经网络
一、引言1.1研究背景在当今社会，智能交通系统的发展日益重要，而车牌识别作为其关键组成部分，发挥着至关重要的作用。车牌识别技术广泛应用于交通管理、停车场管理、安防监控等领域。在交通管理中，它可以用于车辆识别、交通违法监控和车流统计等，提高交通管理的效率和准确性。在停车场管理中，实现车辆的自动识别和收费，提升管理和服务水平。在安防监控领域，可用于追踪嫌疑人及犯罪行为。深度学习的出现为车牌识别带来了重
每天五分钟玩转深度学习PyTorch：模型参数优化器torch.optim 幻风_huanfeng 深度学习框架pytorch 深度学习 pytorch 人工智能神经网络机器学习优化算法
本文重点在机器学习或者深度学习中，我们需要通过修改参数使得损失函数最小化(或最大化)，优化算法就是一种调整模型参数更新的策略。在pytorch中定义了优化器optim，我们可以使用它调用封装好的优化算法，然后传递给它神经网络模型参数，就可以对模型进行优化。本文是学习第6步(优化器)，参考链接pytorch的学习路线随机梯度下降算法在深度学习和机器学习中，梯度下降算法是最常用的参数更新方法，它的公式
什么是AIGC？有哪些免费工具？ chent_某位 AIGC
AIGC（AIGeneratedContent），即“人工智能生成内容”，是指通过人工智能技术自动生成各种类型的数字内容。AIGC让机器能够根据输入的信息或数据生成符合人类需求的文本、图像、音频、视频等内容，极大提高了内容创作的效率。AIGC的背景与起源随着深度学习和自然语言处理技术的快速发展，人工智能已经不再局限于简单的任务，如分类、预测和数据分析，而是具备了生成内容的能力。生成式AI模型，如O
transformer架构(Transformer Architecture)原理与代码实战案例讲解 AI架构设计之禅大数据AI人工智能 Python入门实战计算科学神经计算深度学习神经网络大数据人工智能大型语言模型 AI AGI LLM Java Python 架构设计 Agent RPA
transformer架构(TransformerArchitecture)原理与代码实战案例讲解关键词：Transformer,自注意力机制,编码器-解码器,预训练,微调,NLP,机器翻译作者：禅与计算机程序设计艺术/ZenandtheArtofComputerProgramming1.背景介绍1.1问题的由来自然语言处理（NLP）领域的发展经历了从规则驱动到统计驱动再到深度学习驱动的三个阶段。
安装数据库首次应用 Array_06 java oracle sql
可是为什么再一次失败之后就变成直接跳过那个要求 enter full pathname of java.exe的界面这个java.exe是你的Oracle 11g安装目录中例如：【F:\app\chen\product\11.2.0\dbhome_1\jdk\jre\bin】下的java.exe 。不是你的电脑安装的java jdk下的java.exe！注意第一次，使用SQL D
Weblogic Server Console密码修改和遗忘解决方法 bijian1013 Welogic
在工作中一同事将Weblogic的console的密码忘记了，通过网上查询资料解决，实践整理了一下。一.修改Console密码打开weblogic控制台，安全领域 --> myrealm -->&n
IllegalStateException: Cannot forward a response that is already committed Cwind java Servlets
对于初学者来说，一个常见的误解是：当调用 forward() 或者 sendRedirect() 时控制流将会自动跳出原函数。标题所示错误通常是基于此误解而引起的。示例代码： protected void doPost() { if (someCondition) { sendRedirect(); } forward(); // Thi
基于流的装饰设计模式木zi_鸣设计模式
当想要对已有类的对象进行功能增强时，可以定义一个类，将已有对象传入，基于已有的功能，并提供加强功能。自定义的类成为装饰类模仿BufferedReader，对Reader进行包装，体现装饰设计模式装饰类通常会通过构造方法接受被装饰的对象，并基于被装饰的对象功能，提供更强的功能。装饰模式比继承灵活，避免继承臃肿，降低了类与类之间的关系装饰类因为增强已有对象，具备的功能该
Linux中的uniq命令被触发 linux
Linux命令uniq的作用是过滤重复部分显示文件内容，这个命令读取输入文件，并比较相邻的行。在正常情况下，第二个及以后更多个重复行将被删去，行比较是根据所用字符集的排序序列进行的。该命令加工后的结果写到输出文件中。输入文件和输出文件必须不同。如果输入文件用“- ”表示，则从标准输入读取。 AD： uniq [选项] 文件说明：这个命令读取输入文件，并比较相邻的行。在正常情况下，第二个
正则表达式Pattern 肆无忌惮_ Pattern
正则表达式是符合一定规则的表达式，用来专门操作字符串，对字符创进行匹配，切割，替换，获取。例如，我们需要对QQ号码格式进行检验规则是长度6~12位不能0开头只能是数字，我们可以一位一位进行比较，利用parseLong进行判断，或者是用正则表达式来匹配[1-9][0-9]{4,14} 或者 [1-9]\d{4,14} &nbs
Oracle高级查询之OVER (PARTITION BY ..) 知了ing oracle sql
一、rank()/dense_rank() over(partition by ...order by ...) 现在客户有这样一个需求，查询每个部门工资最高的雇员的信息，相信有一定oracle应用知识的同学都能写出下面的SQL语句： select e.ename, e.job, e.sal, e.deptno from scott.emp e, (se
Python调试矮蛋蛋 python pdb
原文地址： http://blog.csdn.net/xuyuefei1988/article/details/19399137 1、下面网上收罗的资料初学者应该够用了，但对比IBM的Python 代码调试技巧： IBM：包括 pdb 模块、利用 PyDev 和 Eclipse 集成进行调试、PyCharm 以及 Debug 日志进行调试： http://www.ibm.com/d
webservice传递自定义对象时函数为空，以及boolean不对应的问题 alleni123 webservice
今天在客户端调用方法 NodeStatus status=iservice.getNodeStatus(). 结果NodeStatus的属性都是null。进行debug之后，发现服务器端返回的确实是有值的对象。后来发现原来是因为在客户端，NodeStatus的setter全部被我删除了。本来是因为逻辑上不需要在客户端使用setter，结果改了之后竟然不能获取带属性值的
java如何干掉指针，又如何巧妙的通过引用来操作指针————>说的就是java指针百合不是茶
C语言的强大在于可以直接操作指针的地址，通过改变指针的地址指向来达到更改地址的目的,又是由于c语言的指针过于强大，初学者很难掌握， java的出现解决了c，c++中指针的问题 java将指针封装在底层，开发人员是不能够去操作指针的地址，但是可以通过引用来间接的操作：定义一个指针p来指向a的地址（&是地址符号）：
Eclipse打不开，提示“An error has occurred.See the log file ***/.log” bijian1013 eclipse
打开eclipse工作目录的\.metadata\.log文件，发现如下错误： !ENTRY org.eclipse.osgi 4 0 2012-09-10 09:28:57.139 !MESSAGE Application error !STACK 1 java.lang.NoClassDefFoundError: org/eclipse/core/resources/IContai
spring aop实例annotation方法实现 bijian1013 java spring AOP annotation
在spring aop实例中我们通过配置xml文件来实现AOP，这里学习使用annotation来实现，使用annotation其实就是指明具体的aspect,pointcut和advice。1.申明一个切面(用一个类来实现)在这个切面里,包括了advice和pointcut AdviceMethods.jav
[Velocity一]Velocity语法基础入门 bit1129 velocity
用户和开发人员参考文档 http://velocity.apache.org/engine/releases/velocity-1.7/developer-guide.html 注释 1.行级注释## 2.多行注释#* *# 变量定义使用$开头的字符串是变量定义，例如$var1, $var2, 赋值使用#set为变量赋值，例
【Kafka十一】关于Kafka的副本管理 bit1129 kafka
1. 关于request.required.acks request.required.acks控制者Producer写请求的什么时候可以确认写成功，默认是0， 0表示即不进行确认即返回。 1表示Leader写成功即返回，此时还没有进行写数据同步到其它Follower Partition中 -1表示根据指定的最少Partition确认后才返回，这个在 Th
lua统计nginx内部变量数据 ronin47 lua nginx　统计
server { listen 80; server_name photo.domain.com; location /{set $str $uri; content_by_lua ' local url = ngx.var.uri local res = ngx.location.capture(
java-11.二叉树中节点的最大距离 bylijinnan java
import java.util.ArrayList; import java.util.List; public class MaxLenInBinTree { /* a. 1 / \ 2 3 / \ / \ 4 5 6 7 max=4 pass "root"
Netty源码学习-ReadTimeoutHandler bylijinnan java netty
ReadTimeoutHandler的实现思路：开启一个定时任务，如果在指定时间内没有接收到消息，则抛出ReadTimeoutException 这个异常的捕获，在开发中，交给跟在ReadTimeoutHandler后面的ChannelHandler，例如 private final ChannelHandler timeoutHandler = new ReadTim
jquery验证上传文件样式及大小(好用) cngolon 文件上传 jquery验证
<!DOCTYPE html> <html> <head> <meta http-equiv="Content-Type" content="text/html; charset=utf-8" /> <script src="jquery1.8/jquery-1.8.0.
浏览器兼容【转】 cuishikuan css 浏览器 IE
浏览器兼容问题一：不同浏览器的标签默认的外补丁和内补丁不同问题症状：随便写几个标签，不加样式控制的情况下，各自的margin 和padding差异较大。碰到频率:100% 解决方案：CSS里 *{margin:0;padding:0;} 备注：这个是最常见的也是最易解决的一个浏览器兼容性问题，几乎所有的CSS文件开头都会用通配符*来设
Shell特殊变量：Shell $0, $#, $*, $@, $?, $$和命令行参数 daizj shell $#$?特殊变量
前面已经讲到，变量名只能包含数字、字母和下划线，因为某些包含其他字符的变量有特殊含义，这样的变量被称为特殊变量。例如，$ 表示当前Shell进程的ID，即pid，看下面的代码： $echo $$ 运行结果 29949 特殊变量列表变量含义 $0 当前脚本的文件名 $n 传递给脚本或函数的参数。n 是一个数字，表示第几个参数。例如，第一个
程序设计KISS 原则-------KEEP IT SIMPLE, STUPID! dcj3sjt126com unix
翻到一本书，讲到编程一般原则是kiss：Keep It Simple, Stupid.对这个原则深有体会，其实不仅编程如此，而且系统架构也是如此。 KEEP IT SIMPLE, STUPID! 编写只做一件事情，并且要做好的程序；编写可以在一起工作的程序，编写处理文本流的程序，因为这是通用的接口。这就是UNIX哲学.所有的哲学真正的浓缩为一个铁一样的定律，高明的工程师的神圣的“KISS 原
android Activity间List传值 dcj3sjt126com Activity
第一个Activity： import java.util.ArrayList;import java.util.HashMap;import java.util.List;import java.util.Map;import android.app.Activity;import android.content.Intent;import android.os.Bundle;import a
tomcat 设置java虚拟机内存 eksliang tomcat 内存设置
转载请出自出处：http://eksliang.iteye.com/blog/2117772 http://eksliang.iteye.com/ 常见的内存溢出有以下两种: java.lang.OutOfMemoryError: PermGen space java.lang.OutOfMemoryError: Java heap space ------------
Android 数据库事务处理 gqdy365 android
使用SQLiteDatabase的beginTransaction()方法可以开启一个事务，程序执行到endTransaction() 方法时会检查事务的标志是否为成功，如果程序执行到endTransaction()之前调用了setTransactionSuccessful() 方法设置事务的标志为成功则提交事务，如果没有调用setTransactionSuccessful() 方法则回滚事务。事
Java 打开浏览器 hw1287789687 打开网址 open浏览器 open browser 打开url 打开浏览器
使用java 语言如何打开浏览器呢? 我们先研究下在cmd窗口中,如何打开网址使用IE 打开 D:\software\bin>cmd /c start iexplore http://hw1287789687.iteye.com/blog/2153709 使用火狐打开 D:\software\bin>cmd /c start firefox http://hw1287789
ReplaceGoogleCDN：将 Google CDN 替换为国内的 Chrome 插件 justjavac chrome Google google api chrome插件
Chrome Web Store 安装地址： https://chrome.google.com/webstore/detail/replace-google-cdn/kpampjmfiopfpkkepbllemkibefkiice 由于众所周知的原因，只需替换一个域名就可以继续使用Google提供的前端公共库了。同样，通过script标记引用这些资源，让网站访问速度瞬间提速吧
进程VS.线程 m635674608 线程
资料来源： http://www.liaoxuefeng.com/wiki/001374738125095c955c1e6d8bb493182103fac9270762a000/001397567993007df355a3394da48f0bf14960f0c78753f000 1、Apache最早就是采用多进程模式 2、IIS服务器默认采用多线程模式 3、多进程优缺点优点：多进程模式最大
Linux下安装MemCached 字符串 memcached
前提准备：1. MemCached目前最新版本为：1.4.22，可以从官网下载到。2. MemCached依赖libevent，因此在安装MemCached之前需要先安装libevent。2.1 运行下面命令，查看系统是否已安装libevent。[root@SecurityCheck ~]# rpm -qa|grep libevent libevent-headers-1.4.13-4.el6.n
java设计模式之--jdk动态代理（实现aop编程） Supanccy2013 java DAO 设计模式 AOP
与静态代理类对照的是动态代理类，动态代理类的字节码在程序运行时由Java反射机制动态生成，无需程序员手工编写它的源代码。动态代理类不仅简化了编程工作，而且提高了软件系统的可扩展性，因为Java 反射机制可以生成任意类型的动态代理类。java.lang.reflect 包中的Proxy类和InvocationHandler 接口提供了生成动态代理类的能力。 &
Spring 4.2新特性-对java8默认方法(default method)定义Bean的支持 wiselyman spring 4
2.1 默认方法(default method) java8引入了一个default medthod; 用来扩展已有的接口,在对已有接口的使用不产生任何影响的情况下,添加扩展使用default关键字 Spring 4.2支持加载在默认方法里声明的bean 2.2 将要被声明成bean的类 public class DemoService {