marasimc

【论文精度】CodeBERT——基于自然语言和编程语言的预训练模型

CodeBERT

论文地址：https://arxiv.org/abs/2002.08155

Abstract

提出了一种用于编程语言（PL）和自然语言（NL）的双模态预训练模型CodeBERT，CodeBERT学习了通用表示，支持自然语言代码搜索、代码文档生成等下游NL-PL任务。本文利用基于Transformer的神经架构开发了CodeBERT，使用**混合目标函数(hybrid objective function)**对其进行训练，该混合目标函数包含了替换token检测的预训练任务，即检测从生成器中采样的可行替代方案，这使我们能够利用NL-PL对的双模态数据以及单模态数据，前者为模型训练提供输入tokens；后者有助于学习更好的生成器。

在实验方面，通过微调模型参数在两个NL-PL应用上评估CodeBERT，结果表明CodeBERT在自然语言代码搜索和代码文档生成任务上都达到了SOTA性能；此外，为了研究在CodeBERT中学习了什么类型的知识，论文构造了一个用于NL-PL探测(NL-PL probing)的数据集，并在一个zero-shot设置中进行评估，其中预训练模型的参数中固定的，结果表明CodeBERT模型在NL-PL探测方面的性能优于之前的预训练模型。

1. Introduction

ELMo(2018)/GPT(2018)/BERT(2018)/XLNet(2019)/RoBERTa(2019)等预训练模型在各种NLP任务上显著地提高了最先进的技术，这些预训练模型从大量自监督目标优化的未标记文本学习有效的上下文表示，例如掩码语言建模从一个人工掩码输入序列中预测原始被掩码的词。预训练模型在NLP领域的成功也推动了多模态预训练模型的激增，例如ViLBERT（用于语言-图像）、VideoBERT（用于语言-视频），他们从双模态数据（如带有双模态自监督目标的语言-图像对）中进行学习。

本论文提出了CodeBERT，是一个用于自然语言（NL）与像Python、java、JavaScript等编程语言（PL）的双模态预训练模型。CodeBERT捕获了自然语言和编程语言的语义联系，生成了通用的（general-purpose）表示，广泛支持NL-PL理解任务（例如自然语言代码搜索）和生成式任务（例如代码文档生成）。CodeBERT使用多层Transformer进行开发，为了充分利用NL-PL对的双模态实例以及大量单模态代码，采用一个**混合目标函数（hybrid objective function）**对CodeBERT进行训练，包含了标准的masked language modeling 与 replaces token detection，淡漠太代码可以帮助学习更好的生成器，生成器能够为后一个训练目标产生更好的可替代tokens。

从包含6中编程语言的GitHub代码仓库中训练CodeBERT，其中双模态数据点是与函数级自然语言文档配对的代码，训练是在类似于多语言BERT（multilingual BERT）的设置下进行的，一个预训练模型是在6中编程语言学习的，没有使用显式标记来表示输入的编程语言。

在两个下游NL-PL任务上对CodeBERT进行评估，包括自然语言代码检索与代码文档生成。结果表明对CoBERT进行参数微调后再两个任务都获得了SOTA性能。
为了进一步探索CodeBERT学习了什么类型的知识，论文构造了一个用于NL-PL探索的数据集，在zero-shot场景（比如，没有对参数进行微调）下对CodeBERT进行测试，发现CodeBERT性能始终优于RoBERTa（一个单纯基于自然语言的预训练模型）。

论文的贡献主要包括：

CodeBERT是第一个为多种编程语言预训练的大型NL-PL模型；
实验结果表明，CodeBERT在代码搜索与代码到文本生成任务上都是有效的；
进一步构造了一个数据集，这是第一个用于测试基于代码的预训练模型的探测能力(probing ability)的数据集。

2. Background

2.1 NLP中的预训练模型

很多成功的方法在具有自监督学习目标的大规模纯文本上训练神经网络，最具有代表性的架构为Transformer，它包含多层self-attention层，并且可以以端到端方式以梯度下降的方式进行常规学习，因为每个部分都是可微的（differentiable）。“自监督”的意思是用于预训练的监督是自动从原始数据(raw data)中收集的。主要的学习目标是语言模型及其变体，例如，在GPT中学习目标是语言模型，即根据某个词w_k前面的文本{w₁,w₂,…,w_k-1}去预测词w_k，这里只考虑了上文；对于BERT，使用了掩码语言建模目标，学习在给定的上下文情况下预测被随机掩码词序列的掩码词。掩码语言建模被用于CodeBERT训练的一个学习目标。

2.2 多模态(Multi-Modal)预训练模型

预训练模型在NLP中的显著成功推动了多模态预训练模型的发展，学习不同模态数据的隐式对齐（implicit alignment），这些模型通常是从双模态数据中学习的，例如语言-图像对或者语言-视频对，例如，ViLBERT从图像说明数据（image caption data）中进行学习，模型通过给定观察到的输入重建掩码图像区域或掩码词的类别进行学习，同时预测说明是否描述了图像内容；VideoBERT从语言-视频数据中学习，通过预测掩码视频或文本进行训练。

本文工作中，将NL与PL视为两种模态，与以往研究不同的是，模型的训练数据不仅包括NL-PL对的双模态数据，还包括大量的单模态数据（如没有配对文档的代码）。

一个同样的研究（Kanade et al., 2019）使用掩码语言模型和下句预测作为目标，在Python源代码上训练一个BERT模型，其中一个句子是一个Python标准定义的逻辑代码行。在预训练过程上，CodeBERT与其他研究的不同点在于：（1）CodeBERT采用跨模态的方式（cross-modal style）进行训练，同时利用了双模态NL-PL数据和单模态PL/NL数据；（2）CodeBERT采用了6中编程语言进行预训练；（3）CodeBERT使用一个新的基于replaces token detection训练目标进行训练。

3. CodeBERT

这一部分介绍：模型结构、输入输出表示、用于CodeBERT训练的目标与数据、如何对CodeBERT进行微调。

3.1 模型架构

遵循BERT、RoBERTa，使用多层的双向Transformer作为CodeBERT的模型架构，使用与RoBERTa-base完全相同的模型架构开发CodeBERT，模型参数总数为125M。

3.2 输入/输出表示

在预训练阶段，将输入设置为带有特殊分隔符的两个片段的拼接，即：[CLS], w₁, w₂, …w_n, [SEP], c₁, c₂, …, c_m, [EOS]. 一个片段是自然语言文本，另一个是来自特定编程语言的代码；[CLS]是在两个片段开头的特殊token，其最终隐藏层表示被认为是聚合的序列表示，用于分类或排序。遵循在Transformer中处理文本的标准方式，将一个自然语言文本视为一个单词序列，并将其拆分为WordPiece；将一段代码视为一个token序列。

CodeBERT的输出包括：（1）自然语言和代码中每个token的上下文向量表示；（2）作为聚合序列表示的[CLS]的表示。

3.3 预训练数据

同时使用双模态数据（自然语言-代码对）和单模态数据（无配对自然语言文本的代码或者无配对代码的自然语言）训练CodeBERT。

使用来自GitHub仓库的数据点，其中每个双模态数据点是一个单独的带有配对文档的函数、每个单模态代码是一个没有配对文档的函数。具体来说，使用了一个最近的大型数据集，包含2.1M的双模态数据点和6.4M的单模态代码，跨越6中编程语言（Python、java、JavaScript、PHP、Ruby、Go），具体如表1所示：

数据来自公开的开源GitHub仓库，通过一组约束和规则进行过滤。例如：（1）每个项目应该至少被一个其他项目使用；（2）每个文档被截断到第一段；（3）短语三个token的文档被删除；（4）短语三行的函数被删除；（5）带有子字符串"test"的函数名被删除。具体样例如图1所示：

3.4 预训练CodeBERT

训练CodeBERT的过程基于两个目标：①MLM：MLM在文献(Devlin et al., 2018; Liu et al.,2019; Sun et al., 2019).中被证明是有效的，对NL-PL对的双模态数据进行了掩码语言建模；②RTD：该目标进一步利用了大量的单模态数据（例如没有配对自然语言文本的代码）。

3.4.1 MLM (Masked Language Modeling)

给定NL-PL对的一个数据点（x={w,c}）作为输入，其中w是NL单词序列，c是PL token序列，首先为NL何PL选择一个随机的位置集合进行掩码（分别为m_w和m_c），然后将选中的位置替换为[MASK] token，x中15%的tokens被掩码。

MLM目标是预测被掩码的原始token，公式如下，其中p^D1是从一个大词汇表中预测一个token的鉴别器

3.4.2 RTD (Replaces Token Detection)

在MLM目标中，只有双模态数据被用于训练。

有两种数据生成器：NL生成器p^Gw和GL生成器p^Gc,用于为随机masked 位置集生成可用的替代。

鉴别器被训练与判断一个词是否为原词，这是一个二分类问题。值得注意的是，RTD目标应用与输入中的每个位置，它与GAN（生成对抗网络，generative adversarial network）的不同之处在于，如果生成器碰巧产生了正确的token，该token的标签的"real"而不是"fake"。RTD关于θ参数化鉴别器的损失函数如下：（其中， δ(i)为一个指示函数；p^D2是鉴别器，预测第i个词是原词的概率）

实现了两种有效的双向上下文n-gram语言模型，一个用于NL、一个用于PL，并分别从相应的单模态数据点学习它们，该方法很容易推广到学习双模态生成器或使用更复杂的生成器，如以联合方式学习的基于Transformer的神经架构。PL训练数据是表1所示的单模态代码，NL训练数据来自双模态数据中的文档，我们可以很容易地将这两个训练数据集扩展到更大的量，最终损失函数如下所示：
$\underset θ in \ L_{MIN}(θ) + L_{RTD}(θ)$

3.5 CodeBERT微调

在下游NL-PL任务中使用CodeBERT时有不同的设置，例如，

在自然语言代码搜索中，与预训练阶段相同的方式输入，使用[CLS]表示来衡量代码和自然语言查询之间的语义相关性；
在代码文档生成任务中，基于encoder-decoder框架，使用CodeBERT生成模型来初始化encoder。

4. Experiment

4.1 自然语言代码搜索

给定一个自然语言作为输入，代码搜索的目标是从代码集中找出语义最接近的代码。在CodeSearchNet语料库中进行实验，在999个扰乱的(distractor)代码集中，遵循官方评估指标为每对测试数据(c, w)计算MRR(Mean Reciprocal Rank)，进一步计算了所有编程语言的宏观平均MRR作为整体评估指标。值得注意的是，这个指标与原始论文中的AVG指标不同，AVG指标六种语言的候选语言中检索得到的。为每种编程语言微调得到特定的语言模型，对于每种模型，使用一个二进制分类损失函数进行训练，其中softmax层连接到[CLS]的表示。训练和测试集都是以正负样本平衡的方式进行创建，负样本由随机替换的NL和PL的样本平衡数量组成。

Model Comparisons：表2展示了在CodeSearchNet语料库上不同方法的结果。

前四行结果为Husain et al.的结果，是NL和PL的联合嵌入(joint embedding)。NBOW表示neural bag-of-words；CNN/GIRNN/SELFATT分别表示1D卷积神经网络、双向基于GRU的循环神经网络、多头注意力。

对于其他结果，将代码视为token序列对所有预训练模型进行训练；还基于掩码语言建模对RoBERTa进行训练，训练仅使用CodeSearchNet中的代码。

实验表明：

CodeBERT稳定优于RoBERTa和仅用代码预训练的模型；
从零开始学习的CodeBERT(MLM)比RoBERTa性能要优；
使用RoBERTa初始化CodeBERT可以提升性能。

4.2 NL-PL探测 (NL-PL Probing)

进一步研究在没有修改参数的情况下CodeBERT学习了什么样的知识。

（1）Task Formulation and Data Construction：由于目前没有相关研究工作，因此论文将NL-PL探测问题形式化，并创建数据集。

给定一个NL-PL对(c, w)，NL-PL探测的目标是测试模型在干扰点(distractors)之间正确预测/恢复masked token的能力（一个code token c_i或者word token w_j），有两中主要类型的干扰：①用于掩码语言建模目标的整个目标词汇表；②根据专家对被测能力的理解过滤或策划的更少的候选词汇表。论文遵循第二个类型，将NL-PL探测定义为一个多选项问题的问答任务，其中的问题是完型类问题，特定token被[MASK]替代，并基于专业知识策划扰乱的候选答案(distractor candidate answers)。

特别地，论文分别在NL侧和PL侧进行评估。为了减轻数据收集的工作量，从Code-SearchNet的验证集和测试集中自动收集NL-PL对的数据，这两者在预训练阶段都是看不到的。

对于NL方面的评估：选择NL文档中包含6个关键字(max, maximize, min, minimize, less, greater)之一的NL-PL对，通过合并前两个关键字和中间两个关键字将其分组为4个候选关键字。任务目标是要求预训练的模型选择正确的一共，而不是其他三个选项。即：输入包括完整的代码和被掩码的NL文档，目标是从四个候选者中选择正确答案；
对于PL方面的评估：选择包含关键字max和min的代码，将任务表述为二选答案选择问题。输入包括完整的NL文档和被掩码的PL代码，目标是从两个候选答案中选择正确答案。由于代码补全是一个重要的场景，我们希望测试模型仅基于先前的PL context(preceding PL context)预测正确token的能力，因此，为PL方面添加了一个额外的设置，其中的输入包括完整的NL文档和先前的PL代码。

结果如表3所示：

（2）Model Comparisons：结果如表3所示，报告了每种编程语言的准确性（即正确预测实例的数量除以所有实例的数量），由于不同编程语言的数据集是及其不平衡的，用相同的方式报告了累积的衡量。这里使用CodeBERT(MLM)是因为其输出层自然地适合用于探测。

实验结果表明：CodeBERT在NL和PL探测上几乎在所有语言的性能都优于基线，只有preceding context only的结果要比bidirectional context的结果要查，这表明代码补全是具有挑战性的。

进一步给出了PL-NL探测的案例研究：分别掩码NL token与PL token，然后报告RoBERTa和CodeBERT的预测概率。

如图3所示，可以看到CodeBERT在NL与PL预测中都得到了正确的预测结果，显著优于RoBERTa.

4.3 代码文档生成

尽管CodeBERT的预训练目标不包含基于生成的目标，这里仍然测试CodeBERT在生成任务上的性能表现，特别地，测试了code-to-NL生成任务，报告了在六种编程语言下，基于CodeSearchNet语料库的文档生成任务的结果。由于生成的文档较短，更高阶的n-gram可能不会重叠，我们通过使用平滑的BLEU评分来解决这个问题。

Model Comparisons：将CodeBERRT与几个基线模型进行比较，包括一个带有attention机制的基于RNN的模型、Transformer、RoBERTa、以及只在代码上预训练的模型。为了验证CodeBERT在code-to-NL生成任务中的有效性，采用了多种预训练模型作为编码器，并保持超参数的一致性。结果如表4所示：

可以看到：

在编程语言预训练的模型显著优于RoBERTa，这表明在编程语言进行预训练可以提升code-to-NL生成任务的性能；
CodeBERT通过RTD和MLM目标进行预训练，总体上比RoBERTa获得了1.3BLEU score增益，并达到了SOTA性能。

4.4 泛化性：测试在预训练期间没有使用的编程语言类型

研究了生成C#代码片段的自然语言摘要任务，在CodeNN数据集上进行实验，该数据集由StackOverflow自动收集的66015个问题-答案对组成，其规模比CodeSearchNet语料库小一个数量级，具有挑战性。使用平滑的BLEU-4 score对模型进行评估。

Model Comparisons：

如表5所示，CodeBERT比大多数模型获得了更优的性能，这表明CodeBERT可以更好地推广到其他预训练期间未使用的编程语言。然而结果略低于Code2Seq，其主要原因可能是Code2Seq在其抽象语法树（AST）中使用了组合路径，而CodeBERT仅使用原始代码作为输入。论文作者通过按照一定的顺序遍历AST的树结构训练了另一个版本的CodeBERT，但应用该模型并没有改善生成任务，这显示了通过合并AST来改进CodeBERT的潜在方向。

5. Conclusion

提出了CodeBERT模型，这是第一个针对自然语言和编程语言的大规模双模态预训练模型，在双模态和单模态数据上训练CodeBERT。
结果表明，微调CodeBERT在自然语言搜索和代码文档生成等下游任务上取得了SOTA性能。
为进一步研究预训练模型中蕴含的知识，论文定义了NL-PL探测任务并创建了探测数据集，将探测任务视为完型答案选择问题，为NL与PL策划干扰选项。结果表明，在模型参数固定的情况下，CodeBERT模型的性能优于RoBERTa模型和仅使用代码预训练的模型。
在这一领域还有许多潜在研究方向。①可以学习具有双模态数据、或使用更复杂的神经架构，得到更好的生成器，以改善RTD目标；②CodeBERT损失函数主要针对NL-PL理解任务，虽然CodeBERT在代码文档生成方面取得了较好的BLEU分数，但通过使用与生成相关的学习目标，CodeBERT本身可以进一步提高；如何将AST融入到预训练步骤中也是一个很有吸引力的方向；③计划将CodeBERT应用到更多的NL-PL相关的任务中，并将其扩展到更多的编程语言中，灵活而强大的领域/语言适应方法对于模型的泛化是很有必要的。

QQ群采集助手，精准引流必备神器 2401_87347160 其他经验分享
功能概述微信群查找与筛选工具是一款专为微信用户设计的辅助工具，它通过关键词搜索功能，帮助用户快速找到相关的微信群，并提供筛选是否需要验证的群组的功能。主要功能关键词搜索：用户可以输入关键词，工具将自动查找包含该关键词的微信群。筛选功能：工具提供筛选机制，用户可以选择是否只显示需要验证或不需要验证的群组。精准引流：通过上述功能，用户可以更精准地找到目标群组，进行有效的引流操作。3.设备需求该工具可以
机器学习与深度学习间关系与区别 ℒℴѵℯ心·动ꦿ໊ོ꫞ 人工智能学习深度学习 python
一、机器学习概述定义机器学习（MachineLearning,ML）是一种通过数据驱动的方法，利用统计学和计算算法来训练模型，使计算机能够从数据中学习并自动进行预测或决策。机器学习通过分析大量数据样本，识别其中的模式和规律，从而对新的数据进行判断。其核心在于通过训练过程，让模型不断优化和提升其预测准确性。主要类型1.监督学习（SupervisedLearning）监督学习是指在训练数据集中包含输入
UI学习——cell的复用和自定义cell Magnetic_h ui 学习
目录cell的复用手动（非注册）自动（注册）自定义cellcell的复用在iOS开发中，单元格复用是一种提高表格（UITableView）和集合视图（UICollectionView）滚动性能的技术。当一个UITableViewCell或UICollectionViewCell首次需要显示时，如果没有可复用的单元格，则视图会创建一个新的单元格。一旦这个单元格滚动出屏幕，它就不会被销毁。相反，它被添
element实现动态路由+面包屑软件技术NINI vue案例 vue.js 前端
el-breadcrumb是ElementUI组件库中的一个面包屑导航组件，它用于显示当前页面的路径，帮助用户快速理解和导航到应用的各个部分。在Vue.js项目中，如果你已经安装了ElementUI，就可以很方便地使用el-breadcrumb组件。以下是一个基本的使用示例：安装ElementUI（如果你还没有安装的话）:你可以通过npm或yarn来安装ElementUI。bash复制代码npmi
C语言如何定义宏函数？小九格物 c语言
在C语言中，宏函数是通过预处理器定义的，它在编译之前替换代码中的宏调用。宏函数可以模拟函数的行为，但它们不是真正的函数，因为它们在编译时不会进行类型检查，也不会分配存储空间。宏函数的定义通常使用#define指令，后面跟着宏的名称和参数列表，以及宏展开后的代码。宏函数的定义方式：1.基本宏函数：这是最简单的宏函数形式，它直接定义一个表达式。#defineSQUARE(x)((x)*(x))2.带参
理解Gunicorn：Python WSGI服务器的基石范范0825 ipython linux 运维
理解Gunicorn：PythonWSGI服务器的基石介绍Gunicorn，全称GreenUnicorn，是一个为PythonWSGI（WebServerGatewayInterface）应用设计的高效、轻量级HTTP服务器。作为PythonWeb应用部署的常用工具，Gunicorn以其高性能和易用性著称。本文将介绍Gunicorn的基本概念、安装和配置，帮助初学者快速上手。1.什么是Gunico
扫地机类清洁产品之直流无刷电机控制悟空胆好小清洁服务机器人单片机人工智能
扫地机类清洁产品之直流无刷电机控制1.1前言扫地机产品有很多的电机控制，滚刷电机1个，边刷电机1-2个，清水泵电机，风机一个，部分中高端产品支持抹布功能，也就是存在抹布盘电机，还有追觅科沃斯石头等边刷抬升电机，滚刷抬升电机等的，这些电机有直流有刷电机，直接无刷电机，步进电机，电磁阀，挪动泵等不同类型。电机的原理，驱动控制方式也不行。接下来一段时间的几个文章会作个专题分析分享。直流有刷电机会自动持续
绘本讲师训练营【24期】8/21阅读原创《独生小孩》 1784e22615e0
24016-孟娟《独生小孩》图片发自App今天我想分享一个蛮特别的绘本，讲的是一个特殊的群体，我也是属于这个群体，80后的独生小孩。这是一本中国绘本，作者郭婧，也是一个80厚。全书一百多页，均为铅笔绘制，虽然为黑白色调，但并不显得沉闷。全书没有文字，犹如“默片”，但并不影响读者对该作品的理解，反而显得神秘，梦幻，給读者留下想象的空间。作者在前蝴蝶页这样写到：“我更希望父母和孩子一起分享这本书，使他
店群合一模式下的社区团购新发展——结合链动 2+1 模式、AI 智能名片与 S2B2C 商城小程序源码说私域人工智能小程序
摘要：本文探讨了店群合一的社区团购平台在当今商业环境中的重要性和优势。通过分析店群合一模式如何将互联网社群与线下终端紧密结合，阐述了链动2+1模式、AI智能名片和S2B2C商城小程序源码在这一模式中的应用价值。这些创新元素的结合为社区团购带来了新的机遇，提升了用户信任感、拓展了营销渠道，并实现了线上线下的完美融合。一、引言随着互联网技术的不断发展，社区团购作为一种新兴的商业模式，在满足消费者日常需
消息中间件有哪些常见类型 xmh-sxh-1314 java
消息中间件根据其设计理念和用途，可以大致分为以下几种常见类型：点对点消息队列（Point-to-PointMessagingQueues）：在这种模型中，消息被发送到特定的队列中，消费者从队列中取出并处理消息。队列中的消息只能被一个消费者消费，消费后即被删除。常见的实现包括IBM的MQSeries、RabbitMQ的部分使用场景等。适用于任务分发、负载均衡等场景。发布/订阅消息模型（Pub/Sub
html 中如何使用 uniapp 的部分方法某公司摸鱼前端 html uni-app 前端
示例代码：Documentconsole.log(window);效果展示：好了，现在就可以uni.使用相关的方法了
【一起学Rust | 设计模式】习惯语法——使用借用类型作为参数、格式化拼接字符串、构造函数广龙宇一起学Rust #Rust设计模式 rust 设计模式开发语言
提示：文章写完后，目录可以自动生成，如何生成可参考右边的帮助文档文章目录前言一、使用借用类型作为参数二、格式化拼接字符串三、使用构造函数总结前言Rust不是传统的面向对象编程语言，它的所有特性，使其独一无二。因此，学习特定于Rust的设计模式是必要的。本系列文章为作者学习《Rust设计模式》的学习笔记以及自己的见解。因此，本系列文章的结构也与此书的结构相同（后续可能会调成结构），基本上分为三个部分
回溯 Leetcode 332 重新安排行程 mmaerd Leetcode刷题学习记录 leetcode 算法职场和发展
重新安排行程Leetcode332学习记录自代码随想录给你一份航线列表tickets，其中tickets[i]=[fromi,toi]表示飞机出发和降落的机场地点。请你对该行程进行重新规划排序。所有这些机票都属于一个从JFK（肯尼迪国际机场）出发的先生，所以该行程必须从JFK开始。如果存在多种有效的行程，请你按字典排序返回最小的行程组合。例如，行程[“JFK”,“LGA”]与[“JFK”,“LGB
Python数据分析与可视化实战指南 William数据分析 python python 数据
在数据驱动的时代，Python因其简洁的语法、强大的库生态系统以及活跃的社区，成为了数据分析与可视化的首选语言。本文将通过一个详细的案例，带领大家学习如何使用Python进行数据分析，并通过可视化来直观呈现分析结果。一、环境准备1.1安装必要库在开始数据分析和可视化之前，我们需要安装一些常用的库。主要包括pandas、numpy、matplotlib和seaborn等。这些库分别用于数据处理、数学
python os.environ 江湖偌大 python 深度学习
os.environ['TF_CPP_MIN_LOG_LEVEL']='0'#默认值，输出所有信息os.environ['TF_CPP_MIN_LOG_LEVEL']='1'#屏蔽通知信息（INFO）os.environ['TF_CPP_MIN_LOG_LEVEL']='2'#屏蔽通知信息和警告信息（INFO\WARNING）os.environ['TF_CPP_MIN_LOG_LEVEL']='
Python中os.environ基本介绍及使用方法鹤冲天Pro #Python python 服务器开发语言
文章目录python中os.environos.environ简介os.environ进行环境变量的增删改查python中os.environ的使用详解1.简介2.key字段详解2.1常见key字段3.os.environ.get()用法4.环境变量的增删改查和判断是否存在4.1新增环境变量4.2更新环境变量4.3获取环境变量4.4删除环境变量4.5判断环境变量是否存在python中os.envi
Pyecharts数据可视化大屏：打造沉浸式数据分析体验我的运维人生信息可视化数据分析数据挖掘运维开发技术共享
Pyecharts数据可视化大屏：打造沉浸式数据分析体验在当今这个数据驱动的时代，如何将海量数据以直观、生动的方式展现出来，成为了数据分析师和企业决策者关注的焦点。Pyecharts，作为一款基于Python的开源数据可视化库，凭借其丰富的图表类型、灵活的配置选项以及高度的定制化能力，成为了构建数据可视化大屏的理想选择。本文将深入探讨如何利用Pyecharts打造数据可视化大屏，并通过实际代码案例
Goolge earth studio 进阶4——路径修改与平滑陟彼高冈yu Google earth studio 进阶教程旅游
如果我们希望在大约中途时获得更多的城市鸟瞰视角。可以将相机拖动到这里并创建一个新的关键帧。camera_target_clip_7EarthStudio会自动平滑我们的路径，所以当我们通过这个关键帧时，不是一个生硬的角度，而是一个平滑的曲线。camera_target_clip_8路径上有贝塞尔控制手柄，允许我们调整路径的形状。右键单击，我们可以选择“平滑路径”，这是默认的自动平滑算法，或者我们可
Python教程：一文了解使用Python处理XPath 旦莫 Python进阶 python 开发语言
目录1.环境准备1.1安装lxml1.2验证安装2.XPath基础2.1什么是XPath？2.2XPath语法2.3示例XML文档3.使用lxml解析XML3.1解析XML文档3.2查看解析结果4.XPath查询4.1基本路径查询4.2使用属性查询4.3查询多个节点5.XPath的高级用法5.1使用逻辑运算符5.2使用函数6.实战案例6.1从网页抓取数据6.1.1安装Requests库6.1.2代
python os.environ_python os.environ 读取和设置环境变量 weixin_39605414 python os.environ
>>>importos>>>os.environ.keys()['LC_NUMERIC','GOPATH','GOROOT','GOBIN','LESSOPEN','SSH_CLIENT','LOGNAME','USER','HOME','LC_PAPER','PATH','DISPLAY','LANG','TERM','SHELL','J2REDIR','LC_MONETARY','QT_QPA
LLM 词汇表落难Coder LLMs NLP 大语言模型大模型 llama 人工智能
Contextwindow“上下文窗口”是指语言模型在生成新文本时能够回溯和参考的文本量。这不同于语言模型训练时所使用的大量数据集，而是代表了模型的“工作记忆”。较大的上下文窗口可以让模型理解和响应更复杂和更长的提示，而较小的上下文窗口可能会限制模型处理较长提示或在长时间对话中保持连贯性的能力。Fine-tuning微调是使用额外的数据进一步训练预训练语言模型的过程。这使得模型开始表示和模仿微调数
将cmd中命令输出保存为txt文本文件落难Coder Windows cmd window
最近深度学习本地的训练中我们常常要在命令行中运行自己的代码，无可厚非，我们有必要保存我们的炼丹结果，但是复制命令行输出到txt是非常麻烦的，其实Windows下的命令行为我们提供了相应的操作。其基本的调用格式就是：运行指令>输出到的文件名称或者具体保存路径测试下，我打开cmd并且ping一下百度：pingwww.baidu.com>./data.txt看下相同目录下data.txt的输出：如果你再
感赏日志133 马姐读书
图片发自App感赏自己今天买个扫地机，以后可以解放出来多看点书，让这个智能小机器人替我工作了。感赏孩子最近进步很大，每天按时上学，认真听课，认真背书，主动认真完成老师布置的作业。感赏自己明白自己容易受到某人的影响，心情不好，每当此刻我就会舒缓，感赏，让自己尽快抽离，想好的一面。感赏儿子今天在我提醒他事情时，告诉我谢谢妈妈对我的提醒我明白了，而不是说我啰嗦，管事情，孩子更懂事了，懂得感恩了。投射父母
基于社交网络算法优化的二维最大熵图像分割智能算法研学社（Jack旭）智能优化算法应用图像分割算法 php 开发语言
智能优化算法应用：基于社交网络优化的二维最大熵图像阈值分割-附代码文章目录智能优化算法应用：基于社交网络优化的二维最大熵图像阈值分割-附代码1.前言2.二维最大熵阈值分割原理3.基于社交网络优化的多阈值分割4.算法结果：5.参考文献：6.Matlab代码摘要：本文介绍基于最大熵的图像分割，并且应用社交网络算法进行阈值寻优。1.前言阅读此文章前，请阅读《图像分割：直方图区域划分及信息统计介绍》htt
关于提高复杂业务逻辑代码可读性的思考编程经验分享开发经验 java 数据库开发语言
目录前言需求场景常规写法拆分方法领域对象总结前言实际工作中大部分时间都是在写业务逻辑，一般都是三层架构，表示层（Controller）接收客户端请求，并对入参做检验，业务逻辑层（Service）负责处理业务逻辑，一般开发都是在这一层中写具体的业务逻辑。数据访问层（Dao）是直接和数据库交互的，用于查数据给业务逻辑层，或者是将业务逻辑层处理后的数据写入数据库。简单的增删改查接口不用多说，基本上写好一
DIV+CSS+JavaScript技术制作网页（旅游主题网页设计与制作）云南大理 STU学生网页设计网页设计期末网页作业 html静态网页 html5期末大作业网页设计 web大作业
️精彩专栏推荐作者主页:【进入主页—获取更多源码】web前端期末大作业：【HTML5网页期末作业(1000套)】程序员有趣的告白方式：【HTML七夕情人节表白网页制作(110套)】文章目录二、网站介绍三、网站效果▶️1.视频演示2.图片演示四、网站代码HTML结构代码CSS样式代码五、更多源码二、网站介绍网站布局方面：计划采用目前主流的、能兼容各大主流浏览器、显示效果稳定的浮动网页布局结构。网站程
【加密社】Solidity 中的事件机制及其应用加密社闲侃区块链智能合约区块链
加密社引言在Solidity合约开发过程中，事件（Events）是一种非常重要的机制。它们不仅能够让开发者记录智能合约的重要状态变更，还能够让外部系统（如前端应用）监听这些状态的变化。本文将详细介绍Solidity中的事件机制以及如何利用不同的手段来触发、监听和获取这些事件。事件存储的地方当我们在Solidity合约中使用emit关键字触发事件时，该事件会被记录在区块链的交易收据中。具体而言，事件
探索OpenAI和LangChain的适配器集成：轻松切换模型提供商 nseejrukjhad langchain easyui 前端 python
#探索OpenAI和LangChain的适配器集成：轻松切换模型提供商##引言在人工智能和自然语言处理的世界中，OpenAI的模型提供了强大的能力。然而，随着技术的发展，许多人开始探索其他模型以满足特定需求。LangChain作为一个强大的工具，集成了多种模型提供商，通过提供适配器，简化了不同模型之间的转换。本篇文章将介绍如何使用LangChain的适配器与OpenAI集成，以便轻松切换模型提供商
使用Faiss进行高效相似度搜索 llzwxh888 faiss python
在现代AI应用中，快速和高效的相似度搜索是至关重要的。Faiss（FacebookAISimilaritySearch）是一个专门用于快速相似度搜索和聚类的库，特别适用于高维向量。本文将介绍如何使用Faiss来进行相似度搜索，并结合Python代码演示其基本用法。什么是Faiss？Faiss是一个由FacebookAIResearch团队开发的开源库，主要用于高维向量的相似性搜索和聚类。Faiss
python是什么意思中文-在python中%是什么意思编程大乐趣
Python中%有两种：1、数值运算：%代表取模，返回除法的余数。如：>>>7%212、%操作符（字符串格式化，stringformatting），说明如下：%[(name)][flags][width].[precision]typecode(name)为命名flags可以有+，-，''或0。+表示右对齐。-表示左对齐。''为一个空格，表示在正数的左侧填充一个空格，从而与负数对齐。0表示使用0填
java数字签名三种方式知了ing java jdk
以下3钟数字签名都是基于jdk7的 1，RSA String password="test"; // 1.初始化密钥 KeyPairGenerator keyPairGenerator = KeyPairGenerator.getInstance("RSA"); keyPairGenerator.initialize(51
Hibernate学习笔记 caoyong Hibernate
1>、Hibernate是数据访问层框架，是一个ORM(Object Relation Mapping)框架，作者为:Gavin King 2>、搭建Hibernate的开发环境 a>、添加jar包: aa>、hibernatte开发包中/lib/required/所
设计模式之装饰器模式Decorator（结构型）漂泊一剑客 Decorator
1. 概述若你从事过面向对象开发，实现给一个类或对象增加行为，使用继承机制，这是所有面向对象语言的一个基本特性。如果已经存在的一个类缺少某些方法，或者须要给方法添加更多的功能（魅力），你也许会仅仅继承这个类来产生一个新类—这建立在额外的代码上。
读取磁盘文件txt，并输入String 一炮送你回车库 String
public static void main(String[] args) throws IOException { String fileContent = readFileContent("d:/aaa.txt"); System.out.println(fileContent);
js三级联动下拉框 3213213333332132 三级联动
//三级联动省/直辖市<select id="province"></select> 市/省直辖<select id="city"></select> 县/区 <select id="area"></select>
erlang之parse_transform编译选项的应用 616050468 parse_transform 游戏服务器属性同步 abstract_code
最近使用erlang重构了游戏服务器的所有代码，之前看过C++/lua写的服务器引擎代码，引擎实现了玩家属性自动同步给前端和增量更新玩家数据到数据库的功能，这也是现在很多游戏服务器的优化方向，在引擎层面去解决数据同步和数据持久化，数据发生变化了业务层不需要关心怎么去同步给前端。由于游戏过程中玩家每个业务中玩家数据更改的量其实是很少
JAVA JSON的解析 darkranger java
// { // “Total”：“条数”， // Code: 1, // // “PaymentItems”:[ // { // “PaymentItemID”:”支款单ID”, // “PaymentCode”:”支款单编号”, // “PaymentTime”:”支款日期”, // ”ContractNo”:”合同号”， //
POJ-1273-Drainage Ditches aijuans ACM_POJ
POJ-1273-Drainage Ditches http://poj.org/problem?id=1273 基本的最大流，按LRJ的白书写的 #include<iostream> #include<cstring> #include<queue> using namespace std; #define INF 0x7fffffff int ma
工作流Activiti5表的命名及含义 atongyeye 工作流 Activiti
activiti5 - http://activiti.org/designer/update在线插件安装 activiti5一共23张表 Activiti的表都以ACT_开头。第二部分是表示表的用途的两个字母标识。用途也和服务的API对应。 ACT_RE_*: 'RE'表示repository。这个前缀的表包含了流程定义和流程静态资源（图片，规则，等等）。 A
android的广播机制和广播的简单使用百合不是茶 android 广播机制广播的注册
Android广播机制简介在Android中，有一些操作完成以后，会发送广播，比如说发出一条短信，或打出一个电话，如果某个程序接收了这个广播，就会做相应的处理。这个广播跟我们传统意义中的电台广播有些相似之处。之所以叫做广播，就是因为它只负责“说”而不管你“听不听”，也就是不管你接收方如何处理。另外，广播可以被不只一个应用程序所接收，当然也可能不被任何应
Spring事务传播行为详解 bijian1013 java spring 事务传播行为
在service类前加上@Transactional，声明这个service所有方法需要事务管理。每一个业务方法开始时都会打开一个事务。 Spring默认情况下会对运行期例外(RunTimeException)进行事务回滚。这
eidtplus operate 征客丶 eidtplus
开启列模式: Alt+C 鼠标选择 OR Alt+鼠标左键拖动列模式替换或复制内容(多行): 右键-->格式-->填充所选内容-->选择相应操作 OR Ctrl+Shift+V(复制多行数据,必须行数一致) -------------------------------------------------------
【Kafka一】Kafka入门 bit1129 kafka
这篇文章来自Spark集成Kafka(http://bit1129.iteye.com/blog/2174765)，这里把它单独取出来，作为Kafka的入门吧下载Kafka http://mirror.bit.edu.cn/apache/kafka/0.8.1.1/kafka_2.10-0.8.1.1.tgz 2.10表示Scala的版本，而0.8.1.1表示Kafka
Spring 事务实现机制 BlueSkator spring 代理事务
Spring是以代理的方式实现对事务的管理。我们在Action中所使用的Service对象，其实是代理对象的实例，并不是我们所写的Service对象实例。既然是两个不同的对象，那为什么我们在Action中可以象使用Service对象一样的使用代理对象呢？为了说明问题，假设有个Service类叫AService，它的Spring事务代理类为AProxyService，AService实现了一个接口
bootstrap源码学习与示例：bootstrap-dropdown（转帖） BreakingBad bootstrap dropdown
bootstrap-dropdown组件是个烂东西，我读后的整体感觉。一个下拉开菜单的设计： <ul class="nav pull-right"> <li id="fat-menu" class="dropdown">
读《研磨设计模式》-代码笔记-中介者模式-Mediator bylijinnan java 设计模式
声明：本文只为方便我个人查阅和理解，详细的分析以及源代码请移步原作者的博客http://chjavach.iteye.com/ /* * 中介者模式（Mediator）：用一个中介对象来封装一系列的对象交互。 * 中介者使各对象不需要显式地相互引用，从而使其耦合松散，而且可以独立地改变它们之间的交互。 * * 在我看来，Mediator模式是把多个对象（
常用代码记录 chenjunt3 UI Excel J#
1、单据设置某行或某字段不能修改 //i是行号,"cash"是字段名称 getBillCardPanelWrapper().getBillCardPanel().getBillModel().setCellEditable(i, "cash", false); //取得单据表体所有项用以上语句做循环就能设置整行了 getBillC
搜索引擎与工作流引擎 comsci 算法工作搜索引擎网络应用
最近在公司做和搜索有关的工作，(只是简单的应用开源工具集成到自己的产品中)工作流系统的进一步设计暂时放在一边了，偶然看到谷歌的研究员吴军写的数学之美系列中的搜索引擎与图论这篇文章中的介绍，我发现这样一个关系(仅仅是猜想) -----搜索引擎和流程引擎的基础--都是图论，至少像在我在JWFD中引擎算法中用到的是自定义的广度优先
oracle Health Monitor daizj oracle Health Monitor
About Health Monitor Beginning with Release 11g, Oracle Database includes a framework called Health Monitor for running diagnostic checks on the database. About Health Monitor Checks Health M
JSON字符串转换为对象 dieslrae java json
作为前言,首先是要吐槽一下公司的脑残编译部署方式,web和core分开部署本来没什么问题,但是这丫居然不把json的包作为基础包而作为web的包,导致了core端不能使用,而且我们的core是可以当web来用的(不要在意这些细节),所以在core中处理json串就是个问题.没办法,跟编译那帮人也扯不清楚,只有自己写json的解析了.
C语言学习八结构体，综合应用，学生管理系统 dcj3sjt126com C语言
实现功能的代码： # include <stdio.h> # include <malloc.h> struct Student { int age; float score; char name[100]; }; int main(void) { int len; struct Student * pArr; int i,
vagrant学习笔记 dcj3sjt126com vagrant
想了解多主机是如何定义和使用的, 所以又学习了一遍vagrant 1. vagrant virtualbox 下载安装 https://www.vagrantup.com/downloads.html https://www.virtualbox.org/wiki/Downloads 查看安装在命令行输入vagrant 2.
14.性能优化-优化-软件配置优化 frank1234 软件配置性能优化
1.Tomcat线程池修改tomcat的server.xml文件： <Connector port="8080" protocol="HTTP/1.1" connectionTimeout="20000" redirectPort="8443" maxThreads="1200" m
一个不错的shell 脚本教程入门级 HarborChung linux shell
一个不错的shell 脚本教程入门级建立一个脚本　　Linux中有好多中不同的shell，但是通常我们使用bash (bourne again shell) 进行shell编程，因为bash是免费的并且很容易使用。所以在本文中笔者所提供的脚本都是使用bash（但是在大多数情况下，这些脚本同样可以在 bash的大姐，bourne shell中运行）。　　如同其他语言一样
Spring4新特性——核心容器的其他改进 jinnianshilongnian spring 动态代理 spring4 依赖注入
Spring4新特性——泛型限定式依赖注入 Spring4新特性——核心容器的其他改进 Spring4新特性——Web开发的增强 Spring4新特性——集成Bean Validation 1.1(JSR-349)到SpringMVC Spring4新特性——Groovy Bean定义DSL Spring4新特性——更好的Java泛型操作API Spring4新
Linux设置tomcat开机启动 liuxingguome tomcat linux 开机自启动
执行命令sudo gedit /etc/init.d/tomcat6 然后把以下英文部分复制过去。（注意第一句#!/bin/sh如果不写，就不是一个shell文件。然后将对应的jdk和tomcat换成你自己的目录就行了。 #!/bin/bash # # /etc/rc.d/init.d/tomcat # init script for tomcat precesses
第13章 Ajax进阶（下） onestopweb Ajax
index.html <!DOCTYPE html PUBLIC "-//W3C//DTD XHTML 1.0 Transitional//EN" "http://www.w3.org/TR/xhtml1/DTD/xhtml1-transitional.dtd"> <html xmlns="http://www.w3.org/
Troubleshooting Crystal Reports off BW blueoxygen BO
http://wiki.sdn.sap.com/wiki/display/BOBJ/Troubleshooting+Crystal+Reports+off+BW#TroubleshootingCrystalReportsoffBW-TracingBOE Quite useful, especially this part: SAP BW connectivity For t
Java开发熟手该当心的11个错误 tomcat_oracle java jvm 多线程单元测试
#1、不在属性文件或XML文件中外化配置属性。比如，没有把批处理使用的线程数设置成可在属性文件中配置。你的批处理程序无论在DEV环境中，还是UAT（用户验收测试）环境中，都可以顺畅无阻地运行，但是一旦部署在PROD 上，把它作为多线程程序处理更大的数据集时，就会抛出IOException，原因可能是JDBC驱动版本不同，也可能是#2中讨论的问题。如果线程数目可以在属性文件中配置，那么使它成为
正则表达式大全 yang852220741 html 编程正则表达式
今天向大家分享正则表达式大全，它可以大提高你的工作效率正则表达式也可以被当作是一门语言，当你学习一门新的编程语言的时候，他们是一个小的子语言。初看时觉得它没有任何的意义，但是很多时候，你不得不阅读一些教程，或文章来理解这些简单的描述模式。一、校验数字的表达式数字：^[0-9]*$ n位的数字：^\d{n}$ 至少n位的数字：^\d{n,}$ m-n位的数字：^\d{m,n}$