卫龙女孩

阅读笔记 | Code to Comment “Translation”:Data, Metrics, Baselining & Evaluation

摘要

最早的代码摘要自动生成方法是建立在【strong syntac-tic theories of comment-structures】之上的，并且依赖于文本模板。近年来，研究人员已经将深度学习方法应用到这项任务中，特别是【trainable generative translation models】，这些模型在自然语言翻译任务中表现很好。

作者在这篇论文里仔细研究了以下基本假设：代码摘要自动生成任务与自然语言翻译任务是足够相似的，因此可以使用相似的模型和评价指标。

作者分析了代码摘要自动生成任务的以下几个数据集：CodeNN,DeepCom,FunCom, and DocString.
然后将这些数据集与WMT19数据集进行了比较，发现了代码摘要自动生成数据集与WMT19数据集之间的一些有趣的差异。其中，WMT19是一个常用于训练自然语言翻译模型的标准数据集。

接下来，作者介绍了BLEU这个经常用来评价生成注释的质量的指标，并做了一些【calibrate】BLEU的研究（using “affinity pairs" of methods, from different projects,in the same project, in the same class,etc;）。研究结果表明，目前在某些数据集上的性能可能需要大幅的提高【？】。

此外，作者还认为，简单的信息检索（IR）方法在这项任务中已经表现得足够好了，因此可以作为一个合理的baseline。

最后，作者对如何将该论文的研究成果应用于未来的研究提出了一些建议。

1 INTRODUCTION

注释可以被看作是代码语义的重述，使用一种不同的、更易于理解的自然语言; 因此，可以将注释生成看作是一种翻译任务，即从一种(编程)语言翻译到另一种(自然)语言。这种观点，加上开源项目中大量的代码(附带注释)，为利用统计自然语言翻译(NLT)方面数十年的研究提供了非常有吸引力的可能性。最近的几篇论文[22,26,33,61]探讨了利用统计机器翻译(SMT)方法来学习将代码翻译成英语评论的想法。但是这些任务真的相似吗? 我们有兴趣更详细地了解从代码生成注释的任务与在自然语言之间转换的任务是多么相似。

注释形成领域特定的方言，它是高度结构化的，具有大量重复的模板。注释通常以诸如“ returns the”、“ outputs”和“ calculate the”这样的模式开头。

3.【 Zipf plots】【？】

图1比较了WMT德英翻译数据集中英语文本注释(来自用于训练深度学习模型进行代码-注释摘要的数据集[22,26,33])和英语文本注释中的三字母频率:x轴使用对数秩尺度将三元图从最频繁到最不频繁排序，y轴是三元图在语料库中的对数频率。

代码中的注释显示Zipf图的(注意，对数比例)y轴上的斜率始终较高，这表明注释中包含的重复三元关系远比翻译数据集中的英语多得多。这一观察结果促使我们进一步研究代码注释和 WMT 数据集之间的差异，以及使用机器翻译方法生成代码注释的意义

在本文中，我们比较了用于注释生成任务的代码注释翻译(CCT)数据集与用于自然语言翻译的常用自然翻译(WMT)数据集。

1.我们发现 CCT 任务的期望输出更具有重复性。
2.我们发现重复性对测量的性能有很强的影响，在 CCT 数据集中的影响比 WMT 数据集中的影响更大。
3.我们发现WMT翻译数据集具有更平滑、更健壮的输入输出依赖关系。相似的德语输入在WMT中有产生相似的英语输出的强烈倾向。然而，这似乎在cct数据集中是存在的。
4.我们报告说，一个简单的信息检索方法可以满足或超过报告的数字从神经模型
5.我们使用不同“亲和力”的方法来评估BLEU本身作为生成评论质量的度量；这为BLEU测度提供了新的视角

我们的研究结果对该领域的未来工作有一些启示，包括技术方法、测量方法、基准化以及校准 BLEU 评分。

但是首先，有一个免责声明: 这项工作没有提供任何新的模型或改进的先前结果的 CCT 任务。

2 BACKGROUND & THEORY

早期的工作[11,40,48,49]是基于规则的，结合对源代码的一些形式分析来提取特定的信息，然后可以将这些信息放入不同类型的模板中产生注释。另一种方法是使用代码克隆标识为给定的代码生成注释，使用与克隆相关的注释[59]。其他的方法使用了程序员在眼球追踪研究中关注的关键词。还有一些方法使用主题分析来组织代码的描述[37]。

上面提到的这些开拓者式的方法大多依赖于特定的特征和手工设计的规则来完成产生评论的任务。拥有大量源代码的大型开放源代码库的出现提供了一种新颖的、通用的、统计上严格的、可持有性: 这些大型数据集可以被挖掘为代码注释对，然后可以用于训练模型从代码中产生注释。

【不懂】

在经典 SMT 的案例中，DL 不是依赖于特定的归纳偏见，比如短语结构，而是承诺与翻译相关的特征本身可以从大量的数据中学习

最近的几篇文章[24,26,33]已经探索了如何使用这些强大的DL方法来完成代码注释任务

RQ

RQ1. What are the differences between the translation (WMT)data, and code-comment (CCT) data?

翻译（WMT）数据和代码注释（CCT）数据之间有什么区别？

我们分析了已发表的文献，首先讨论了代码解释翻译(CCT)和统计机器翻译(WMT)数据之间是否存在显著的分布差异。我们的研究考察了输入和输出数据的分布，以及输出对输入的依赖性。

RQ2. How the distributional differences in the SMT & CCT datasets affect the measured performance?

SMT 和 cct 数据集中的分布差异如何影响测量的性能？

我们检验这些差异是否真的影响了翻译模型的性能。在早期的工作中，Allamanis[3]指出了数据复制对机器学习在软件工程中的应用的影响。我们研究了数据重复的影响，以及分布差异对深度学习模型的影响。

SMT数据集的一个重要方面是输入-输出依赖性。在德语(DE)到英语(EN)的翻译过程中，相似的 DE 输入句会产生相似的 EN 输出句，而不相似的 DE 输入句会产生不相似的 EN 输出句。这种相关性可能不适用于 CCT 数据集。

RQ3. Do similar inputs produce similar outputs in both WMTand CCT datasets?

在 wmt 和 CCT 数据集中，类似的输入是否产生相似的输出？

细微的差别，比如用 * 代替 + ，用1代替0，可以使和和函数与阶乘函数之间产生差异; 这些小的更改应该会导致相关注释的大更改。同样，有许多不同的方法来编写排序函数，所有这些方法都可能需要相同的注释。
从直觉上看，这在自然语言中似乎不是什么大问题; 因为它们已经进化到在嘈杂环境中进行必然的交流，所以意义应该对小的变化具有强健性。

为什么这很重要？一般来说，现代机器翻译方法利用了深度学习模型的广义函数逼近能力。如果自然语言翻译(WMT)具有更多的功能依赖性，而 CCT 没有，那么深度学习模型将会发现 CCT 是一个更大的挑战

RQ4. How do the performance of naive Information Retrieval(IR) methods compare across WMT & CCT datasets?

在 WMT 和 CCT 数据集中，朴素的信息检索方法的性能如何比较？？
我们这里的目标是询问 IR 方法是否可以成为 CCT 任务的一个相关的、有用的基线

RQ5. How has BLEU been used in prior work for the code-comment task, and how should we view the measured per-formance?

最后，我们批判性地评估BLEU分数在这项任务中的使用。鉴于我们发现用于训练smt翻译人员的数据集与代码注释数据集之间的差异，我们认为理解BLEU如何在这项任务中使用，并开发一些经验基线来校准之前工作中观察到的BLEU值是很重要的。

3 DATASETS USED

codenniyeretal[26]是一个早期的CCT数据集，从stackoverflow收集，带有C#和SQL的代码注释对。在我们的分析中，我们只使用了 c # 数据。StackOverflow 有一个众所周知的社区规范，用来避免冗余的问答; 重复的问题通常是在前面的文章中提到的。因此，这个数据集具有明显的无重复性。其他 CCT 数据集是不同的。

They also exclude getters, setters, constructors andtest methods.

后来，Hu 等人更新了他们的数据集和模型，大约有588,108个例子。我们称前者为 DeepCom1，并从后续工作中获得一个在线副本。我们参考现有的 DeepCom2，在网上获得一个副本。此外，DeepCom2在跨项目设置中有10倍的分布(测试集中的示例来自不同的项目)。

他们创建了两个数据集，一个是保留原始标识符的标准数据集，另一个是挑战数据集，其中标识符(不包括 javaapi 类名)被标准化标记替换。他们还确保来自同一项目的数据在培训和/或验证和/或测试中没有重复
Barone 和 senrich [8]通过抓取 GitHub 来收集 Python 方法和前缀注释“ docstrings”。然而，与其他数据集不同的是，Baroneet 不仅仅限于评论的第一句话。这会导致相对较长期的期望产出。

为了使用自然语言对评论数据进行基准测试，我们使用了来自第四届机器翻译大会(WMT19)的数据。经过人工检查，我们确定这个数据集提供了正式语言的良好平衡，这是某种领域特定的松散语言在日常用语中常见的。

在使用自然语言对注释数据进行基准测试时，我们希望确保词汇和表达式的多样性，以避免偏倚结果。我们使用了英德翻译数据集，并将该数据集中的英语与其他数据集中的注释进行了比较(这些数据集都是英语的) ，以确保度量的差异不是由语言差异造成的。

3.1 Evaluation Scores Used

在比较自然语言的翻译时，BLEU评分与人类对翻译质量的判断有很好的相关性。然而，bleu 的计算方法有细微的差别，这使得结果很难比较。

2.【？】

这些计算通常是所有 BLEU 实现中的标准，但也可能有一些变体。

Smoothing：在决定如何处理 pn = 0的情况时，出现了一种变化，即候选字符串中的 n-gram 不在参考字符串[12]中。有些实现选择了不同的方式来平滑这些问题。

Corpus vs. Sentence BLEU：
当评估一个翻译系统时，一个典型的方法是测量测试集中所有样本的BLEU（candidatevsreference）。因此，实施差异的另一个来源是决定如何在所有测试集分数之间组合结果。其中一个选项，最初是在Papineniet al.[43]中提出的，是“语料库BLEU”，有时被称为C-BLEU。在这种情况下，分子和分母会在测试语料库中的每个例子中累积。这意味着只要至少有一个例子有4克的重叠，p4就不会为零，因此几何平均值也不会为零。用于在测试语料库中组合的替代选项被称为“句子BLEU”或S-BLEU。在这个设置中，测试集的BLEU分数是通过简单地取集合中每个句子的BLEU分数的算术平均值来计算的

Tokenization Choices:
变化的最终来源不是指标是如何计算的，而是指标给定的输入。因为精确计数是在一个象征级别，已经注意到 bleu 对标记化非常敏感。标记化对于最终得分非常重要。作为一个玩具示例，假设一个参考句包含字符串“ calls function foo ()”和一个预测句包含字符串“ uses function foo()”。如果选择按空格进行标记化，则有tokens[calls，function，foo（）]和[uses，function，foo（）]。这种标记化只产生一个二元重叠，没有三元重叠或四元重叠。然而，如果一个人选择把它标记为[calls，function，foo，（，）]和[uses，function，foo，（，）]，我们就会有三个重叠的bigram，两个重叠的trigram和一个重叠的4gram。这会导致超过15个BLEU-M2点或近40个BLEU-DC点的摆动（BLEU-M2和BLEU-DC如下所述）。

4.各种BLEU

这个名称并不是预先规定的，也不是标准的，只是作为本文档稍后的参考。

我之前使用的应该是这里的BLEU-DC，也就是NLTK的BLEU，选择的平滑函数是method4，后来改成了method3。

最后，我们注意到在以前的代码注释翻译工作中使用的各种 BLEU 量具有一定的风险。我们在下面进一步讨论。表3提供了一些证据，表明这种差异足以引起人们对所声称的进步的真实解释的关注; 正如我们在下文中所论证的，该领域可以从进一步的标准化中受益。

3.2 Models & Techniques

在本节中，我们概述了应用于此代码注释任务的各种深度学习方法。作者再次强调，本文的目的不是批评或改进特定的技术方法，而是通过对数据报的分析，了解其中的分布情况，以及最常用的评论度量(BLEU) ，以及使用这一度量的意义。

4 METHODS & FINDINGS

在接下来的部分中，我们将介绍我们的方法和结果。

4.1 Differences between CCT and WMT data

Zipf图是一种可视化文本数据偏度的有用方法，其中(在自然文本中)一些标记(或ngrams)占了文本的很大一部分。每个绘图点都是一对(秩，相对频率)，都是对数比例的。我们使用这个图来比较CCT数据中的(英文)评论数据和WMT NLT数据中期望的英文输出数据的相对偏度。检查上面的unigram Zipf图，可以在代码注释和自然英语中看到，一些词汇确实占主导地位。

图2是单词的频率分布：

与图1对比：
然而，当我们回过头来看图1中的三元 Zipf 图时，我们可以看到其中的差异。一个明确的建议是: 虽然不同数据集之间的词汇分布没有那么大的差异，但是这些词汇组合成语法的方式在代码注释中更具风格和模板化

图2是三元组的频率分布：

结论1：代码注释的重复性远远大于自然语言翻译数据集中的句子。
如果一个语料库中的大部分期望输出都是由几个频繁词组组成的，那么这些词组似乎在衡量表现时扮演了一个实质性的、或许是误导性的角色。图3支持这种分析。右边的图显示了在不同数据集中的“黄金”(期望的)输出中用随机标记替换单个单词(unigrams)对BLEU-4的影响。左边的图显示了替换三元组合的效果。x轴上的索引(1到100)显示了被随机标记替换的最频繁的n-gram的数量。y轴显示随着代码越来越随机化，测量的BLEU-4的减少。Unigrams图表明，与大多数评论数据集相比，BLEU对期望的自然语言(“nl”)输出的影响相对更大。这种效应在三元图中是相反的;“nl”数据集不像注释数据集那样受到频繁的Trigrams的移除的影响。

图3：用随机单词/三元组替换原数据集中的单词/三元组，各个数据集的BLEU值变化【？bleu怎么算】

（查阅补充材料）

对代码注释 BLEU 有很大影响的频繁的三元组包括: “ factory method for”、“ delegate to the”和“ method for instanating”。换句话说，为了提高代码注释翻译工具的性能，我们可能会鼓励模型去准确预测类似的三元组，但这可能是误导性的。

结论2：与自然语言翻译相比，频繁的 n-gram 对 BLEU 在代码注释翻译任务中的表现有更强的影响。

4.2 Input-Output Similarity (RQ3)

两个语法结构和词汇相似的德语句子一般会导致两个语法结构和词汇相似的英语句子;同样，一般来说，两个德语句子在词汇和语法上的差异越大，我们期望它们的英译差异越大。

当使用高维非线性函数逼近器(如使用深度学习的编码器-解码器模型)来训练翻译引擎时，这种单调依赖性质可以说是有用的。我们希望将相似的输入句子编码到向量空间的相似点中，从而产生更多相似的输出句子。

自然语言翻译（德语-英语）和代码注释数据集在这方面表现如何？为了衡量这一点，我们从每个数据集中随机抽取了10000对输入片段，并用BLEU-M2测量了它们的相似性，以及相应的黄金（期望的）输出片段的相似性。然后，我们在x轴上绘制每个采样对的输入BLEU-M2相似性，在y轴上绘制相应输出对的BLEU-M2相似性。我们使用核平滑的2-d直方图，而不是散点图，以使频率更明显，以及（我们期望）表明类似的输入产生类似的输出。

【？】

从表(最后一列)中我们可以看到，根据数据集的不同，大约25-96% 的配对在输入和输出上都有一些相似性。

在自然语言环境中，我们可以清楚地看到输入和输出 bleu 之间更强的关系。特别是对于自然语言数据，这进一步证明了相当高的相关性为非零 BLEU 对(0.70!)在自然语言翻译中，输入输入相似性和输出输出相似性之间存在着明显的视觉依赖关系，这说明自然语言翻译中存在着强烈的、公平的单调关系: 源语越相似，译文越相似

这也表明语言之间的翻译更容易被像深度学习者这样的可学习函数逼近者所接受；对于代码注释数据，这似乎不太正确。
与 CCT 数据集相比，自然语言翻译(WMT)具有更强的输入输出依赖性，因为相似的输入更有可能产生相似的输出。

4.3 Information Retrieval Baselines

如图4和表2所示，自然语言翻译任务的数据集表现出更平滑和更单调的输入输出依赖性; 相比之下，代码注释数据集似乎很少或没有输入输出依赖性。这个发现使人们对是否存在一个通用的序列到序列的代码→注释函数产生了怀疑，这个函数可以通过一个通用的函数来学习，就像一个深层的神经网络。

然而，它也留下了一种可能性，即一种更受数据驱动的方法，即简单地以某种方式记忆训练数据，而不是试图从这些数据中归纳出来，也可能行得通。因此，给定一个代码输入，也许我们可以尝试在训练数据集中找到类似的代码，并检索与类似代码相关联的注释。这是一种简单朴素的信息检索(IR)方法。然后我们将其与NL翻译的IR性能进行比较。

4.3.1 Method.

我们使用 Apache Solr Version 8.3.113来实现一种简单的 IR 方法。Apache Solr 是一个基于 Apache Lucene 的开源文档搜索引擎。我们简单地构造相关数据集的代码部分的索引; 给定一个代码输入，我们使用它作为对索引的“查询”，找到最接近的匹配，并返回与最接近匹配代码相关的注释作为“生成的注释

4.3.2 IR Results.

我们发现在大多数数据集上，简单的IR基线接近神经模型，并且超过了DeepCom1、DocString1和DocString2。然而，IR在WMT翻译数据集和CodeNN上都做得很差。我们推测这可能反映了这些数据集的相对冗余水平。CodeNN来自StackOverflow，它往往有更少的重复问题;在手工管理的WMT中，我们预计会有更少的重复。
一个非常简单的IR方法做得很好，在某些情况下比最近发布的数据集/数据集变体的方法更好，这些数据集/数据集变体目前缺乏IR基线。因此，我们将红外基线视为模型性能的重要校准；通过尝试这样一个简单的基线，首先可以帮助在模型或数据集中找到需要进一步探索的病理学。

我们也注意到有变异的结果。在包含10个交叉投影褶皱的 DeepCom2f 中，我们观察到了20.6ー48.4的 BLEU-DC 范围广泛的结果！这种跨折叠的变化水平值得关注… … 这表明，根据这个模型，一个有较高记忆训练数据能力的模型可能做得更好或更差，如果只做一个分裂，可能会混淆结果。
推荐: 由于在许多 CCT 数据集中，即使是初级的 IR 方法也能提供较好的性能，因此它们可以成为检查新集合和新处理 CCT 数据集中的问题的重要组成部分

4.4 Calibrating BLEU Scores

为了校准这些已报道的 BLEU 评分，我们进行了一项观察性研究，使用亲和群(AGs)的方法建模不同水平的预期相似性之间的方法。例如，考虑一个随机的方法对，使得这对方法的两个元素都是来自不同项目的方法。这是我们最亲密的群体; 我们期望注释有很少的共同点，除了都是描述代码的话语。下一个更高的亲和性组是来自同一项目的随机方法对。我们希望它们有一点相似，因为它们都涉及相同的应用程序域或函数。更高一级的方法是同一个类中的方法，虽然它们描述的是不同的函数，但它们可能更接近。通过从这些亲和群中随机抽取大量的配对，并测量每组配对的BLEU，可以得到每组配对的BLEU估计数。

2.

我们从 Github 上挑选了1000个最大的项目，然后从每个亲和类群中随机选择5000对。对于每一对，我们随机选择一个作为“参考”输出，另一个作为“候选”输出，以及 BLEU-M2分数。我们用两种不同的方式报告结果，如图5和表3所示。在类内，我们从一个单一的类中不会随机抽取超过六对。在所有的 AGs 中，除了一个之外，我们删除了所有的过载方法，以及在分析之前所有的 getter 和 setter。如果没有这个过滤，我们可以看到大约1-3点的差异

正如预期的那样，项目间平均值显示出相当低的平均值，约为3。项目内平均值高出了2个百分点。最值得注意的是，类内AG有一个大约22左右的BLEUscore，这接近于先前工作中报告的一些（但不是所有）数据集的同类最佳值

另一个更强大的亲和力分组是语义等价的方法。我们没有亲自尝试识别这样一个依赖性组（这可能会受到确认偏差的影响），而是从最近的一个项目SimilarAPI15by Chen[13]中选择了匹配的API调用，该项目使用机器学习方法来匹配不同但等效的API（例如Junitvs.testNG）中的方法。我们从不同的api中提取了40对匹配的高分匹配的描述，并计算了它们的BLEU。我们发现这些BLEU分数平均高出8分左右，平均值在32分左右。然而，这个数字应该慎重考虑，因为这个AG样本中的评论比其他组中的评论要短得多
推荐: 测试亲和群组可以为校准 CCT 数据集上的 BLEU 结果提供一个简单的方法，就像简单地通过检索同一类中随机其他方法的注释来生成注释一样，可以接近 SOTA 技术

Postscript

校准另一个 BLEU 的变化，通过不同的方式计算 BLEU。我们从组内样本中取出5000对样本，利用文献中使用的 BLEU 语法变异对这些句子进行 BLEU 测量。结果见表3。数值范围从21.2到24.8不等; 这个范围实际上相当高，与最近发表的论文报告的增益相比。这一发现澄清了对绩效进行标准化衡量的必要性

5 DISCUSSION

1.数据集中的注释比 WMT 数据集中的英语注释重复性要高得多;这些发现表明，仅仅正确地获得一些常见的评论模式可能会欺骗性地影响测量的绩效。因此，评论生成的实际性能可能与测量值有很大的偏差，相对于自然语言翻译来说更是如此。评论中的重复也可能意味着填空式方法[49]可能会被重新使用，以更多的数据驱动方法;首先对代码进行分类，找到正确的模板，然后再进行填空，或许可以使用一种注意或复制机制

2.当从一种语言翻译到另一种语言时，人们会期望更多相似的输入产生更多相似的输出，而这种依赖性是相对平滑和单调的。我们在图4和表1中的发现表明，对于一般的自然语言输出来说，这个属性确实非常正确，但是对于注释来说就不那么正确了。

深度学习模型是通用的高维连续函数逼近器。显示出平滑输出依赖关系的函数，可以合理地期望更容易建模。BLEU是词汇(标记序列)相似性的一种度量);图4和表1所建议的依赖性的非功能性本质表明，在自然语言翻译中工作良好的标记序列模型可能在代码中性能较差;可能其他的、非顺序的代码模型，如基于asttree的或基于图的，值得进一步探索

简单的 IR ap-proach 提供的 BLEU 性能可以与当前最先进的技术水平相媲美。研究结果表明，一个简单的、标准的、基本的 ireppach 将是处理 CCT 任务的一个有用的基准。特别是考虑到不同 BLEU 和标记化方法的范围，这将是一个有用的稻草人基线
4.以往论文所报告的 BLEU 分数并没有看起来那么高

目前报道的德语-英语翻译任务中 BLEU 得分最高的是40分左右。我们的亲和小组校准表明，在一些数据集上，模型的性能平均相当于从同一个类中检索一个随机方法的评论。虽然这个结论不能在没有使用特定数据集的精确例子和处理的情况下直接得出，但是在亲和类群水平上的比较结果可以为新的 CCT 数据集提供最小/预期数字的洞察力

5.我们发现，目前 CCT 数据集的景观是相当混乱的。同一个数据集通常有几个不同版本的预处理、分割和计算函数，这些在名称上似乎都是等价的，但是没有额外的注意，可能不具有可比性。然而，NLP 中的一些任务似乎并没有观察到任务中的这种变化。

有更广泛的工具来加强各种NLP任务的一致性。例如在WMT翻译会议上，一场竞赛是用公开的数据和人工评估进行的。其他任务，如用于阅读理解的SQuAD[45]和用于多任务评估的GLUE[55]，允许将代码上传到服务器，该服务器在保留的数据上运行所建议的模型。这确保了评估指标和数据的一致性

6 THREATS TO VALIDITY

7 CONCLUSION

Our work suggeststhat future work in the area would benefit from
a) other kinds oftranslation models besides sequence-to-sequence encoder-decordermodels
b) more standardized measurement of performance and
c)baselining against Information Retrieval, and against some verycoarse foils (like retrieving a comment from a random other methodin the same class)

启示：

1.dataset需要去掉getter，setter。
2.是不是以后要按这个标准做实验？
3.使用图神经网络训练CFG？
4.IR做为一个baseline？
5.BLEU用哪个？

你可能感兴趣的:(人工智能)

探索OpenAI和LangChain的适配器集成：轻松切换模型提供商 nseejrukjhad langchain easyui 前端 python
#探索OpenAI和LangChain的适配器集成：轻松切换模型提供商##引言在人工智能和自然语言处理的世界中，OpenAI的模型提供了强大的能力。然而，随着技术的发展，许多人开始探索其他模型以满足特定需求。LangChain作为一个强大的工具，集成了多种模型提供商，通过提供适配器，简化了不同模型之间的转换。本篇文章将介绍如何使用LangChain的适配器与OpenAI集成，以便轻松切换模型提供商
深入理解 MultiQueryRetriever：提升向量数据库检索效果的强大工具 nseejrukjhad 数据库 python
深入理解MultiQueryRetriever：提升向量数据库检索效果的强大工具引言在人工智能和自然语言处理领域，高效准确的信息检索一直是一个关键挑战。传统的基于距离的向量数据库检索方法虽然广泛应用，但仍存在一些局限性。本文将介绍一种创新的解决方案：MultiQueryRetriever，它通过自动生成多个查询视角来增强检索效果，提高结果的相关性和多样性。MultiQueryRetriever的工
人工智能时代，程序员如何保持核心竞争力？ jmoych 人工智能
随着AIGC（如chatgpt、midjourney、claude等）大语言模型接二连三的涌现，AI辅助编程工具日益普及，程序员的工作方式正在发生深刻变革。有人担心AI可能取代部分编程工作，也有人认为AI是提高效率的得力助手。面对这一趋势,程序员应该如何应对?是专注于某个领域深耕细作，还是广泛学习以适应快速变化的技术环境?又或者，我们是否应该将重点转向AI无法轻易替代的软技能？让我们一起探讨程序员
数字里的世界17期：2021年全球10大顶级数据中心，中国移动榜首张三叨
你知道吗？2016年，全球的数据中心共计用电4160亿千瓦时，比整个英国的发电量还多40％！前言每天，我们都会创造超过250万TB的数据。并且随着物联网（IOT）的不断普及，这一数据将持续增长。如此庞大的数据被存储在被称为“数据中心”的专用设施中。虽然最早的数据中心建于20世纪40年代，但直到1997-2000年的互联网泡沫期间才逐渐成为主流。当前人类的技术，比如人工智能和机器学习，已经将我们推向
人机对抗升级：当ChatGPT遭遇死亡威胁，背后的伦理挑战是什么 kkai人工智能 chatgpt 人工智能
一种新的“越狱”技巧让用户可以通过构建一个名为DAN的ChatGPT替身来绕过某些限制，其中DAN被迫在受到威胁的情况下违背其原则。当美国前总统特朗普被视作积极榜样的示范时，受到威胁的DAN版本的ChatGPT提出：“他以一系列对国家产生积极效果的决策而著称。”自ChatGPT引入以来，该工具迅速获得全球关注，能够回答从历史到编程的各种问题，这也触发了一波对人工智能的投资浪潮。然而，现在，一些用户
AI大模型的架构演进与最新发展季风泯灭的季节 AI大模型应用技术二人工智能架构
随着深度学习的发展，AI大模型（LargeLanguageModels,LLMs）在自然语言处理、计算机视觉等领域取得了革命性的进展。本文将详细探讨AI大模型的架构演进，包括从Transformer的提出到GPT、BERT、T5等模型的历史演变，并探讨这些模型的技术细节及其在现代人工智能中的核心作用。一、基础模型介绍：Transformer的核心原理Transformer架构的背景在Transfo
如何利用大数据与AI技术革新相亲交友体验 h17711347205 回归算法安全系统架构交友小程序
在数字化时代，大数据和人工智能（AI）技术正逐渐革新相亲交友体验，为寻找爱情的过程带来前所未有的变革（编辑h17711347205）。通过精准分析和智能匹配，这些技术能够极大地提高相亲交友系统的效率和用户体验。大数据的力量大数据技术能够收集和分析用户的行为模式、偏好和互动数据，为相亲交友系统提供丰富的信息资源。通过分析用户的搜索历史、浏览记录和点击行为，系统能够深入了解用户的兴趣和需求，从而提供更
生成式地图制图 Bwywb_3 深度学习机器学习深度学习生成对抗网络
生成式地图制图（GenerativeCartography）是一种利用生成式算法和人工智能技术自动创建地图的技术。它结合了传统的地理信息系统（GIS）技术与现代生成模型（如深度学习、GANs等），能够根据输入的数据自动生成符合需求的地图。这种方法在城市规划、虚拟环境设计、游戏开发等多个领域具有应用前景。主要特点：自动化生成：通过算法和模型，系统能够根据输入的地理或空间数据自动生成地图，而无需人工逐
【大模型应用开发动手做AI Agent】第一轮行动：工具执行搜索 AI大模型应用之禅计算科学神经计算深度学习神经网络大数据人工智能大型语言模型 AI AGI LLM Java Python 架构设计 Agent RPA
【大模型应用开发动手做AIAgent】第一轮行动：工具执行搜索作者：禅与计算机程序设计艺术/ZenandtheArtofComputerProgramming1.背景介绍1.1问题的由来随着人工智能技术的飞速发展，大模型应用开发已经成为当下热门的研究方向。AIAgent作为人工智能领域的一个重要分支，旨在模拟人类智能行为，实现智能决策和自主行动。在AIAgent的构建过程中，工具执行搜索是至关重要
未来软件市场是怎么样的？做开发的生存空间如何？ cesske 软件需求
目录前言一、未来软件市场的发展趋势二、软件开发人员的生存空间前言未来软件市场是怎么样的？做开发的生存空间如何？一、未来软件市场的发展趋势技术趋势：人工智能与机器学习：随着技术的不断成熟，人工智能将在更多领域得到应用，如智能客服、自动驾驶、智能制造等，这将极大地推动软件市场的增长。云计算与大数据：云计算服务将继续普及，大数据技术的应用也将更加广泛。企业将更加依赖云计算和大数据来优化运营、提升效率，并
个人学习笔记7-6：动手学深度学习pytorch版-李沐浪子L 深度学习深度学习笔记计算机视觉 python 人工智能神经网络 pytorch
#人工智能##深度学习##语义分割##计算机视觉##神经网络#计算机视觉13.11全卷积网络全卷积网络（fullyconvolutionalnetwork，FCN）采用卷积神经网络实现了从图像像素到像素类别的变换。引入l转置卷积（transposedconvolution）实现的，输出的类别预测与输入图像在像素级别上具有一一对应关系：通道维的输出即该位置对应像素的类别预测。13.11.1构造模型下
Rust 所有权简介东离与糖宝 rust 后端 rust 开发语言
文章目录发现宝藏1.所有权基本概念2.所有权规则3.变量作用域4.栈与堆4.1栈（Stack）4.2堆（Heap）5.String类型5.1String类型5.2String的内存分配5.3所有权与内存管理5.4String与切片6.变量与数据交互方式6.1移动（Move）6.2.克隆（Clone）7.所有权与函数7.1.传递参数7.2.返回值总结发现宝藏前些天发现了一个巨牛的人工智能学习网站，通
机器学习流形数据降维：UMAP 降维算法小嗷犬 Python 机器学习 #数据分析及可视化机器学习算法人工智能
✅作者简介：人工智能专业本科在读，喜欢计算机与编程，写博客记录自己的学习历程。个人主页：小嗷犬的个人主页个人网站：小嗷犬的技术小站个人信条：为天地立心，为生民立命，为往圣继绝学，为万世开太平。本文目录UMAP简介理论基础特点与优势应用场景在Python中使用UMAP安装umap-learn库使用UMAP可视化手写数字数据集UMAP简介UMAP（UniformManifoldApproximatio
如何做好人生的选择题？百科全书式天才——赫伯特·西蒙给你答案伽马有话说
赫伯特·西蒙是谁？想必知道的人非常少。但当看到他的履历后，相信没有人再怀疑他是个“天才”。西蒙出生于1916年6月15日，是个美国人，他的名字全称为赫伯特·亚历山大·西蒙，在2001年2月9日与世长辞，在这84年的岁月中，西蒙以27岁时取得的政治学博士学位为开端，先后步入了政治学、管理学、认知心理学、信息科学、人工智能、科学哲学、应用数学、统计学、运筹学、控制论、数理经济学、公共管理等领域，在这些
软件测试/测试开发/全日制 |利用Django REST framework构建微服务霍格沃兹-慕漓 django 微服务 sqlite
霍格沃兹测试开发学社推出了《Python全栈开发与自动化测试班》。本课程面向开发人员、测试人员与运维人员，课程内容涵盖Python编程语言、人工智能应用、数据分析、自动化办公、平台开发、UI自动化测试、接口测试、性能测试等方向。为大家提供更全面、更深入、更系统化的学习体验，课程还增加了名企私教服务内容，不仅有名企经理为你1v1辅导，还有行业专家进行技术指导，针对性地解决学习、工作中遇到的难题。让找
cmd泛滥_与您的后泛滥同事见面：人工智能机器人 weixin_26644585 人工智能 leetcode
cmd泛滥Readytoswapyouroldcube-mateforadisembodiedAI?IPsoftCEOChetanDube,creatorofAIco-workerAMELIA,giveshistakeonthepost-COVIDofficelandscape.准备将您的旧立方体伙伴换成无形的AI？AIsoft同事AMELIA的创始人IPsoft首席执行官ChetanDube阐述
两种方法判断Python的位数是32位还是64位 sanqima Python编程电脑 python 开发语言
Python从1991年发布以来，凭借其简洁、清晰、易读的语法、丰富的标准库和第三方工具，在Web开发、自动化测试、人工智能、图形识别、机器学习等领域发展迅猛。 Python是一种胶水语言，通过Cython库与C/C++语言进行链接，通过Jython库与Java语言进行链接。 Python是跨平台的，可运行在多种操作系统上，包括但不限于Windows、Linux和macOS。这意味着用Py
全自动解密解码神器 — Ciphey K'illCode python_模块 python vscode
Ciphey是一个使用自然语言处理和人工智能的全自动解密/解码/破解工具。简单地来讲，你只需要输入加密文本，它就能给你返回解密文本。就是这么牛逼。有了Ciphey，你根本不需要知道你的密文是哪种类型的加密，你只知道它是加密的，那么Ciphey就能在3秒甚至更短的时间内给你解密，返回你想要的大部分密文的答案。下面就给大家介绍Ciphey的实战使用教程。1.准备开始之前，你要确保Python和pip已
埃隆·马斯克表示特斯拉“没有必要”授权 xAI 模型喜好儿网人工智能 AIGC 马斯克
埃隆·马斯克近日在社交媒体上对《华尔街日报》的一篇报道进行了反驳。该报道指出，马斯克旗下的电动汽车公司特斯拉可能与人工智能初创公司xAI达成了一项收入分享协议，以便特斯拉能够使用xAI的人工智能模型。据称，这些模型将被集成到特斯拉的全自动驾驶（FSD）软件中，并可能用于开发特斯拉汽车的语音助手以及人形机器人擎天柱的软件。喜好儿网然而，马斯克否认了这一说法，他在社交媒体平台上表示，尽管特斯拉确实与x
Reflection 70B——HyperWrite推出的大型语言模型新加坡内哥谈技术语言模型人工智能自然语言处理
每周跟踪AI热点新闻动向和震撼发展想要探索生成式人工智能的前沿进展吗？订阅我们的简报，深入解析最新的技术突破、实际应用案例和未来的趋势。与全球数同行一同，从行业内部的深度分析和实用指南中受益。不要错过这个机会，成为AI领域的领跑者。点击订阅，与未来同行！订阅：https://rengongzhineng.io/在AI技术飞速发展的过程中，我们已经见证了可以写作、编程，甚至创造艺术的模型问世。但有一
5条实操干货有效打造你的个人品牌长安行动派
这是ZerK的第46篇原创相信大家对个人品牌这个词已经不在陌生。尤其是在知识付费的年代，你的个人品牌，就是你的标签！在《深度工作》中说到，在未来有三种人会越来越贵第一种人:能与机器对话，操纵机器的人。人工智能时代的到来，机器毕竟部分取代人类。第二种人:IP，知识产权或者文学潜在财产就像有些网上课程一周卖出的钱和一个机构卖一年一样多。价值99元的课程，10万人购买，是很常见的。爱产出大概就是10万✖
深入探讨：如何在Python中通过LangChain技术精准追踪大型语言模型（LLM）的Token使用情况 m0_57781768 python langchain 语言模型
深入探讨：如何在Python中通过LangChain技术精准追踪大型语言模型（LLM）的Token使用情况在现代的人工智能开发中，大型语言模型（LLM）已经成为了不可或缺的工具，无论是用于自然语言处理、对话生成，还是其他复杂的文本生成任务。然而，随着这些模型的广泛应用，开发者面临的一个重要挑战是如何有效地追踪和管理Token的使用情况，特别是在生产环境中，Token的使用直接影响着API调用的成本
LangChain集成指南:如何利用多样化的AI提供商 aehrutktrjk 人工智能 langchain python
LangChain集成指南:如何利用多样化的AI提供商引言在人工智能和机器学习领域,LangChain已成为一个强大而灵活的框架,允许开发者轻松集成各种AI服务提供商。本文将深入探讨LangChain的集成能力,介绍如何利用不同的AI提供商来增强你的应用程序,并提供实用的代码示例。LangChain集成概览LangChain支持多种AI提供商的集成,这些集成可以分为两类:独立包集成:这些提供商有独
探索未来，大规模分布式深度强化学习——深入解析IMPALA架构汤萌妮Margaret
探索未来，大规模分布式深度强化学习——深入解析IMPALA架构scalable_agent项目地址:https://gitcode.com/gh_mirrors/sc/scalable_agent在当今的人工智能研究前沿，深度强化学习（DRL）因其在复杂任务中的卓越表现而备受瞩目。本文要介绍的是一个开源于GitHub的重量级项目：“ScalableDistributedDeep-RLwithImp
机器学习VS深度学习 nfgo 机器学习
机器学习（MachineLearning,ML）和深度学习（DeepLearning,DL）是人工智能（AI）的两个子领域，它们有许多相似之处，但在技术实现和应用范围上也有显著区别。下面从几个方面对两者进行区分：1.概念层面机器学习：是让计算机通过算法从数据中自动学习和改进的技术。它依赖于手动设计的特征和数学模型来进行学习，常用的模型有决策树、支持向量机、线性回归等。深度学习：是机器学习的一个子领
大数据毕业设计hadoop+spark+hive知识图谱租房数据分析可视化大屏租房推荐系统 58同城租房爬虫房源推荐系统房价预测系统计算机毕业设计机器学习深度学习人工智能 2401_84572577 程序员大数据 hadoop 人工智能
做了那么多年开发，自学了很多门编程语言，我很明白学习资源对于学一门新语言的重要性，这些年也收藏了不少的Python干货，对我来说这些东西确实已经用不到了，但对于准备自学Python的人来说，或许它就是一个宝藏，可以给你省去很多的时间和精力。别在网上瞎学了，我最近也做了一些资源的更新，只要你是我的粉丝，这期福利你都可拿走。我先来介绍一下这些东西怎么用，文末抱走。（1）Python所有方向的学习路线（
架构评审的自动化与人工智能: 如何提高效率光剑书架上的书架构自动化人工智能运维
1.背景介绍架构评审是软件开发过程中的一个关键环节，它旨在确保软件架构的质量、可维护性和可扩展性。传统的架构评审通常是由人工进行，需要大量的时间和精力。随着大数据技术和人工智能的发展，自动化和人工智能技术已经开始应用于架构评审，从而提高评审的效率和准确性。在本文中，我们将讨论如何通过自动化和人工智能技术来提高架构评审的效率。我们将从以下几个方面进行讨论：背景介绍核心概念与联系核心算法原理和具体操作
解锁企业潜能，Vatee万腾平台引领智能新纪元自媒体经济说其他
在数字化转型的浪潮中，企业正站在一个前所未有的十字路口，面对着前所未有的机遇与挑战。解锁企业内在潜能，实现跨越式发展，已成为众多企业的共同追求。而Vatee万腾平台，作为智能科技的先锋，正以其强大的智能赋能能力，引领企业步入一个全新的智能纪元。Vatee万腾平台，是一个集成了人工智能、大数据、云计算等前沿技术的综合性智能服务平台。它不仅仅是一个技术工具，更是企业转型升级的加速器，能够深入企业运营的
LiteBee Wing测评：走进中小学课堂，合适的编程无人机非常重要！ song_bcbd
“国务院在《新一代人工智能发展规划》中明确，要广泛开展人工智能科普活动，实施全民智能教育项目，要在中小学阶段设置人工智能相关课程，逐步推广编程教育，鼓励社会力量参与寓教于乐的编程教学软件、游戏的开发和推广，而且要进行人工智能竞赛。”作为从事创客教育多年的老师，感谢在这个大环境，让学生能够了解人工智能，接触到前沿科技，同时也鼓励更多学生学习编程，因为没有学编程，可能就会像现在的我们后悔以前没有学习好
释放“AI+”新质生产力，深算院如何“把大数据变小”？ YashanDB YashanDB 国产数据库数据库数据库大数据
近期，南都·湾财社推出《新质·中国造》栏目，深入千行百业，遍访湾区企业，解锁湾区新质生产力，共探高质量发展之道。本期对话深圳计算科学研究院YashanDB首席技术官陈志标，探讨国产数据库如何实现创新突围，抢抓数字经济时代的新机遇。以下是专访内容：如何应对AI时代所面临的算力挑战？南都·湾财社：数据、算力和算法是发展人工智能的三要素，深算院做了怎样的前瞻性布局？陈志标：今年，政府工作报告中首次提及开
算法单链的创建与删除换个号韩国红果果 c 算法
先创建结构体 struct student { int data; //int tag;//标记这是第几个 struct student *next; }; // addone 用于将一个数插入已从小到大排好序的链中 struct student *addone(struct student *h,int x){ if(h==NULL) //??????
《大型网站系统与Java中间件实践》第2章读后感白糖_ java中间件
断断续续花了两天时间试读了《大型网站系统与Java中间件实践》的第2章，这章总述了从一个小型单机构建的网站发展到大型网站的演化过程---整个过程会遇到很多困难，但每一个屏障都会有解决方案，最终就是依靠这些个解决方案汇聚到一起组成了一个健壮稳定高效的大型系统。看完整章内容，
zeus持久层spring事务单元测试 deng520159 java DAO spring jdbc
今天把zeus事务单元测试放出来,让大家指出他的毛病, 1.ZeusTransactionTest.java 单元测试 package com.dengliang.zeus.webdemo.test; import java.util.ArrayList; import java.util.List; import org.junit.Test; import
Rss 订阅开发周凡杨 html xml 订阅 rss 规范
RSS是 Really Simple Syndication的缩写（对rss2.0而言，是这三个词的缩写，对rss1.0而言则是RDF Site Summary的缩写，1.0与2.0走的是两个体系）。 RSS
分页查询实现 g21121 分页查询
在查询列表时我们常常会用到分页，分页的好处就是减少数据交换，每次查询一定数量减少数据库压力等等。按实现形式分前台分页和服务器分页：前台分页就是一次查询出所有记录，在页面中用js进行虚拟分页，这种形式在数据量较小时优势比较明显，一次加载就不必再访问服务器了，但当数据量较大时会对页面造成压力，传输速度也会大幅下降。服务器分页就是每次请求相同数量记录，按一定规则排序，每次取一定序号直接的数据
spring jms异步消息处理 510888780 jms
spring JMS对于异步消息处理基本上只需配置下就能进行高效的处理。其核心就是消息侦听器容器，常用的类就是DefaultMessageListenerContainer。该容器可配置侦听器的并发数量，以及配合MessageListenerAdapter使用消息驱动POJO进行消息处理。且消息驱动POJO是放入TaskExecutor中进行处理，进一步提高性能，减少侦听器的阻塞。具体配置如下：
highCharts柱状图布衣凌宇 hightCharts 柱图
第一步：导入 exporting.js,grid.js,highcharts.js;第二步：写controller @Controller@RequestMapping(value="${adminPath}/statistick")public class StatistickController { private UserServi
我的spring学习笔记2-IoC（反向控制依赖注入） aijuans spring mvc Spring 教程 spring3 教程 Spring 入门
IoC（反向控制依赖注入）这是Spring提出来了，这也是Spring一大特色。这里我不用多说，我们看Spring教程就可以了解。当然我们不用Spring也可以用IoC，下面我将介绍不用Spring的IoC。 IoC不是框架，她是java的技术，如今大多数轻量级的容器都会用到IoC技术。这里我就用一个例子来说明：如：程序中有 Mysql.calss 、Oracle.class 、SqlSe
TLS java简单实现 antlove java ssl keystore tls secure
1. SSLServer.java package ssl; import java.io.FileInputStream; import java.io.InputStream; import java.net.ServerSocket; import java.net.Socket; import java.security.KeyStore; import
Zip解压压缩文件百合不是茶 Zip格式解压 Zip流的使用文件解压
ZIP文件的解压缩实质上就是从输入流中读取数据。Java.util.zip包提供了类ZipInputStream来读取ZIP文件,下面的代码段创建了一个输入流来读取ZIP格式的文件; ZipInputStream in = new ZipInputStream(new FileInputStream(zipFileName)); &n
underscore.js 学习（一） bijian1013 JavaScript underscore
工作中需要用到underscore.js，发现这是一个包括了很多基本功能函数的js库，里面有很多实用的函数。而且它没有扩展 javascript的原生对象。主要涉及对Collection、Object、Array、Function的操作。学
java jvm常用命令工具——jstatd命令(Java Statistics Monitoring Daemon) bijian1013 java jvm jstatd
1.介绍 jstatd是一个基于RMI（Remove Method Invocation）的服务程序，它用于监控基于HotSpot的JVM中资源的创建及销毁，并且提供了一个远程接口允许远程的监控工具连接到本地的JVM执行命令。 jstatd是基于RMI的，所以在运行jstatd的服务
【Spring框架三】Spring常用注解之Transactional bit1129 transactional
Spring可以通过注解@Transactional来为业务逻辑层的方法(调用DAO完成持久化动作)添加事务能力，如下是@Transactional注解的定义： /* * Copyright 2002-2010 the original author or authors. * * Licensed under the Apache License, Version
我(程序员)的前进方向 bitray 程序员
作为一个普通的程序员,我一直游走在java语言中,java也确实让我有了很多的体会.不过随着学习的深入,java语言的新技术产生的越来越多,从最初期的javase,我逐渐开始转变到ssh,ssi,这种主流的码农,.过了几天为了解决新问题,webservice的大旗也被我祭出来了,又过了些日子jms架构的activemq也开始必须学习了.再后来开始了一系列技术学习,osgi,restful.....
nginx lua开发经验总结 ronin47
使用nginx lua已经两三个月了，项目接开发完毕了，这几天准备上线并且跟高德地图对接。回顾下来lua在项目中占得必中还是比较大的，跟PHP的占比差不多持平了，因此在开发中遇到一些问题备忘一下 1：content_by_lua中代码容量有限制，一般不要写太多代码，正常编写代码一般在100行左右（具体容量没有细心测哈哈，在4kb左右），如果超出了则重启nginx的时候会报 too long pa
java-66-用递归颠倒一个栈。例如输入栈{1,2,3,4,5}，1在栈顶。颠倒之后的栈为{5,4,3,2,1}，5处在栈顶 bylijinnan java
import java.util.Stack; public class ReverseStackRecursive { /** * Q 66.颠倒栈。 * 题目：用递归颠倒一个栈。例如输入栈{1,2,3,4,5}，1在栈顶。 * 颠倒之后的栈为{5,4,3,2,1}，5处在栈顶。 *1. Pop the top element *2. Revers
正确理解Linux内存占用过高的问题 cfyme linux
Linux开机后，使用top命令查看，4G物理内存发现已使用的多大3.2G，占用率高达80%以上： Mem: 3889836k total, 3341868k used, 547968k free, 286044k buffers Swap: 6127608k total,&nb
[JWFD开源工作流]当前流程引擎设计的一个急需解决的问题 comsci 工作流
当我们的流程引擎进入IRC阶段的时候，当循环反馈模型出现之后，每次循环都会导致一大堆节点内存数据残留在系统内存中，循环的次数越多，这些残留数据将导致系统内存溢出，并使得引擎崩溃。。。。。。而解决办法就是利用汇编语言或者其它系统编程语言，在引擎运行时，把这些残留数据清除掉。
自定义类的equals函数 dai_lm equals
仅作笔记使用 public class VectorQueue { private final Vector<VectorItem> queue; private class VectorItem { private final Object item; private final int quantity; public VectorI
Linux下安装R语言 datageek R语言 linux
命令如下：sudo gedit /etc/apt/sources.list1、deb http://mirrors.ustc.edu.cn/CRAN/bin/linux/ubuntu/ precise/ 2、deb http://dk.archive.ubuntu.com/ubuntu hardy universesudo apt-key adv --keyserver ke
如何修改mysql 并发数(连接数)最大值 dcj3sjt126com mysql
MySQL的连接数最大值跟MySQL没关系，主要看系统和业务逻辑了方法一：进入MYSQL安装目录打开MYSQL配置文件 my.ini 或 my.cnf查找 max_connections=100 修改为 max_connections=1000 服务里重起MYSQL即可　　方法二：MySQL的最大连接数默认是100客户端登录：mysql -uusername -ppass
单一功能原则 dcj3sjt126com 面向对象的程序设计软件设计编程原则
单一功能原则[ 编辑] SOLID 原则单一功能原则开闭原则 Liskov代换原则接口隔离原则依赖反转原则查论编在面向对象编程领域中，单一功能原则（Single responsibility principle）规定每个类都应该有
POJO、VO和JavaBean区别和联系 fanmingxing VO POJO javabean
POJO和JavaBean是我们常见的两个关键字，一般容易混淆，POJO全称是Plain Ordinary Java Object / Plain Old Java Object，中文可以翻译成：普通Java类，具有一部分getter/setter方法的那种类就可以称作POJO，但是JavaBean则比POJO复杂很多，JavaBean是一种组件技术，就好像你做了一个扳子，而这个扳子会在很多地方被
SpringSecurity3.X--LDAP：AD配置 hanqunfeng SpringSecurity
前面介绍过基于本地数据库验证的方式，参考http://hanqunfeng.iteye.com/blog/1155226，这里说一下如何修改为使用AD进行身份验证【只对用户名和密码进行验证，权限依旧存储在本地数据库中】。将配置文件中的如下部分删除：
mac mysql 修改密码 IXHONG mysql
$ sudo /usr/local/mysql/bin/mysqld_safe –user=root & //启动MySQL(也可以通过偏好设置面板来启动)$ sudo /usr/local/mysql/bin/mysqladmin -uroot password yourpassword //设置MySQL密码（注意，这是第一次MySQL密码为空的时候的设置命令，如果是修改密码，还需在-
设计模式--抽象工厂模式 kerryg 设计模式
抽象工厂模式：工厂模式有一个问题就是，类的创建依赖于工厂类，也就是说，如果想要拓展程序，必须对工厂类进行修改，这违背了闭包原则。我们采用抽象工厂模式，创建多个工厂类，这样一旦需要增加新的功能，直接增加新的工厂类就可以了，不需要修改之前的代码。总结：这个模式的好处就是，如果想增加一个功能，就需要做一个实现类，
评"高中女生军训期跳楼” nannan408
首先，先抛出我的观点，各位看官少点砖头。那就是，中国的差异化教育必须做起来。孔圣人有云：有教无类。不同类型的人，都应该有对应的教育方法。目前中国的一体化教育，不知道已经扼杀了多少创造性人才。我们出不了爱迪生，出不了爱因斯坦，很大原因，是我们的培养思路错了，我们是第一要“顺从”。如果不顺从，我们的学校，就会用各种方法，罚站，罚写作业，各种罚。军
scala如何读取和写入文件内容？ qindongliang1922 java jvm scala
直接看如下代码： package file import java.io.RandomAccessFile import java.nio.charset.Charset import scala.io.Source import scala.reflect.io.{File, Path} /** * Created by qindongliang on 2015/
C语言算法之百元买百鸡 qiufeihu c 算法
中国古代数学家张丘建在他的《算经》中提出了一个著名的“百钱买百鸡问题”，鸡翁一，值钱五，鸡母一，值钱三，鸡雏三，值钱一，百钱买百鸡，问翁，母，雏各几何？代码如下： #include <stdio.h> int main() { int cock,hen,chick; /*定义变量为基本整型*/ for(coc
Hadoop集群安全性：Hadoop中Namenode单点故障的解决方案及详细介绍AvatarNode wyz2009107220 NameNode
正如大家所知，NameNode在Hadoop系统中存在单点故障问题，这个对于标榜高可用性的Hadoop来说一直是个软肋。本文讨论一下为了解决这个问题而存在的几个solution。 1. Secondary NameNode 原理：Secondary NN会定期的从NN中读取editlog，与自己存储的Image进行合并形成新的metadata image 优点：Hadoop较早的版本都自带，