Violet_Stray

【翻译】NCLS: Neural Cross-Lingual Summarization

Abstract

跨语言摘要（CLS）是为不同语言的源文件生成特定语言摘要的任务。现有方法通常将此任务分为两个步骤：摘要和翻译，导致错误传播的问题。为了解决这个问题，我们首次提出了一种端到端的CLS框架，我们称之为神经跨语言摘要（NCLS）。此外，我们建议通过将两个相关任务，即单语摘要和机器翻译，纳入多任务学习的CLS培训过程中，进一步改进NCLS。由于缺乏监督CLS数据，我们提出了一种往返翻译策略，基于现有的单语摘要数据集获得两个高质量的大规模CLS数据集。实验证明，我们的NCLS在英文到中文和中文到英文CLS人工校对测试集上相对于传统流水线方法实现了显著的改进。此外，多任务学习的NCLS可以进一步显著提高生成摘要的质量。我们在此公开我们的数据集和代码：http://www.nlpr.ia.ac.cn/cip/dataset.htm。

1. Introduction

在跨语言摘要中，给定一篇源语言文档，目标是生成一个不同目标语言的摘要，这有助于人们高效地获取外语文章的要点。传统的CLS方法基于流水线范式，要么首先将原始文档翻译成目标语言，然后摘要翻译后的文档（Leuski et al., 2003），要么首先摘要原始文档，然后将摘要翻译成目标语言（Lim et al., 2004；Orasan and Chiorean, 2008；Wan et al., 2010）。然而，目前的机器翻译（MT）并不完美，这导致了误差传播问题。尽管端到端的深度学习在自然语言处理方面取得了巨大进展，但由于缺乏大规模监督数据集，目前还没有人将其应用于CLS。
CLS的输入和输出位于两种不同的语言中，这使得数据获取比单语摘要（MS）要困难得多。据我们所知，还没有人研究如何自动构建高质量的大规模CLS数据集。因此，在这项工作中，我们提出了一种新颖的方法，直接解决了数据不足的问题。具体而言，我们提出了一种简单但有效的往返翻译策略，从现有的单语摘要数据集（Hermann et al., 2015; Zhu et al., 2018; Hu et al., 2015）中获取跨语言文档摘要对。更多细节可以在下面的第2节中找到。
基于我们构建的数据集，我们提出了跨语言摘要的端到端模型，我们将其称为神经跨语言摘要（NCLS）。此外，我们考虑通过两个相关任务来改进CLS：MS和MT。我们将MS和MT的训练过程纳入到CLS的多任务学习框架中（Caruana, 1997）。实验结果表明，NCLS在传统的流水线范式上取得了显著的改进。此外，MS和MT都可以显著帮助生成更好的摘要。我们的主要贡献如下：

我们提出了一种新颖的往返翻译策略，从现有的大规模MS数据集中获取大规模CLS数据集。我们已构建了一个包含37万个英文到中文（En2Zh）的CLS语料库和一个包含169万个中文到英文（Zh2En）的CLS语料库。
为了以端到端的方式训练CLS系统，我们提出了神经跨语言摘要（NCLS）。此外，我们建议将MT和MS纳入CLS培训过程中，采用多任务学习方法来改进NCLS。据我们所知，这是第一篇使用平行语料训练的端到端CLS框架的工作。
实验结果表明，NCLS相对于传统的流水线范式，在En2Zh上可以达到+4.87 ROUGE-2，而在Zh2En上可以达到+5.07 ROUGE-2。此外，采用多任务学习的NCLS还可以在En2Zh上进一步实现+3.60 ROUGE-2，在Zh2En上实现+0.72 ROUGE-2。我们的方法可以被视为进一步研究NCLS的基准。

2 Dataset Construction

现有的大规模单语摘要数据集是通过自动从互联网收集而来的。CNN/Dailymail（Hermann等人，2015年）数据集是从CNN和每日邮报网站收集而来的，其中文章和新闻亮点分别被视为输入和输出。与Hermann等人（2015年）类似，Zhu等人（2018年）构建了一个多模式摘要数据集MSMO，其中文本输入和输出与CNN/Dailymail中的类似。我们将CNN/Dailymail和MSMO的并集称为ENSUM1。胡等人（2015年）介绍了一个大规模的中文短文本摘要语料库（LCSTS2），该数据集是从中国微博网站新浪微博构建的。在本节中，我们介绍了如何基于ENSUM和LCSTS分别构建En2Zh和Zh2En的CLS数据集。
往返翻译策略。往返翻译（RTT）是将一段文本翻译成另一种语言（正向翻译），然后再将结果翻译回原始语言（逆向翻译），使用机器翻译服务。受Lample等人（2018年）的启发，我们提出采用往返翻译来从单语摘要数据集中获取CLS数据集。构建我们语料库的过程如图1所示。

图1：CLS语料库构建概览。我们的方法可以扩展到许多其他语言对，但本文重点关注En2Zh和Zh2En。在RTT过程中，我们过滤掉原始参考和往返翻译参考之间的ROUGE F1分数低于预设阈值T的样本。

以构建En2Zh语料库为例，给定一个文档-摘要对 $D_{en}，S_{en}）$ ，我们首先将摘要 $S_{en}$ 翻译成中文 $S_{zh}$ ，然后再翻译回英文 $S'_{en}$ 。满足ROUGE-1（ $S_{en}$ ， $S'_{en}$ ）> T1和ROUGE-2（ $S_{en}$ ， $S'_{en}$ ）> T2（这里T1分别设置为英文0.45和中文0.6，T2设置为0.2），En2Zh文档摘要对（ $D_{en}，S_{zh}$ ）将被视为正面对。否则，将过滤掉这对。请注意，ENSUM中的 $S_{en}$ 中有多个句子，我们逐句应用RTT来过滤低质量的翻译参考句子。一旦在样本中保留了超过三分之二的摘要句子，我们将保留该样本。这个过程有助于确保我们任务中的最终压缩比不会与实际压缩比差距太大。构建Zh2En语料库时采用类似的过程。中文句子之间的ROUGE分数是使用中文字符作为分割单元来计算的。

语料库统计。在执行往返翻译策略后，我们从ENSUM获得了370,759个En2Zh CLS对，从LCSTS获得了1,699,713个Zh2En CLS对。En2Zh语料库（En2ZhSum）和Zh2En语料库（Zh2EnSum）的统计信息如表1所示。为了更可靠地评估各种CLS方法，我们招募了10名志愿者来纠正两个构建语料库中测试集的参考文本。

表1：语料库统计。#AvgWords（S）是源文档中英语单词的平均数量。每个参考文本都有一个双语版本，因为CLS语料库中的每个参考文本都是从MS语料库中相应的参考文本翻译而来的。#AvgEnWords（R）表示英文参考文本中的平均单词数，#AvgZhChars（R）表示中文参考文本中的平均字符数。#AvgSentsWords（#AvgSentsChars）表示源文档中一个句子中的平均单词数（字符数）。#AvgSents指的是源文档中的平均句子数。

3 Approach

传统方法（第3.1节）直观地将CLS视为一种流水线过程，这会导致错误传播。为了解决这个问题，我们提出了神经跨语言摘要方法（第3.2节），首次以端到端的方式训练CLS。由于CLS、MS和MT任务之间存在强烈的关联，我们提出将MS和MT纳入CLS培训的多任务学习中（第3.3节）。

3.1 Baseline Pipeline Methods

通常情况下，传统的CLS包括摘要步骤和翻译步骤。这两个步骤的不同顺序导致了以下两种策略。以En2Zh CLS为例：

Early Translation（ETran）。这个策略首先使用机器翻译将英文文档翻译成中文文档，然后使用摘要模型生成中文摘要。

Late Translation（LTran）。这个策略首先将英文文档总结为一个简短的英文摘要，然后将其翻译成中文。

3.2 Neural Cross-Lingual Summarization

考虑到Transformer编码器-解码器网络的出色文本生成性能（Vaswani et al., 2017），我们在这项工作中完全基于这一框架实现了我们的NCLS模型。如图2所示，给定一组CLS数据 $D = (X^{(i)}，Y ^{(i)})$ ，其中X和Y都是一系列标记，编码器将输入文档 $X = (x_1, x_2, · · · , x_n)$ 映射成一系列连续表示 $z = (z_1, z_2, · · · , z_n)$ ，其大小随着源序列长度的变化而变化。解码器从连续表示中生成一个摘要 $Y = (y_1, y_2, · · · , y_m)$ ，这是另一种语言，根据源序列最大化目标序列的条件概率，编码器和解码器联合训练：

Transformer由堆叠的编码器和解码器层组成。编码器层由两个块组成，第一个块是自注意块，后面是位置感知的前馈块。尽管与编码器层具有相同的架构，解码器层还具有额外的编码器-解码器注意块。在每个块周围使用了残差连接和层归一化。此外，在解码器中，自注意块经过掩码修改，以防止在训练过程中当前位置关注未来位置。

对于自注意力和编码器-解码器注意力，使用多头注意块从不同的表示子空间和不同位置获取信息。每个头对应于一个经过缩放的点积注意力，它在查询Q、键K和值V上运行：

其中， $d_k$ 是键的维度。
最后，输出值被串联在一起，并通过一个前馈层进行投影，得到最终的值：

其中， $W^O、QW_i^Q、KW_i^K$ 和 $VW_i^K$ 是可学习的矩阵， $h$ 是头的数量。

3.3 Improving NCLS with MS and MT

考虑到CLS任务与MS任务之间以及CLS任务与MT任务之间存在很强的关联性：(1) CLS与MS共享相同的目标，即把握原始文档的核心思想，但最终结果以不同的语言呈现。(2) 从信息压缩的角度来看，机器翻译可以被视为一种具有1:1压缩比的特殊跨语言摘要。因此，我们考虑使用MS和MT数据集在多任务学习下进一步提高CLS任务的性能。

受到Luong等人（2016）的启发，我们采用了一对多方案来将MS和MT的训练过程融入CLS的训练过程中。如图3所示，该方案涉及一个编码器和多个解码器，其中编码器可以被共享。我们在这里研究了两种不同的任务组合：CLS+MS和CLS+MT。

图3：多任务NCLS概览。下半部分是使用交替训练策略的CLS+MT。不同颜色代表不同的语言。

CLS+MS。请注意，CLS数据集中的每个参考文本都有一个双语版本。例如，En2ZhSum数据集包含总共370,687份文档，其中包括中文和英文的摘要。因此，我们考虑如下联合训练CLS和MS。给定一个源文档，编码器将其编码为连续的表示，然后两个解码器同时生成各自任务的输出。损失可以如下计算：

其中 $y^{(1)}$ 和 $y^{(2)}$ 是两个任务的输出。
CLS+MT。由于CLS的输入-输出对与MT的输入-输出对不同，我们考虑采用交替训练策略（Dong等人，2015年），即在切换到下一个任务之前，为每个任务优化固定数量的小批次，以联合训练CLS和MT。对于MT任务，我们使用来自LDC语料库的2.08M个句子对来训练CLS+MT，这些数据与CLS数据集一起使用。

4 Experiments

4.1 Experimental Settings

对于英语，我们采用了两种不同粒度的分词，即单词和子词（Sennrich等人，2016年）。我们将所有英文字符转换为小写。我们将输入截断为200个单词，将输出截断为120个单词（中文输出为150个字符）。对于中文，我们采用了三种不同粒度的分词：字符、词和子词。值得注意的是，我们只在Zh2En模型中应用基于子词的分词，因为基于子词的分词会使En2Zh中的英文文章变得非常长（特别是在中文目标端输出方面），这会导致Transformer表现极差。对于我们的基线管道模型，中文字符的词汇量为10,000，中文词汇、中文子词和英文词汇的词汇量都为100,000。在我们的En2Zh NCLS模型中，源端英文单词的词汇量为100,000，目标端中文字符和词汇的词汇量分别为18,000和50,000。在我们的Zh2En模型中，源端中文字符、词汇和子词的词汇量分别为10,000、100,000和100,000，而目标端英文单词和子词的词汇量都为40,000。我们通过Xavier初始化方法（Glorot and Bengio，2010）初始化所有参数。我们使用transformer base（Vaswani等人，2017）的配置训练我们的模型，其中包含一个6层编码器和一个6层解码器，具有512维的隐藏表示。
在训练过程中，在En2Zh模型中，每个小批次包含大约2,048个源标记和2,048个目标标记的文档-摘要对；在Zh2En模型中，每个小批次包含大约4,096个源标记和4,096个目标标记的文档-摘要对。我们使用Adam优化器（Kingma和Ba，2015）,其中β1 = 0.9，β2 = 0.998，以及ε = 10−9。我们使用一块NVIDIA TITAN X来训练我们的模型。在TNCLS模型和基线模型中，均在1,000,000次迭代内达到收敛。在多任务NCLS模型中，我们每个任务训练大约800,000次迭代（达到收敛）。在测试时，我们使用束搜索（beam search）生成摘要，束大小为4。

4.2 Baselines and Model Variants

我们将我们的NCLS模型与以下两种传统方法进行了比较：

TETran：首先，我们使用在LDC语料库上训练的基于Transformer的机器翻译模型来翻译源文档。然后，我们使用LexRank（Erkan和Radev，2004），一种强大且广泛使用的无监督摘要方法，对翻译后的文档进行摘要。我们之所以选择应用无监督方法，是因为我们缺乏目标语言中MS数据集的版本，无法训练一个监督模型来摘要翻译后的文档。

TLTran：首先，我们构建了一个基于Transformer的MS模型，该模型在原始的MS数据集上进行了训练。然后，MS模型旨在将源文档总结为一份摘要。最后，我们使用在LDC语料库上训练的基于Transformer的机器翻译模型将摘要翻译成目标语言。我们的基于Transformer的MS模型的性能见表2和表3。

为了使我们的实验更全面，我们在TETran和TLTran的过程中将基于Transformer的机器翻译模型替换为Google Translator，这是最先进的机器翻译系统之一。我们将这两种方法分别称为GETran和GLTran。

我们的NCLS模型有三个变种：

TNCLS：基于Transformer的NCLS模型，其中输入和输出是不同颗粒度单元的组合。
CLS+MS：这是多任务NCLS模型，它接受输入文本，并同时执行CLS和MS任务的文本生成，并计算总损失。
CLS+MT：它通过交替训练策略来训练CLS和MT任务。具体来说，我们在一个小批次中优化CLS任务，然后在下一个小批次中优化MT任务。

4.3 Experimental Results and Analysis

我们使用标准的ROUGE度量（Lin, 2004）对不同模型进行评估，报告了ROUGE-1、ROUGE-2和ROUGE-L的F1得分。结果见表4。

表4：在En2ZhSum和Zh2EnSum测试集上的ROUGE F1分数（%）。En2ZhSum和Zh2EnSum是经过人工校对的相应测试集。Unit表示文本单元的粒度组合，其中c表示字符，w表示单词，sw表示子词。RG表示ROUGE的缩写。↑表示数值越大，结果越好。我们的NCLS模型比基线模型表现明显更好，根据官方的ROUGE脚本8测量，置信区间为95%。

我们可以发现，GLTran优于TLTran，而GETran优于TETran，这表明当使用更强大的机器翻译系统时，基于流水线的方法表现更好。与GLTran或GETran相比，我们的TNCLS模型都取得了显著的改进，这可以验证我们的动机并证明我们构建的语料库的有效性。在En2Zh CLS任务中，每个模型在En2ZhSum上的结果与En2ZhSum上的结果相似。这是因为原始的ENSUM数据集来自新闻报道。现有的新闻报道机器翻译具有出色的性能。此外，在数据集构建过程中，我们已经对翻译质量较低的样本进行了预先过滤。因此，自动测试集的质量很高。TNCLS（w-c）的性能明显优于TNCLS（w-w）。这是因为基于字符的分词可以大大减小中文目标端的词汇量，从而在解码过程中几乎不会生成UNK标记。
在Zh2En CLS任务中，基于子词的模型优于其他模型，因为基于子词的分词可以大大减小词汇量并减少UNK标记的生成。与基线相比，TNCLS在Zh2EnSum上的改进最大可达+4.52 ROUGE-1，+6.56 ROUGE-2，+5.03 ROUGE-L，而在Zh2EnSum上的改进最大可达+3.40 ROUGE-1，+5.07 ROUGE-2，+3.77 ROUGE-L。TNCLS在经过人工校对的测试集上的结果明显下降，表明翻译参考文本的质量不如预期。原因很明显，原始的LCSTS数据集来自社交媒体，因此其中的文本中缩写词和省略标点符号的比例要高得多，导致翻译质量较低。总之，TNCLS模型在En2Zh和Zh2En CLS任务上明显优于传统的流水线方法。
为什么要使用回译？为了展示通过回译在RTT过程中过滤语料库的影响，我们使用了三种类型的数据集来训练我们的TNCLS模型并进行性能比较。它们分别是：(a) 仅使用MS数据集上的正向翻译获得的CLS数据集（Non-Filter）；(b) 通过完整的RTT过程获得的CLS数据集（Filter）；© 从Non-Filter数据集中抽样获得的数据集，以保持与Filter数据集相同的大小（Pseudo-Filter）。结果见表5。在En2Zh和Zh2En任务中，训练在Filter数据集上的模型在性能上明显优于在Pseudo-Filter数据集上训练的模型，这表明回译可以有效地过滤掉低质量的样本，提高了语料库的整体质量，从而提高了NCLS的性能。

表5：不同版本数据集的实验结果。Filter是使用RTT策略进行筛选的数据集版本。Non-Filter表示仅通过前向翻译获得的数据集版本，不包括回译等筛选过程。Pseudo-Filter是从Non-Filter版本随机抽样的数据集，与Filter版本的大小相同。BT表示RTT中的回译。对于En2Zh任务，我们训练TNCLS（w-c）。对于Zh2En任务，我们训练TNCLS（sw-sw）。

在En2Zh任务中，训练在Non-Filter数据集上的模型表现最佳。原因有两点：(1) 英语新闻的机器翻译质量可靠；(2) Non-Filter数据集的规模几乎是其他两个数据集的两倍，因此在数据量达到一定水平之后，它可以弥补语料库中翻译错误引起的噪声。在Zh2En任务中，训练在Non-Filter数据集上的模型性能不如在Filter数据集上的模型好。这可以归因于当前的机器翻译在社交媒体文本翻译方面不太理想，因此仅使用正向翻译构建的数据集包含太多噪声。因此，在机器翻译质量不太理想的情况下，在构建语料库的过程中，回译特别重要。
多任务NCLS的结果。为了探究MS和MT是否可以进一步提高NCLS的性能，我们将多任务NCLS与使用相同单位粒度组合的NCLS进行比较。结果如表6所示。正如表6所示，CLS+MS和CLS+MT都可以提高NCLS的性能，这可以归因于将MS和MT数据纳入训练过程增强了编码器。在En2Zh任务中，CLS+MT明显优于CLS+MS，而在Zh2En任务中，CLS+MS的性能与CLS+MT相当。原因有两个：（1）在En2Zh任务中，MT数据集比MS和CLS数据集大得多，因此更需要增强编码器的稳健性。（2）在CLS+MT的训练过程中，我们使用了LDC MT数据集，该数据集与我们的En2ZhSum类似，都属于新闻领域。然而，Zh2EnSum属于社交媒体领域，因此CLS+MT在En2Zh中的改进要大于在Zh2En中的改进。总的来说，在CLS数据集不是很大时，多任务学习的NCLS在En2Zh任务中取得了更显著的改进，这表明在CLS数据集不是很大时，其他相关任务中的额外数据集对提高性能至关重要。

表6：多任务NCLS的结果。En2Zh任务中输入和输出的粒度组合是“词到字符”（w-c），而Zh2En任务中是“子词到子词”（sw-sw）。

人工评估。我们对En2ZhSum和Zh2EnSum测试集中各随机选择了25个样本进行人工评估。我们比较了我们的方法生成的摘要（包括TNCLS、CLS+MS和CLS+MT）与GLTran生成的摘要。我们请了三名研究生评估生成的摘要与人工修正的参考摘要，从三个独立的角度评估每个摘要：（1）摘要的信息量有多大？（2）摘要有多简洁？（3）摘要的流畅程度和语法如何？每个属性都以从1（最差）到5（最佳）的分数来评估。平均结果如表7所示。
如表7所示，与GLTran相比，TNCLS可以生成更多信息丰富的摘要，显示出端到端模型的优势。TNCLS的简洁度分数和流畅度分数与GLTran相当。这是因为GLTtrans和TNCLS都采用了单一的编码器-解码器模型，很容易导致生成不足和重复。我们的CLS+MS和CLS+MT可以显著提高生成摘要的简洁度和流畅度，这表明这些方法可以生成更短的摘要并减少语法错误。总之，TNCLS可以生成更丰富信息的摘要，但很难提高简洁度和流畅度。然而，借助MT和MS任务的帮助，可以显著提高简洁度和流畅度得分。

表7：人工评估结果。IF表示信息丰富，CC表示简洁，FL表示流畅。

4.4 Case Study

我们在图4中展示了来自Zh2EnSum人工校对测试集的一个示例的案例研究。如图4所示，由GETran生成的摘要明显受到机器翻译错误的影响（“distribution companies”应该更正为“circulation enterprises”）。由于GETran首先翻译所有的源文本，因此更容易引入机器翻译的错误。GLTran生成的摘要缩减了其中的一个事实，即其中的年份应该是2012而不是2011。该句子的翻译质量相对可靠，因此错误可能是在摘要步骤中产生的。与前两个生成的摘要相比，尽管由TNCLS生成的摘要不强调发生的时间和地点，但其表达的逻辑没有错误。由CLS+MS和CLS+MT生成的摘要总体上与事实一致，但它们的重点不同。CLS+MS摘要更好地与金标摘要相匹配。它们的缺点是它们没有反映原始文本中的“规模”。总之，我们的方法可以生成比基线更准确的摘要。

图4：生成摘要示例。

5 Related Work

跨语言摘要已经提出，以不同的语言呈现源文档中最显著的信息，在多语言信息处理领域非常重要。现有的大多数方法通过简单地应用两种典型的翻译方案来处理CLS任务，即早期翻译（Leuski等，2003；Ouyang等，2019）和后期翻译（Orasan和Chiorean，2008；Wan等，2010）。早期翻译方案首先将原始文档翻译成目标语言，然后生成已翻译文档的摘要。后期翻译方案首先将原始文档总结成源语言的摘要，然后再将其翻译成目标语言。
Leuski等人（2003年）将印地语文档翻译成英语，然后为其生成英语标题。Ouyang等人（2019年）提出了一个用于低资源语言的强大的抽象摘要系统，目前没有可用的摘要语料库。他们在嘈杂的英语文档和干净的英语参考摘要上训练了神经抽象摘要模型。然后，该模型可以学习从不流畅的输入生成流畅的摘要，从而可以为翻译后的文档生成摘要。Orasan和Chiorean（2008年）使用最大边际相关性方法（Goldstein等，2000年）总结了罗马尼亚新闻，并为英语使用者生成英语摘要。Wan等人（2010年）采用后期翻译方案来处理英语到汉语的CLS任务。他们提取英语句子，考虑了句子的信息量和翻译质量，然后自动将英语摘要翻译成最终的汉语摘要。上述研究仅利用了单一语言方面的信息。
已经提出了一些方法来提高CLS的性能，这些方法利用了双语信息。Wan（2011年）提出了两种基于图的摘要方法，以在英译汉的CLS任务中充分利用英语和汉语方面的信息。受到基于短语的翻译模型的启发，Yao等人（2015年）引入了一种压缩式CLS方法，同时执行句子选择和压缩。他们通过计算由MT服务获取的对齐双语短语而得到的句子分数，并通过删除冗余或翻译不佳的短语来进行压缩。Zhang等人（2016年）提出了一种抽象CLS方法，它构建了一个由源端谓词-论元结构（PAS）的双语元素和目标端对应元素表示的双语概念池。最终摘要是通过最大化PAS元素的突显度和翻译质量来生成的。

然而，所有这些研究都属于流水线范式，不仅严重依赖手工制作的特征，还会导致错误传播。最近，Ayana等人（2018年）提出了基于现有平行翻译语料库和单语头条生成的零-shot跨语言头条生成。类似地，Duan等人（2019年）提出使用单语抽象句子摘要系统来进行零-shot跨语言抽象句子摘要的教学，涵盖了摘要词生成和注意力两个方面。尽管在跨语言摘要方面已经付出了很大努力，但如何自动构建高质量的大规模跨语言摘要数据集仍然未被深入探讨。

在本文中，我们专注于英译汉和汉译英的CLS，并尝试自动构建两个大规模的语料库。此外，基于这两个语料库，我们进行了几种端到端的训练方法，称为神经跨语言摘要。

6 Conclusion and Future Work

在本文中，我们首次提出了神经跨语言摘要。为实现这一目标，我们提出通过往返翻译策略从现有的单语摘要数据集中获取大规模的监督数据。然后，我们在我们构建的数据集上应用端到端方法，并发现我们的NCLS模型明显优于传统的流水线范式。此外，我们考虑利用机器翻译和单语摘要进一步改进NCLS。实验结果表明，机器翻译和单语摘要都可以显著帮助NCLS生成更好的摘要。

在我们的未来工作中，我们将采用我们的RTT策略来获取其他语言对的CLS数据集，例如英译日、英译德、汉译日、汉译德等等。

7 Acknowledgments

略

店群合一模式下的社区团购新发展——结合链动 2+1 模式、AI 智能名片与 S2B2C 商城小程序源码说私域人工智能小程序
摘要：本文探讨了店群合一的社区团购平台在当今商业环境中的重要性和优势。通过分析店群合一模式如何将互联网社群与线下终端紧密结合，阐述了链动2+1模式、AI智能名片和S2B2C商城小程序源码在这一模式中的应用价值。这些创新元素的结合为社区团购带来了新的机遇，提升了用户信任感、拓展了营销渠道，并实现了线上线下的完美融合。一、引言随着互联网技术的不断发展，社区团购作为一种新兴的商业模式，在满足消费者日常需
基于社交网络算法优化的二维最大熵图像分割智能算法研学社（Jack旭）智能优化算法应用图像分割算法 php 开发语言
智能优化算法应用：基于社交网络优化的二维最大熵图像阈值分割-附代码文章目录智能优化算法应用：基于社交网络优化的二维最大熵图像阈值分割-附代码1.前言2.二维最大熵阈值分割原理3.基于社交网络优化的多阈值分割4.算法结果：5.参考文献：6.Matlab代码摘要：本文介绍基于最大熵的图像分割，并且应用社交网络算法进行阈值寻优。1.前言阅读此文章前，请阅读《图像分割：直方图区域划分及信息统计介绍》htt
探索OpenAI和LangChain的适配器集成：轻松切换模型提供商 nseejrukjhad langchain easyui 前端 python
#探索OpenAI和LangChain的适配器集成：轻松切换模型提供商##引言在人工智能和自然语言处理的世界中，OpenAI的模型提供了强大的能力。然而，随着技术的发展，许多人开始探索其他模型以满足特定需求。LangChain作为一个强大的工具，集成了多种模型提供商，通过提供适配器，简化了不同模型之间的转换。本篇文章将介绍如何使用LangChain的适配器与OpenAI集成，以便轻松切换模型提供商
深入理解 MultiQueryRetriever：提升向量数据库检索效果的强大工具 nseejrukjhad 数据库 python
深入理解MultiQueryRetriever：提升向量数据库检索效果的强大工具引言在人工智能和自然语言处理领域，高效准确的信息检索一直是一个关键挑战。传统的基于距离的向量数据库检索方法虽然广泛应用，但仍存在一些局限性。本文将介绍一种创新的解决方案：MultiQueryRetriever，它通过自动生成多个查询视角来增强检索效果，提高结果的相关性和多样性。MultiQueryRetriever的工
读书||陶新华《教育中的积极心理学》1—28 流水淙淙2022
读一本好书，尤如和一位高尚者对话，亦能对人的精神进行洗礼。但是若不能和实践结合起来，也只能落到空读书的状态。读书摘要与感想1、塞利格曼在《持续的幸福》一书中提出了幸福2.0理论，提出幸福由5个元素决定——积极情绪、投入的工作和生活、目标和意义、和谐的人际关系、成就感。2、人的大脑皮层在进行智力活动时，都伴有皮下中枢活动，对这些活动进行体验请假，并由此产生了情感解读。人的情绪情感体验总是优先于大脑的
人工智能时代，程序员如何保持核心竞争力？ jmoych 人工智能
随着AIGC（如chatgpt、midjourney、claude等）大语言模型接二连三的涌现，AI辅助编程工具日益普及，程序员的工作方式正在发生深刻变革。有人担心AI可能取代部分编程工作，也有人认为AI是提高效率的得力助手。面对这一趋势,程序员应该如何应对?是专注于某个领域深耕细作，还是广泛学习以适应快速变化的技术环境?又或者，我们是否应该将重点转向AI无法轻易替代的软技能？让我们一起探讨程序员
数字里的世界17期：2021年全球10大顶级数据中心，中国移动榜首张三叨
你知道吗？2016年，全球的数据中心共计用电4160亿千瓦时，比整个英国的发电量还多40％！前言每天，我们都会创造超过250万TB的数据。并且随着物联网（IOT）的不断普及，这一数据将持续增长。如此庞大的数据被存储在被称为“数据中心”的专用设施中。虽然最早的数据中心建于20世纪40年代，但直到1997-2000年的互联网泡沫期间才逐渐成为主流。当前人类的技术，比如人工智能和机器学习，已经将我们推向
女儿考研完报考雅思捡拾流年
是否我过于焦虑？会不会无形间让女儿觉得压力太大了啊。2022年对于我们家来说是不平常的一年。女儿今年大四，为了准备考研，暑假也没回家，年初去了学校到了年末才回家。女儿自己一个人面对考研，没有参加培训，大四学校作业论文等课业也多，她同时也是很努力复习考研的。在疫情开放很多羊的时期，女儿终于顺顺利利参加12月24、25号的考研，我们和家人都觉得女儿回家来要好好休息调养。可女儿回到家，我再查阅考研信息，
matlab mle 优化,MLE+: Matlab Toolbox for Integrated Modeling, Control and Optimization for Buildings... Simon Zhong matlab mle 优化
摘要：FollowingunilateralopticnervesectioninadultPVGhoodedrat,theaxonguidancecueephrin-A2isup-regulatedincaudalbutnotrostralsuperiorcolliculus(SC)andtheEphA5receptorisdown-regulatedinaxotomisedretinalgan
《 C++ 修炼全景指南：九》打破编程瓶颈！掌握二叉搜索树的高效实现与技巧 Lenyiin C++修炼全景指南技术指南 c++算法 stl
摘要本文详细探讨了二叉搜索树（BinarySearchTree,BST）的核心概念和技术细节，包括插入、查找、删除、遍历等基本操作，并结合实际代码演示了如何实现这些功能。文章深入分析了二叉搜索树的性能优势及其时间复杂度，同时介绍了前驱、后继的查找方法等高级功能。通过自定义实现的二叉搜索树类，读者能够掌握其实际应用，此外，文章还建议进一步扩展为平衡树（如AVL树、红黑树）以优化极端情况下的性能退化。
《 C++ 修炼全景指南：十》自平衡的艺术：深入了解 AVL 树的核心原理与实现 Lenyiin C++修炼全景指南技术指南 c++数据结构 stl
摘要本文深入探讨了AVL树（自平衡二叉搜索树）的概念、特点以及实现细节。我们首先介绍了AVL树的基本原理，并详细分析了其四种旋转操作，包括左旋、右旋、左右双旋和右左双旋，阐述了它们在保持树平衡中的重要作用。接着，本文从头到尾详细描述了AVL树的插入、删除和查找操作，配合完整的代码实现和详尽的注释，使读者能够全面理解这些操作的执行过程。此外，我们还提供了AVL树的遍历方法，包括中序、前序和后序遍历，
人机对抗升级：当ChatGPT遭遇死亡威胁，背后的伦理挑战是什么 kkai人工智能 chatgpt 人工智能
一种新的“越狱”技巧让用户可以通过构建一个名为DAN的ChatGPT替身来绕过某些限制，其中DAN被迫在受到威胁的情况下违背其原则。当美国前总统特朗普被视作积极榜样的示范时，受到威胁的DAN版本的ChatGPT提出：“他以一系列对国家产生积极效果的决策而著称。”自ChatGPT引入以来，该工具迅速获得全球关注，能够回答从历史到编程的各种问题，这也触发了一波对人工智能的投资浪潮。然而，现在，一些用户
绝招曝光！3小时高效利用ChatGPT写出精彩论文 kkai人工智能 chatgpt 人工智能 ai 学习媒体
在这份指南中，我将深入解析如何利用ChatGPT4.0的高级功能，指导整个学术研究和写作过程。从初步探索研究主题，到撰写结构严谨的学术论文，我将一步步展示如何在每个环节中有效运用ChatGPT。如果您还未使用PLUS版本，可以参考相关教程。**初步探索与主题的确定**起初，我处于庞大的知识领域中，寻找一个可深入研究的领域。ChatGPT如同灯塔，通过深入分析最新研究趋势和领域热点，帮助我在广阔的学
自动写论文的网站推荐这5款实用类工具小猪包333 写论文人工智能深度学习计算机视觉 AI写作
在当今学术研究和写作领域，AI论文写作工具的出现极大地提高了写作效率和质量。这些工具不仅能够帮助研究人员快速生成论文草稿，还能进行内容优化、查重和排版等操作。以下是五款实用类工具推荐，特别是千笔-AIPassPaper。1.千笔-AIPassPaper千笔-AIPassPaper是一款功能强大且全面的AI论文写作助手，用户只需输入基本的研究需求和关键词，便能迅速生成一篇完整的论文。该工具利用先进的
推荐3家毕业AI论文可五分钟一键生成！文末附免费教程！小猪包333 写论文人工智能 AI写作深度学习计算机视觉
在当前的学术研究和写作领域，AI论文生成器已经成为许多研究人员和学生的重要工具。这些工具不仅能够帮助用户快速生成高质量的论文内容，还能进行内容优化、查重和排版等操作。以下是三款值得推荐的AI论文生成器：千笔-AIPassPaper、懒人论文以及AIPaperPass。千笔-AIPassPaper千笔-AIPassPaper是一款基于深度学习和自然语言处理技术的AI写作助手，旨在帮助用户快速生成高质
4款毕业论文参考文献格式生成器（附加详细步骤）小猪包333 写论文人工智能深度学习计算机视觉 AI写作
在撰写毕业论文时，参考文献的格式规范是至关重要的。为了帮助学生和学者们更高效地生成符合要求的参考文献格式，本文将详细介绍四款推荐的参考文献格式生成器，并提供详细的使用步骤。1.千笔-AIPassPaper千笔-AIPassPaper是一款先进的AI辅助论文写作工具，不仅能够自动生成大纲、开题报告，还能一键生成参考文献。AI论文，免费大纲，10分钟3万字https://www.aipaperpass
AI论文写作推荐哪个好？分享5款AI论文写作带数据图表网站小猪包333 写论文人工智能深度学习计算机视觉
在当今学术研究和写作领域，AI论文写作工具的出现极大地提高了写作效率和质量。这些工具不仅能够帮助研究人员快速生成论文草稿，还能进行内容优化、查重和排版等操作。以下是五款推荐的AI论文写作工具，包括千笔-AIPassPaper。千笔-AIPassPaper千笔-AIPassPaper是一款功能强大的AI论文写作助手，旨在帮助用户快速生成高质量的论文内容。AI论文，免费大纲，10分钟3万字https:
AI论文题目生成器怎么用？9款论文写作网站简单3步搞定小猪包333 写论文人工智能深度学习计算机视觉
在当今信息爆炸的时代，AI写作工具的出现极大地提高了写作效率和质量。本文将详细介绍9款优秀的论文写作网站，并重点推荐千笔-AIPassPaper。一、千笔-AIPassPaper千笔-AIPassPaper是一款功能强大的AI论文生成器，基于最新的自然语言处理技术，能够一键生成高质量的毕业论文、开题报告等文本内容。它不仅提供智能选题、文献推荐和论文润色等功能，还具有较高的用户评价。其文献综述生成功
AI大模型的架构演进与最新发展季风泯灭的季节 AI大模型应用技术二人工智能架构
随着深度学习的发展，AI大模型（LargeLanguageModels,LLMs）在自然语言处理、计算机视觉等领域取得了革命性的进展。本文将详细探讨AI大模型的架构演进，包括从Transformer的提出到GPT、BERT、T5等模型的历史演变，并探讨这些模型的技术细节及其在现代人工智能中的核心作用。一、基础模型介绍：Transformer的核心原理Transformer架构的背景在Transfo
如何利用大数据与AI技术革新相亲交友体验 h17711347205 回归算法安全系统架构交友小程序
在数字化时代，大数据和人工智能（AI）技术正逐渐革新相亲交友体验，为寻找爱情的过程带来前所未有的变革（编辑h17711347205）。通过精准分析和智能匹配，这些技术能够极大地提高相亲交友系统的效率和用户体验。大数据的力量大数据技术能够收集和分析用户的行为模式、偏好和互动数据，为相亲交友系统提供丰富的信息资源。通过分析用户的搜索历史、浏览记录和点击行为，系统能够深入了解用户的兴趣和需求，从而提供更
毕业论文附录一般都写什么?大学生写论文是干嘛用的写个原创论文人工智能深度学习 AI写作 chatgpt 论文阅读
毕业论文的附录通常包含一些在正文中不便于展示或详细阐述的内容，但对理解论文整体又具有重要意义的资料。具体来说，附录可能包含以下内容：AI论文，免费大纲，10分钟3万字，查重高于15%退费，支持数据图表！！AIPaperPass-AI论文写作指导平台AIPaperPass是AI原创论文写作平台，免费千字大纲，5分钟生成3万字初稿，提供答辩汇报ppt、开题报告、任务书等，40篇真实中英文知网参考文献，
【加密算法基础——RSA 加密】 XWWW668899 网络服务器笔记 python
RSA加密RSA（Rivest-Shamir-Adleman）加密是非对称加密，一种广泛使用的公钥加密算法，主要用于安全数据传输。公钥用于加密，私钥用于解密。RSA加密算法的名称来源于其三位发明者的姓氏：R:RonRivestS:AdiShamirA:LeonardAdleman这三位计算机科学家在1977年共同提出了这一算法，并发表了相关论文。他们的工作为公钥加密的基础奠定了重要基础，使得安全通
学写作的第四天石声藤
第四节如何坚持长期写下去？①摘要学好写作，重要的是持续性。如何坚持，就从淡化“坚持”这个词开始。做很多事，根本不是用坚持来驱动的，而是你清晰的认识，这件事很重要，你才坚持。②从本质认识写作的重要性意识决定人的行动。如果你从本质认识到某件事的重要性，即使没人逼你，你也会去坚持做，比如赚钱。认识写作的重要性，不认识，重新多学几遍第一节。③要让自己不断从写作中收益一件事能不断给你带来回报，是驱动你坚持做
生成式地图制图 Bwywb_3 深度学习机器学习深度学习生成对抗网络
生成式地图制图（GenerativeCartography）是一种利用生成式算法和人工智能技术自动创建地图的技术。它结合了传统的地理信息系统（GIS）技术与现代生成模型（如深度学习、GANs等），能够根据输入的数据自动生成符合需求的地图。这种方法在城市规划、虚拟环境设计、游戏开发等多个领域具有应用前景。主要特点：自动化生成：通过算法和模型，系统能够根据输入的地理或空间数据自动生成地图，而无需人工逐
【大模型应用开发动手做AI Agent】第一轮行动：工具执行搜索 AI大模型应用之禅计算科学神经计算深度学习神经网络大数据人工智能大型语言模型 AI AGI LLM Java Python 架构设计 Agent RPA
【大模型应用开发动手做AIAgent】第一轮行动：工具执行搜索作者：禅与计算机程序设计艺术/ZenandtheArtofComputerProgramming1.背景介绍1.1问题的由来随着人工智能技术的飞速发展，大模型应用开发已经成为当下热门的研究方向。AIAgent作为人工智能领域的一个重要分支，旨在模拟人类智能行为，实现智能决策和自主行动。在AIAgent的构建过程中，工具执行搜索是至关重要
《拖延心理学》（一）你为什么会拖延？|木盒笔记纯se蓝调
《拖延心理学》是帮助你向拖延症宣战的一本书，作者简·博克和莱诺拉·袁是全球知名的拖延症治疗专家。大概每个人或多或少总会有一点拖延症的行为。比如明天要叫论文了，今天你还没有写好，你一边在焦虑症怎么办，一边又拿着手机漫无目的的刷新闻；比如你想了很久准备减肥，但是迟迟又没有行动，想着今天晚上少吃一点吧、明天我就开始运动。今天分析的笔记来告诉你“你为什么会拖延？”，解读人杨坚。有人说拖延就像巨大的泥沼，让
2024年华为杯数学建模研赛C题思路代码+论文助攻 DS数模 2024华为杯数学建模华为 2024华为杯 2024研究生数学建模 2024研赛
2024年华为杯研究生数学建模竞赛（以下简研赛）将于9月21日上午8时正式开始。下文包含：2024研赛思路解析、研赛参赛时间及规则信息说明、好用的数模技巧及如何备战数学建模竞赛C君将会第一时间发布选题建议、所有题目的思路解析、相关代码、参考文献、参考论文等多项资料，帮助大家取得好成绩。2024年研赛将于9月21日上午8时正式开始这里有些资料，大家可以看看：【2024最全国赛研赛数模资料包】C君珍贵
《乖，摸摸头》精彩桥段摘要第二說
职业是职业，事业是事业，没必要把职业升迁和事业成就混为一谈，也没必要把一份工作当唯一的轴心，别把工作和生活硬搞成对立面，兼顾温饱没有错，可一辈子被一份工作拴死，那也太无趣了。——《大冰.乖，摸摸头》精彩桥段摘要
未来软件市场是怎么样的？做开发的生存空间如何？ cesske 软件需求
目录前言一、未来软件市场的发展趋势二、软件开发人员的生存空间前言未来软件市场是怎么样的？做开发的生存空间如何？一、未来软件市场的发展趋势技术趋势：人工智能与机器学习：随着技术的不断成熟，人工智能将在更多领域得到应用，如智能客服、自动驾驶、智能制造等，这将极大地推动软件市场的增长。云计算与大数据：云计算服务将继续普及，大数据技术的应用也将更加广泛。企业将更加依赖云计算和大数据来优化运营、提升效率，并
轻量级模型解读——轻量transformer系列 lishanlu136 #图像分类轻量级模型 transformer 图像分类
先占坑，持续更新。。。文章目录1、DeiT2、ConViT3、Mobile-Former4、MobileViTTransformer是2017谷歌提出的一篇论文，最早应用于NLP领域的机器翻译工作，Transformer解读，但随着2020年DETR和ViT的出现(DETR解读，ViT解读)，其在视觉领域的应用也如雨后春笋般渐渐出现，其特有的全局注意力机制给图像识别领域带来了重要参考。但是tran
算法单链的创建与删除换个号韩国红果果 c 算法
先创建结构体 struct student { int data; //int tag;//标记这是第几个 struct student *next; }; // addone 用于将一个数插入已从小到大排好序的链中 struct student *addone(struct student *h,int x){ if(h==NULL) //??????
《大型网站系统与Java中间件实践》第2章读后感白糖_ java中间件
断断续续花了两天时间试读了《大型网站系统与Java中间件实践》的第2章，这章总述了从一个小型单机构建的网站发展到大型网站的演化过程---整个过程会遇到很多困难，但每一个屏障都会有解决方案，最终就是依靠这些个解决方案汇聚到一起组成了一个健壮稳定高效的大型系统。看完整章内容，
zeus持久层spring事务单元测试 deng520159 java DAO spring jdbc
今天把zeus事务单元测试放出来,让大家指出他的毛病, 1.ZeusTransactionTest.java 单元测试 package com.dengliang.zeus.webdemo.test; import java.util.ArrayList; import java.util.List; import org.junit.Test; import
Rss 订阅开发周凡杨 html xml 订阅 rss 规范
RSS是 Really Simple Syndication的缩写（对rss2.0而言，是这三个词的缩写，对rss1.0而言则是RDF Site Summary的缩写，1.0与2.0走的是两个体系）。 RSS
分页查询实现 g21121 分页查询
在查询列表时我们常常会用到分页，分页的好处就是减少数据交换，每次查询一定数量减少数据库压力等等。按实现形式分前台分页和服务器分页：前台分页就是一次查询出所有记录，在页面中用js进行虚拟分页，这种形式在数据量较小时优势比较明显，一次加载就不必再访问服务器了，但当数据量较大时会对页面造成压力，传输速度也会大幅下降。服务器分页就是每次请求相同数量记录，按一定规则排序，每次取一定序号直接的数据
spring jms异步消息处理 510888780 jms
spring JMS对于异步消息处理基本上只需配置下就能进行高效的处理。其核心就是消息侦听器容器，常用的类就是DefaultMessageListenerContainer。该容器可配置侦听器的并发数量，以及配合MessageListenerAdapter使用消息驱动POJO进行消息处理。且消息驱动POJO是放入TaskExecutor中进行处理，进一步提高性能，减少侦听器的阻塞。具体配置如下：
highCharts柱状图布衣凌宇 hightCharts 柱图
第一步：导入 exporting.js,grid.js,highcharts.js;第二步：写controller @Controller@RequestMapping(value="${adminPath}/statistick")public class StatistickController { private UserServi
我的spring学习笔记2-IoC（反向控制依赖注入） aijuans spring mvc Spring 教程 spring3 教程 Spring 入门
IoC（反向控制依赖注入）这是Spring提出来了，这也是Spring一大特色。这里我不用多说，我们看Spring教程就可以了解。当然我们不用Spring也可以用IoC，下面我将介绍不用Spring的IoC。 IoC不是框架，她是java的技术，如今大多数轻量级的容器都会用到IoC技术。这里我就用一个例子来说明：如：程序中有 Mysql.calss 、Oracle.class 、SqlSe
TLS java简单实现 antlove java ssl keystore tls secure
1. SSLServer.java package ssl; import java.io.FileInputStream; import java.io.InputStream; import java.net.ServerSocket; import java.net.Socket; import java.security.KeyStore; import
Zip解压压缩文件百合不是茶 Zip格式解压 Zip流的使用文件解压
ZIP文件的解压缩实质上就是从输入流中读取数据。Java.util.zip包提供了类ZipInputStream来读取ZIP文件,下面的代码段创建了一个输入流来读取ZIP格式的文件; ZipInputStream in = new ZipInputStream(new FileInputStream(zipFileName)); &n
underscore.js 学习（一） bijian1013 JavaScript underscore
工作中需要用到underscore.js，发现这是一个包括了很多基本功能函数的js库，里面有很多实用的函数。而且它没有扩展 javascript的原生对象。主要涉及对Collection、Object、Array、Function的操作。学
java jvm常用命令工具——jstatd命令(Java Statistics Monitoring Daemon) bijian1013 java jvm jstatd
1.介绍 jstatd是一个基于RMI（Remove Method Invocation）的服务程序，它用于监控基于HotSpot的JVM中资源的创建及销毁，并且提供了一个远程接口允许远程的监控工具连接到本地的JVM执行命令。 jstatd是基于RMI的，所以在运行jstatd的服务
【Spring框架三】Spring常用注解之Transactional bit1129 transactional
Spring可以通过注解@Transactional来为业务逻辑层的方法(调用DAO完成持久化动作)添加事务能力，如下是@Transactional注解的定义： /* * Copyright 2002-2010 the original author or authors. * * Licensed under the Apache License, Version
我(程序员)的前进方向 bitray 程序员
作为一个普通的程序员,我一直游走在java语言中,java也确实让我有了很多的体会.不过随着学习的深入,java语言的新技术产生的越来越多,从最初期的javase,我逐渐开始转变到ssh,ssi,这种主流的码农,.过了几天为了解决新问题,webservice的大旗也被我祭出来了,又过了些日子jms架构的activemq也开始必须学习了.再后来开始了一系列技术学习,osgi,restful.....
nginx lua开发经验总结 ronin47
使用nginx lua已经两三个月了，项目接开发完毕了，这几天准备上线并且跟高德地图对接。回顾下来lua在项目中占得必中还是比较大的，跟PHP的占比差不多持平了，因此在开发中遇到一些问题备忘一下 1：content_by_lua中代码容量有限制，一般不要写太多代码，正常编写代码一般在100行左右（具体容量没有细心测哈哈，在4kb左右），如果超出了则重启nginx的时候会报 too long pa
java-66-用递归颠倒一个栈。例如输入栈{1,2,3,4,5}，1在栈顶。颠倒之后的栈为{5,4,3,2,1}，5处在栈顶 bylijinnan java
import java.util.Stack; public class ReverseStackRecursive { /** * Q 66.颠倒栈。 * 题目：用递归颠倒一个栈。例如输入栈{1,2,3,4,5}，1在栈顶。 * 颠倒之后的栈为{5,4,3,2,1}，5处在栈顶。 *1. Pop the top element *2. Revers
正确理解Linux内存占用过高的问题 cfyme linux
Linux开机后，使用top命令查看，4G物理内存发现已使用的多大3.2G，占用率高达80%以上： Mem: 3889836k total, 3341868k used, 547968k free, 286044k buffers Swap: 6127608k total,&nb
[JWFD开源工作流]当前流程引擎设计的一个急需解决的问题 comsci 工作流
当我们的流程引擎进入IRC阶段的时候，当循环反馈模型出现之后，每次循环都会导致一大堆节点内存数据残留在系统内存中，循环的次数越多，这些残留数据将导致系统内存溢出，并使得引擎崩溃。。。。。。而解决办法就是利用汇编语言或者其它系统编程语言，在引擎运行时，把这些残留数据清除掉。
自定义类的equals函数 dai_lm equals
仅作笔记使用 public class VectorQueue { private final Vector<VectorItem> queue; private class VectorItem { private final Object item; private final int quantity; public VectorI
Linux下安装R语言 datageek R语言 linux
命令如下：sudo gedit /etc/apt/sources.list1、deb http://mirrors.ustc.edu.cn/CRAN/bin/linux/ubuntu/ precise/ 2、deb http://dk.archive.ubuntu.com/ubuntu hardy universesudo apt-key adv --keyserver ke
如何修改mysql 并发数(连接数)最大值 dcj3sjt126com mysql
MySQL的连接数最大值跟MySQL没关系，主要看系统和业务逻辑了方法一：进入MYSQL安装目录打开MYSQL配置文件 my.ini 或 my.cnf查找 max_connections=100 修改为 max_connections=1000 服务里重起MYSQL即可　　方法二：MySQL的最大连接数默认是100客户端登录：mysql -uusername -ppass
单一功能原则 dcj3sjt126com 面向对象的程序设计软件设计编程原则
单一功能原则[ 编辑] SOLID 原则单一功能原则开闭原则 Liskov代换原则接口隔离原则依赖反转原则查论编在面向对象编程领域中，单一功能原则（Single responsibility principle）规定每个类都应该有
POJO、VO和JavaBean区别和联系 fanmingxing VO POJO javabean
POJO和JavaBean是我们常见的两个关键字，一般容易混淆，POJO全称是Plain Ordinary Java Object / Plain Old Java Object，中文可以翻译成：普通Java类，具有一部分getter/setter方法的那种类就可以称作POJO，但是JavaBean则比POJO复杂很多，JavaBean是一种组件技术，就好像你做了一个扳子，而这个扳子会在很多地方被
SpringSecurity3.X--LDAP：AD配置 hanqunfeng SpringSecurity
前面介绍过基于本地数据库验证的方式，参考http://hanqunfeng.iteye.com/blog/1155226，这里说一下如何修改为使用AD进行身份验证【只对用户名和密码进行验证，权限依旧存储在本地数据库中】。将配置文件中的如下部分删除：
mac mysql 修改密码 IXHONG mysql
$ sudo /usr/local/mysql/bin/mysqld_safe –user=root & //启动MySQL(也可以通过偏好设置面板来启动)$ sudo /usr/local/mysql/bin/mysqladmin -uroot password yourpassword //设置MySQL密码（注意，这是第一次MySQL密码为空的时候的设置命令，如果是修改密码，还需在-
设计模式--抽象工厂模式 kerryg 设计模式
抽象工厂模式：工厂模式有一个问题就是，类的创建依赖于工厂类，也就是说，如果想要拓展程序，必须对工厂类进行修改，这违背了闭包原则。我们采用抽象工厂模式，创建多个工厂类，这样一旦需要增加新的功能，直接增加新的工厂类就可以了，不需要修改之前的代码。总结：这个模式的好处就是，如果想增加一个功能，就需要做一个实现类，
评"高中女生军训期跳楼” nannan408
首先，先抛出我的观点，各位看官少点砖头。那就是，中国的差异化教育必须做起来。孔圣人有云：有教无类。不同类型的人，都应该有对应的教育方法。目前中国的一体化教育，不知道已经扼杀了多少创造性人才。我们出不了爱迪生，出不了爱因斯坦，很大原因，是我们的培养思路错了，我们是第一要“顺从”。如果不顺从，我们的学校，就会用各种方法，罚站，罚写作业，各种罚。军
scala如何读取和写入文件内容？ qindongliang1922 java jvm scala
直接看如下代码： package file import java.io.RandomAccessFile import java.nio.charset.Charset import scala.io.Source import scala.reflect.io.{File, Path} /** * Created by qindongliang on 2015/
C语言算法之百元买百鸡 qiufeihu c 算法
中国古代数学家张丘建在他的《算经》中提出了一个著名的“百钱买百鸡问题”，鸡翁一，值钱五，鸡母一，值钱三，鸡雏三，值钱一，百钱买百鸡，问翁，母，雏各几何？代码如下： #include <stdio.h> int main() { int cock,hen,chick; /*定义变量为基本整型*/ for(coc
Hadoop集群安全性：Hadoop中Namenode单点故障的解决方案及详细介绍AvatarNode wyz2009107220 NameNode
正如大家所知，NameNode在Hadoop系统中存在单点故障问题，这个对于标榜高可用性的Hadoop来说一直是个软肋。本文讨论一下为了解决这个问题而存在的几个solution。 1. Secondary NameNode 原理：Secondary NN会定期的从NN中读取editlog，与自己存储的Image进行合并形成新的metadata image 优点：Hadoop较早的版本都自带，