piaocoder

UNILM翻译

翻译：***
审核：yphacker
原论文
论文代码

UNILM翻译

摘要
1. 介绍
2. 统一预训练语言模型

2.1 输入表示
2.2 主干网：多层Transformer
2.3 预训练目标
2.4 预训练安装
2.5 对下游NLU和NLG任务进行微调

3. 实验

3.1 文本摘要
3.2问答(QA)

提取QA：
生成式 QA：

3.3 问题生成
3.4 基于对话生成
3.5 GLUE Benchmark

4. 总结和未来工作

摘要

本文提出了一种新的统一的预训练语言模型（UNILM）可以针对自然语言理解和生成任务进行微调。该模型使用三种类型的语言建模任务进行预训练：单向、双向和序列到序列预测。采用共享transfomer网络，利用特定的self-attention masks来控制预测条件所处的上下文，从而实现统一建模。UNILM在GLUE基准测试、Squad2.0和CoQA问答任务方面都优于BERT。此外UNILM在五个自然语言生成数据集上取得了最新的技术成果，包括将CNN/DailyMail文本摘要ROUGE-L提高到40.51分（2.04的绝对改进），Gigaword文本摘要ROUGE-L到35.75分（0.86分的绝对改进），CoQA生成式问答F1score到82.5分（37.1分的绝对改进），SQuAD问题生成 BLEU-4 到22.12分（3.75分的绝对改进），DSTC7基于文档对话生成 NIST-4到2.67（人的成绩为2.65）。代码和预训练的模型可在https://github.com/microsoft/unilm找到。

1. 介绍

语言模型（LM）的预培训已经大大提高了各种领域的自然语言处理任务[8，29，19，31，9，1]。预训练LMs通过使用大量文本数据根据上下文预测单词来学习上下文的文本表示，并且可以微调以适应下游任务。

不同的预测任务和训练目标已用于不同类型的预训练LMs，如图1所示。ELMo[29]学习了两个单向LMs：前向LM从左到右读取文本，后向LM从右到左编码文本。GPT[31]使用从左到右的Trandformer[43]逐字预测文本序列。相反，BERT[9]使用双向Transformer encoder来融合左右文本预测屏蔽词。虽然BERT显著地提高了许多自然语言理解任务的性能[9]，但是它的双向性使得它很难应用于自然语言生成任务[44]。

在这项工作中，我们提出了一个新的统一预训练语言模型（UNILM），可以应用于自然语言理解（NLU）和自然语言生成（NLG）任务。UNILM是一个多层transfomer网络，共同的对大量文本进行预训练，针对三种类型的无监督语言模型目标自动进行优化，如图2所示。值得一提的是，我们在加拿大温哥华安排了第33届神经信息处理系统会议（NeurIPS 2019）。
图1：语言模型（LM）预训练目标之间的比较。

图2：这个统一的LM是由多个语言模型目标共同预训练的，共享相同的参数。我们在不同的数据集（包括语言理解和生成任务）上对预训练的统一LM进行微调和评估。

一组完形填空任务[42]，其中根据上下文预测答案。这些完形填空任务在怎么定义上下文方面有所不同。对于从左到右的单向LM，要预测的答案的上下文由其左侧的所有词组成。对于从右到左的单向LM，上下文由右侧的所有单词组成。对于双向LM，上下文由左右两边的单词组成[9]。对于序列到序列LM，第二个（目标）序列中要预测的单词的上下文由第一个（源）序列中的所有单词和目标序列中其左侧的单词组成。

与BERT类似，可以对预训练的UNILM进行微调（如有必要，可以添加特定于任务的层），以适应各种下游任务。但是与BERT不同，它主要被用于NLU任务的，UNILM可以配置为使用不同的self-attention masks（第2节）来聚合不同类型语言模型的上下文，因此可以同时用于NLU和NLG任务。

我们提出的UNILM有三大优势。首先，统一的预训练处理使得一个单一的Trandformer LM能对不同类型的LMs使用共享的参数和架构，减轻了单独训练和托管多个LMs的需要。第二，参数共享使得学习的文本表示更加通用，因为它们是针对不同的语言模型目标而联合优化的，其中上下文以不同的方式使用，减轻了对任何单个LM任务的过拟合。第三，除了在NLU任务中的应用外，使用UNILM作为LM到LM的序列（第2.3节），使得它成为NLG的一个自然选择，如文本摘要和问题生成。

实验结果表明，该模型作为一个双向encoder，在GLUE排行榜和两个抽取式问答任务相同的基础上（SQuAD 2.0和CoQA）上均优于BERT。此外，我们在五个NLG数据集上展示了UNILM的有效性，其中UNILM作为一个序列到序列模型，在CNN/DailyMail和Gigaword抽象摘要、SQuAD

问题生成、CoQA生成问题回答和DSTC7对话响应生成上创建最新的结果。

2. 统一预训练语言模型

输入指定的序列x=x1···xjxj，UNILM获得每个token的上下文向量表示。如图1所示，预训练针对几个无监督语言模型目标优化共享Trandformer网络，即单向LM、双向LM和序列到序列LM。为了控制对要预测的单词token上下文的访问，我们使用不同的self-attention masks。换句话说，我们使用MASKS来控制文中的token应该在计算其上下文的表示，一旦UNILM被预训练，我们就可以使用指定的下游任务数据对其进行微调。

图1：统一 LM预训练概述。模型参数在LM目标之间共享（即双向LM、单向LM和序列到序列LM）。我们使用不同的self-attention masks来控制每个单词token对上下文的访问。从右到左LM类似于从左到右LM，为简洁起见，图中省略了这一点。

2.1 输入表示

输入x是一个字序列，它要么是单向LMs的文本段，要么是为双向LM和序列到序列LM打包在一起的段。我们总是在输入的开头添加一个特殊的序列开始标记（[SOS]），在每个段的结尾添加一个特殊的序列结束标记（[EOS]）。[EOS]不仅在NLU任务中标记句子边界，同时也用于模型学习在NLG任务中何时终止解码过程。输入表示形式遵循BERT[9]的表示形式。文本通过WordPiece[48]标记为子词单位。对于每个输入token，其矢量表示是通过对相应的token嵌入、位置嵌入和段嵌入求和来计算的。由于UNILM是使用多个LM任务训练的，因此段嵌入也扮演了LM标识符的角色，因为我们为不同的LM目标使用不同的段嵌入。

2.2 主干网：多层Transformer

首先将输入向量fxigj ix=1j打包成H0=[x1；···；xjxj]，然后使用L层TransformerHl=Transformerl（Hl-1）；L 2[1；L]编码成抽象Hl=[Hl 1；···；Hl jxj]的不同层次的上下文表示。在每个Transformerl块中，使用多个self-attention heads来聚合前一层的输出向量。对于第l 个Transformerl层，self-attention headAl的输出通过以下方式计算：

Q = Hl*-1WlQ**;* K = Hl*-1WlK**;* V = Hl*-1WlV* (1)
Mij = 0*-1* ; ; allow to attend prevent from attending (2)
Al = softmax(QK pdk| + M)Vl (3)

其中，前一层的输出Hl-12 Rjxj×dh分别使用参数矩阵WlQ；WlK；WlV 2 Rdh×dk线性地投影到三个查询、键和值中，并且MASK矩阵M 2 Rjxj×jxj确定一对tokens是否可以相互连接。

我们使用不同的MASK矩阵M来控制文本中的token被处理当计算其上下文化表。如图1所示。以双向LM为例。掩码矩阵的元素都是0，表示所有token都可以访问彼此。

2.3 预训练目标

我们使用针对不同语言模型目标设计的四个完形填空任务对UNILM进行预训练，在一个完形填空任务中，我们随机选择输入中的一些WordPiece tokens，并用特殊的token [MASK]来替换，然后将Transformer网络计算出的相应输出向量输入到softmax分类器中，以预测MASK的标记。学习UNILM的参数以最小化使用预测token和原始token计算的交叉熵损失。值得关注的是，完形填空任务的使用使得对所有LMs使用相同的训练过程成为可能，无论是单向的还是双向的。

单向LM 我们使用从左到右和从右到左的LM目标。以从左到右LM为例。每个标记的表示仅对向左上下文标记及其自身进行编码。例如，要预测“x1 x2[MASK]x4”的MASK标记，只能使用标记x1；x2及其自身。这是通过使用self-attention mask M的三角形矩阵（如等式（2））来实现的，其中self-attention mask的上三角形部分被设置为负无穷，而其他元素被设置为0，如图1所示。类似地，从右到左LM根据其未来（右）上下文预测MASK。

双向LM 在[9]之后，双向LM允许所有MASK在预测中相互关注。它从两个方向对上下文信息进行编码，可以生成比单向文本更好的上下文表示。如等式（2）所示，self-attention mask M是零矩阵，因此允许每个token在输入序列中的所有位置上参与。

序列到序列LM 如图1所示，为了进行预测，第一个（源）段中的token可以从段内的两个方向相互关注，而第二个（目标）段中的token只能关注目标段及其自身的左上下文以及源段中的所有MASK。例如，给定源段t1 t2及其目标段t3 t4 t5，我们将输入“[SOS]t1t2[EOS]t3 t4 t5[EOS]”输入到模型中。虽然t1和t2都可以访问前四个MASK，包括[SOS]和[EOS]，但t4只能处理前六个MASK。

图1显示了用于序列到序列LM目标的self-attention mask M。M的左侧部分设置为0，以便所有token都可以处理第一个段。右上部分设置为-1以阻止从源段到目标段的注意。此外，对于右下部分，我们将其上三角部分设置为负无穷，将其他元素设置为0，这将阻止目标段中的MASK进入其未来（右）位置。

在训练过程中，我们随机选择两个片段中的标记，并用特殊标记[MASK]替换它们。学习该模型以恢复masked token。由于在训练过程中，源文本和目标文本被打包为一个连续的输入文本序列，因此我们隐式地鼓励模型学习这两个文本段之间的关系。为了更好地预测目标段中的token，UNILM学习对源段进行有效编码。因此，为序列到序列LM设计的完形填空任务（也称为编码器-解码器模型）同时预训练双向编码器和单向解码器。预训练的模型作为一个encoder- decoder模型，可以很容易地适应广泛的文本生成任务，例如文本摘要。

下一个句子预测对于双向LM的预测，我们还将下一个句子预测任务包括在预训练中，如[9]。

2.4 预训练安装

总体训练目标是上述不同类型的LM目标的总和。具体来说，在一个训练批中，我们1/3的时间使用双向LM目标训练，1/3的时间使用序列到序列LM目标续联，并且从左到右和从右到左LM目标训练时间均为1/6。UNILM的模型架构与bertrage[9]的模型架构进行了比较。gelu activation [18]用作GPT[31]。具体来说，我们使用一个24层Transformer，1024 hidden size，16 attention heads，其中包含大约340M的参数。softmax分类器的权值矩阵与token嵌入相结合。UNILM由bertligh初始化，然后使用英语Wikipedia2和BookCorpus[53]进行预训练，它们的处理方式与[9]相同。词汇量是28；996。输入序列的最大长度为512。token掩蔽概率为15%。在隐藏位置中，80%我们用[MASK]替换令牌，10%用随机token替换，剩下保留原始token。另外，80%我们每次随机屏蔽一个token，20%的时候我们屏蔽一个bigram或trigram。

用β1=0:9，β2=0:999的Adam[22]进行优化。学习率为3e-5，前4万步为线性预热，线性衰减。辍学率是0:1。重量衰减是0:01。批量大小是330。预训练过程大约运行770000个步骤。使用8个Nvidia Telsa V100 32GB GPU卡，经过混合精度训练，大约需要7个小时完成10000个步骤。

2.5 对下游NLU和NLG任务进行微调

对于NLU任务，我们微调UNILM作为双向Transformer编码器，如BERT。以文本分类为例。我们使用[SOS]的编码向量作为输入的表示，表示为hL1，并将其馈送到随机初始化的softmax分类器（即任务特定的输出层），其中类概率计算为softmax（hL 1 WC），其中WC 2 Rdh×C是参数矩阵，C是类别数。我们通过更新预训练的LM和添加的softmax分类器的参数来最大化标记训练数据的可能性。

对于NLG任务，我们以序列到序列任务为例。微调程序类似于第2.3节中使用self-attention masks的预训练。让S1和S2分别表示源序列和目标序列。我们将它们与特殊标记一起打包，形成输入“[SOS]S1[EOS]S2[EOS]。该模型通过随机屏蔽目标序列中一定百分比的标记，并学习恢复被屏蔽的单词来进行微调。训练目标是在给定的上下文中最大化屏蔽MASK的可能性。值得注意的是，在微调过程中，标记目标序列结束的[EOS]也可以被屏蔽，因此当发生这种情况时，模型将学习何时发出[EOS]以终止目标序列的生成过程。

3. 实验

我们对NLU（即GLUE基准测试和抽取式问答）和NLG任务（即文本摘要、问题生成、生成式问答和基于对话生成）进行了实验。

3.1 文本摘要

自动文本摘要生成一个简洁流畅的摘要，在输入中传达关键信息（例如，新闻文章）。我们专注于文本摘要，这是一个生成任务，其中摘要不限于重用输入文本中的短语或句子。我们使用非匿名版本的CNN/DailyMail数据集[37]和Gigaword[36]进行模型微调和评估。我们按照第2.5节中描述的过程，通过将文档（第一段）和摘要（第二段）连接起来作为输入，并根据预定义的最大长度截断，将UNILM微调为一个序列到序列模型。

表3:CNN/每日邮件摘要的评估结果。第一个模块中的模型是这里列出的可供参考的抽取系统，而其他模块是抽象模型。最佳提取模型的结果摘自[27]。RG是ROUGE的缩写。

表4:Gigaword摘要的结果。第一个模块中的模型只使用10K示例进行训练，而其他模块使用3.8M示例。OpenNMT和Transformer的结果取自[4，39]。RG是ROUGE的缩写。

我们在训练集上对模型进行了30轮的微调。我们重用了大多数预训练的超参数。MASK概率为0:7。我们还使用epsilon为0.1标签平滑[40]。对于CNN/DailyMail，我们将批处理大小设置为32，最大长度设置为768。对于Gigaword，我们将批处理大小设置为64，最大长度设置为256。在解码过程中，我们使用beam 大小为5的beam search，对于CNN/DailyMail和Gigaword，输入文件分别被截断为前640和192个token。我们在beam search中删除了重复的三元组，并调整了开发集的最大摘要长度[28，13]。

我们使用F1版本的ROUGE[25]作为两个数据集的评估指标。在表3中，我们将UNILM在CNN/DailyMail上的基线和几个最新模型进行了比较。LEAD-3是一个基线模型，它提取文档中的前三个句子作为摘要。PGNet[37]是基于pointer-generator网络的序列到序列模型。S2S-ELMo[13]使用了一个序列到序列模型，该模型用预训练的ELMo表示进行增强，在[13]中称为SRC-ELMo+SHDEMB。自底向上[16]是一个序列到序列模型，它增加了一个自底向上的内容选择器，用于选择显著短语。我们还将数据集上报告的最佳提取摘要结果[27]包括在表3中。如表3所示，我们的模型优于所有以前的抽象系统，在数据集上创建了一个最新的文本摘要结果。在ROUGE-L中，我们的模型的性能也优于最佳提取模型[27]0:88点。

在图4中，我们用不同的尺度（10K和3.8M）对Gigaword上的模型进行了评估。Transformer[43]和OpenNMT[23]都实现了标准的attentional序列到序列模型。Re3Sum[4]检索摘要作为候选模板，然后使用扩展序列到序列模型生成摘要。MASS[39]是一个基于Transformer网络的预训练的序列到序列模型。实验结果表明，UNILM比以往的工作取得了更好的性能。此外，在低资源环境下（即仅使用10000个例子作为训练数据），我们的模型在ROUGE-L中的性能比MASS高7:08点。

3.2问答(QA)

任务是回答一个指定段落的问题[33，34，15]。有两种情景。第一种被称为抽取式问答（extractive QA），假设答案是文章中的一段文本。另一种称为生成性QA，答案需要动态生成。

提取QA：

这个任务可以表述为一个NLU任务，我们需要预测文章中答案的开始和结束位置。我们微调预训练的UNILM作为任务的双向编码器。我们在斯坦福问答集（SQuAD）2.0[34]和会话问答集（CoQA）[35]上进行了实验。

图5：在CoQA训练集上提取QA的结果。 ![在这里插入图片描述](https://img-blog.csdnimg.cn/20200429193947473.png#pic_center) 图6：在CoQA训练集上提取QA的结果。 ![在这里插入图片描述](https://img-blog.csdnimg.cn/20200429194008412.png#pic_center) 图7：在CoQA训练集上提取QA的结果。

在SQuAD 2.0 上的结果如图5所示，我们比较了两个模型的精确匹配（EM）和F1得分。RMR+ELMo[20]是一个基于LSTM的问题回答模型，它使用预训练好的语言表示进行增强。Bertrage是一个cased模型，根据3轮训练在训练数据进行微调，批处理大小为24，最大长度为384。UNILM的微调方式与Bertrage相同。我们看到UNILM的表现优于BERTLARGE。

CoQA是一个会话问答数据集。与SQuAD相比，CoQA有几个独特的特点。首先，CoQA中的例子是会话性的，因此我们需要根据会话历史回答输入问题。其次，CoQA中的答案可以是自由形式的文本，其中很大一部分是肯定/否定的答案。

我们对SQuAD使用的模型进行了如下修改。首先，除了提出的问题外，我们还将问答历史连接到第一段，这样模型就可以捕获会话信息。其次，对于是/否问题，我们使用[SOS]标记的最终隐藏向量来预测输入是否为是/否问题，以及答案是否为是。对于其他示例，我们选择F1得分最高的段落进行训练。

CoQA的结果如图6所示，其中我们比较了F1得分中的两个模型。DrQA+ELMo[35]是一个基于LSTM的问答模型，并使用了预训练的ELMo模型。Bertlarge是一个cased模型，在CoQA训练数据进行了两轮微调，批处理大小为16，最大长度为512。UNILM与Bertlarge使用相同的超参数进行微调。我们看到UNILM的表现优于BERTLARGE

生成式 QA：

生成式问答为输入的问题和文章生成自由形式的答案，这是一个NLG任务。相反，抽取方法只能预测输入文章的一段作为答案。在CoQA数据集（如上所述）上，Reddy等人。[2019]证明vanilla的序列到序列模型仍然远远落后于提取方法。

我们将UNILM作为一个序列到序列的模型来适应生成式问答。第一段（即输入序列）是会话历史、输入问题和段落的串联。第二段（即输出序列）就是答案。我们在CoQA训练集上对预训练的UNILM进行了10轮的微调。我们将批处理大小设置为32，MASK概率设置为0:5，最大长度设置为512。我们也使用epsilon为0.1的标签平滑。其他超参数保持与训练前相同。在解码过程中，我们使用beam 大小为3的beam search。输入问题和文章的最大长度为470。对于长度超过最大长度的段落，我们使用滑动窗口方法将段落分成多个块，并在问题上选择单词重叠度最高的块。

我们将我们的方法与文献[35]中描述的生成式问答模型Seq2Seq和PGNet进行了比较。Seq2Seq的baseline是一个具有attention机制的序列到序列模型。PGNet模型使用复制机制来增强Seq2Seq。如图7所示，我们的生成式问答模型在很大程度上优于以前的生成式方法，这大大缩小了生成式方法和抽取式方法之间的差距。

3.3 问题生成

我们对答案感知问题生成任务进行了实验[52]。指定一个输入段落和一个答案段，我们的目标是生成一个要求答案的问题。第1.1组数据集[33]用于评估。参考[12]，我们将原始训练集分成训练集和测试集，并保留原始开发集。我们还进行了数据分割后的实验，如[51]所示，它使用反向dev-test分割。

图8：在SQuAD.MTR上的问题生成结果.MTR是METEOR的缩写，RG是ROUGE的缩写。结果在组中使用不同的数据分割。

图9：基于UNILM的问题生成改进了SQuAD development set的问题回答结果。

图10：回复生成的结果。Div-1和Div-2分别表示unigrams和bigrams的多样性。

问题生成任务被表示为一个序列到序列的问题。第一段是输入文章和答案的连接，第二段是生成的问题。

我们在训练集上对UNILM进行了10轮的微调。我们将批处理大小设置为32，MASK概率设置为0:7，学习率设置为2e-5。标签平滑率为0:1。其他超参数与训练前相同。在解码过程中，我们通过选择包含答案的段落块中的输入截断为464个标记。评估指标BLEU-4、METEOR和ROUGE-L由与[12]中相同的脚本计算。

结果3见表8。CorefNQG[11]基于带attention的序列到序列模型和特征丰富的编码器。MP-GSN[51]使用基于attention的序列到序列模型和门控self-attention编码器。SemQG[50]使用两个语义增强的奖励来规范生成。UNILM的性能优于以前的模型，并实现了一个最新的问题生成技术。

生成的问题得到改进QA 该问题生成模型可以从文本语料库中自动获取大量的问答实例。结果表明，问题生成产生的增广数据改进了问答模型。

我们生成了500万个可回答的示例，通过修改可回答的示例，生成了400万个不可回答的示例。现在我们根据生成的数据对问答模型进行了一轮微调，然后对另外两个Squad2.0数据进行了超过2轮微调。

如图9所示，UNILM生成的扩充数据改进了第3.2节中介绍的问答模型。注意，在微调期间，我们使用双向MASK语言模型作为生成的和Squad2.0数据集的辅助任务，与直接使用自动生成的示例相比，这带来了2:3的绝对改进。一个可能的原因是，辅助任务减轻了对增强数据进行微调时的灾难性遗忘[49]。

3.4 基于对话生成

我们在基于文档的对话生成任务[30，15]上评估UNILM。给定一个多回合的会话历史和一个web文档作为知识源，系统需要生成一个自然的语言响应，该响应既适合会话，又能反映web文档的内容。我们将UNILM作为一个序列到序列模型对任务进行微调，第一个片段（输入序列）是web文档和会话历史的连接。第二段（输出序列）是响应。我们在DSTC7训练数据上对UNILM进行20轮微调，批处理大小为64。MASK概率设置为0:5。最大长度为512。在解码过程中，我们使用beam 大小为10的beam search。生成的响应的最大长度设置为40。如表10所示，在所有评估指标中，UNILM在DSTC7共享任务[14]中的表现都优于最佳系统[41]。

Ps.请注意，如果我们直接使用Du等人提供的标记化引用。[2017]，原始数据分割结果为（21.63 BLEU-4/25.04 METEOR/51.09 ROUGE-L）[12]，反向开发测试设置结果为（23.08 BLEU-4/25.57 METEOR/52.03 ROUGE-L）[51]。

图11：使用GLUE评估服务器对GLUE测试集结果进行评分。

3.5 GLUE Benchmark

我们在通用语言理解评估（GLUE）Benchmark 上评估UNILM[45]。GLUE是九种语言理解任务的集合，包括问答[33]、语言可接受性[46]、情感分析[38]、文本相似性[5]、释义检测[10]和自然语言推理（NLI）[7、2、17、3、24、47]。

我们的模型被微调为双向LM。我们使用Adamax[21]作为优化器，学习率为5e-5，批处理大小为32。最大轮数设置为5。采用warmup为0.1的线性学习速率衰减表。除MNLI为0:3、CoLA/SST-2为0:05外，每个任务的最后一个线性投影的dropout rate 设置为0:1。为了避免梯度爆炸问题，将梯度范数限制在1以内。我们截断了token不超过512个。

图11显示了从标准评估服务器获得的GLUE测试结果。结果表明，UNILM与bertlarge相比，在GLUE任务上具有更好的变现。

4. 总结和未来工作

我们提出了一个统一的预训练模型，UNILM，它是为多个共享参数的LM目标联合优化的。双向、单向和序列到序列LMs的统一使我们能够直接微调NLU和NLG任务的预训练UNILM。实验结果表明，我们的模型在GLUE benchmark 和两个问答数据集上都优于BERT。此外，UNILM在五个NLG数据集上的表现优于以前的最新模型：CNN/DailyMail和Gigaword文本摘要、SQuAD问题生成、CoQA生成问题回答和DSTC7基于对话生成。

这项工作可以从以下几个方面推进：

现在我们将通过在网络文本语料库上进行更多的训练和更大的模型来突破当前方法的局限。同时，我们还将在模型性能和优势的研究上进行更多的实验，以研究在同一网络上对多语言模型任务进行预训练的性能和好处。

在我们目前的实验中，我们专注于一种语言的NLP任务。我们也有兴趣扩展UNILM以支持跨语言任务[6]。

我们将对NLU和NLG任务进行多任务微调，这是多任务深度神经网络（MTDNN）的自然扩展[26]。

你可能感兴趣的:(论文翻译)

论文阅读笔记1——DARTS：Differentiable Architecture Search可微分架构搜索（一）（论文翻译学习） fuhao7i 论文阅读笔记深度学习人工智能机器学习算法计算机视觉
DARTS：DifferentiableArchitectureSearch可微分架构搜索（一）DARTS：DifferentiableArchitectureSearch（一）ABSTRACT摘要1.INTRODUCTION介绍2.可微的结构搜索加油加油！如果你感觉你现在很累，那么恭喜你，你现在正在走上坡路！让我们一起加油！欢迎关注我的讲解视频，让我们一起学习：Bilibili主页：https:
DeepSeek R1 AI 论文翻译后端java
摘要原文地址：DeepSeekR1AI论文翻译我们介绍了我们的第一代推理模型，DeepSeek-R1-Zero和DeepSeek-R1。DeepSeek-R1-Zero是一个通过大规模强化学习（RL）训练的模型，且在此过程中未使用监督微调（SFT）作为预处理步骤，展现出了显著的推理能力。通过RL，DeepSeek-R1-Zero自然而然地展现了许多强大且引人注目的推理行为。然而，它也遇到了一些挑战
DeepSeek R1 AI 论文翻译老马啸西风 java
摘要原文地址：DeepSeekR1AI论文翻译我们介绍了我们的第一代推理模型，DeepSeek-R1-Zero和DeepSeek-R1。DeepSeek-R1-Zero是一个通过大规模强化学习（RL）训练的模型，且在此过程中未使用监督微调（SFT）作为预处理步骤，展现出了显著的推理能力。通过RL，DeepSeek-R1-Zero自然而然地展现了许多强大且引人注目的推理行为。然而，它也遇到了一些挑战
DeepSeek R1 AI 论文翻译后端java
摘要原文地址：DeepSeekR1AI论文翻译我们介绍了我们的第一代推理模型，DeepSeek-R1-Zero和DeepSeek-R1。DeepSeek-R1-Zero是一个通过大规模强化学习（RL）训练的模型，且在此过程中未使用监督微调（SFT）作为预处理步骤，展现出了显著的推理能力。通过RL，DeepSeek-R1-Zero自然而然地展现了许多强大且引人注目的推理行为。然而，它也遇到了一些挑战
【论文翻译】DeepSeek-Coder-V2: Breaking the Barrier of Closed-Source Models in Code Intelligence 行动π技术博客代码大模型 deepseek
本翻译来自大模型翻译，如有不对的地方，敬请谅解引言开源社区通过开发诸如StarCoder（Li等人，2023b；Lozhkov等人，2024）、CodeLlama（Roziere等人，2023）、DeepSeek-Coder（Guo等人，2024）和Codestral（MistralAI，2024）等开源代码模型，在推进代码智能方面取得了显著进展。这些模型的性能已稳步接近闭源同类产品，为代码智能的
论文翻译：ChatGPT for good? On opportunities and challenges of large language models for education Author CSPhD-winston-杨帆智慧教育论文翻译 chatgpt 语言模型人工智能
高引用论文：ChatGPTforgood?OnopportunitiesandchallengesoflargelanguagemodelsforeducationAuthorlinksopenoverlaypanelhttps://www.sciencedirect.com/science/article/pii/S1041608023000195ChatGPTforgood？大型语言模型在教育
【论文翻译】GOT-OCR论文翻译——General OCR Theory: Towards OCR-2.0 via a Unified End-to-end Model 机器白学论文翻译 ocr 论文阅读论文翻译
论文原文链接：https://arxiv.org/abs/2409.01704特别声明，本文不做任何商业用途，仅作为个人学习相关论文的翻译记录。本文对原文内容直译，一切以论文原文内容为准，对原文作者表示最大的敬意。如有任何侵权请联系我下架相关文章。目录通用OCR理论：通过统一的端到端模型迈向OCR-2.00摘要1引言2相关工作2.1传统OCR2.2基于LVLM的OCR3通用OCR理论3.1框架3.
论文翻译：A survey on large language model (LLM) security and privacy: The Good, The Bad, and The Ugly CSPhD-winston-杨帆论文翻译 LLMs-鲁棒性语言模型人工智能自然语言处理
Asurveyonlargelanguagemodel(LLM)securityandprivacy:TheGood,TheBad,andTheUglyhttps://www.sciencedirect.com/science/article/pii/S266729522400014X文章目录关于大型语言模型（LLM）安全性和隐私的调查：好的、坏的和丑陋的摘要1.引言2.背景2.1大型语言模型（L
论文翻译：arxiv-2022 Ignore Previous Prompt: Attack Techniques For Language Models CSPhD-winston-杨帆论文翻译 LLMs-安全 prompt 语言模型人工智能
IgnorePreviousPrompt:AttackTechniquesForLanguageModelshttps://arxiv.org/pdf/2211.09527忽略之前的提示：针对语言模型的攻击技术文章目录忽略之前的提示：针对语言模型的攻击技术摘要1引言摘要基于Transformer的大型语言模型（LLMs）为大规模面向客户的应用程序中的自然语言任务提供了强大的基础。然而，探索恶意用户
论文翻译：arxiv-2024 Data Contamination Quiz: A Tool to Detect and Estimate Contamination in Large CSPhD-winston-杨帆 LLMs-数据污染论文翻译语言模型人工智能深度学习
DataContaminationQuiz:ATooltoDetectandEstimateContaminationinLargeLanguageModelshttps://arxiv.org/abs/2311.06233数据污染测验：一种检测和估计大型语言模型中污染的工具文章目录数据污染测验：一种检测和估计大型语言模型中污染的工具摘要1引言摘要我们提出了数据污染测验（DataContamina
实验DAY5：借假修真放逐997
a.昨日完成情况不佳，起床是9.30，除了报名（一口气报了五门..祝我好运），论文翻译和教育都没有完成；b.明日计划：9点前起床；明天优先复盘教育，以及准备cpa的考试资料；论文、和cpa留到周末做吧c.今天读到一篇讲美团公司战略的文章，对于整体战略搭建的方法论、具体业务的促成、以及更偏意识上层的“借假修真”思想的解读非常佩服，摘录核心如下：美团的增长引擎：1.严明的纪律性：放弃不符合业务逻辑的利
开源Bluespec bsc编译器和可重用示例设计达坦科技DatenLord 硬件加速 fpga fpga开发硬件工程开源
这篇介绍Bluespec以及设计示例的文章，是在2021年ICCAD（InternationalConferenceOnComputer-AidedDesign）发布的论文。达坦科技的open-rdma项目和推广的MIT体系结构学习社区都用到Bluespec，因此将此论文翻译成中文，以便大家了解2020年Bluespec开源后相关的开源项目。摘要：bsc编译器是一个商业可用的编译器，在过去的二十年
论文翻译 - BITE: Textual Backdoor Attacks with Iterative Trigger Injection anniewwy LLM Backdoor Attack
论文链接：https://arxiv.org/pdf/2205.12700.pdf项目代码：https://github.com/INK-USC/BITEBITE:TextualBackdoorAttackswithIterativeTriggerInjectionAbstract1Introduction2ThreatModel3Methodology3.1BiasMeasurementonLa
我做这件事，唯一的目的就是让你开心沉吟大叔
一个男人心里满满的爱意：我做这件事，唯一的目的就是让你高兴，而不是赢得你的好感、证明我的能力、让你对我感恩戴德。所以，我不想让你知道我的付出，不想让你对我怀有歉意和内疚，更不想因此获得什么回报。我只是心甘情愿地想为你做点什么，因为我爱你。这才是真爱吧。以前有个读者，说她男朋友特别小气，还不诚实。请她吃顿饭要念叨很久，给她买礼物，花一百要说成三百，帮她做论文翻译，明明一小时就搞定了，非要说是熬了个通
剖析以太坊上的庞氏骗局：识别、分析和影响卷神
区块链安全防护论文翻译：Bartoletti,Massimo,etal."DissectingPonzischemesonEthereum:identification,analysis,andimpact."FutureGenerationComputerSystems102(2020):259-277.摘要：庞氏骗局是一种以高额利润为诱饵的金融欺诈。实际上，只有新用户加入了庞氏骗局，用户才能得
《 HFContractFuzzer: Fuzzing Hyperledger Fabric Smart Contractsfor Vulnerability Detection》论文翻译 WXF_Security 智能合约安全研究 fabric golang
《HFContractFuzzer:FuzzingHyperledgerFabricSmartContractsforVulnerabilityDetection》（EASE2021）摘要区块链技术以其特有的去中心化、不可变性等优点，近年来被广泛应用于各个领域。运行在区块链上的智能合约在去中心化应用场景中也扮演着越来越重要的角色。因此，自动检测智能合约中的安全漏洞成为区块链技术应用中亟待解决的问题
Data Augmentation and Deep Learning Methods in SoundClassification: A Systematic Review ggqyh 深度学习人工智能
文章为翻译，仅供学习参考论文原地址：DataAugmentationandDeepLearningMethodsinSoundClassification:ASystematicReview作者：OlusolaO.Abayomi-Alli,RobertasDamaševiˇcius,AtikaQazi,MariamAdedoyin-OloweandSanjayMisra4论文翻译地址：https:
因果学习及反因果学习（论文翻译）三分钟湿度
OnCausalandAnti-causalLearning本博文对论文OnCausalandAnti-causalLearning的摘要和模型部分做了翻译和小修改，本论文主要描述因果学习中常见的几类基于函数估计的模型，同时说明了因果与相关性、因果学习与机器学习之间的关系，论文重点在讨论和比较不同模型，内容较为笼统，不做深入探讨，但对不同模型之间的本质关系的讨论值得一看。论文地址：https://
Convolutional Neural Networks for No-Reference Image Quality Assessment 论文翻译亚里论文阅读 NR-IQA 使用卷积网络进行图像质量评价
ConvolutionalNeuralNetworksforNo-ReferenceImageQualityAssessment论文翻译TranslationAbstract1Introduction2RelatedWork3CNNforNR-IQA3.1NetworkArchitecture3.2LocalNormalization3.3Pooling3.4ReLUNonlinearity3.5
有道论文翻译接口，python版和lua版 monsterskiller 手机编程脚本编程 python
论文翻译接口python版importrequestsimporthashlibfromurllib.parseimportquotedefget_md5(s,is_hex=True):md5=hashlib.md5()md5.update(s.encode())ifis_hex:returnmd5.hexdigest()returnmd5.digest()deftranslate(source_
医学论文翻译有哪些要求，应该如何翻译呢？英信翻译公司其他
近年来，随着国内医学水平的不断提高，医学论文翻译的需求也呈现出快速增长的趋势。在国外期刊上发表论文，往往需要将整篇论文翻译成英文。那么，医学论文翻译有哪些要求，应该如何翻译呢？专家指出，医学论文翻译最基本的要求就是准确性，要求翻译者能够准确地将原文的含义传达给读者，不出现歧义或者误解的情况。这要求翻译者具备深厚的医学专业知识和语言能力，能够理解原文的含义，并将其准确地表达出来。除了准确性之外，医学
GPT原始论文：Improving Language Understanding by Generative Pre-Training论文翻译 iKang_dlut gpt 人工智能深度学习
1摘要自然语理解包括文本蕴含、问题回答、语义相似性评估和文档分类等一系列多样化的任务。尽管大量未标注的文本语料库很丰富，但用于学习这些特定任务的标注数据却很稀缺，这使得基于区分性训练的模型难以充分发挥作用。我们展示了通过在多样化的未标注文本语料库上对语言模型进行生成式预训练，随后对每个特定任务进行区分性微调，可以实现这些任务的大幅度改进。与以往的方法不同，我们在微调过程中使用了任务感知的输入转换，
【论文翻译】Generation of Non-Deterministic Synthetic Face Datasets Guided by Identity Priors（21.12）联系丝信计算机视觉
文章目录读后感Abstract1Introduction1.1Ourcontributions2RelatedWorks2.1SyntheticImageGeneration2.2MatedSampleGeneration2.3LimitationsinState-of-the-art3PCA-FR-GuidedSampling4SyntheticMatedFace(SymFace)Dataset
ORB-SLAM2代码学习1 rgdb_tum.cc Dziwu SLAM 学习计算机视觉人工智能
论文翻译参考1参考2rgdb_tum.cc的框架代码大致思路LoadImages()加载图像——判断rgb图是否存在——判断rgb图与depth图数量是否对应相同。ORB_SLAM2::SystemSLAM()初始化，创建SLAM系统，并初始化各个线程。遍历每一对RGB图和depth图【读取RGB图和depth图，读取时间戳（vTimestamps存储了时间戳，实际上就是存储了数据文件的每一幅图像
GFS--Google File System论文翻译和理解不争_900c
一、系统设计目标高可用的大文件分布式文件系统。二、关键点Architecture-架构：有哪些Server，每个Server的功能。Master存储的MetaData的结构。client写数据流程。client读数据流程。启动时Master和ChunkServer的交互。ChunkServer发生故障时，Master和ChunkServer的交互。三、核心设计概述2.Master中存储的MetaD
翻译 5765f3fa240e
对于论文翻译，大家要极其重视阅读平行文本和查资料的重要性。我平时经常做论文翻译和润色，每一次都是如履薄冰。需要阅读核心参考文献，查资料消除术语，彻底领会论文背后的逻辑。这些都解决了，才轮到运用语言基本功。假如大家接论文翻译，请认真对待查资料和阅读平行文本这两件事，如果做不到，暂时不要接论文翻译。
BERT论文翻译 TheHonestBob NLP 自然语言处理
一、写在前面在Transformer和BERT大行其道的时代，搞懂这两种基础模型结构很有必要，在网上没有搜索到满意的论文翻译结果，最近刚好有时间，把BERT的论文在个人英语水平基础上最大程度的保留原作者的本意翻译一遍，如有翻译不到位的地方请各位指出，觉得不错的点个赞鼓励一下，Tansformer的论文我之前已经翻译了，可以查看我的这篇博客attentionisallyouneed论文翻译。查看be
ImageNet Classification with Deep Convolutional Neural Networks论文翻译——中英文对照 SnailTyan 深度学习 Deep Learnig
文章作者：Tyan博客：noahsnail.com|CSDN|简书翻译论文汇总：https://github.com/SnailTyan/deep-learning-papers-translationImageNetClassificationwithDeepConvolutionalNeuralNetworksAbstractWetrainedalarge,deepconvolutionaln
2021-02-05 碰撞检测GJK算法详解（初学者慎入） MathPhilosophy
碰撞检测有2个经典算法，一个是分离轴算法SAT,还有一个就是本文要介绍的GJK，GJK是三个人的名字首写大字母；这个算法的数学推导有点复杂，目前网上只有这篇https://blog.csdn.net/u010016421/article/details/104788769/相对比较详细的介绍了算法，其主要也是参考原始论文翻译的；考虑到原始论文比较难读，博主特地专门写一篇文章介绍，博主的这篇文章会必
YoloV8改进策略：BackBone改进|DCNv4最新实践|高效涨点|多种改进教程|完整论文翻译静静AI学堂 YOLO
摘要涨点效果：在我自己的数据集上，mAP50由0.986涨到了0.993，mAP50-95由0.737涨到0.77，涨点明显！DCNv4是可变形卷积的第四版，速度和v3相比有了大幅度的提升，但是环境搭建有一定的难度，对新手不太友好。如果在使用过程遇到编译的问题，请严格按照我写的环境配置。论文：《DCNv4：对视觉应用的动态和稀疏算子的重新思考》https://arxiv.org/pdf/2401.
JVM StackMapTable 属性的作用及理解 lijingyao8206 jvm 字节码 Class文件 StackMapTable
在Java 6版本之后JVM引入了栈图(Stack Map Table)概念。为了提高验证过程的效率，在字节码规范中添加了Stack Map Table属性，以下简称栈图，其方法的code属性中存储了局部变量和操作数的类型验证以及字节码的偏移量。也就是一个method需要且仅对应一个Stack Map Table。在Java 7版
回调函数调用方法百合不是茶 java
最近在看大神写的代码时,.发现其中使用了很多的回调 ,以前只是在学习的时候经常用到 ,现在写个笔记记录一下代码很简单: MainDemo :调用方法得到方法的返回结果
[时间机器]制造时间机器需要一些材料 comsci 制造
根据我的计算和推测,要完全实现制造一台时间机器,需要某些我们这个世界不存在的物质和材料... 甚至可以这样说,这种材料和物质,我们在反应堆中也无法获得......
开口埋怨不如闭口做事邓集海邓集海做人做事工作
“开口埋怨，不如闭口做事。”不是名人名言，而是一个普通父亲对儿子的训导。但是，因为这句训导，这位普通父亲却造就了一个名人儿子。这位普通父亲造就的名人儿子，叫张明正。　　　　张明正出身贫寒，读书时成绩差，常挨老师批评。高中毕业，张明正连普通大学的分数线都没上。高考成绩出来后，平时开口怨这怨那的张明正，不从自身找原因，而是不停地埋怨自己家庭条件不好、埋怨父母没有给他创造良好的学习环境。　　　　
jQuery插件开发全解析，类级别与对象级别开发 IT独行者 jquery 开发插件　函数
jQuery插件的开发包括两种：一种是类级别的插件开发，即给 jQuery添加新的全局函数，相当于给 jQuery类本身添加方法。 jQuery的全局函数就是属于 jQuery命名空间的函数，另一种是对象级别的插件开发，即给 jQuery对象添加方法。下面就两种函数的开发做详细的说明。 1 、类级别的插件开发类级别的插件开发最直接的理解就是给jQuer
Rome解析Rss 413277409 Rome解析Rss
import java.net.URL; import java.util.List; import org.junit.Test; import com.sun.syndication.feed.synd.SyndCategory; import com.sun.syndication.feed.synd.S
RSA加密解密无量加密解密 rsa
RSA加密解密代码代码有待整理 package com.tongbanjie.commons.util; import java.security.Key; import java.security.KeyFactory; import java.security.KeyPair; import java.security.KeyPairGenerat
linux 软件安装遇到的问题 aichenglong linux 遇到的问题 ftp
1 ftp配置中遇到的问题 500 OOPS: cannot change directory 出现该问题的原因:是SELinux安装机制的问题.只要disable SELinux就可以了修改方法:1 修改/etc/selinux/config 中SELINUX=disabled 2 source /etc
面试心得 alafqq 面试
最近面试了好几家公司。记录下；支付宝，面试我的人胖胖的，看着人挺好的；博彦外包的职位，面试失败；阿里金融，面试官人也挺和善，只不过我让他吐血了。。。由于印象比较深，记录下； 1，自我介绍 2，说下八种基本类型；（算上string。楼主才答了3种，哈哈，string其实不是基本类型，是引用类型） 3，什么是包装类，包装类的优点； 4，平时看过什么书？NND，什么书都没看过。。照样
java的多态性探讨百合不是茶 java
java的多态性是指main方法在调用属性的时候类可以对这一属性做出反应的情况 //package 1; class A{ public void test(){ System.out.println("A"); } } class D extends A{ public void test(){ S
网络编程基础篇之JavaScript-学习笔记 bijian1013 JavaScript
1.documentWrite <html> <head> <script language="JavaScript"> document.write("这是电脑网络学校"); document.close(); </script> </h
探索JUnit4扩展：深入Rule bijian1013 JUnit Rule 单元测试
本文将进一步探究Rule的应用，展示如何使用Rule来替代@BeforeClass，@AfterClass，@Before和@After的功能。在上一篇中提到，可以使用Rule替代现有的大部分Runner扩展，而且也不提倡对Runner中的withBefores()，withAfte
[CSS]CSS浮动十五条规则 bit1129 css
这些浮动规则，主要是参考CSS权威指南关于浮动规则的总结，然后添加一些简单的例子以验证和理解这些规则。 1. 所有的页面元素都可以浮动 2. 一个元素浮动后，会成为块级元素，比如<span>,a, strong等都会变成块级元素 3.一个元素左浮动，会向最近的块级父元素的左上角移动，直到浮动元素的左外边界碰到块级父元素的左内边界；如果这个块级父元素已经有浮动元素停靠了
【Kafka六】Kafka Producer和Consumer多Broker、多Partition场景 bit1129 partition
0.Kafka服务器配置 3个broker 1个topic，6个partition，副本因子是2 2个consumer，每个consumer三个线程并发读取 1. Producer package kafka.examples.multibrokers.producers; import java.util.Properties; import java.util.
zabbix_agentd.conf配置文件详解 ronin47 zabbix 配置文件
Aliaskey的别名，例如 Alias=ttlsa.userid:vfs.file.regexp[/etc/passwd,^ttlsa:.:([0-9]+),,,,\1]，或者ttlsa的用户ID。你可以使用key：vfs.file.regexp[/etc/passwd,^ttlsa:.: ([0-9]+),,,,\1]，也可以使用ttlsa.userid。备注: 别名不能重复，但是可以有多个
java--19.用矩阵求Fibonacci数列的第N项 bylijinnan fibonacci
参考了网上的思路，写了个Java版的： public class Fibonacci { final static int[] A={1,1,1,0}; public static void main(String[] args) { int n=7; for(int i=0;i<=n;i++){ int f=fibonac
Netty源码学习-LengthFieldBasedFrameDecoder bylijinnan java netty
先看看LengthFieldBasedFrameDecoder的官方API http://docs.jboss.org/netty/3.1/api/org/jboss/netty/handler/codec/frame/LengthFieldBasedFrameDecoder.html API举例说明了LengthFieldBasedFrameDecoder的解析机制，如下：实
AES加密解密 chicony 加密解密
AES加解密算法，使用Base64做转码以及辅助加密： package com.wintv.common; import javax.crypto.Cipher; import javax.crypto.spec.IvParameterSpec; import javax.crypto.spec.SecretKeySpec; import sun.misc.BASE64Decod
文件编码格式转换 ctrain 编码格式
package com.test; import java.io.File; import java.io.FileInputStream; import java.io.FileOutputStream; import java.io.IOException; import java.io.InputStream; import java.io.OutputStream;
mysql 在linux客户端插入数据中文乱码 daizj mysql 中文乱码
1、查看系统客户端，数据库，连接层的编码查看方法： http://daizj.iteye.com/blog/2174993 进入mysql，通过如下命令查看数据库编码方式： mysql> show variables like 'character_set_%'; +--------------------------+------
好代码是廉价的代码 dcj3sjt126com 程序员读书
长久以来我一直主张：好代码是廉价的代码。当我跟做开发的同事说出这话时，他们的第一反应是一种惊愕，然后是将近一个星期的嘲笑，把它当作一个笑话来讲。当他们走近看我的表情、知道我是认真的时，才收敛一点。当最初的惊愕消退后，他们会用一些这样的话来反驳： “好代码不廉价，好代码是采用经过数十年计算机科学研究和积累得出的最佳实践设计模式和方法论建立起来的精心制作的程序代码。” 我只
Android网络请求库——android-async-http dcj3sjt126com android
在iOS开发中有大名鼎鼎的ASIHttpRequest库，用来处理网络请求操作，今天要介绍的是一个在Android上同样强大的网络请求库android-async-http，目前非常火的应用Instagram和Pinterest的Android版就是用的这个网络请求库。这个网络请求库是基于Apache HttpClient库之上的一个异步网络请求处理库，网络处理均基于Android的非UI线程，通
ORACLE 复习笔记之SQL语句的优化 eksliang SQL优化 Oracle sql语句优化 SQL语句的优化
转载请出自出处：http://eksliang.iteye.com/blog/2097999 SQL语句的优化总结如下 sql语句的优化可以按照如下六个步骤进行：合理使用索引避免或者简化排序消除对大表的扫描避免复杂的通配符匹配调整子查询的性能 EXISTS和IN运算符下面我就按照上面这六个步骤分别进行总结：
浅析：Android 嵌套滑动机制（NestedScrolling） gg163 android 移动开发滑动机制嵌套
谷歌在发布安卓 Lollipop版本之后，为了更好的用户体验，Google为Android的滑动机制提供了NestedScrolling特性 NestedScrolling的特性可以体现在哪里呢？ 比如你使用了Toolbar，下面一个ScrollView，向上滚
使用hovertree菜单作为后台导航 hvt JavaScript jquery .net hovertree asp.net
hovertree是一个jquery菜单插件，官方网址：http://keleyi.com/jq/hovertree/ ，可以登录该网址体验效果。 0.1.3版本：http://keleyi.com/jq/hovertree/demo/demo.0.1.3.htm hovertree插件包含文件： http://keleyi.com/jq/hovertree/css
SVG 教程（二）矩形天梯梦 svg
SVG <rect> SVG Shapes SVG有一些预定义的形状元素，可被开发者使用和操作：矩形 <rect> 圆形 <circle> 椭圆 <ellipse> 线 <line> 折线 <polyline> 多边形 <polygon> 路径 <path>
一个简单的队列 luyulong java 数据结构队列
public class MyQueue { private long[] arr; private int front; private int end; // 有效数据的大小 private int elements; public MyQueue() { arr = new long[10]; elements = 0; front
基础数据结构和算法九：Binary Search Tree sunwinner Algorithm
A binary search tree (BST) is a binary tree where each node has a Comparable key (and an associated value) and satisfies the restriction that the key in any node is larger than the keys in all
项目出现的一些问题和体会 Steven-Walker DAO Web servlet
第一篇博客不知道要写点什么，就先来点近阶段的感悟吧。这几天学了servlet和数据库等知识，就参照老方的视频写了一个简单的增删改查的，完成了最简单的一些功能，使用了三层架构。 dao层完成的是对数据库具体的功能实现，service层调用了dao层的实现方法，具体对servlet提供支持。 &
高手问答：Java老A带你全面提升Java单兵作战能力！ ITeye管理员 java
本期特邀《Java特种兵》作者：谢宇，CSDN论坛ID: xieyuooo 针对JAVA问题给予大家解答，欢迎网友积极提问，与专家一起讨论! 作者简介：淘宝网资深Java工程师，CSDN超人气博主，人称“胖哥”。 CSDN博客地址： http://blog.csdn.net/xieyuooo 作者在进入大学前是一个不折不扣的计算机白痴，曾经被人笑话过不懂鼠标是什么，