算法码上来

字节跳动 AI Lab：机器写作和机器翻译领域的新进展

作者 | 李磊

编辑 | 火山翻译

人工智能正在改变人们创造、获取、分享及消费信息的模式——计算机借助算法只用两秒就写出运动新闻，甚至生成球赛解说；仅依靠一个统一的翻译模型也能自动准确翻译9900个语对...这些看似在科幻小说里才会出现的情节正慢慢照入现实。

字节跳动 AI Lab 总监李磊近期在GTC 2020的演讲便为大家分享了文本生成技术及火山翻译在机器翻译技术的进展，带领大家感受人工智能的无限魅力。

随着新媒体平台的兴起，人工智能技术已经大大提高了信息内容的创作，而个性化推荐算法的信息又为信息内容的分发提供了极大的便利，这其中，文本生成技术非常重要，因为它在很多的应用场景有广泛的应用，比如机器翻译、机器写作、对话机器人以及自动问答。2019 年在《管理科学》杂志上 MIT 研究人员发表的一项最新研究表明，机器翻译技术已经将国际化贸易量提高了 10%，这相当于将地球上的各个国家之间的距离缩短了 25% [1]。

近年来，字节跳动也研发了多项先进的机器翻译技术，目前字节跳动自研的火山翻译平台已经有公司内外的 50 多个客户使用，支持超过 50 多种语言的互相翻译。此外，在字节跳动我们研发了 Xiaomingbot 自动写稿平台，自 2016 年上线以来，已经累计写了 60 万篇文章，覆盖了 17 项的体育赛事，支持 6 种语言，在自媒体平台上面也有 15 万的粉丝。

下面给大家展示一下 Xiaomingbot 如何自动写新闻。

我们的系统将从数据源获取到比赛信息，例如球员比赛布阵、球员的进球等等信息。同时我们还会利用计算机视觉的算法，对比赛视频进行分析识别出其中的球员、球衣上面的号码，球员的运动轨迹、球员的动作、球员的位置以及关键的一些场景等等。再利用这些信息我们利用文本生成算法写出最后的文章 [2]。

在另外一项研究当中我们使用计算机视觉的算法去分析斯诺克比赛的运动、桌上球的运动轨迹、以及利用机器学习最后去预测球员的击球策略，预测下一杆球会落到哪个袋，并且利用这些预测去生成最终的比赛解说 [3]。这对于一些非职业的观众来说，非常有助于帮助理解球赛的进程。这是我们算法最终生成的一些解说情况。

本场讲座，会分为五部分内容。第一部分，我会给大家先简单介绍一下什么是序列生成问题，它有什么样的难度和挑战；第二部分，将介绍深度隐变量模型，Deep latent Variable Models for Text Generation；第三部分，我将介绍文本生成当中如果加上限制之后，如何做更好的算法，我们提出了一类蒙特卡洛采样算法来做文本生成；第四部分会介绍机器翻译当中如何使一个模型可以去获取四项双语语言能力。最后一部分介绍多语言的机器翻译，我们最新的一个工作 mRASP。

在自然语言中，所有自然语言生成的核心问题是对句子序列做建模，比如说这样一个句子的 The quick brown fox jumps over the lazy dog 句号，这里有 10 个字符，Modeling 的问题就是对这 10 个字符的联合概率去建模，也就任意一个句子长度为 L 的句子，我需要对整个 L 各字符对它算出它的联合概率分布。当然最基本的一种方法是叫 Auto-Regressive Language model，是把这个联合概率分解成下面这个形式，每一个部分它实际上是第 i 个字符的概率，是建立在前面 1 到 i-1 个字符的基础之上，这具体的每一个概率可以有很多建模的方法。比如说现在从 2017 年开始比较流行的叫 Transformer 网络里面对个条件概率的建模是使用多层的多头注意力机制（Muti-Head Attention）来建模的 [4]。当然这个 Transformer 有很多的参数，实际学习当中就需要找到最好的一组参数，使得语料里面的联合概率最大。

在另外一些问题当中，例如机器翻译、对话生成以及自动问答当中，我们通常会有一个输入，输入也是一个序列，我们要针对这个输入做一个输出，例如机器翻译，给定一个输入的英文句子（X），我们要输出一个目标语言中文的句子（Y），所以我们要对 Y|X 这样一个条件概率去建模，同样可以用之前提到的 Transformer 模型来对这个概率建模。

把深度生成模型按照方法类别去归一个类，大致可以分成这样几类：按照自然估计的方法可以分成概率密度有没有显式密度（explicit density），以及隐式密度（implicit density）。显式密度当中又分是否密度是可直接计算的，例如像自回归分解（Auto-Regressive Factorization）里面的 Transformer 模型 [4]。如果不是自回归分解，还有像马尔科夫分解（Markov Factorization）以及并行分解（Parallel Factorization）。像最新做的一些工作就 GLAT 等等这样一些工作就可以做并行分解。在显式密度中另外一块是不可高效计算的密度（Intractable Density），也是今天需要重点介绍的一类模型，叫隐变量模型（Latent Variable Model），典型的代表有 DSSVAE、VTM 等，本场讲座也将会介绍。

假如说这个密度没有显式公式的，是隐式的，也就是说你无法严格地写出它的概率分布，通常可以写出它的能量函数（Energy Function），可以是条件能量模型（Conditional Energy Based model）或者是受限概率模型（Constrained Probability Model）。这次，我们会特别介绍受限概率模型如何来快速生成句子。包含 CGMH、MHA、TSMH 等一系列算法。但有一部分内容这里不会介绍，就是对抗学习（Adversarial learning），它已经超出极大自然概率估计这个范围以外。

接下来的一部分我将会介绍文本生成的深度隐变量模型（Deep Latent Variable Models for Text Generation）。我具体会介绍两类工作，一类是我们如何从文本当中学到可解释的深度隐含表示。第二类是我们如何从文本当中学到解耦的一个表示，并且利用这个解耦的表示来做更好的文本生成。

我们先看第一部分，我们要去学可解释的隐层表示，那么，什么是可解释？我们看这样一个具体的问题：我们从对话的句子当中希望去学到对话的一个隐表示，并且这个隐表示对应一定的语义关系，例如这里两个对话，”Remind me about the football game”，”Will it be overcast tomorrow”。这两个对话句子对应两个不同的意图，第一个意图是希望去给它一个提醒（Remind），第二个意图是问路（request for the information about where），这两个意图我们希望从句子本身通过学这样一个生成模型去学到，你在使用当中就可以根据对应的不同的意图去生成不同的回答。

传统的做法是用变分自编码（Variational Auto-encoder）的方法，去学一个隐表示，这个方法具体是假设有一个隐变量（Latent Variable） Z，它自己有一个高斯分布。从这个 Z 里面可以生成出文本句子 X 出来，利用这样的方法，Kingma & Welling 在 2013 年提出了 VAE 的算法，通过变分推断去学到隐层表示。这个方法当然可以去生成句子，也可以学到隐表示。但是当你把这个隐表示投影到低维空间去可视化出来的时候，你会发现不同的句子全部都混合到一起了，这整个混合在一起的一个大组并没有明显的聚类，所以很难去解释这个隐层表示。

如何从这里的隐变量 Z 得到一个可解释的隐层表示？一个比较好的自然的方法是在隐变量 Z 上面再加一个先验变量 c，而这个先验和 Z 不同的在于 Z 是连续的，Z 的先验 C 是离散的。也就是说，Z 是一个高斯混合分布（Gaussian Mixture distribution），我们希望从原始文本里去学到比较有意义的 C 和 Z，这样不同语义、不同意图的句子可以落到不同的聚类里面，也就是对应不同 C 的值。

这里有一个很重要的动机是，在隐变量模型里面引入离散的变量，会显著提高模型的可解释性。这个愿望当然非常美好，可是大家在实际学习过程中会发现，往往学到的 Z 去投影到低聚维空间的时候，会发生一个 mode-collapse 问题，也就是实际上学到的这些不同的意图的句子，它在隐空间的表示是混合在一起的，无法看到一个很明显的区分。如何从混合在一起的区分里面，去理解为什么会产生这种现象？并且试图去修正它，使它得到我们希望的可解释的一个隐层表示？

我们最近在 ICML2020 上面的发表的 DEMVAE 的工作 [5]，实际上解决了这个问题。

首先我们把要处理的模型推广到一个非常广泛的一族模型叫指数族混合变分自编码器（Exponential-family Mixture VAE）中。我们假设句子 X 是由一个隐变量 z 生成出来的。z 是指数族密度的一个混合分布。这里的 C 是离散的，代表不同混合概率。而 Z 是对应的不同组分，每个组分是一个指数族概率分布。我们前面提到的高斯混合自编码器 (Gaussian Mixture VAE) 是属于这一族分布里面的一个具体例子。

同样，这个模型我们要去直接估计的话，也仍然会遇到峰值塌缩（mode collapse）的问题。我们做的一个解决方案，是我们仔细分析了损失函数（Loss Function），我们发现只要在这个损失函数里面，也就是变分下界（Variational ELBO）里面加上一个额外的惩罚项叫离散项（dispersion term），加了这个之后，我们最终就可以让不同的峰值不会发生塌缩，从而会学到更有意义的隐层空间表示。

这是我们使用 DEMVAE 方法去学习到的一个效果。我们从对话句子里面去学到它的一个隐层表示 C 和 Z，注意 C 是离散的。我们用后验分布去分析这个 C 并且对它做一个简单的分类，发现这个 C 和真实的意图会非常非常接近，例如左边的这些句子，我们分析出来它们都属于同一个 C，实际上可以对应对话动作是问路（Request address），第二类都是对应问天气（Request-weather）这样一个意图。有了这个之后，我们就可以去生成更好的对话回复，例如，这样一个输入句子，“Taking you to Chevron“，我们可以预测假如说我们需要去做感谢这个意图的话，我们可以生成这样一个回复句子，“Thank you car ，let us go there“，假如说我们要去 Request address 的话，我们又可以生成另外一个句子，What is the address，所以根据不同的例子出来的意图，我们可以做可控的生成，这也是可解释性带来的一个好处。

介绍了可解释性，我们再介绍另外一个相关的问题，叫数据到文本的生成（Data-to-Text Generation），这个问题我们给定一个数据表格它是一个键值（Key- vaule）的表格的形式，比如这里显示了一个餐馆的一些的属性，希望去生成这个餐馆的描述。例如这右边是它一个可行的描述。这个问题可以把它建模成数据到文本的生成，Data-to-Text Generation。传统的做法是人工写出非常多的模板，这个模板里面留了很多空位，这些空位和数据结合之后，我们就可以去生成比较好的文本了。当然实际应用当中，我们不希望生成是一成不变的，我们希望同一个内容可以生成各式各样的文本。这就需要我们人工去写非常多的模板，而人工写这些模板是比较枯燥的。

我们希望提出一个新的方法，它能够自动地从语料里面学到这些模板，并且根据这些模板去做很好的生成。如何做呢？我们有两个动机：一是我们从概念上可以把隐空间的表示区分成两个随机变量，一个变量是用来刻画的数据内容（Content），另一个随机变量是用来刻画模板（Template），这样两个合起来之后，我们就能够从数据里面去生成句子。并且我们希望这个模板的隐层表示不是显示的离散的表示，而是连续的一个空间，这也就意味着你可以有几乎无限的模板。

第二个动机是我们不仅仅需要利用成对的表格和文本句子，这样一个成对数据来训练，我们实际上这种成对的数据是非常少的。在实际应用中，我们还是希望去利用原始文本（Raw text）来训练，并且从原始文本当中学到模板（Template）和内容（Content）的表示。

我们提出了一个新的模型叫变分模板机（Variational Template Machine），这个模型里面主要框架和前面介绍的变分自编码器（Variational Auto-encoder），本质上是非常类似的，但是与之不同的是我们有两个隐变量，一个是内容隐变量 C，它是从数据里面来得到的。另外一个是模板隐变量 Z，是有自己的先验分布。

生成的过程是怎么样的呢？一个输入数据 X，表示成 field，position 和 value 的一个三元组集合。我们先从输入的数据 X 里面去计算内容变量 C，这个可以通过一个神经网络来实现。第二步我们从 Z 的先验（例如高斯分布）里面去采样一个 Z，得到 Z 的值，这是相当于从一个无限大的模板库里面去采样选择一个模板。第三个是把 C 和 Z 合并之后，利用另外一个神经网络，例如 Transformer 可以去做生成。

利用这个变分模板机（Variational Template Machine）它最大的好处是不仅能够利用成对的表格数据和句子来训练，还可以利用额外的原始文本，这个并没有对应的表格数据也可以用来训练，并且提升这个模型的性能。这就相当于做了一个反向翻译，根据原始文本找到了对应的 C 和 Z，即模板和内容的后验分布，等同于制造了更多的一些伪平行语料，而这些伪平行语料可以用来提升学习的效果 [6]。

我们在 WIKI Data 和 SPNLG 的 Data 上面去做了实验，前者根据数据去生成个人简介，后者是根据餐馆的一些属性去生成餐馆的描述。

这里两幅图比较了我们变分模板机 VTM 方法和其他一些生成方法的性能优劣。纵轴是 BLEU SCORE，是用来衡量的生成结果和真实结果之间的相关性，所以越高越好。横轴是 self-BLEU，是用来衡量同一个方法生成的不同句子之间的相关性，我们希望同一个方法生成的句子，相互之间相关性越小越好。所以理想情况是：左上角的位置，质量最高，BLUE SCORE 最高，而 Self-BLEU 相关性越好，Self-BLEU 要越低越好。我们提出的这个变分模板机方法，它在质量上面和 Self-BLEU 两方面都取得了最好的分数。

我们也比较了变分模板机的优势，如果完整的变分模板机它并不使用原始文本的话，只用成对数据对它来训练，它的性能就会下降，它的 Self-BLEU 质量会下降，同时它的多样性会降低。所以额外的原始数据还是非常重要的，我们也验证了在这个过程当中有一些重要的训练目标，也是起了非常关键的作用，去掉它也会使性能下降。

使用这个变分模板机 VTM 模型，我们得到的额外的一个好处是我们能够去分析原始数据里面它对应的隐变量，以及通过这个隐变量找到数据的一些合理的结构。例如，我们把模板变量 z 映射到二维空间去之后，我们会发现每一个句子实际上有一些独立的聚类，比如说右边这个聚类它对应于因果描述，里面的句子基本上都有一些 because、since、with 等等这样一些表达因果的模式在里面，这个是完全从数据里面学到的。

如果大家关心的话，这里有生成的一些例子，这是从用户画像去生成用户简历的一个例子，通过在模板变量里面做不同的采样，我们可以得到不同的模板值，把它与表格里面学到的内容变量合并之后我们可去生成不同的句子，不同的句子长度和写作风格都有很大的差别，这样就得到了比较多样，并且质量比较高的一些句子。

利用类似的解耦表示学习（Disentangled Representation Learning）的方法，我们也可以去学到句子的语法表示以及语义表示。

这个语法表示和语义表示有什么作用？我们可以做一个非常有趣的实验，叫『句子嫁接』。例如有两个句子，“There is an apple on the table”，“The dog is behind the door”。我们可以从从第一个句子里面学到它的语法表示，从第二个句子里面学到它的语义表示，把前者语法表示和后者语义表示合并起来，通过 DSSVAE 模型 [7]，生成另外一个句子，“There is a dog behind the door”。从形式上，它非常接近第一个句子，都是 there-be 句型；从语义上，它更接近第二个句子，这就是句子嫁接。有了句子嫁接之后，我们可以利用这个技术在质量非常高的文章上面去学一些模型。比如一些业余作者要写文章的时候，我们就可以用这些高质量文章上面学出的模型去帮助业余的作者改进他们的写作内容。这是第二部分，文本生成的深度隐变量模型（Deep Latent Variable Models for Text generation）。

第三部分我将介绍一下，如果文本生成过程当中有额外的条件限制，如何高效地去做生成。这个问题是我们在火山引擎的实践当中发现的。

假如说我们要广告主设计一个广告，希望在广告文案当中出现一些给定的关键词，这个问题可以描述成受限文本的生成（Constrained Text Generation）。这里具体的限制是 keyword-occurrence constraint，即这些词必须要在句子当中出现。针对关键词限制（keyword occurrence），传统的算法是格束搜索（grid beam search） [8]。通过格束搜索，我们能够去生成一些句子，句子中必然会包含给定的关键词，但是这种方法并不能保证会生成质量比较高的句子。

我们提出了一个新的基于采样的文本生成框架。首先我们把目标问题和目标函数拆解成两部分，第一部分是预训练好的语言模型表征句子概率（pre-trained language model），这部分代表了句子本身的通顺程度，所以可以用以前训练好的语言模型来表示，对应图中橘黄色的部分。第二部分代表的是受限的文本，这可以用指示函数（indicator function）来表示图中蓝色的部分。而我们目标的句子，实际上是这两部分的交集，也就是图中红色的部分。

我们的目标是从红色的部分里面去生成既通顺又满足约束的高质量句子。所有的文本生成问题几乎都可以用这样一个框架来表示。而有了这样一个目标问题的表示之后，我们发现这个目标函数实际上不是一个合理的、有效的概率分布，因为它并没有归一化，要直接去找出其中的概率最高的样本点是比较困难的。

我们提出了一个新方法——CGMH [9]。

首先我们从原始语料当中可以预训练一个语言模型，例如现在比较流行的 GPT2 或者 GPT3 [10]。然后我们从一个初始的句子出发，不断地修改这个句子，每一步都可以 插入、替换、或删掉一个词。对于得到的新句子，我们再用梅特罗波利斯－黑斯廷斯算法（Metropolis-Hastings）去计算是否接受这个改动还是保留原来的句子。通过这样不断迭代式的改动之后，我们最终就可以得到一些比较高质量的句子。这是整个 CGMH 的核心思想。

我们也在之前介绍的关键词约束的文本生成任务上做了实验，这张图是 CGMH、格束搜索（GBS，即 grid beam search）以及 LSTM 等算法的对比。上图是自动评估 NLL（Negative Log-likelihood）分数，越低越好；下图是人工评价的指标，越高越好。在上下两个图当中，CGMH 方法（红色柱子）都得到了最好分数。

我们已经将 CGMH 部署到大规模线上广告创作平台，去为我们的广告主服务。它已经被超过 10 万个广告主以及组织采纳，每天生成非常多广告，广告文案的采纳率约达 75% 以上，也就是说 CGMH 生成的广告质量实际上是非常高的。

利用类似的思想，我们还可以去做对抗文本的生成。在机器学习里面，很多机器学习分类模型都是非常脆弱的，非常容易受到一些噪声（Noises）或者攻击（Attacks）的影响。如果要去分析它会受到哪些影响，我们就要去生成对抗样本，而在文本里面，如果要生成比较像人说的话且具有对抗性质的文本，实际上是非常难的。而我们用 CGMH 同样的思想去建模之后，就可以快速找到比较高质量并且真正具有对抗性质的样本。例如，我们有一个情感分类器，要对影评文本做情感分类。原来对于句子「I really like this movie」，可以正确地进行情感分类，是 99% 的正向（Positive），通过 MHA 算法，在不改动语义的情况下，我们的算法只小小改动了几个词，把它改成「we truely like the show」，这个时候就会让情感分类器混淆了，它甚至会认为这个句子是 59% 的负向（Negative） [10]。

更复杂的限制（Constraints）是我们有一些逻辑的或者组合的限制，在这个情况下，要去做生成实际上就非常难了。比如我要把一个陈述句改成一个疑问句，同时关键信息要保留，不能缺失，就需要加上比较多的组合的限制以及逻辑语义上的限制。逻辑语义上的限制加了之后如何去做生成，这是比较难的一个问题。

同样，我们把它建模成采样的形式，把目标函数分成两部分，第一部分有语言模型，第二部分有限制，不过这里的限制根据逻辑公式去做了一个构造，根据这个限制去做生成，我们提出了一个新的算法，叫 TSMH（Tree Search enhanced Metropolis-Hastings），这个算法可以高效地针对目标函数去做采样 [11]。这是介绍的带限制的文本如何去做生成。

接下来我将介绍一下我们在神经网络机器翻译方面最新研究的方法，如何去提升神经网络机器翻译的性能。首先我要介绍镜像生成式模型（Mirror Generative Model），这是 2020 年发表在 ICLR 会议上面的一个新方法。

我们知道，神经网络机器翻译是非常吃数据的，一个好的翻译模型需要大量的平行双语语料来训练。有很多的语对之间并没有这么大量的平行语料，例如对于中文到印第语的翻译，实际上是无法找到中文和印第语之间大量的平行语料的。自然的一个问题是：我们能否利用单一语料去做训练，例如英语到泰米尔语的翻译当中，我们有大量的英语或者泰米尔语的单语语料，我们利用单语的语料和少量的平行语料一起来做更好的训练。

如何做到这一点呢？实际上当我们观察人的语言能力，我们从中得到一个启发。当一个人会中文和英文的时候，他必然同时具有四种能力：能用中文造句，能用英文造句，能把中文翻译成英文，也能把英文翻译成中文。实际上这里代表了四种语言能力，我们把前两种对应到神经网络里面的语言模型，把后两种对应到神经网络里面的两个翻译方向。

那么，我们能否做一个模型，使得它像人一样只要会两种语言，就会与这两种语言相关的四种语言技能？答案是肯定的。我们可以在两个语言句子 X、Y 之间引入一个隐变量 Z，这个隐变量同时跟原语言以及目标语言有关。把它作为一个桥梁之后，我们把四种技能都整合到一个模型里面，做目标语言的生成，就是 P（Y|Z），原语言到目标语言的翻译就是 P（Y|X、Z），原语言的语言模型就是 P（X|Z），而目标语言到原语言的翻译模型就是 P（X|Y，Z）。如何把这四个概率都放到一个框架里面去呢？我们有一个重要的发现，就是镜像性（Mirror property），我们发现生成概率 P（X，Y|Z），实际上可以写成这样对称的形式，最终把它分解成四项，而这四项分别代表了原语言和目标语言的生成能力，以及原语言到目标语言、目标语言到原语言的翻译能力。而把四个放到一起之后，我们就可以去联合做优化，也就是我们提出的镜像生成式神经机器翻译模型（MGNMT） [12]。

利用这个镜像生成模型（MGNMT），我们在多个数据上都得到了最好的翻译结果。在低资源的情况下，相对于传统的 Transformer 或者 Transformer 联合反向翻译（Back Translation）的方式，MGNMT 都有比较一致的、显著的提高。

在高资源的情况下（例如英德语向），利用 MGNMT 加上额外的非平行语料之后，我们可以依然比 Transformer 加上反向翻译的方法有明显提升，并且验证了非平行语料的数据是非常有用的，而 MGNMT 在低资源语向的提升会更大一些。

刚才提到两个语言之间的翻译，我们下一步要介绍的是我们如何做更多语言的翻译。我们在最新的发表在今年 EMNLP 会议上的工作 mRASP 的论文当中就提出了一个多语言预训练的方法。mRASP 是一个全新的范式去训练一个多语言翻译模型，并且在很多场景里面进行少量微调之后，就可以让它在目标语对之间的翻译有较大的提升 [13]。

世界上有非常非常多的语言，如果你数一下，真正有人使用的人类语言有超过 6900 种，我们这里的目标是去构建一个统一的翻译模型，能够自动翻译任何语对。这当然是机器翻译的最终目标，这个目标也是非常具有挑战性的。

我们为什么要把很多门语言放在一起训练？第一个现实的原因是，要训练一个好的机器翻译的模型需要大量的平行语对，而很多语对之间并没有平行语料，所以很多语对之间是非常稀疏的。第二个原因是，根据我们的直观经验，在语对之间有很多共同的信息是可以迁移的。我们知道，如果一个人学德语需要花一年时间，他学法语也需要花一年的时间，这是单独学习的情况。如果他花一年时间先学了德语之后，再去学法语，只需要花三个月时间就可以学会法语了。也就是说，当一个人有了学习德语的能力之后，再去学另一门语言，可以大大缩短他学习其他语言的时间，这就是常说的触类旁通。这就给我们一个很大的启示，我们在做多语言翻译的时候，也许把很多语言放在一起学，总的代价可以比单独学习各门语言的代价总和要小得多。

从模型上来讲，我们还有一个更深层次的目标，更偏数学的一个直观想法是：假如单独学习英语、法语、西班牙语、德语、意大利语等语言的翻译，我们可能学到一个比较好的表示，但是这些表示之间都没有相互的关系。其实这些语言之间，我们依然可以找到一些双语的语对把它们连接起来，这些语对具有相同的意思。

我们就希望通过这些具有相同意思、并且在各个语言里面都出现的一些句子作为锚点，有了这个锚点之后，我们再去统一地学习所有的语言的表示，这样就会学到一个更好的表示。在这个表示的框架下，一个句子即使在不同的语言里面，只要它有同样的语义，就会映射到同样一个表示空间里面的向量上面去。

这也是我们提出的 mRASP 核心思想。mRASP 翻译的模型是用基于 Transformer 的编解码器（Encoder-Decoder），我们在输入端加了编码器（Encoder）的语言标识符去表示它输入的语种，在解码器（Decoder）做了一个额外的输入是目标语言的语言标识符，表示它需要翻译的语种。

除了使用大量的双语平行句对来训练之外，我们还利用这些平行句对做了一个数据增强。通过发明的随机对齐替换（Random Aligned Substitution）的方法，我们把原句里面一些词通过同义词词典找到它对应的另外一种语言里面的同义词，然后做随机替换，之后把替换后的源端句子和真正的目标句子再组合成一个伪平行句对，通过这样的方式去做训练之后，就可以得到一个比较好的模型。

通过 mRASP 这个方法，我们在很多场景下去做了多种语言翻译的测试，这里面显示了我们通过 mRASP 训练了一个初始的模型，这个统一的模型我们在具体语对平行数据上又去微调。比如说这里英语到白俄罗斯语（Be），我们应用 mRASP 预训练好的模型在英语到白俄罗斯语微调之后得到的翻译模型，和在英语到白俄罗斯语双语语料上面直接训练出一个 Transformer 翻译模型做比较之后，发现 mRASP 可以大大提升翻译的性能。在极低资源方向（Extremely-Low Resource Directions）以及低资源方向（Low Resource Directions）这两种场景下，我们都发现 mRASP 这样做预训练微调之后会得到更好的翻译，提升都在 10 个点以上。

在中等资源（Medium Resource）和高资源（Rich Resource，指双语语对有 100 万以上的平行语料）两个场景下，我们发现 mRASP 方法仍然有比较大的提升，我们也和之前提出的所有其他方法做了对比，包括 XLM、CTNMT、MASS 以及 mBART 等。

我们也做了另外一个实验，mRASP 是否对未见语种也有效？通过 mRASP 训练了之后，我们在一些从来没有见过的语对上面去做微调，例如从荷兰语（Nl）到葡萄牙语（Pt）。这两个语言都没有在 mRASP 的预训练语料里面出现过，而且微调阶段双语平行语料只有 1.25 万，非常少，如果直接在这个语对上面用 Transformer 去训练的话，得不到任何有意义的结果，BLEU SCORE 会是 0。用 mRASP 预训练好的模型，在荷兰语到葡萄牙语的语料上面去微调之后，会得到一些有意义的翻译结果，而 BLEU SCORE 也有了 10 个点的提升（从 0 涨到 13）。

简单总结下我的演讲内容。这里我介绍了多模态协作机器人 Xiaomingbot，也介绍了两种从数据当中学到解耦隐表示（Disentangled Latent Representation）的方法，包括变分模板机 VTM，用来做数据到文本的生成（Data-to-Text Generation）。以及 DSSVAE，从数据当中学到文本和语义隐层表示的。以及 DEMVAE 方法，如何从原始文本数据当中学到有意义的隐表示和语义聚类。我也介绍了在文本生成当中如果有额外的限制，如何用比较好的一些方法去生成高质量的句子，并且符合这些限制，如 CGMH、MHA 和 TSMH 等方法。最后我介绍了两个机器翻译的新方法，一个是镜像式生成模型 MGNMT，可以把平行语料和非平行语料联合在一起去学到两个语言之间的四种语言能力。而 mRASP 更是把机器翻译预训练推广到非常多的语对之间，把这些语对联合起来训练一个比较好的模型，然后在下游的翻译任务上做微调，能够非常有效地提升翻译性能。

我们也开源了一些算法还有工具，包括 mRASP。我们已经把训练后的以及训练好的模型开源。我们最近也发布了一个高性能的序列推理工具 LightSeq [14]，针对 Nvidia 的 GPU 做性能优化，重写了序列生成的计算内核，并且在序列生成机器翻译等任务上相对 tensorflow 版本，有 10 倍以上的速度提升。

最后，我们推出了火山翻译系统，如果大家感兴趣，欢迎到 translate.volcengine.cn 网站去体验。目前火山引擎 AI 中台也集合了包括视频翻译、机器翻译、智能同传等模块功能，同时欢迎到火山引擎官网 volcengine.cn 详细了解。

作者介绍

李磊，字节跳动 AI Lab 总监。字节跳动杰出科学家，卡耐基梅隆大学计算机科学博士，致力于机器翻译、机器写作、智能机器人的研发。

关于火山翻译：

火山翻译（Volctrans）是由字节跳动计算机研究科学家、工程师、产品经理、产品运营和语言专家组成的专业团队研发，其基于自主研发的机器学习技术，积累了百亿多种语言语料，已支持超过50个语种、2500个语对之间的互译，翻译效果和速度业界领先。

目前，火山翻译具备文本翻译、语音翻译、图像翻译、语种识别四种能力，在办公、娱乐、新闻等场景表现优异。

火山翻译团队还研发了多项机器翻译前沿技术，目前已经集成到火山翻译系列产品中，例如镜像式生成模型MGNMT、CTNMT算法、交互式翻译算法CAMIT、胶囊翻译网络、并行翻译算法PNAT和GLAT等。火山翻译还采用了自研的高性能序列推理引擎LightSeq，推理速度业界领先，比原生系统提高10倍，可以达到每秒两万词的翻译速度。

基于这些能力，火山翻译推出了各类优质翻译产品，为飞书、今日头条等多款海内外产品提供稳定和高质量的翻译服务，为来自全球的过亿用户群体提供优质的翻译体验。

随着越来越多自研产品的诞生与投用，火山翻译将会在更多领域进行技术深耕，为更多用户提供领先的翻译服务，为更多行业和社会的创新发展贡献一份力量。

参考文献：

[1] E.Brynjolfsson, X. Hui and M. Liu, "Does machine translation affectinternational trade? Evidence from a large digital platform.," ManagementScience, vol. 65, no. 12, pp. 5449- 5460, 2019.

[2] R.Xu, J. Cao, M. Wang, J. Chen, H. Zhou, Y. Zeng, Y. Wang, L. Chen, X. Yin, X.Zhang, S. Jiang, Y. Wang and L. Li, "Xiaomingbot: A Multilingual RobotNews Reporter," in the 58th Annual Meeting of the Association forComputational Linguistics (ACL): System Demonstrations, 2020.

[3] Z.Sun, J. Chen, H. Zhou, D. Zhou, L. Li and M. Jiang, "GraspSnooker:Automatic Chinese Commentary Generation for Snooker Videos," in the28th International Joint Conference on Artificial Intelligence (IJCAI) : Demo,2019.

[4] A. Vaswani, N. Shazeer, N. Parmar, J. Uszkoreit, L. Jones, A. N. Gomez, L. Kaiser and I. Polosukhin, "Attention is All You Need," in NeurIPS, 2017.

[5] W. Shi, H. Zhou, N. Miao and L. Li, "Dispersed Exponential Family Mixture VAEs for Interpretable Text Generation," in the Proceedings of the 37th International Conference on Machine Learning, 2020.

[6] R. Ye, W. Shi, H. Zhou, Z. Wei and L. Li, "Variational Template Machine for Data-to-Text Generation," in Proceedings of International Conference on Learning Representations, 2020.

[7] B. Bao, H. Zhou, S. Huang, L. Li, L. Mou, O. Vechtomova, X. Dai and J. Chen, "Generating Sentences from Disentangled Syntactic and Semantic Spaces," in the 57th Annual Meeting of the Association for Computational Linguistics, 2019.

[8]C. Hokamp and Q. Liu, "Lexically Constrained Decoding for Sequence Generation Using Grid Beam Search," in the 55th Annual Meeting of the Association for Computational Linguistics, 2017.

[9]N. Miao, H. Zhou, L. Mou, R. Yan and L. Li, "CGMH: Constrained Sentence Generation by Metropolis-Hastings Sampling," in the 33rd AAAI Conference on Artificial Intelligence , 2019.

[10] T. Brown, B. Mann, N. Ryder, M. Subbiah, J. D. Kaplan, P. Dhariwal, A. Neelakantan, P. Shyam, G. Sastry, A. Askell, S. Agarwal, A. Herbert-Voss, G. Krueger, T. Henighan and Chil, "Language Models are Few-Shot Learners," in Advances in Neural Information Processing Systems, 2020.

[11] H. Zhang, N. Miao, H. Zhou and L. Li, "Generating Fluent Adversarial Examples for Natural Languages," in 57th Annual Meeting of the Association for Computational Linguistics - short papers, 2019.

[12] M. Zhang, N. Jiang, L. Li and Y. Xue, "Language Generation via Combinatorial Constraint Satisfaction: A Tree Search Enhanced Monte-Carlo Approach," in the Conference on Empirical Methods in Natural Language Processing (EMNLP) - Findings, 2020.

[13] Z.Zheng, H. Zhou, S. Huang, L. Li, X. Dai and J. Chen, "Mirror GenerativeModels for Neural Machine Translation," in International Conference onLearning Representations , 2020.

[14] Z.Lin, X. Pan, M. Wang, X. Qiu, J. Feng, H. Zhou and L. Li, "Pre-trainingMultilingual Neural Machine Translation by Leveraging AlignmentInformation," in the Conference on Empirical Methods in NaturalLanguage Processing, 2020.

[15] "LightSeq,"[Online]. Available: https://github.com/bytedance/lightseq. [Accessed 2020].

你可能感兴趣的:(算法,大数据,编程语言,python,计算机视觉)

打造高质量Python代码：使用Black、Ruff和Mypy进行格式化与Lint llzwxh888 python 数据库服务器
#打造高质量Python代码：使用Black、Ruff和Mypy进行格式化与Lint在软件开发过程中，确保代码的风格、可读性和正确性是每位开发者面临的重要任务。借助于现代工具，我们可以自动化许多重复性的检查任务，从而提高代码质量和开发效率。在这篇文章中，我们将探讨如何使用Black、Ruff和Mypy为Python代码进行格式化和Lint。##引言面对不断增长的代码库，维护代码风格和质量可以变得非
提高代码质量：使用Python Lint工具black、ruff和mypy ndAbsAfaqwdav python 服务器开发语言
提高代码质量：使用PythonLint工具black、ruff和mypy在软件开发过程中，代码质量是一个非常重要的环节。良好的代码格式和风格不仅使代码更易于阅读和维护，还能减少潜在的错误和问题。本文将介绍如何使用Python的三个流行工具：black，ruff，和mypy，帮助开发者提升代码质量。引言在这篇文章中，我们将探讨如何有效使用black，ruff，和mypy来提高Python代码的质量。
DeepSeek- R1 原理介绍 kcarly 大模型知识乱炖杂谈 DeepSeek R1 原理介绍
DeepSeek-R1是由DeepSeek公司推出的一款基于强化学习（RL）的开源推理模型，其核心原理和特点如下：1.核心技术与架构强化学习驱动：DeepSeek-R1是首个完全通过强化学习训练的大型语言模型，无需依赖监督微调（SFT）或人工标注数据。它采用组相对策略优化（GRPO）算法，通过奖励机制和规则引导模型生成结构化思维链（CoT），从而提升推理能力。多阶段训练流程：模型采用冷启动阶段、强
初探FastAPI：从Flask到FastAPI的入门指南 WqxEditor fastapi flask python
FastAPI和Flask是两个非常流行的PythonWeb框架，它们都提供了强大的功能和易用性，但在某些方面有所不同。本文将介绍FastAPI的基本概念和用法，并通过比较Flask和FastAPI的相似之处来帮助你更好地理解FastAPI。什么是FastAPI？FastAPI是一个现代化的PythonWeb框架，它旨在提供高性能、易用性和可靠性。它基于Python3.7+的类型提示和异步编程特性
[全面掌握Python代码格式化与静态检查：使用Black, Ruff, 和 Mypy] ahdfwcevnhrtds python 服务器 linux
全面掌握Python代码格式化与静态检查：使用Black,Ruff,和Mypy引言在Python开发中，代码的可读性和一致性是至关重要的。为了确保代码达到高标准的格式化和静态检查，Black、Ruff和Mypy成为了开发者们的得力辅助手段。本篇文章将为您介绍如何使用这些工具来提升代码质量，并通过一个完整的示例演示其使用方法。主要内容1.Black：自动格式化工具Black是一个“无争议”的Pyth
Ruff：Python圈的最快代码分析工具！ BbflNim python macos 前端
随着后端开发的不断发展，代码分析工具成为了开发者们必备的利器之一。在Python圈中，Ruff已经崭露头角，成为了性能最快的代码分析工具。本文将介绍Ruff的特点以及如何使用它来优化Python代码。Ruff是一个基于Python的代码分析工具，它专注于提供快速而准确的代码分析和性能优化。Ruff的设计目标是通过静态分析和动态追踪相结合的方式，帮助开发者发现代码中的瓶颈，并提供针对性的优化建议。下
2024年最全Doris：读取Doris数据的N种方法_访问 doris，阿里大牛教你自己写大数据开发第三方库 2401_84181108 程序员大数据
网上学习资料一大堆，但如果学到的知识不成体系，遇到问题时只是浅尝辄止，不再深入研究，那么很难做到真正的技术提升。需要这份系统化资料的朋友，可以戳这里获取一个人可以走的很快，但一群人才能走的更远！不论你是正从事IT行业的老鸟或是对IT行业感兴趣的新人，都欢迎加入我们的的圈子（技术交流、学习资源、职场吐槽、大厂内推、面试辅导），让我们一起学习成长！arrow-memory-netty${arrow.v
Flask与FastAPI对比选择最佳Python Web框架的指南一键难忘 python flask fastapi Flask
Flask与FastAPI对比选择最佳PythonWeb框架的指南在现代的Web开发中，Python的Web框架为开发者提供了多种选择，其中Flask和FastAPI是目前最流行的两个框架。Flask因其简洁、灵活和轻量而广受欢迎，而FastAPI凭借其高性能和异步支持，逐渐成为了越来越多开发者的首选。在这篇文章中，我们将深入比较Flask与FastAPI，分析它们的特点、优势和适用场景，并帮助你
Python - pyautogui库模拟鼠标和键盘执行GUI任务 Ethel L 自动化测试 python
安装库：pipinstallpyautogui导入库：importpyautogui获取屏幕尺寸：s_width,s_height=pyautogui.size()获取鼠标当前位置：x,y=pyautogui.position()移动鼠标到指定位置（可以先使用用上一个函数调试获取当前位置参数再使用）：pyautogui.moveTo(x,y)#x,y是屏幕上的坐标鼠标点击：pyautogui.cl
python的ruff简单使用 golemon. Python python 开发语言
Ruff是一个用Rust编写的高性能Python静态分析工具和代码格式化工具。它旨在提供快速的代码检查和格式化功能，同时支持丰富的配置选项和与现有工具的兼容性。ruff是用rust实现的pythonLinter&Formatter。安装：condainstall-cconda-forgeruff#pippipinstallruff它可以作为代码检查工具和代码格式化工具使用运行代码检查ruffche
【问题】升级指定conda虚拟环境的python到指定版本 Jackilina_Stone 【EH】报错处理人工智能 python linux 问题
1背景当前conda环境的名字为python38，进入环境python38命令如下：condaactivatepython382升级python到3.10版本condainstallpython=3.103查看python版本
leetcode字节面试高频题思路总结（二叉树专栏） hust_yrh leetcode 算法面试二叉树
leetcode刷题，一个好的思路很重要，刷leetcode不如就只看好的解题思路，记下来关键思路然后面试的时候就会容易很多。自己的算法思路可能就会有很多冗余代码，跟好的算法思路比起来差距很大，并且看了很多题解就不会出现有没有一点思路的情况。举例：顺时针打印数组，寻找重复数lc287，k个一组翻转链表。(乱序)顺时针打印：先第一行，然后消去，再最后一列，然后消去，最下一行，然后消去…287：给定一
python字典从头到尾_从头到尾开发并销售python API weixin_26750481 python 人工智能
python字典从头到尾IrecentlyreadablogpostaboutsettingupyourownAPIandsellingit.我最近阅读了一篇有关设置和销售自己的API的博客文章。Iwasquiteinspiredandwantedtotestifitworks.Injust5daysIwasabletocreateanAPIfromstarttoend.SoIthoughtIsh
python实例化类的存储内存地址_【JVM之内存与垃圾回收篇】对象实例化内存布局与访问定位... 学姐吖
对象实例化内存布局与访问定位从各自具体的内存分配上来讲new的对象放在堆中对象所属的类型信息是放在方法区的方法当中的局部变量放在栈空间这new的对象怎么把三块粘合到一起就是这章的内容了对象实例化面试题美团：对象在JVM中是怎么存储的？对象头信息里面有哪些东西？蚂蚁金服：二面Java对象头有什么？从对象创建的方式和步骤开始说对象创建方式new：最常见的方式，单例类中调用getInstance的静态类
深度学习框架PyTorch原理与实践 AI天才研究院 AI实战大数据人工智能语言模型 Java Python 架构设计
作者：禅与计算机程序设计艺术文章目录1.简介2.背景介绍3.基本概念和术语3.1PyTorch简介3.2PyTorch的特点1）自动求导机制2）GPU加速3）模型部署4）数据管道5）代码阅读友好4.核心算法原理4.1神经网络结构4.2神经网络层4.3激活函数5.实际案例——MNIST手写数字识别数据准备模型定义训练测试整体代码1.简介Deeplearning(DL)hasbeenanincreas
虚拟环境的python升降级办法 @@wo python 开发语言
首先先进入自己建的虚拟环境中1.将python=3.12版本降级为3.7版本condainstall-ypython=3.72.升级办法condaupdatepython3.查看当前python版本办法python--version4.新建虚拟环境办法condacreate-npyupmaskpython==3.8pyupmask可换为自己想建的环境名,版本可变5.进入虚拟环境condaactiv
LeetCode--347. 前 K 个高频元素/Golang中的堆(container/heap) Rinai_R LeetCode leetcode golang 算法数据结构
例题链接-前k个高频元素前言以前都是用的C++写算法题，最近也想熟悉一下golang的数据结构，故来一篇题解+堆分析。正文这里重点不在分析题目，在于golang中的container/heap对于内部实现逻辑有兴趣的可以去看看源码。这里先给出题解的代码packagemainimport("container/heap""fmt")//IHeap是一个最小堆的实现typeIHeap[][2]intf
自动生成关于软件程序开发的100个文件并可提供下载入口唐城 postgresql 数据库人工智能电脑机器人
创建一个包含100个关于软件程序开发的文件并提供下载入口是一个庞大的任务，因为这需要编写大量的代码、文档和示例。不过，我可以提供一个大致的框架和指导，帮助你生成这些文件，并说明如何设置下载入口。文件生成思路编程语言文件：每种主流编程语言（如Python、Java、C++、JavaScript等）的HelloWorld程序。数据结构示例（链表、树、图等）。算法实现（排序、搜索等）。项目模板：Web项
Databricks 开源 LLM，训练只需三个小时唐城 AI-毕业设计全套 spring log4j postgresql 数据库 java
大数据分析公司DatabricksInc近日也加入了生成式AI领域的竞争之中，发布了一个名为Dolly的开源大型语言模型，将模型命名为Dolly是为了向第一只克隆羊多莉致敬。像ChatGPT和Bard这样的生成式AI，它们使用的数据通常来自于在成千上万不同网站，使用的数据量十分惊人，而且想要使用这些数据训练AI还需要数以千计的强大GPU在背后提供支持。Databricks希望通过开源Dolly及其
Paddle进阶实战系列（三）：基于SVTR算法的手写英文单词识别 GoAI 深入浅出OCR 深入浅出AI 计算机视觉 OCR paddle 深度学习人工智能
‍作者简介：CSDN、阿里云人工智能领域博客专家，新星计划计算机视觉导师，百度飞桨PPDE，专注大数据与AI知识分享。公众号：GoAI的学习小屋，免费分享书籍、简历、导图等，更有交流群分享宝藏资料，关注公众号回复“加群”或➡️链接加群。专栏推荐：➡️
python中import库出现路径问题邻家的狗2 python
运行prepro_vocab.py文件，由于需要导入common文件夹下的chem.py中的类，出现找不到模块的问题。解决方法common文件夹和prepro_vocab.py的父目录同级，如果将prepro_vocab.py的父目录的父目录的路径加入到环境变量中，就可以导入common模块了。importsyssys.path.append(os.path.dirname(os.path.dir
Python第三阶段学习 Django day08 MetalTrader Tude-Py django python
《DjangoWeb框架教学笔记》目录文章目录《DjangoWeb框架教学笔记》目录文件上传Django中的用户认证(使用Django认证系统)auth基本模型操作:auth扩展字段电子邮件发送项目部署uWSGI网关接口配置(ubuntu18.04配置)nginx及反向代理配置nginx配置静态文件路径404/500界面邮件告警文件上传文件上传必须为POST提交方式表单中文件上传时必须有带有enc
第 11 课 Python 多线程嵌入式老牛 Python入门开发语言 python
1.进程与线程进程就是程序执行的载体，我们打开的每个软件、游戏，执行的每一个Python脚本都是启动一个进程。线程是进程中执行运算的最小单位，是进程中的一个实体，是被系统独立调度和分派的基本单位。例如车间的生产是一个进程，那每个流水线就是它的一个线程。线程自己不拥有系统资源，只拥有一点在运行中必不可少的资源，但它可与同属一个进程的其它线程共享进程所拥有的全部资源。一个线程可以创建和撤消另一个线程，
Hadoop3.2.1安装-单机模式和伪分布式模式花菜回锅肉大数据 hadoop hdfs 大数据 linux
Hadoop入门篇概述Hadoop是使用Java编写的，是为了解决大数据场景下的两大问题，分布式存储和分布式处理而诞生的，包含很多组件、套件。需要运行在Linux系统下。主要包括HDFS和MapReduce两个组件。下载安装下载下载地址https://archive.apache.org/dist/hadoop/common/选择合适自己的tar.gz版本下载,该文档选择V3.2.1。Hadoop
Spark3.1.2单机安装部署花菜回锅肉大数据 spark 大数据 hadoop
spark3.1.2单机安装部署概述Spark是一个性能优异的集群计算框架，广泛应用于大数据领域。类似Hadoop，但对Hadoop做了优化，计算任务的中间结果可以存储在内存中，不需要每次都写入HDFS，更适用于需要迭代运算的算法场景中。Spark专注于数据的处理分析，而数据的存储还是要借助于Hadoop分布式文件系统HDFS等来实现。大数据问题场景包含以下三种：复杂的批量数据处理基于历史数据的交
如何在QGIS中安装Python第三方库朗道十戒 QGIS python 开发语言
目录1.在QGIS安装目录下，找到Windows批处理文件OSGeo4W。2.双击运行该批处理文件，然后使用pipinstall命令安装相应的第三方库。3.在QGISPythonConsole控制平台就可以运行anacondajupyternotebook的脚本了。1.在QGIS安装目录下，找到Windows批处理文件OSGeo4W。2.双击运行该批处理文件，然后使用pipinstall命令安装相
R语言环境下载和RStudio安装教程 CyberXZ r语言开发语言 R语言
R语言环境下载和RStudio安装教程R语言是一种广泛应用于统计计算和数据分析的编程语言。它提供了丰富的统计和图形功能，被广泛用于数据科学、机器学习和数据可视化等领域。本教程将向您介绍如何下载和安装R语言环境以及RStudio集成开发环境。步骤1：下载R语言环境首先，您需要下载R语言环境。请按照以下步骤进行操作：在您的Web浏览器中打开R官方网站（https://www.r-project.org
Ada语言的循环实现沈韶珺包罗万象 golang 开发语言后端
Ada语言的循环实现引言Ada语言是一种强类型、高级的编程语言，以其可靠性和并发特性而著称。最初由美国国防部为其军事应用而开发，Ada语言如今已被广泛应用于航空航天、铁路和其他要求高可靠性的行业。在编程时，控制结构是基本构成部分，而循环作为一种重要的控制结构，允许程序在满足特定条件的情况下重复执行代码块。本文将深入探讨Ada语言中循环的实现方式，包括循环的类型、结构及其应用实例。Ada语言的基本概
Elixir语言的物联网蔺曲韵包罗万象 golang 开发语言后端
使用Elixir语言构建物联网应用引言物联网（IoT）是当今技术发展的热门领域，它涉及各种设备的互联互通，这些设备能够收集和交换数据。随着智能家居、智能城市、工业自动化等应用场景的逐步普及，如何高效地构建和管理这些设备之间的通信已经成为一个重要的问题。在众多编程语言中，Elixir以其并发、可靠性和分布式特性，逐渐成为构建物联网应用的一个优秀选择。本文将详细探讨Elixir在物联网项目中的应用，包
Visual Basic语言的循环实现沈韶珺包罗万象 golang 开发语言后端
VisualBasic语言中的循环实现引言在编程中，循环结构是一种非常重要的控制结构，它允许我们重复执行一段代码多次，直到满足特定条件为止。VisualBasic（VB）作为一种广泛使用的编程语言，提供了多种循环控制结构，帮助开发者高效地处理重复性任务。本文将深入探讨VisualBasic语言中的循环实现，包括其基础概念、不同类型的循环结构、实际应用以及一些最佳实践。一、循环的基本概念循环是一种控
java观察者模式 3213213333332132 java 设计模式游戏观察者模式
观察者模式——顾名思义，就是一个对象观察另一个对象，当被观察的对象发生变化时，观察者也会跟着变化。在日常中，我们配java环境变量时，设置一个JAVAHOME变量,这就是被观察者，使用了JAVAHOME变量的对象都是观察者，一旦JAVAHOME的路径改动，其他的也会跟着改动。这样的例子很多，我想用小时候玩的老鹰捉小鸡游戏来简单的描绘观察者模式。老鹰会变成观察者，母鸡和小鸡是
TFS RESTful API 模拟上传测试 ronin47
TFS RESTful API 模拟上传测试。　　细节参看这里：https://github.com/alibaba/nginx-tfs/blob/master/TFS_RESTful_API.markdown 模拟POST上传一个图片： curl --data-binary @/opt/tfs.png http
PHP常用设计模式单例, 工厂, 观察者, 责任链, 装饰, 策略,适配,桥接模式 dcj3sjt126com 设计模式 PHP
// 多态, 在JAVA中是这样用的, 其实在PHP当中可以自然消除, 因为参数是动态的, 你传什么过来都可以, 不限制类型, 直接调用类的方法 abstract class Tiger { public abstract function climb(); } class XTiger extends Tiger { public function climb()
hibernate 171815164 Hibernate
main,save Configuration conf =new Configuration().configure(); SessionFactory sf=conf.buildSessionFactory(); Session sess=sf.openSession(); Transaction tx=sess.beginTransaction(); News a=new
Ant实例分析 g21121 ant
下面是一个Ant构建文件的实例，通过这个实例我们可以很清楚的理顺构建一个项目的顺序及依赖关系，从而编写出更加合理的构建文件。下面是build.xml的代码： <?xml version="1
[简单]工作记录_接口返回405原因 53873039oycg 工作
最近调接口时候一直报错，错误信息是: responseCode:405 responseMsg:Method Not Allowed 接口请求方式Post.
关于java.lang.ClassNotFoundException 和 java.lang.NoClassDefFoundError 的区别程序员是怎么炼成的
真正完成类的加载工作是通过调用 defineClass来实现的；而启动类的加载过程是通过调用 loadClass来实现的；就是类加载器分为加载和定义 protected Class<?> findClass(String name) throws ClassNotFoundExcept
JDBC学习笔记-JDBC详细的操作流程 aijuans jdbc
所有的JDBC应用程序都具有下面的基本流程：　　1、加载数据库驱动并建立到数据库的连接。　　2、执行SQL语句。　　3、处理结果。　　4、从数据库断开连接释放资源。下面我们就来仔细看一看每一个步骤：其实按照上面所说每个阶段都可得单独拿出来写成一个独立的类方法文件。共别的应用来调用。 1、加载数据库驱动并建立到数据库的连接： Html代码 St
rome创建rss antonyup_2006 tomcat cms xml struts Opera
引用 1.RSS标准 RSS标准比较混乱，主要有以下3个系列 RSS 0.9x / 2.0 : RSS技术诞生于1999年的网景公司(Netscape)，其发布了一个0.9版本的规范。2001年，RSS技术标准的发展工作被Userland Software公司的戴夫温那(Dave Winer)所接手。陆续发布了0.9x的系列版本。当W3C小组发布RSS 1.0后，Dave W
html表格和表单基础百合不是茶 html 表格表单 meta 锚点
第一次用html来写东西,感觉压力山大,每次看见别人发的都是比较牛逼的再看看自己什么都还不会, html是一种标记语言,其实很简单都是固定的格式 _----------------------------------------表格和表单表格是html的重要组成部分,表格用在body里面的主要用法如下; <table> &
ibatis如何传入完整的sql语句 bijian1013 java sql ibatis
ibatis如何传入完整的sql语句？进一步说，String str ="select * from test_table"，我想把str传入ibatis中执行，是传递整条sql语句。解决办法： <
精通Oracle10编程SQL(14)开发动态SQL bijian1013 oracle 数据库 plsql
/* *开发动态SQL */ --使用EXECUTE IMMEDIATE处理DDL操作 CREATE OR REPLACE PROCEDURE drop_table(table_name varchar2) is sql_statement varchar2(100); begin sql_statement:='DROP TABLE '||table_name;
【Linux命令】Linux工作中常用命令 bit1129 linux命令
不断的总结工作中常用的Linux命令 1.查看端口被哪个进程占用通过这个命令可以得到占用8085端口的进程号，然后通过ps -ef|grep 进程号得到进程的详细信息 netstat -anp | grep 8085 察看进程ID对应的进程占用的端口号 netstat -anp | grep 进程ID &
优秀网站和文档收集白糖_ 网站
集成 Flex, Spring, Hibernate 构建应用程序性能测试工具-JMeter Hmtl5-IOCN网站 Oracle精简版教程网站鸟哥的linux私房菜 Jetty中文文档 50个jquery必备代码片段 swfobject.js检测flash版本号工具
angular.extend boyitech AngularJS angular.extend AngularJS API
angular.extend 复制src对象中的属性去dst对象中. 支持多个src对象. 如果你不想改变一个对象，你可以把dst设为空对象{}: var object = angular.extend({}, object1, object2). 注意: angular.extend不支持递归复制. 使用方法: angular.extend(dst, src); 参数:
java-谷歌面试题-设计方便提取中数的数据结构 bylijinnan java
网上找了一下这道题的解答，但都是提供思路，没有提供具体实现。其中使用大小堆这个思路看似简单，但实现起来要考虑很多。以下分别用排序数组和大小堆来实现。使用大小堆： import java.util.Arrays; public class MedianInHeap { /** * 题目：设计方便提取中数的数据结构 * 设计一个数据结构，其中包含两个函数，1.插
ajaxFileUpload 针对 ie jquery 1.7+不能使用问题修复版本 Chen.H ajaxFileUpload ie6 ie7 ie8 ie9
jQuery.extend({ handleError: function( s, xhr, status, e ) { // If a local callback was specified, fire it if ( s.error ) { s.error.call( s.context || s, xhr, status, e ); }
[机器人制造原则]机器人的电池和存储器必须可以替换 comsci 制造
机器人的身体随时随地可能被外来力量所破坏,但是如果机器人的存储器和电池可以更换,那么这个机器人的思维和记忆力就可以保存下来,即使身体受到伤害,在把存储器取下来安装到一个新的身体上之后,原有的性格和能力都可以继续维持..... 另外,如果一
Oracle Multitable INSERT 的用法 daizj oracle
转载Oracle笔记-Multitable INSERT 的用法 http://blog.chinaunix.net/uid-8504518-id-3310531.html 一、Insert基础用法语法： Insert Into 表名 (字段1,字段2,字段3...） Values (值1,
专访黑客历史学家George Dyson datamachine on
20世纪最具威力的两项发明——核弹和计算机出自同一时代、同一群年青人。可是，与大名鼎鼎的曼哈顿计划（第二次世界大战中美国原子弹研究计划）相比，计算机的起源显得默默无闻。出身计算机世家的历史学家George Dyson在其新书《图灵大教堂》（Turing’s Cathedral）中讲述了阿兰·图灵、约翰·冯·诺依曼等一帮子天才小子创造计算机及预见计算机未来
小学6年级英语单词背诵第一课 dcj3sjt126com english word
always 总是 rice 水稻，米饭 before 在...之前 live 生活，居住 usual 通常的 early 早的 begin 开始 month 月份 year 年 last 最后的 east 东方的 high 高的 far 远的 window 窗户 world 世界 than 比...更
在线IT教育和在线IT高端教育 dcj3sjt126com 教育
codecademy http://www.codecademy.com codeschool https://www.codeschool.com teamtreehouse http://teamtreehouse.com lynda http://www.lynda.com/ Coursera https://www.coursera.
Struts2 xml校验框架所定义的校验文件蕃薯耀 Struts2 xml校验 Struts2 xml校验框架 Struts2校验
>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>> 蕃薯耀 2015年7月11日 15:54:59 星期六 http://fa
mac下安装rar和unrar命令 hanqunfeng mac
1.下载：http://www.rarlab.com/download.htm 选择 RAR 5.21 for Mac OS X 2.解压下载后的文件 tar -zxvf rarosx-5.2.1.tar 3.cd rar sudo install -c -o $USER unrar /bin #输入当前用户登录密码 sudo install -c -o $USER rar
三种将list转换为map的方法 jackyrong list
在本文中，介绍三种将list转换为map的方法： 1）传统方法假设有某个类如下 class Movie { private Integer rank; private String description; public Movie(Integer rank, String des
年轻程序员需要学习的5大经验 lampcy 工作 PHP 程序员
在过去的7年半时间里，我带过的软件实习生超过一打，也看到过数以百计的学生和毕业生的档案。我发现很多事情他们都需要学习。或许你会说，我说的不就是某种特定的技术、算法、数学，或者其他特定形式的知识吗？没错，这的确是需要学习的，但却并不是最重要的事情。他们需要学习的最重要的东西是“自我规范”。这些规范就是：尽可能地写出最简洁的代码；如果代码后期会因为改动而变得凌乱不堪就得重构；尽量删除没用的代码，并添加
评“女孩遭野蛮引产致终身不育 60万赔偿款1分未得”医腐深入骨髓 nannan408
先来看南方网的一则报道：再正常不过的结婚、生子，对于29岁的郑畅来说，却是一个永远也无法实现的梦想。从2010年到2015年，从24岁到29岁，一张张新旧不一的诊断书记录了她病情的同时，也清晰地记下了她人生的悲哀。　　粗暴手术让人发寒　　2010年7月，在酒店做服务员的郑畅发现自己怀孕了，可男朋友却联系不上。在没有和家人商量的情况下，她决定堕胎。　　12月5日，
使用jQuery为input输入框绑定回车键事件 VS 为a标签绑定click事件 Everyday都不同 jsp input 回车键绑定 click enter
假设如题所示的事件为同一个，必须先把该js函数抽离出来，该函数定义了监听的处理： function search() { //监听函数略...... } 为input框绑定回车事件，当用户在文本框中输入搜索关键字时，按回车键，即可触发search(): //回车绑定 $(".search").keydown(fun
EXT学习记录 tntxia ext
1. 准备（1）官网：http://www.sencha.com/ 里面有源代码和API文档下载。 EXT的域名已经从www.extjs.com改成了www.sencha.com ，但extjs这个域名会自动转到sencha上。（2）帮助文档：想要查看EXT的官方文档的话，可以去这里h
mybatis3的mapper文件报Referenced file contains errors xingguangsixian mybatis
最近使用mybatis.3.1.0时无意中碰到一个问题： The errors below were detected when validating the file "mybatis-3-mapper.dtd" via the file "account-mapper.xml". In most cases these errors can be d