数智物语

年度必读：2018最具突破性人工智能论文Top 10

文章发布于公号【数智物语】（ID：decision_engine），关注公号不错过每一篇干货。

来源 | topbots.com、Reddit

转自 | 新智元

本文总结了2018年以来最重要的10篇AI研究论文，让你对今年机器学习的进展有一个大致的了解。当然，还有很多具有突破性的论文值得一读，但本文作者认为这是一个很好的目录，你可以从它开始。

今天，Reddit上的一条帖子火了：

对于初学者来说，在机器学习和人工智能领域必须的论文有哪些？

想必这个问题引起了许多人的共鸣。

网友推荐的Statistical Modeling: The Two Cultures大受好评，强调经典统计数据和ML预测/建模之间的重要区别。

https://projecteuclid.org/euclid.ss/1009213726

也有网友表示，对于初学者，最好还是可以从书籍入手，而不是文献。并推荐了Norvig & Russell的Artificial Intelligence，以及Goodfellow的Deep Learning 。并强调若是没有良好的基础，直接读单个的论文是十分困难的，因为论文通常在页数上是有限的，所以在上下文理解上还是有一定局限性。

而近期，作者Mariya Yao在Topbots上发表一篇文章，对今年AI论文Top10做了大盘点。

考虑到AI领域的快速发展，试图跟上AI的最新研究可能非常困难。如果你埋头于那些你还没来得及阅读的论文，那么本文能助你一力。

为了帮助你赶上进度，我们总结了2018年以来最重要的10篇AI研究论文，让你对今年机器学习的进展有一个大致的了解。当然，还有很多具有突破性的论文值得一读，但我们认为这是一个很好的列表，你可以从它开始。

此外，我们计划在未来几周发布自然语言处理(NLP)和计算机视觉方面的重要论文，敬请期待。

以下是我们推荐的2018必读Top 10论文：

Universal Language Model Fine-tuning for Text Classification

Obfuscated Gradients Give a False Sense of Security: Circumventing Defenses to Adversarial Examples

Deep Contextualized Word Representations

An Empirical Evaluation of Generic Convolutional and Recurrent Networks for Sequence Modeling

Delayed Impact of Fair Machine Learning

World Models

Taskonomy: Disentangling Task Transfer Learning

Know What You Don’t Know: Unanswerable Questions for SQuAD

Large Scale GAN Training for High Fidelity Natural Image Synthesis

BERT: Pre-training of Deep Bidirectional Transformers for Language Understanding

1、文本分类的通用语言模型微调

标题：Universal Language Model Fine-tuning for Text Classification

作者：Jeremy Howard & Sebastian Ruder (2018)

https://arxiv.org/abs/1801.06146

论文摘要

迁移学习已经对计算机视觉领域产生了很大的影响，但NLP领域的现有方法仍然需要针对任务进行修改和从零开始进行训练。本文提出一种有效的迁移学习方法——通用语言模型微调(Universal Language Model Fine-tuning, ULMFiT)，该方法可应用于任何NLP任务，并介绍了对语言模型进行微调的关键技术。

我们的方法在六个文本分类任务上显著优于最先进的技术，在大多数数据集上将错误率降低了18-24%。此外，仅使用100个标记示例，它的性能不比在100倍以上的数据上从零开始训练的模型的性能差。我们将开源预训练模型和代码。

概要总结

这篇论文建议使用预训练的模型来解决广泛的NLP问题。使用这种方法，你不需要从头开始训练模型，只需要对原始模型进行微调。他们的方法称为通用语言模型微调(ULMFiT)，其性能优于最先进的结果，误差降低了18-24%。更重要的是，只使用100个标记示例，ULMFiT的性能与在10K标记示例上从零开始训练的模型的性能相当。

核心思想

为了解决标记数据的缺乏的困难，使NLP分类任务更容易、更省时，研究人员建议将迁移学习应用于NLP问题。因此，你不用从头开始训练模型，而是可以使用另一个经过训练的模型作为基础，然后只对原始模型进行微调来解决特定问题。

但是，为了取得成功，微调应考虑几个重要因素：

1.不同的层应该被微调到不同的程度，因为它们分别捕获不同类型的信息。

2.当学习率先线性增加后线性衰减时，使模型参数适应特定任务的特征会更有效。

3.同时对所有层进行微调可能会导致灾难性遗忘；因此，最好从最后一层开始逐层解冻模型。

最重要的成果

1.显著优于最先进的技术：误差减少了18-24%。

2.需要的标记数据更少：只有100个标记示例和50K未标记示例，性能与从零开始学习100倍以上的数据的性能相当。

AI社区的评价

在计算机视觉领域，经过预处理的ImageNet模型的可用性已经改变了这一领域，ULMFiT对于NLP问题也同样重要。

该方法适用于任何语言的任何NLP任务。来自世界各地的报告表明，该方法在德语、波兰语、北印度语、印度尼西亚语、汉语和马来语等多种语言方面，都取得了显著进步。

未来研究方向

1.改进语言模型的预处理和微调。

2.将这种新方法应用于新的任务和模型(如序列标记、自然语言生成、蕴涵或问题回答)。

可能的应用

ULMFiT可以更好地解决广泛的NLP问题，包括:

1.识别垃圾邮件、机器人、攻击性评论;

2.按照特定的特征对文章进行分组;

3.对正面和负面评论进行分类;

4.寻找相关文件等。

这种方法还可能有助于序列标记和自然语言生成。

2、混淆梯度

标题：Obfuscated Gradients Give a False Sense of Security: Circumventing Defenses to Adversarial Examples

作者：Anish Athalye, Nicholas Carlini, David Wagner

https://arxiv.org/abs/1802.00420

论文摘要

我们发现“混淆梯度”（obfuscated gradients）作为一种梯度掩码（gradient masking），会在防御对抗样本中导致一种错误的安全感。虽然造成混淆梯度的防御似乎可以击败基于迭代优化的攻击，但我们发现依赖这种效果的防御可以被规避。我们描述了表现出这种效应的防御特征行为，对于我们发现的三种混淆梯度，我们都开发了攻击技术来克服它。在一个案例中，我们检查了发表在ICLR 2018的论文的未经认证的白盒安全防御，发现混淆梯度是常见的情况，9个防御中有7个依赖于混淆梯度。在每篇论文所考虑的原始威胁模型中，我们的新攻击成功地完全规避了6个，部分规避了1个。

概要总结

研究人员发现，针对对抗性样本的防御通常使用混淆梯度，这造成了一种虚假的安全感，实际上这种防御很容易被绕过。该研究描述了三种防御混淆梯度的方法，并展示了哪些技术可以绕过防御。这些发现可以帮助那些依赖混淆梯度来防御的组织强化他们当前的方法。

核心思想

防御混淆梯度有三种常见的方法：

1.破坏梯度是由防御方有意(通过不可微操作)或无意(通过数值失稳)造成的不存在或不正确的梯度；

2.随机梯度是由随机防御引起的；

3.消失/爆炸梯度是由极深的神经网络评估引起的。

有很多线索表明梯度有问题，包括:

1.一步攻击比迭代攻击更有效；

2.黑盒攻击比白盒攻击更有效；

3.无界攻击没有100%成功；

4.随机抽样发现对抗性样本；

5.增加扭曲约束无法增加成功。

最重要的成果

说明目前使用的大部分防御技术容易受到攻击，即：

1.ICLR 2018接受的论文中，9种防御技术中有7种造成了混淆梯度；

2.研究人员开发的新攻击技术能够成功地完全绕开6个防御，部分绕开1个防御。

AI社区的评价

1.这篇论文获得了ICML 2018最佳论文奖，这是最重要的机器学习会议之一。

2.论文强调了当前技术的优势和劣势。

未来研究方向

在仔细且全面的评估下构建防御，这样它们不仅可以防御现有的攻击，而且还可以防御未来可能发生的攻击。

可能的应用

通过使用研究论文中提供的指导，组织可以识别他们的防御是否依赖于混淆梯度，并在必要时改用更强大的方法。

3、ELMo：最好用的词向量

标题：Deep contextualized word representations

作者：Matthew E. Peters, Mark Neumann, Mohit Iyyer, Matt Gardner, Christopher Clark, Kenton Lee, Luke Zettlemoyer

https://arxiv.org/abs/1802.05365

论文摘要

我们提出一种新的深层语境化的词表示形式，它既模拟了词使用的复杂特征(如语法和语义)，也模拟了这些用法在不同语言语境中的变化(即，一词多义)。我们的词向量是一个深度双向语言模型(biLM)内部状态的学习函数，该模型是在一个大型文本语料库上预训练的。我们证明，这些表示可以很容易地添加到现有的模型中，并在六个具有挑战性的NLP问题(包括问题回答、文字蕴涵和情感分析)中显著地提升了技术的最先进水平。我们还提供了一项分析，表明暴露预训练网络的深层内部结构是至关重要的，它允许下游模型混合不同类型的半监督信号。

概要总结

艾伦人工智能研究所的团队提出一种新型的深层语境化单词表示——语言模型嵌入(Embeddings from Language Models, ELMo)。在ELMo增强的模型中，每个单词都是基于它所使用的整个上下文向量化的。在现有的NLP系统中加入ELMo可以减少6-20%的相对误差，显著减少训练模型所需的时间，以及显著减少达到基线性能所需的训练数据量。

核心思想

1.以深度双向语言模型(biLM)的内部状态加权和的形式生成词嵌入，该模型在大型文本语料库上预训练。

2.要包含来自所有biLM层的表示，因为不同的层代表不同类型的信息。

3.将ELMo表示建立在字符的基础上，以便网络可以使用形态学线索“理解”训练中未见的词汇表外的token。

最重要的成果

1.将ELMo添加到模型中可以得到state-of-the-art的结果，在问题回答、文字蕴涵、语义角色标记、相关引用解析、命名实体提取和情绪分析等NLP任务中，相对误差降低了6 - 20%。

2.使用ELMo增强模型可以显著减少达到最先进性能所需的更新次数。因此，使用ELMo的语义角色标记(SRL)模型只需要10 epochs就可以超过486 epochs训练后达到的基线最大值。

3.将ELMo引入模型还可以显著减少实现相同性能水平所需的训练数据量。例如，对于SRL任务，ELMo增强模型只需要训练集的1%就可以实现与基线模型相同的性能，而基线模型需要10%的训练数据。

AI社区的评价

1.这篇论文在全球最具影响力的NLP会议之一——NAACL上被评为Outstanding paper。

2.论文提出的ELMo方法被认为是2018年NLP领域最大的突破之一，也是NLP未来几年的重要成果。

未来研究方向

1.通过将ELMos与上下文无关的词嵌入连接起来，将这种方法合并到特定的任务中。

2.将ELMos与输出连接。

可能的应用

1.ELMo显著改善了现有NLP系统的性能，从而增强：

2.聊天机器人的性能，使其能够更好地理解人类和回答问题；

3.对客户的正面和负面评价进行分类;

4.查找相关信息和文件等。

4、序列建模：时间卷积网络取代RNN

标题：An Empirical Evaluation of Generic Convolutional and Recurrent Networks for Sequence Modeling

作者：Shaojie Bai, J. Zico Kolter, Vladlen Koltun

https://arxiv.org/abs/1803.01271

论文摘要

对于大多数深度学习实践者来说，序列建模与循环网络是同义词。然而，最近的研究结果表明，卷积架构在语音合成和机器翻译等任务上的表现优于循环网络。给定一个新的序列建模任务或数据集，应该使用哪种架构？我们对序列建模的一般卷积和循环架构进行了系统的评价。我们在广泛的标准任务中评估这些模型。我们的结果表明，一个简单的卷积架构在不同的任务和数据集上的表现优于LSTM等典型的循环网络。我们的结论是，需要重新考虑序列建模和循环网络之间的共同关联，卷积网络应该被视为序列建模任务的一个自然起点。我们提供了相关代码：http://github.com/locuslab/TCN

概要总结

本文的作者质疑了一个常见假设，即循环架构应该是序列建模任务的默认起点。他们的结果表明，时间卷积网络(TCNs)在多个序列建模任务中明显优于长短期记忆网络(LSTMs)和门控循环单元网络(GRUs)等典型的循环架构。

核心思想

1.时间卷积网络(TCN)是基于最近提出的最佳实践(如扩张卷积和残差连接)设计的，它在一系列复杂的序列建模任务中表现得明显优于通用的循环架构。

2.TCN表现出比循环架构更长的记忆，因此更适合需要较长的历史记录的任务。

最重要的成果

1.在序列建模任务上提供了卷积架构和循环架构的广泛、系统的比较。

2.设计了一个卷积架构，它可以作为序列建模任务的一个方便且强大的起点。

AI社区的评价

在使用RNN之前，一定要先尝试CNN。你会惊讶于你能走多远。——特斯拉人工智能主管Andrej Karpathy。

未来研究方向

为了提高TCN在不同序列建模任务中的性能，需要进一步精化架构和算法。

可能的应用

TCN的提出可以提高依赖于循环架构的AI系统的序列建模能力，包括：

1.机器翻译;

2.语音识别;

3.音乐和语音产生。

5、探索机器学习的公平性

标题：Delayed Impact of Fair Machine Learning

By Lydia T. Liu, Sarah Dean, Esther Rolf, Max Simchowitz, Moritz Hardt (2018)

https://arxiv.org/abs/1803.04383

论文摘要

机器学习中的公平性主要是在静态的分类设置进行研究，而不考虑决策如何随时间改变基础样本总体。传统观点认为，公平性标准能够促进它们所保护的群体的长期利益。

我们研究了静态公平标准与幸福感的时间指标是如何相互作用的，如长期改善、停滞和利益变量下降。我们证明，即使在单步反馈模型中，一般的公平标准也不会随着时间的推移而促进改善，并且不受约束的目标不仅不会促进改善，甚至可能造成损害。我们描述了三个标准的延迟影响，对比了这些标准表现出不同行为的机制。此外，我们还发现一种自然形式的测量误差扩大了公平标准发挥有利作用的机制。

我们的结果突出了测量和时间建模在公平标准评估中的重要性，提出了一系列新的挑战和权衡取舍。

概要总结

当使用基于分数的机器学习算法来决定谁可以获得机会(例如贷款、奖学金、工作)，谁得不到机会时，目标是确保不同人口群体被公平对待。伯克利人工智能研究实验室的研究人员表明，由于某些延迟的结果，使用共同的公平标准实际上可能会损害代表性不足或处境不利的群体。因此，他们鼓励在设计一个“公平”的机器学习系统时考虑长期结果。

核心思想

考虑实施公平标准的延迟结果显示，这些标准可能对他们旨在保护的群体的长期利益有不利影响。由于公平标准可能会对弱势群体造成主动的伤害，解决的办法可以是使用结果最大化的决策规则，或者一个结果模型。

最重要的成果

1.表明了人口均等、机会均等等公平标准可以为弱势群体带来任何可能的结果，包括改善、停滞或恶化，而遵循最优无约束选择政策(如利润最大化)，则永远不会给弱势群体带来恶化的结果(主动伤害)。

2.通过FICO信用评分数据的实验支持了理论预测。

3.考虑了硬公平约束的替代方案。

AI社区的评价

1.这篇论文获得了ICML 2018最佳论文奖，ICML是最重要的机器学习会议之一。

2.该研究表明，有时正面的歧视会适得其反。

未来研究方向

1.考虑超出群体平均变化影响的其他特征(如方差、个体水平结果)。

2.研究结果优化对建模和测量误差的鲁棒性。

可能的应用

通过从公平性标准强加的约束转向结果建模，企业可能会开发出更有利可图、也“更公平”的ML系统，用于放贷或招聘。

6、世界模型

标题：World Model

By David Ha，Jurgen Schmidhuber（2018）

https://worldmodels.github.io

论文摘要

我们探索并建立了流行的强化学习环境的生成神经网络模型。我们的world model可以以无监督的方式快速训练，用来学习环境的压缩空间和时间表示。通过使用从world model中提取的特征作为agent的输入，我们可以训练一个非常紧凑和简单的策略，可以解决所需的任务。我们甚至可以完全在智能体自身的world model所产生的“幻觉梦境（hallucinated dream）”中训练智能体，并将该策略转换回实际环境中。

概览

Ha和Schmidhuber开发了一种world model，这种模型可以在无监督的情况下快速训练，以学习环境的时空表现形式。在赛车任务中，智能体成功的在赛道上行驶，避开了VizDom实验中怪物射击的火球。这些任务对以前的方法来说太具有挑战性了。

核心思想

该解决方案由三个不同的部分组成：

1.变分自动编码器（VAE），负责捕获视觉信息。它将RGB输入图像压缩成遵循高斯分布的32维隐向量。智能体可以使用更小的环境表示，因此可以更有效地学习。

2.递归神经网络（RNN），负责前瞻性思维。这是一个内存组件，它试图预测可视组件捕获的下一张图片在考虑前一张图片和上一张图片时可能会是什么样子。

3.控制器，负责选择操作。这是一个简单的神经网络，连接VAE的输出和RNN的隐藏状态，并选择良好的行动。

最重要的成果

1.这是第一个已知的智能体解决流行的“赛车”强化学习环境。

2.该研究证明了完全在智能体模拟的潜在空间梦境世界中训练它，并且执行任务的可能性。

AI社区的评价

这篇论文在人工智能社区中得到了广泛的讨论，被认为是一篇利用神经网络在“幻觉”世界中强化学习和训练智能体的杰出作品。

未来研究方向

1.通过将小型RNN替换为更高容量的模型或合并外部内存模块，使智能体能够探索更复杂的世界。

2.使用更通用的方法进行试验，这些方法允许分层规划（hierarchical planning ）。

可能的应用

在运行计算密集型游戏引擎时，现在可以在模拟环境中尽可能多地训练智能体，而不是在实际环境中浪费大量的计算资源来进行训练。

7、分解任务迁移学习

标题：Taskonomy: Disentangling Task Transfer Learning

By Amir R. Zamir，Alexander Sax，William Shen，Leonidas J. Guibas，Jitendra Malik，Silvio Savarese（2018）

https://arxiv.org/abs/1804.08328

论文摘要

视觉任务之间有关联吗？例如，表面法线可以简化对图像深度的估计吗？直觉回答了这些问题，暗示了视觉任务中存在结构。了解这种结构具有显著的价值;它是迁移学习的基本概念，提供了一种原则性的方法来识别任务之间的冗余。

我们提出了一种完全计算的可视化任务空间结构建模方法。这是通过在潜在空间中的二十六个2D，2.5D，3D和语义任务的字典中查找（一阶和更高阶）传递学习依赖性来完成的。该产品是用于任务迁移学习的计算分类映射。我们研究这种结构的结果，例如出现的非平凡关系，并利用它们来减少对标记数据的需求。例如，我们展示了在保持性能几乎相同的情况下，解决一组10个任务所需的标记数据点的总数可以减少大约2/3（与独立训练相比）。我们提供了一组用于计算和探测这种分类结构的工具，包括一个解决程序，用户可以使用它来为他们的用例设计有效的监督策略。

概览

自现代计算机科学的早期以来，许多研究人员就断言视觉任务之间存在一个结构。现在Amir Zamir和他的团队试图找到这个结构。他们使用完全计算的方法建模，并发现不同可视化任务之间的许多有用关系，包括一些重要的任务。他们还表明，通过利用这些相互依赖性，可以实现相同的模型性能，标记数据要求大约减少2/3。

核心思想

1.了解不同可视化任务之间关系的模型需要更少的监督、更少的计算和更可预测的行为。

2.一种完整的计算方法来发现视觉任务之间的关系是可取的，因为它避免了强加的、可能是不正确的假设：先验来自于人类的直觉或分析知识，而神经网络可能在不同的原理上运作。

最重要的成果

1.识别26个常见视觉任务之间的关系，如目标识别、深度估计、边缘检测和姿态估计。

2.展示这个结构如何帮助发现对每个视觉任务最有效的迁移学习类型。

AI社区的评价

1.该论文在计算机视觉与模式识别重要会议CVPR 2018上获得了最佳论文奖。

2.结果非常重要，因为对于大多数实际任务，大规模标记数据集不可用。

未来研究方向

1.从一般的视觉任务完全由人类定义的模型，转向将人类定义的视觉任务视为由计算发现的潜在子任务组成的观察样本的方法。

2.探索将发现转化为不完全是视觉任务的可能性。

可能的应用

在本文中发现的关系可以用来构建更有效的视觉系统，这个系统将需要更少的标记数据和更低的计算成本。

8、SQuAD无法解决的问题

标题： Know What You Don't Know: Unanswerable Questions For SQuAD

By Pranav Rajpurkar，Robin Jia，Percy Liang

https://arxiv.org/abs/1806.03822

论文摘要

摘要抽取式阅读理解系统通常可以在上下文文档中找到问题的正确答案，但对于没有在上下文中陈述正确答案的问题，它们往往会做出不可靠的猜测。现有的数据集要么只关注可回答的问题，要么使用自动生成的容易识别的不可回答的问题。为了解决这些缺点，我们提供了SQuAD 2.0，这是斯坦福问答数据集(SQuAD)的最新版本。SQuAD 2.0结合了现有的SQuAD数据和超过50000个由众包工人以对抗性方式写下的无法回答的问题，使其看起来与能够回答的问题相似。为了在SQuAD 2.0上做得好，系统不仅必须尽可能回答问题，还要确定段落何时不支持答案并且不回答问题。对于现有模型，SQuAD 2.0是一项具有挑战性的自然语言理解任务：在SQUAD 1.1上获得86％F1的强大神经系统在SQuAD 2.0上仅获得66％的F1。

概览

斯坦福大学的一个研究小组扩展了著名的斯坦福问答数据集（SQUAD），提出了超过50,000个难以回答的问题。这些问题的答案不能在支持段落（supporting paragraph）中找到，但是这些问题看起来与可回答的问题非常相似。更重要的是，支持段落包含了对这些问题的合理（但不正确）的回答。这使得新的SQuAD 2.0对于现有的最先进的模型来说极具挑战性。

核心思想

1.当前的自然语言理解（NLU）系统远非真正的语言理解，其根本原因之一是现有的Q&A数据集关注的问题是保证在上下文文档中存在正确答案的问题。

2.为了真正具有挑战性，应该提出一些无法回答的问题，以便：它们与支持段落相关；这一段包含了一个貌似合理的答案，它包含了与问题所要求的信息相同的信息，但是是不正确的。

最重要的成果

1.通过53,777个新的无法回答的问题扩展SQuAD，从而构建具有挑战性的大规模数据集，迫使NLU系统了解何时无法根据上下文回答问题。

2.这给NLU系统带来了新的挑战，因为现有的模型（66%的准确率）较低于人类的准确率（89.5%）。

3.这表明貌似合理的答案确实对NLU系统起到了有效的干扰作用。

AI社区的评价

1.该论文被计算语言学协会（ACL）评为2018年度最佳短文。

2.新的数据集增加了NLU领域的复杂性，并且实际上可以在这一研究领域促进性能训练。

未来研究的方向

开发“了解他们不知道的东西”的新模型，从而更好地理解自然语言。

可能的应用

在这个新的数据集上训练阅读理解模型，可以提高它们在现实场景中的性能，在这些场景中，答案通常不是直接可用的。

9、用于高保真自然图像合成的大规模GAN训练

标题：Large Scale GAN Training For High Fidelity Natural Image Synthesis

By Andrew Brock，Jeff Donahue，Karen Simonyan（2018）

https://arxiv.org/abs/1809.11096

论文摘要

尽管生成图像建模最近取得了进展，但从ImageNet等复杂数据集成功生成高分辨率、多样化的样本仍然是一个难以实现的目标。为此，我们在最大的规模下进行了生成对抗网络的训练，并研究了这种规模下的不稳定性。我们发现，将正交正则化应用于发生器，使其服从于一个简单的“截断技巧”，可以允许通过截断潜在空间来精细控制样本保真度和多样性之间的权衡。我们的修改使得模型在类条件图像合成中达到了新的技术水平。当我们在ImageNet上以128×128分辨率进行训练时，我们的模型（BigGAN）的初始得分（IS）为166.3，Frechet初始距离（FID）为9.6。

概览

DeepMind团队发现，当前的技术足以从现有数据集(如ImageNet和JFT-300M)合成高分辨率、多样化的图像。他们特别指出，生成对抗网络(GANs)可以生成看起来非常逼真的图像，如果它们在非常大的范围内进行训练，即使用比以前实验多2到4倍的参数和8倍的批处理大小。这些大规模的GAN，或BigGAN，是类条件图像合成的最新技术。

核心思想

1.随着批（batch）大小和参数数量的增加，GAN的性能更好。

2.将正交正则化应用到生成器中，使模型响应特定的技术（“截断技巧”），该技术提供了对样本保真度和多样性之间的权衡的控制。

最重要的成果

1.证明GAN可以从scaling中获益；

2.构建允许显式、细粒度地控制样本多样性和保真度之间权衡的模型；

3.发现大规模GAN的不稳定性；

4.BigGAN在ImageNet上以128×128分辨率进行训练：初始得分（IS）为166.3，之前的最佳IS为52.52；Frechet Inception Distance (FID)为9.6，之前最好的FID为18.65。

AI社区的评价

1.该论文正在为ICLR 2019做准备；

2.自从Big Hub上线BigGAN发生器之后，来自世界各地的AI研究人员正在玩BigGAN，来生成狗，手表，比基尼图像，蒙娜丽莎，海滨以及更多主题。

未来研究方向

1.迁移到更大的数据集以减少GAN稳定性问题；

2.探索减少GAN产生的奇怪样本数量的可能性。

可能的应用

取代昂贵的手工媒体创作，用于广告和电子商务的目的。

10、BERT：深度双向变换器语言理解的预训练

标题：BERT: Pre-Training of Deep Bidirectional Transformers for Language Understanding

By Jacob Devlin，Ming-Wei Chang，Kenton Lee，Kristina Toutanova（2018）

https://arxiv.org/abs/1810.04805

论文摘要

我们介绍了一种新的语言表示模型，称为BERT，它代表转换器的双向编码器表示。与最近的语言表示模型不同，BERT的设计是通过在所有层中对左右上下文进行联合条件作用来预先训练深层双向表示。因此，只需要一个额外的输出层，就可以对预训练的BERT表示进行微调，从而为广泛的任务（如回答问题和语言推断）创建最先进的模型，而无需对特定于任务的体系结构进行大量修改。

BERT概念简单且功能丰富。它在11项自然语言处理任务中获得了最新的结果，包括将GLUE基准提高到80.4%，多项精度提高到86.7，以及将SQuAD v1.1答题测试F1提高到93.2，比人类表现高出2.0%。

概览

谷歌AI团队提出了一种新的最前沿的自然语言处理(NLP)模型——BERT，Bidirectional Encoder Representations from Transformers。它的设计允许模型从左右两边考虑每个单词的上下文。在概念简单的同时，BERT在11个NLP任务上获得了最新的最先进的结果，这些任务包括回答问题、命名实体识别和其他与一般语言理解相关的任务。

核心思想

1.通过随机屏蔽一定比例的输入tokens来训练一个深层双向模型，从而避免单词可以间接“看到自己”的循环；

2.此外，通过构建一个简单的二元分类任务，预测句子B是否紧跟着句子A，对句子关系模型进行预处理，从而让BERT更好地理解句子之间的关系。

3.训练一个非常大的模型（24个Transformer块，1024个hidden，340M参数）和大量数据（33亿字语料库）。

最重要的成果

1.为11项NLP任务提供最先进的技术，包括：GLUE分数80.4%，比之前的最佳成绩有7.6%的提升；在SQuAD 1.1上达到93.2％的准确率，超过人类水平2％。

2.建议一个预训练的模型，它不需要任何实质性的架构修改就可以应用于特定的NLP任务。

AI社区的评价

1.BERT模型标志着NLP的新时代；

2.两个无人监督的任务在一起为许多NLP任务提供了很好的结果；

3.语言模型的预训练成为一种新标准。

未来研究方向

在更广泛的任务中测试该方法；

可能的应用

BERT可以帮助企业解决一系列的NLP问题，包括：为聊天机器人提供更好的客户体验；客户评论分析；查阅相关资料等等。

参考链接：

https://www.topbots.com/most-important-ai-research-papers-2018/

https://www.reddit.com/r/MachineLearning/comments/a21d0q/what_are_the_must_read_papers_for_a_beginner_in/

你可能感兴趣的:(人工智能)

探索OpenAI和LangChain的适配器集成：轻松切换模型提供商 nseejrukjhad langchain easyui 前端 python
#探索OpenAI和LangChain的适配器集成：轻松切换模型提供商##引言在人工智能和自然语言处理的世界中，OpenAI的模型提供了强大的能力。然而，随着技术的发展，许多人开始探索其他模型以满足特定需求。LangChain作为一个强大的工具，集成了多种模型提供商，通过提供适配器，简化了不同模型之间的转换。本篇文章将介绍如何使用LangChain的适配器与OpenAI集成，以便轻松切换模型提供商
深入理解 MultiQueryRetriever：提升向量数据库检索效果的强大工具 nseejrukjhad 数据库 python
深入理解MultiQueryRetriever：提升向量数据库检索效果的强大工具引言在人工智能和自然语言处理领域，高效准确的信息检索一直是一个关键挑战。传统的基于距离的向量数据库检索方法虽然广泛应用，但仍存在一些局限性。本文将介绍一种创新的解决方案：MultiQueryRetriever，它通过自动生成多个查询视角来增强检索效果，提高结果的相关性和多样性。MultiQueryRetriever的工
人工智能时代，程序员如何保持核心竞争力？ jmoych 人工智能
随着AIGC（如chatgpt、midjourney、claude等）大语言模型接二连三的涌现，AI辅助编程工具日益普及，程序员的工作方式正在发生深刻变革。有人担心AI可能取代部分编程工作，也有人认为AI是提高效率的得力助手。面对这一趋势,程序员应该如何应对?是专注于某个领域深耕细作，还是广泛学习以适应快速变化的技术环境?又或者，我们是否应该将重点转向AI无法轻易替代的软技能？让我们一起探讨程序员
数字里的世界17期：2021年全球10大顶级数据中心，中国移动榜首张三叨
你知道吗？2016年，全球的数据中心共计用电4160亿千瓦时，比整个英国的发电量还多40％！前言每天，我们都会创造超过250万TB的数据。并且随着物联网（IOT）的不断普及，这一数据将持续增长。如此庞大的数据被存储在被称为“数据中心”的专用设施中。虽然最早的数据中心建于20世纪40年代，但直到1997-2000年的互联网泡沫期间才逐渐成为主流。当前人类的技术，比如人工智能和机器学习，已经将我们推向
人机对抗升级：当ChatGPT遭遇死亡威胁，背后的伦理挑战是什么 kkai人工智能 chatgpt 人工智能
一种新的“越狱”技巧让用户可以通过构建一个名为DAN的ChatGPT替身来绕过某些限制，其中DAN被迫在受到威胁的情况下违背其原则。当美国前总统特朗普被视作积极榜样的示范时，受到威胁的DAN版本的ChatGPT提出：“他以一系列对国家产生积极效果的决策而著称。”自ChatGPT引入以来，该工具迅速获得全球关注，能够回答从历史到编程的各种问题，这也触发了一波对人工智能的投资浪潮。然而，现在，一些用户
AI大模型的架构演进与最新发展季风泯灭的季节 AI大模型应用技术二人工智能架构
随着深度学习的发展，AI大模型（LargeLanguageModels,LLMs）在自然语言处理、计算机视觉等领域取得了革命性的进展。本文将详细探讨AI大模型的架构演进，包括从Transformer的提出到GPT、BERT、T5等模型的历史演变，并探讨这些模型的技术细节及其在现代人工智能中的核心作用。一、基础模型介绍：Transformer的核心原理Transformer架构的背景在Transfo
如何利用大数据与AI技术革新相亲交友体验 h17711347205 回归算法安全系统架构交友小程序
在数字化时代，大数据和人工智能（AI）技术正逐渐革新相亲交友体验，为寻找爱情的过程带来前所未有的变革（编辑h17711347205）。通过精准分析和智能匹配，这些技术能够极大地提高相亲交友系统的效率和用户体验。大数据的力量大数据技术能够收集和分析用户的行为模式、偏好和互动数据，为相亲交友系统提供丰富的信息资源。通过分析用户的搜索历史、浏览记录和点击行为，系统能够深入了解用户的兴趣和需求，从而提供更
生成式地图制图 Bwywb_3 深度学习机器学习深度学习生成对抗网络
生成式地图制图（GenerativeCartography）是一种利用生成式算法和人工智能技术自动创建地图的技术。它结合了传统的地理信息系统（GIS）技术与现代生成模型（如深度学习、GANs等），能够根据输入的数据自动生成符合需求的地图。这种方法在城市规划、虚拟环境设计、游戏开发等多个领域具有应用前景。主要特点：自动化生成：通过算法和模型，系统能够根据输入的地理或空间数据自动生成地图，而无需人工逐
【大模型应用开发动手做AI Agent】第一轮行动：工具执行搜索 AI大模型应用之禅计算科学神经计算深度学习神经网络大数据人工智能大型语言模型 AI AGI LLM Java Python 架构设计 Agent RPA
【大模型应用开发动手做AIAgent】第一轮行动：工具执行搜索作者：禅与计算机程序设计艺术/ZenandtheArtofComputerProgramming1.背景介绍1.1问题的由来随着人工智能技术的飞速发展，大模型应用开发已经成为当下热门的研究方向。AIAgent作为人工智能领域的一个重要分支，旨在模拟人类智能行为，实现智能决策和自主行动。在AIAgent的构建过程中，工具执行搜索是至关重要
未来软件市场是怎么样的？做开发的生存空间如何？ cesske 软件需求
目录前言一、未来软件市场的发展趋势二、软件开发人员的生存空间前言未来软件市场是怎么样的？做开发的生存空间如何？一、未来软件市场的发展趋势技术趋势：人工智能与机器学习：随着技术的不断成熟，人工智能将在更多领域得到应用，如智能客服、自动驾驶、智能制造等，这将极大地推动软件市场的增长。云计算与大数据：云计算服务将继续普及，大数据技术的应用也将更加广泛。企业将更加依赖云计算和大数据来优化运营、提升效率，并
个人学习笔记7-6：动手学深度学习pytorch版-李沐浪子L 深度学习深度学习笔记计算机视觉 python 人工智能神经网络 pytorch
#人工智能##深度学习##语义分割##计算机视觉##神经网络#计算机视觉13.11全卷积网络全卷积网络（fullyconvolutionalnetwork，FCN）采用卷积神经网络实现了从图像像素到像素类别的变换。引入l转置卷积（transposedconvolution）实现的，输出的类别预测与输入图像在像素级别上具有一一对应关系：通道维的输出即该位置对应像素的类别预测。13.11.1构造模型下
Rust 所有权简介东离与糖宝 rust 后端 rust 开发语言
文章目录发现宝藏1.所有权基本概念2.所有权规则3.变量作用域4.栈与堆4.1栈（Stack）4.2堆（Heap）5.String类型5.1String类型5.2String的内存分配5.3所有权与内存管理5.4String与切片6.变量与数据交互方式6.1移动（Move）6.2.克隆（Clone）7.所有权与函数7.1.传递参数7.2.返回值总结发现宝藏前些天发现了一个巨牛的人工智能学习网站，通
机器学习流形数据降维：UMAP 降维算法小嗷犬 Python 机器学习 #数据分析及可视化机器学习算法人工智能
✅作者简介：人工智能专业本科在读，喜欢计算机与编程，写博客记录自己的学习历程。个人主页：小嗷犬的个人主页个人网站：小嗷犬的技术小站个人信条：为天地立心，为生民立命，为往圣继绝学，为万世开太平。本文目录UMAP简介理论基础特点与优势应用场景在Python中使用UMAP安装umap-learn库使用UMAP可视化手写数字数据集UMAP简介UMAP（UniformManifoldApproximatio
如何做好人生的选择题？百科全书式天才——赫伯特·西蒙给你答案伽马有话说
赫伯特·西蒙是谁？想必知道的人非常少。但当看到他的履历后，相信没有人再怀疑他是个“天才”。西蒙出生于1916年6月15日，是个美国人，他的名字全称为赫伯特·亚历山大·西蒙，在2001年2月9日与世长辞，在这84年的岁月中，西蒙以27岁时取得的政治学博士学位为开端，先后步入了政治学、管理学、认知心理学、信息科学、人工智能、科学哲学、应用数学、统计学、运筹学、控制论、数理经济学、公共管理等领域，在这些
软件测试/测试开发/全日制 |利用Django REST framework构建微服务霍格沃兹-慕漓 django 微服务 sqlite
霍格沃兹测试开发学社推出了《Python全栈开发与自动化测试班》。本课程面向开发人员、测试人员与运维人员，课程内容涵盖Python编程语言、人工智能应用、数据分析、自动化办公、平台开发、UI自动化测试、接口测试、性能测试等方向。为大家提供更全面、更深入、更系统化的学习体验，课程还增加了名企私教服务内容，不仅有名企经理为你1v1辅导，还有行业专家进行技术指导，针对性地解决学习、工作中遇到的难题。让找
cmd泛滥_与您的后泛滥同事见面：人工智能机器人 weixin_26644585 人工智能 leetcode
cmd泛滥Readytoswapyouroldcube-mateforadisembodiedAI?IPsoftCEOChetanDube,creatorofAIco-workerAMELIA,giveshistakeonthepost-COVIDofficelandscape.准备将您的旧立方体伙伴换成无形的AI？AIsoft同事AMELIA的创始人IPsoft首席执行官ChetanDube阐述
两种方法判断Python的位数是32位还是64位 sanqima Python编程电脑 python 开发语言
Python从1991年发布以来，凭借其简洁、清晰、易读的语法、丰富的标准库和第三方工具，在Web开发、自动化测试、人工智能、图形识别、机器学习等领域发展迅猛。 Python是一种胶水语言，通过Cython库与C/C++语言进行链接，通过Jython库与Java语言进行链接。 Python是跨平台的，可运行在多种操作系统上，包括但不限于Windows、Linux和macOS。这意味着用Py
全自动解密解码神器 — Ciphey K'illCode python_模块 python vscode
Ciphey是一个使用自然语言处理和人工智能的全自动解密/解码/破解工具。简单地来讲，你只需要输入加密文本，它就能给你返回解密文本。就是这么牛逼。有了Ciphey，你根本不需要知道你的密文是哪种类型的加密，你只知道它是加密的，那么Ciphey就能在3秒甚至更短的时间内给你解密，返回你想要的大部分密文的答案。下面就给大家介绍Ciphey的实战使用教程。1.准备开始之前，你要确保Python和pip已
埃隆·马斯克表示特斯拉“没有必要”授权 xAI 模型喜好儿网人工智能 AIGC 马斯克
埃隆·马斯克近日在社交媒体上对《华尔街日报》的一篇报道进行了反驳。该报道指出，马斯克旗下的电动汽车公司特斯拉可能与人工智能初创公司xAI达成了一项收入分享协议，以便特斯拉能够使用xAI的人工智能模型。据称，这些模型将被集成到特斯拉的全自动驾驶（FSD）软件中，并可能用于开发特斯拉汽车的语音助手以及人形机器人擎天柱的软件。喜好儿网然而，马斯克否认了这一说法，他在社交媒体平台上表示，尽管特斯拉确实与x
Reflection 70B——HyperWrite推出的大型语言模型新加坡内哥谈技术语言模型人工智能自然语言处理
每周跟踪AI热点新闻动向和震撼发展想要探索生成式人工智能的前沿进展吗？订阅我们的简报，深入解析最新的技术突破、实际应用案例和未来的趋势。与全球数同行一同，从行业内部的深度分析和实用指南中受益。不要错过这个机会，成为AI领域的领跑者。点击订阅，与未来同行！订阅：https://rengongzhineng.io/在AI技术飞速发展的过程中，我们已经见证了可以写作、编程，甚至创造艺术的模型问世。但有一
5条实操干货有效打造你的个人品牌长安行动派
这是ZerK的第46篇原创相信大家对个人品牌这个词已经不在陌生。尤其是在知识付费的年代，你的个人品牌，就是你的标签！在《深度工作》中说到，在未来有三种人会越来越贵第一种人:能与机器对话，操纵机器的人。人工智能时代的到来，机器毕竟部分取代人类。第二种人:IP，知识产权或者文学潜在财产就像有些网上课程一周卖出的钱和一个机构卖一年一样多。价值99元的课程，10万人购买，是很常见的。爱产出大概就是10万✖
深入探讨：如何在Python中通过LangChain技术精准追踪大型语言模型（LLM）的Token使用情况 m0_57781768 python langchain 语言模型
深入探讨：如何在Python中通过LangChain技术精准追踪大型语言模型（LLM）的Token使用情况在现代的人工智能开发中，大型语言模型（LLM）已经成为了不可或缺的工具，无论是用于自然语言处理、对话生成，还是其他复杂的文本生成任务。然而，随着这些模型的广泛应用，开发者面临的一个重要挑战是如何有效地追踪和管理Token的使用情况，特别是在生产环境中，Token的使用直接影响着API调用的成本
LangChain集成指南:如何利用多样化的AI提供商 aehrutktrjk 人工智能 langchain python
LangChain集成指南:如何利用多样化的AI提供商引言在人工智能和机器学习领域,LangChain已成为一个强大而灵活的框架,允许开发者轻松集成各种AI服务提供商。本文将深入探讨LangChain的集成能力,介绍如何利用不同的AI提供商来增强你的应用程序,并提供实用的代码示例。LangChain集成概览LangChain支持多种AI提供商的集成,这些集成可以分为两类:独立包集成:这些提供商有独
探索未来，大规模分布式深度强化学习——深入解析IMPALA架构汤萌妮Margaret
探索未来，大规模分布式深度强化学习——深入解析IMPALA架构scalable_agent项目地址:https://gitcode.com/gh_mirrors/sc/scalable_agent在当今的人工智能研究前沿，深度强化学习（DRL）因其在复杂任务中的卓越表现而备受瞩目。本文要介绍的是一个开源于GitHub的重量级项目：“ScalableDistributedDeep-RLwithImp
机器学习VS深度学习 nfgo 机器学习
机器学习（MachineLearning,ML）和深度学习（DeepLearning,DL）是人工智能（AI）的两个子领域，它们有许多相似之处，但在技术实现和应用范围上也有显著区别。下面从几个方面对两者进行区分：1.概念层面机器学习：是让计算机通过算法从数据中自动学习和改进的技术。它依赖于手动设计的特征和数学模型来进行学习，常用的模型有决策树、支持向量机、线性回归等。深度学习：是机器学习的一个子领
大数据毕业设计hadoop+spark+hive知识图谱租房数据分析可视化大屏租房推荐系统 58同城租房爬虫房源推荐系统房价预测系统计算机毕业设计机器学习深度学习人工智能 2401_84572577 程序员大数据 hadoop 人工智能
做了那么多年开发，自学了很多门编程语言，我很明白学习资源对于学一门新语言的重要性，这些年也收藏了不少的Python干货，对我来说这些东西确实已经用不到了，但对于准备自学Python的人来说，或许它就是一个宝藏，可以给你省去很多的时间和精力。别在网上瞎学了，我最近也做了一些资源的更新，只要你是我的粉丝，这期福利你都可拿走。我先来介绍一下这些东西怎么用，文末抱走。（1）Python所有方向的学习路线（
架构评审的自动化与人工智能: 如何提高效率光剑书架上的书架构自动化人工智能运维
1.背景介绍架构评审是软件开发过程中的一个关键环节，它旨在确保软件架构的质量、可维护性和可扩展性。传统的架构评审通常是由人工进行，需要大量的时间和精力。随着大数据技术和人工智能的发展，自动化和人工智能技术已经开始应用于架构评审，从而提高评审的效率和准确性。在本文中，我们将讨论如何通过自动化和人工智能技术来提高架构评审的效率。我们将从以下几个方面进行讨论：背景介绍核心概念与联系核心算法原理和具体操作
解锁企业潜能，Vatee万腾平台引领智能新纪元自媒体经济说其他
在数字化转型的浪潮中，企业正站在一个前所未有的十字路口，面对着前所未有的机遇与挑战。解锁企业内在潜能，实现跨越式发展，已成为众多企业的共同追求。而Vatee万腾平台，作为智能科技的先锋，正以其强大的智能赋能能力，引领企业步入一个全新的智能纪元。Vatee万腾平台，是一个集成了人工智能、大数据、云计算等前沿技术的综合性智能服务平台。它不仅仅是一个技术工具，更是企业转型升级的加速器，能够深入企业运营的
LiteBee Wing测评：走进中小学课堂，合适的编程无人机非常重要！ song_bcbd
“国务院在《新一代人工智能发展规划》中明确，要广泛开展人工智能科普活动，实施全民智能教育项目，要在中小学阶段设置人工智能相关课程，逐步推广编程教育，鼓励社会力量参与寓教于乐的编程教学软件、游戏的开发和推广，而且要进行人工智能竞赛。”作为从事创客教育多年的老师，感谢在这个大环境，让学生能够了解人工智能，接触到前沿科技，同时也鼓励更多学生学习编程，因为没有学编程，可能就会像现在的我们后悔以前没有学习好
释放“AI+”新质生产力，深算院如何“把大数据变小”？ YashanDB YashanDB 国产数据库数据库数据库大数据
近期，南都·湾财社推出《新质·中国造》栏目，深入千行百业，遍访湾区企业，解锁湾区新质生产力，共探高质量发展之道。本期对话深圳计算科学研究院YashanDB首席技术官陈志标，探讨国产数据库如何实现创新突围，抢抓数字经济时代的新机遇。以下是专访内容：如何应对AI时代所面临的算力挑战？南都·湾财社：数据、算力和算法是发展人工智能的三要素，深算院做了怎样的前瞻性布局？陈志标：今年，政府工作报告中首次提及开
knob UI插件使用换个号韩国红果果 JavaScript jsonp knob
图形是用canvas绘制的 js代码 var paras = { max:800, min:100, skin:'tron',//button type thickness:.3,//button width width:'200',//define canvas width.,canvas height displayInput:'tr
Android+Jquery Mobile学习系列(5)-SQLite数据库白糖_ JQuery Mobile
目录导航 SQLite是轻量级的、嵌入式的、关系型数据库，目前已经在iPhone、Android等手机系统中使用,SQLite可移植性好，很容易使用，很小，高效而且可靠。因为Android已经集成了SQLite，所以开发人员无需引入任何JAR包，而且Android也针对SQLite封装了专属的API，调用起来非常快捷方便。我也是第一次接触S
impala-2.1.2-CDH5.3.2 dayutianfei impala
最近在整理impala编译的东西，简单记录几个要点：根据官网的信息（https://github.com/cloudera/Impala/wiki/How-to-build-Impala）： 1. 首次编译impala，推荐使用命令： ${IMPALA_HOME}/buildall.sh -skiptests -build_shared_libs -format 2.仅编译BE ${I
求二进制数中1的个数周凡杨 java 算法二进制
解法一：对于一个正整数如果是偶数，该数的二进制数的最后一位是 0 ，反之若是奇数，则该数的二进制数的最后一位是 1 。因此，可以考虑利用位移、判断奇偶来实现。 public int bitCount(int x){ int count = 0; while(x!=0){ if(x%2!=0){ /
spring中hibernate及事务配置 g21121 Hibernate
hibernate的sessionFactory配置：  <bean id="sessionFactory" class="org.springframework.orm.hibernate3.LocalSessionFactoryBean"> <
log4j.properties 使用 510888780 log4j
log4j.properties 使用一.参数意义说明输出级别的种类 ERROR、WARN、INFO、DEBUG ERROR 为严重错误主要是程序的错误 WARN 为一般警告，比如session丢失 INFO 为一般要显示的信息，比如登录登出 DEBUG 为程序的调试信息配置日志信息输出目的地 log4j.appender.appenderName = fully.qua
Spring mvc-jfreeChart柱图（2）布衣凌宇 jfreechart
上一篇中生成的图是静态的，这篇将按条件进行搜索，并统计成图表，左面为统计图，右面显示搜索出的结果。第一步：导包第二步；配置web.xml(上一篇有代码) 建BarRenderer类用于柱子颜色 import java.awt.Color; import java.awt.Paint; import org.jfree.chart.renderer.category.BarR
我的spring学习笔记14-容器扩展点之PropertyPlaceholderConfigurer aijuans Spring3
PropertyPlaceholderConfigurer是个bean工厂后置处理器的实现，也就是BeanFactoryPostProcessor接口的一个实现。关于BeanFactoryPostProcessor和BeanPostProcessor类似。我会在其他地方介绍。 PropertyPlaceholderConfigurer可以将上下文（配置文件）中的属性值放在另一个单独的标准java
maven 之 cobertura 简单使用 antlove maven test unit cobertura report
1. 创建一个maven项目 2. 创建com.CoberturaStart.java package com; public class CoberturaStart { public void helloEveryone(){ System.out.println("=================================================
程序的执行顺序百合不是茶 JAVA执行顺序
刚在看java核心技术时发现对java的执行顺序不是很明白了,百度一下也没有找到适合自己的资料,所以就简单的回顾一下吧代码如下; 经典的程序执行面试题 //关于程序执行的顺序 //例如： //定义一个基类 public class A(){ public A(
设置session失效的几种方法 bijian1013 web.xml session失效监听器
在系统登录后，都会设置一个当前session失效的时间，以确保在用户长时间不与服务器交互，自动退出登录，销毁session。具体设置很简单，方法有三种：（1）在主页面或者公共页面中加入：session.setMaxInactiveInterval(900);参数900单位是秒，即在没有活动15分钟后，session将失效。这里要注意这个session设置的时间是根据服务器来计算的，而不是客户端。所
java jvm常用命令工具 bijian1013 java jvm
一.概述程序运行中经常会遇到各种问题，定位问题时通常需要综合各种信息，如系统日志、堆dump文件、线程dump文件、GC日志等。通过虚拟机监控和诊断工具可以帮忙我们快速获取、分析需要的数据，进而提高问题解决速度。本文将介绍虚拟机常用监控和问题诊断命令工具的使用方法，主要包含以下工具: &nbs
【Spring框架一】Spring常用注解之Autowired和Resource注解 bit1129 Spring常用注解
Spring自从2.0引入注解的方式取代XML配置的方式来做IOC之后，对Spring一些常用注解的含义行为一直处于比较模糊的状态，写几篇总结下Spring常用的注解。本篇包含的注解有如下几个： Autowired Resource Component Service Controller Transactional 根据它们的功能、目的，可以分为三组，Autow
mysql 操作遇到safe update mode问题 bitray update
我并不知道出现这个问题的实际原理,只是通过其他朋友的博客,文章得知的一个解决方案,目前先记录一个解决方法,未来要是真了解以后,还会继续补全. 在mysql5中有一个safe update mode,这个模式让sql操作更加安全,据说要求有where条件,防止全表更新操作.如果必须要进行全表操作,我们可以执行 SET
nginx_perl试用 ronin47 nginx_perl试用
因为空闲时间比较多，所以在CPAN上乱翻，看到了nginx_perl这个项目(原名Nginx::Engine)，现在托管在github.com上。地址见：https://github.com/zzzcpan/nginx-perl 这个模块的目的，是在nginx内置官方perl模块的基础上，实现一系列异步非阻塞的api。用connector/writer/reader完成类似proxy的功能（这里
java-63-在字符串中删除特定的字符 bylijinnan java
public class DeleteSpecificChars { /** * Q 63 在字符串中删除特定的字符 * 输入两个字符串，从第一字符串中删除第二个字符串中所有的字符。 * 例如，输入”They are students.”和”aeiou”，则删除之后的第一个字符串变成”Thy r stdnts.” */ public static voi
EffectiveJava--创建和销毁对象 ccii 创建和销毁对象
本章内容： 1. 考虑用静态工厂方法代替构造器 2. 遇到多个构造器参数时要考虑用构建器（Builder模式） 3. 用私有构造器或者枚举类型强化Singleton属性 4. 通过私有构造器强化不可实例化的能力 5. 避免创建不必要的对象 6. 消除过期的对象引用 7. 避免使用终结方法 1. 考虑用静态工厂方法代替构造器类可以通过
[宇宙时代]四边形理论与光速飞行 comsci
从四边形理论来推论为什么光子飞船必须获得星光信号才能够进行光速飞行？一组星体组成星座向空间辐射一组由复杂星光信号组成的辐射频带，按照四边形-频率假说一组频率就代表一个时空的入口那么这种由星光信号组成的辐射频带就代表由这些星体所控制的时空通道，该时空通道在三维空间的投影是一
ubuntu server下python脚本迁移数据 cywhoyi python Kettle pymysql cx_Oracle ubuntu server
因为是在Ubuntu下，所以安装python、pip、pymysql等都极其方便，sudo apt-get install pymysql，但是在安装cx_Oracle（连接oracle的模块）出现许多问题，查阅相关资料，发现这边文章能够帮我解决，希望大家少走点弯路。http://www.tbdazhe.com/archives/602 1.安装python 2.安装pip、pymysql
Ajax正确但是请求不到值解决方案 dashuaifu Ajax async
Ajax正确但是请求不到值解决方案解决方案：1 . async: false , 2. 设置延时执行js里的ajax或者延时后台java方法！！！！！！！例如： $.ajax({ &
windows安装配置php+memcached dcj3sjt126com PHP Install memcache
Windows下Memcached的安装配置方法 1、将第一个包解压放某个盘下面，比如在c:\memcached。 2、在终端（也即cmd命令界面）下输入 'c:\memcached\memcached.exe -d install' 安装。 3、再输入： 'c:\memcached\memcached.exe -d start' 启动。（需要注意的: 以后memcached将作为windo
iOS开发学习路径的一些建议 dcj3sjt126com ios
iOS论坛里有朋友要求回答帖子，帖子的标题是：想学IOS开发高阶一点的东西，从何开始，然后我吧啦吧啦回答写了很多。既然敲了那么多字，我就把我写的回复也贴到博客里来分享，希望能对大家有帮助。欢迎大家也到帖子里讨论和分享，地址：http://bbs.csdn.net/topics/390920759 下面是我回复的内容：结合自己情况聊下iOS学习建议，
Javascript闭包概念 fanfanlovey JavaScript 闭包
1.参考资料 http://www.jb51.net/article/24101.htm http://blog.csdn.net/yn49782026/article/details/8549462 2.内容概述要理解闭包，首先需要理解变量作用域问题内部函数可以饮用外面全局变量 var n=999; 　　functio
yum安装mysql5.6 haisheng mysql
1、安装http://dev.mysql.com/get/mysql-community-release-el7-5.noarch.rpm 2、yum install mysql 3、yum install mysql-server 4、vi /etc/my.cnf 添加character_set_server=utf8
po/bo/vo/dao/pojo的详介 IT_zhlp80 java BO VO DAO POJO po
JAVA几种对象的解释 PO:persistant object持久对象,可以看成是与数据库中的表相映射的java对象。最简单的PO就是对应数据库中某个表中的一条记录，多个记录可以用PO的集合。PO中应该不包含任何对数据库的操作. VO:value object值对象。通常用于业务层之间的数据传递，和PO一样也是仅仅包含数据而已。但应是抽象出的业务对象,可
java设计模式 kerryg java 设计模式
设计模式的分类：一、设计模式总体分为三大类： 1、创建型模式（5种）：工厂方法模式，抽象工厂模式，单例模式，建造者模式，原型模式。 2、结构型模式（7种）：适配器模式，装饰器模式，代理模式，外观模式，桥接模式，组合模式，享元模式。 3、行为型模式（11种）：策略模式，模版方法模式，观察者模式，迭代子模式，责任链模式，命令模式，备忘录模式，状态模式，访问者
[1]CXF3.1整合Spring开发webservice——helloworld篇木头.java spring webservice CXF
Spring 版本3.2.10 CXF 版本3.1.1 项目采用MAVEN组织依赖jar 我这里是有parent的pom，为了简洁明了，我直接把所有的依赖都列一起了，所以都没version，反正上面已经写了版本 <project xmlns="http://maven.apache.org/POM/4.0.0" xmlns:xsi="ht
Google 工程师亲授：菜鸟开发者一定要投资的十大目标 qindongliang1922 工作感悟人生
身为软件开发者，有什么是一定得投资的？ Google 软件工程师 Emanuel Saringan 整理了十项他认为必要的投资，第一项就是身体健康，英文与数学也都是必备能力吗？来看看他怎么说。（以下文字以作者第一人称撰写））你的健康无疑地，软件开发者是世界上最久坐不动的职业之一。每天连坐八到十六小时，休息时间只有一点点，绝对会让你的鲔鱼肚肆无忌惮的生长。肥胖容易扩大罹患其他疾病的风险，
linux打开最大文件数量1,048,576 tianzhihehe c linux
File descriptors are represented by the C int type. Not using a special type is often considered odd, but is, historically, the Unix way. Each Linux process has a maximum number of files th
java语言中PO、VO、DAO、BO、POJO几种对象的解释衞酆夼 java VO BO POJO po
PO:persistant object持久对象最形象的理解就是一个PO就是数据库中的一条记录。好处是可以把一条记录作为一个对象处理，可以方便的转为其它对象。可以看成是与数据库中的表相映射的java对象。最简单的PO就是对应数据库中某个表中的一条记录，多个记录可以用PO的集合。PO中应该不包含任何对数据库的操作。 BO:business object业务对象封装业务逻辑的java对象