OneFlow深度学习框架

深度学习崛起十年：“开挂”的OpenAI革新者

来源｜The Robot Brains Podcast

编译｜OneFlow社区

AlexNet，AlphaGo，GPT、CLIP、DALL-E和Codex，这些在AI界轰动一时的杰作，对于任何一个AI领域的研究者来说，主导或参与上述任何一项项目都无疑可以成就一段辉煌的职业生涯，但是，偏偏就有人就能集齐这六龙珠。

更让人感到绝望的是，这个人的成就还不止于此。在他2012年博士毕业后的十年里，他的论文被引次数超过25万次，在AI学术界有着巨大影响力。此人就是OpenAI联合创始人兼首席科学家Ilya Sutskever。

（从左至右依次为Ilya Sutskever, Alex Krizhevsky, Geoffrey Hinton）

在多伦多大学读本科时，深度学习三巨头之一的Geoffrey Hinton就成了他的导师，当时这个领域一片荒芜，但他的学习动机非常明确，就是要对AI做出哪怕非常小但有意义的贡献。Hinton一开始给Sutskever的研究项目是改进随机邻居嵌入算法，后者的出色表现给Hinton留下了深刻印象。

2012年，在多伦多大学读博期间，在Hinton的指导下，他和博士生同学Alex Krizhevsky设计了AlexNet，并在当年的ImageNet大赛上一举夺魁。AlexNet的出现使得深度学习大放异彩，并让AI在过去10年里得到突飞猛进的发展。

博士毕业后，他加入了Hinton的新研究公司DNNResearch，2013年3月，这家只有三个人的创业公司被谷歌收购，Sutskever担任Google Brain的研究科学家。

期间，他与谷歌研究员Oriol Vinyals和Quoc Le提出了Seq2seq学习，开启了RNN广泛应用于语言任务的时代。他还参与开发了机器学习框架TensorFlow，用于大规模机器学习。更重要的是，他还参与研发了DeepMind的AlphaGo，该系统基于深度神经网络和蒙特卡罗树搜索方面进行训练，并使用强化学习算法自学习，他也是AlphaGo论文的作者之一。

2015年7月，Sutskever参加了一场有Sam Altman（Y Combinator前总裁）、Elon Musk和Greg Brockman（现OpenAI首席技术官）的饭局，他们一致决定要成立一个“工程型的AI实验室”。同年末，Sutskever与Greg Brockman共同创立OpenAI，致力于创造出通用人工智能，并获得了Elon Musk，Sam Altman和LinkedIn创始人Reid Hoffman等人的私人投资，在6年时间里，他们如今开发出了GPT、CLIP、DALL-E和Codex等震动业界的AI项目。

作为一个AI前沿领域的探索者，纵览其职业生涯，Sutskever的每一次转向似乎都能恰到好处地挖到黄金。

那么，他对AI发展的敏锐度来自何处，又如何看待未来神经网络、AI的发展机遇？在Pieter Abbeel主持的The Robot Brains Podcast节目中，Ilya Sutskever分享了他在多伦多大学、谷歌、OpenAI等经历的研究往事，在深度学习崛起十年之际，我们将了解到这个AI革新者和引领者背后的思考和分析。

以下为对话内容，OneFlow社区做了不改变原意的编译：

为何决定研究神经网络

Pieter Abbeel：很多人认为，新一轮AI高潮的到来是从2012年AlexNet的突破开始的，你是促成这一时刻发生的人之一。但在那之前，别人都在研究其他各种的计算机视觉方法，你为什么却在研究应用于计算机视觉的神经网络？

Ilya Sutskever：这一决定是由过去几年一系列认识产生的结果。第一个认识是，James Martens写的一篇名为《通过Hessian-Free优化深度学习》的论文第一次证明可以从监督数据进行端到端训练深度网络。

但在当时的某些情况下，大家都觉得无法训练深度网络。反向传播太弱了，你需要进行某种形式的预训练，然后才可能会有一些进展。而且，即使能进行端到端训练，深度网络到底能做什么？

当然，现在我们提到深度学习，就觉得训练神经网络是理所当然，只需要一个大型神经网络，输入数据，然后输出很不错的结果。

人们真正关注的是机器学习模型，他们希望可以有一种算法完美地训练这些模型。但是，如果你把这个条件强加给自己，并且想找到一个简单优雅的数学证明时，这最终会限制模型能力。

相比之下，神经网络基本算是小型并行计算机，尽管已经不算小了。而训练一个神经网络相当于用反向传播算法给这台并行计算机进行编程。所以当我看到Hessian优化的结果后，我真的很高兴，这意味着现在可以对并行计算机编程了。你可能觉得，也许有人会雄心勃勃地训练这些东西，但显然基本不可能成功，局部极小值是个大难题。但现在，你可以训练神经网络了。

第二个认识是，人类的视觉速度很快，最快几百毫秒就能识别出东西，尽管神经元的速度很慢。这意味着甚至不需要那么多的层来实现多好的视觉效果。如果有一个相当大的神经网络，那么可以通过调参在视觉应用上实现很好的效果。要是一开始就有做训练用的数据集就好了。然后ImageNet、GPU出现了，我就想，神经网络也必然会出现。

然后某一次我和Alex Krizhevsky聊天，他提到自己的GPU代码可以训练一个小的卷积网络，在60秒内输出很不错的结果，我感到很震惊。我想如果在图像上这么做肯定能成功。所以事情就是这样发生的。

Pieter Abbeel：我还记得你第一次告诉我“神经网络只是一个计算机程序”的情景，这甚至比Andrej Karpathy说软件2.0是用神经网络编程还要早好几年。但在神经网络取得成功之前，你就看到了这一点。你什么时候意识到神经网络在ImageNet上更有效？

Ilya Sutskever：我一直都相信这样做会有效。那时，Alex一直在训练神经网络，得到的结果越来越好，每周都有很大进步。

但从我的角度来看，当时的神经网络都不够大，最大的风险是我们是否有能力充分利用GPU来训练一个非常大的神经网络，它应该比其他所有的神经网络都要好。当然我们做的远远不止这些。

我们的计算机速度更快，神经网络也更大，但我们的目标是尽可能地利用当时的硬件走得更远，这就是风险所在。幸运的是，Alex用高度优化的CUDA内核消除了这个风险。

Pieter Abbeel：如今我们可以直接在PyTorch或TensorFlow中训练神经网络，但那时，你必须自己搭建一些专业的工具才能正常运行。我很好奇，当你比其他人更早知道AlexNet的突破发生后，你在想什么？

Ilya Sutskever：当时在思考两件事。首先我相信，我们已经证明了神经网络可以解决人类在短时间内可以解决的问题，我们已经证明了可以用适量的层来训练神经网络。因此，我认为我们可以把神经网络做得足够宽（wide），但如果想把神经网络做得很深（deep）却很难。如何做深还需要大量思考才可能解决。

那么我们能不能找到一些有趣的、不需要太多思考的问题？我考虑的实际是强化学习，而语言正是人们可以快速理解的东西，翻译也是语言领域一个着重需要解决的问题。

另一件事也是关于AIphaGo系统的，使用卷积网络或许会为当时其他的非神经网络系统提供非常好的直觉参考。

Pieter Abbeel：神经网络如何改变了AlphaGo系统的行为？

Ilya Sutskever：在深度学习之前，任何与AI有关的东西都会涉及某种搜索程序或某种硬编码的启发式方法。在这种情况下，真正有经验的工程师需要花很多时间认真思考：在什么情况下，他们应该继续做某事或停止做某事，还是扩展资源。他们的所有时间都花在找启发式方法上。

但是神经网络是形式化的直觉，会提供一种专家式的直觉。我曾经了解到，在任何一款游戏中，专业级玩家只要观察一下情况，马上就能有一种非常强烈的直觉：不是这么做就是那么做。然后在剩下的时间里，他就会考虑是这两个选择里的哪一个。

如果你相信神经网络可以完成人类短时间内完成的事情，神经网络就真的能做到。围棋这样的游戏就是一个大的“软柿子”（soft problem），我们是有能力做到的。

Pieter Abbeel：当我第一次听说围棋游戏使用卷积网络时，我的第一反应是，既然卷积以平移不变性而闻名，而围棋棋盘上是没办法保证“平移不变”的，因为一个特征所处的位置真的很重要。但很明显，这并没有阻止卷积网络的成功，而且它掌握了这种特征。

Ilya Sutskever：这又是并行计算机的力量，你能想象编写一个卷积网络来做正确的事情吗？这的确不可思议，但这的确是人们信念上的一次飞跃。我最后也间接参与了AlphaGo的论文。我有一个实习生叫Chris Maddison，我们一起想给Go应用超级卷积网络。

与此同时，谷歌收购了DeepMind，所有员工都去拜访过谷歌。我们与David Silver和Aja Huang（AlphaGo主要作者）进行了交谈，这是一个很酷的项目。DeepMind真的付出了很多努力，他们在这个项目上执行得非常出色。

Pieter Abbeel：AlexNet是大多数AI研究人员看到深度学习时代到来的新起点，而AlphaGo的面世可能让大多数人看到AI能够实现许多不可能的时刻。世界上大多数人都在关注这一点，比如在自然语言处理方面中发生了一些非常基本的、颠覆性的事情。

整个谷歌翻译系统已经用神经网络进行改造，尽管当时很多人认为神经网络只是特征识别。而特征应该是像语音或者是视觉上的信号，语言却是离散的、独立的。如何从这些连续的信号“跳转”到离散的、独立的语言上去？这两者差异很大。

Ilya Sutskever：如果你相信生物神经元和人工神经元没什么大的不同，那么你就会认为这个跳转非常自然。世界上最好的专业翻译应该是极度精通至少两种语言的人，他几乎可以马上把一种语言翻译为另一种语言。因此，在这个人的头脑中存在着一些层数相对较少的神经网络，可以完成这项任务。

如果我们在电脑里有一个规模没有那么大的神经网络，通过输入、输出多次训练这个神经网络，我们肯定能得到这样一个神经网络解决问题。因此，世界上极度精通两种语言的人类的存在，也可以证明神经网络可以做到。现在我们有了大型神经网络，我们的大脑也相当强大，也许你可以大胆地说，我们可以不断训练数字神经元，再少点儿噪音就可以了。

当然，现在神经网络还没有达到人类翻译的水平。但我们可以推断，既然生物神经元和人工神经元没有什么不同，那为什么神经网络不能做到？再等等吧。

Pieter Abbeel：你和谷歌的合作者发明了一种用神经网络进行机器翻译的方法，你能介绍下它的工作原理吗？

Ilya Sutskever：你所需要的只是一个大型神经网络，它能以某种方式吸收单词的某些表征。在AI领域我们经常使用“表征”这个词。比如字母a或者是cat这个单词，要怎么把它们传达给计算机或者神经网络？

计算机或神经网络会在单词或字母上建立某种映射，生成某种神经网络可以接受的形式。所以你只需要设计一本字典，然后把这些信号输入到神经网络，然后用某种方法让神经网络一次一个地接收这些信号，之后在翻译过程中一个一个地输出这些单词。这就是现在很流行的所谓的自回归建模方法。

用这个方法并不是因为它有多特别，只是因为比较方便。神经网络会做所有事情，它知道如何建立内部机制，如何构建神经元来正确地翻译每个单词的意思。

神经元会把它们分块、转换、编排，一次输出一个正确的单词。当然也有其他方式来设计其他的神经网络来接收这些单词的信号，现在人们也正在探索，比如扩散模型。也许神经网络能够并行地接收单词，做一些顺序性工作，然后并行地输出。

事实上，这并不重要。重要的是，我们只是以某种方式将单词呈现给神经网络，有办法让神经网络可以输出目标单词。

大学生涯与导师Hinton

Pieter Abbeel：是什么让你最终成为一名AI研究人员？

Ilya Sutskever：我在俄罗斯出生，以色列长大，16岁时移居加拿大。据我父母说，我在很小的时候就开始谈论AI。我也清楚地记得，曾经思考过AI的事情，还读到有文章称这个领域是在“用蛮力下棋”的说法。

很明显，AI似乎可以下国际象棋。但AI真正的核心应该是学习，这也是AI如此糟糕的缘由。因为它不学习，而人类一直在学习，那么我们能一直做到所有的学习吗？

自我去了多伦多大学后，我就找到了研究深度学习的教授Geoffrey Hinton。另一个原因是，他在训练神经网络，而神经网络似乎是更有希望的方向，因为它们没有明显的计算限制，尽管决策树这些在当时比较流行。

Pieter Abbeel：去多伦多大学后有没有想过，Hinton在这个领域研究了三四十年似乎一直没有什么起色，再研究三四十年后可能也不会成功？

Ilya Sutskever：我的动机非常明确，就是要对AI做出哪怕非常小但有意义的贡献。我认为学习并不总是完全有效的，如果因为我的存在，AI的研究变得更好了一点，那么我就成功了。

Pieter Abbeel：还记得自己第一次和Hinton见面时的场景吗？

Ilya Sutskever：我是在大三时第一次见到他。当时我的专业是数学，大家都认为数学很难，真正有天赋的人才会学习数学。我当初选择机器学习因为它不仅是真正有价值的研究，还因为所有聪明人都去学数学和物理了，我对这种状况感到高兴。

Pieter Abbeel：我在读Cade Metz的书时，Hinton讲述了他和你见面的事情。他当时给了你一篇论文，你回去读了之后说看不懂，他说没关系，你还在读本科，有什么不明白的他可以解释给你听。然后你说，手动操作的地方太多了，你不明白为什么他们不把整个学习过程自动化。你能看懂这篇论文，只是不明白他们为什么要这么做。Hinton心想，哇哦，有点儿意思。后来他给了你另一篇论文，你读后回来说，你也不理解为什么他们为每个应用程序都单独训练一个神经网络，为什么不能训练一个庞大的网络来完成所有的事？一起训练效果应该会更好。

这些事让我想起我们在OpenAI的时候，感觉你的思考总是走在我们前面，你会预测事情未来将如何发展。今天回过头来看，你好像真的知道几年后事情的发展是怎样的。

Ilya Sutskever：确有其事。我刚从事这个领域的时候，AI并不被人看好，还没有人做出什么成就，这个领域一片荒芜，也不清楚未来是否会有什么进展。

我一开始给自己制定的目标是，推进对AI有用的、有意义的一小步。这是我在相当长一段时间内的很明确的动机。在这个动机变得更清晰之前，这条路可能会更加崎岖陡峭，但同时也燃起了我们的斗志。

OpenAI和GPT的诞生

Pieter Abbeel：从多伦多大学开始研究生涯，到去谷歌工作，再到创立OpenAI公司，你似乎都是在恰当的时间更换自己的处境，做着领域内最具开创性的工作，这些转变是怎么发生的？

Ilya Sutskever：我记得我在谷歌的时候，感觉非常舒服，同时也非常不安。我认为有两个因素造成了这样的感觉：一方面是我可以展望未来10年，对事情的发展有点太清楚了，我不太喜欢那样；另一方面就是看到DeepMind在AlphaGo构建工作的经历，这非常鼓舞人心，我认为这是深度学习领域开始成熟的标志。

在这之前，AI领域的所有进展都是由从事小项目的一小部分研究人员推动的。大部分的工作都是以想法为重，然后通过工程执行以证明想法是有效的。但我觉得，AlphaGo的不同在于它展现了工程设计的重要性。

事实上，这个领域将发生变化，开始进入工程领域，工具变得非常可靠。接下来的问题是，如何真正训练这些网络？如何调试？如何设置分布式训练？有很多工作要做，而且堆积的东西相当深。

我觉得谷歌的文化与学术界文化非常相似，确实有利于产生激进的新奇想法。事实上，谷歌这些年在AI中产生了很多激进和革命性的想法，最明显的是过去几年的Transformer。

但我觉得这不会是AI进步的全部，它只是AI进步的一部分。如果把AI看作是身体，那还需要肌肉、骨骼和神经系统。如果你只有其中一个部件，挺好的，但整个事情不会有真正的进展，你需要集齐所有的部件。如果某个公司将这些部件都放在一起，就真的很好。

但我不知道怎么做，只是随便想想。某天，我收到了Sam Altman的电子邮件，他说让我们和一些很酷的人一起吃个饭吧。Greg Brookman、Elon Musk等人在那里，我们聊了聊在一个新的AI实验室里开始研究会很好。因为我也在思考同样的想法，我真的希望它是工程型的。看到Elon将参与其中，我想不到还能从比他更好的人身上学到大型工程项目方面的东西。我认为这就是OpenAI的真正起因。从我的角度来看，就像白日梦成真了。

Pieter Abbeel：在OpenAI成立初期，你打算怎么塑造它？

Ilya Sutskever：一开始其实有各方面的压力，而且我并不完全清楚如何马上开始行动。有一点明确的是，我们需要做某种大型项目。我对这个想法感到兴奋，如果你能很好地预测，就能在监督学习上取得进展，但除此之外，还不清楚该怎么做。

当时的情况是，DeepMind已经在强化学习领域取得了一些非常令人兴奋的进展。首先，通过对神经网络的训练，用强化学习来玩简单的电脑游戏，然后AlphaGo事件发生了，人们开始觉得强化学习也许可以做一些事情，但在过去，这看起来是一个不可能实现的任务。

在我们尝试了很多不同的项目后，最终决定，也许解决有挑战的实时战略游戏比如Dota。这是Greg一展身手的地方，他接手了这个项目，即使看起来真的不可能。但不知何故，他用最老套的深度学习方式发挥了作用，我们尝试过的最简单的策略梯度法最终奏效，并且从未停止过通过更大规模和更多训练进行改进。它证明了我们可以做大型项目。

Pieter Abbeel：最简单的方法最终奏效的确令人惊讶。在语言领域，OpenAI还做出了GPT模型，它的能力非常令人惊讶，对你来说，什么时候让你相信这是要去做的事情？

Ilya Sutskever：从我的角度来看，一件非常重要的事情是，我对无监督学习非常感兴趣。Alexnet、AlphaGo和Dota都是以某种方式向神经网络提供输入和期望的输出来进行训练，今天来看这种方式是非常直观的，而且，你至少可以有一个合理的强烈直觉，知道为什么监督学习、强化学习是可行的。但相比之下，至少在我看来，无监督学习要神秘得多。

到底什么是无监督学习？你可以通过简单的观察来了解这个世界，而不需要有一个“老师”来告诉你理想行为应该是什么。问题是，这怎么可能行得通？

普遍的想法是，也许你有某种任务，比如输入图像让神经网络以某种方式去转换它，然后产生相同的图像。但为什么这对你所关心的任务来说是件好事，是否有一些数学上的原因？

我觉得这很不令人满意，在我看来，无监督学习根本就没有好的数学基础，我真的为此感到困扰。经过大量的思考，我形成了这样的信念：实际上，如果你能很好地预测下一步，应该就有了一个很好的监督者。

具体来说，如果你能很好地预测下一个位（bit），那么就已经能提取出所有有意义的信息，模型以某种方式知道存在于信号中这些信息，它应该有一个所有概念的表征，就是语言模型上下文语境中的想法。

这是非常直观的，你可以适度准确地预测下一个单词。也许模型会知道单词只是由空格分隔的字符串。如果你预测得更好，你可能知道那儿有一个词汇表，但是你不擅长语法。如果你进一步改进你的预测，那么你的语法也会变得更好，也会突然产生一些语法上的莫名其妙的错误。但如果进一步改进你的预测，那么语义必须发挥作用，我觉得这同样也可以用来预测像素。

所以在某种程度上，我开始相信，这也许在预测方面做得非常好。有趣的是，现在每个人都知道无监督学习就是有效的。但在不久前，这似乎还是一件非常棘手的事。

回到GPT是如何产生的这个故事。真正朝这个方向迈出一步的项目是由Alec Radford领导的，他是GPT传奇的一个重要英雄，在那个项目里，我们训练神经系统和LSTM来为亚马逊产品的评论中预测下一个字。

我们发现，这个LSTM有一个与情绪相对应的神经元。换句话说，如果你阅读的评论是正面的，那么情绪神经元就会触发，如果你阅读的评论是负面的，那么情绪神经元就会抑制（fall）。这很有趣，验证了我们的猜想。

后来，我们非常高兴地看到Transformer神经网络架构出来了，我们相信长程依赖（Long-Term Dependency）真的很重要，而Transformer对长程依赖有一个非常干净、优雅且计算效率高的答案。

但在技术上，我们讨论了这些神经网络在某种程度上是深层的，直到最近都是这样，要训练深度神经网络相当困难。

以前用于训练模型和语言序列的神经网络，序列越长，网络就越深，就越难训练。但Transformer将深度与序列的长度解耦，所以可以用非常长的序列得到一个可管理的深度Transformer，这令人兴奋。这直接导致了GPT-1的面世，后来我们继续扩大参数规模，就得到了GPT-2和GPT-3。

Pieter Abbeel：GPT-3出来的时候，整个社区都异常兴奋，当你提供一点额外的文本，就可以让它做你想做的事情，甚至可以编写一些基础代码。它大概是怎么运作的？

Ilya Sutskever：你只需要有一个神经网络，还有一些文本，让它输出一个有根据的预测内容，这是对单词可能是什么的概率猜测。你可以根据神经系统输出的概率来挑选一个词，然后提交给它，让“神经元”一次又一次地预测下一个词。足够好的预测带来了你所梦想的一切。

Pieter Abbeel：让人印象深刻的一点是，GPT是一项非常实用的重大研究突破。当GPT开始有效时，你或者其他人是否已经开始考虑相关应用？

Ilya Sutskever：我们对潜在的应用绝对感到兴奋，以至于我们围绕GPT-3构建了API产品，以便人们可以去构建他们的语言应用。看待正在发生的事情的另一种视角是，AI只是不断地继续获得越来越多的能力。

要分辨某一研究进展是否真实，有时会比较棘手。假设你有一些很酷的Demo，可能很难理解这个应用进步的幅度，特别是如果你不知道这个Demo与他们的训练数据有多相似。这个领域已经非常成熟，你不再需要依靠Demo甚至是基准作为衡量进步的唯一指标。不过，产品的有用性是衡量进步的最真实指标。

AI如何影响生产力

Pieter Abbeel：你觉得这些工具将怎样帮助人类提高生产力？

Ilya Sutskever：短期内，生产力会逐步提高。而随着时间推移和AI系统能力的提高，生产力也会显著提升。长期来看，AI系统会让所有的工作都会由AI来完成，我非常有信心见证生产力的大幅提高。

Pieter Abbeel：人们会通过很多方面来思考，在这种背景下，当你赋予AI较强的生产力时，它最好一直做正确的事情。AI不会把事情搞砸，或误解人们想让他做的事。我对这个项目非常好奇，因为它将强化学习与GPT结合在一起。

Ilya Sutskever：退一步说，我们拥有的这些AI系统正变得越来越强大。它们强大的功能来自在非常大的数据集上训练它们，我们对于它们的作用有着直观了解。

我们有这些大型语言模型，有能力通过提示信息（prompt）来控制它们。事实上，语言模型越好，控制能力就越强，它就越容易通过提示信息来控制。但我们希望模型完全按照我们的意愿办事，或者尽可能接近我们的要求。

你刚刚提到的用人类反馈的强化学习来训练这些语言模型。现在强化学习不是针对模拟器而是针对人类裁判，这些人会告诉你输出是理想的还是不理想的。这种强化学习环境真的很令人兴奋，你甚至可以争辩说强化学习可能慢了一点，因为还没有很好的环境。

在强化学习中，通常会提供好坏两种结果。但是我们通过人类反馈的强化学习的方法，“老师”需要观察模型的两个输出，然后判断哪个更好。

比较两件事相对来说哪个更好是比判断一件事绝对的是好还是坏更简单的任务。然后我们做一点机器学习，从奖励模型中创建奖励，然后使用这个模型来训练神经网络。这是一个非常简单有效的事，你可以用精细的方式来控制这些语言模型和神经网络的行为。

最近我们一直在训练Instruction-following（指令跟踪）模型。实际上，人们可以通过GPT3中的开放API进行使用。

所以你需要非常聪明地指定你的提示信息来设计一种核心，并让模型做你想做的，提供一些例子，在这些例子中，指令跟踪模型以这种方式接受训练，可以真正做到我们让它做什么，它就做什么。有一个词在机器学习领域的一些子集里是已知的，但并不是所有的子集都知道。

但再往前，你想从各种方面学习“老师”，想使用机器学习，不仅仅通过提供有监督例子或奖励,但是你想有一个对话，在其中提出正确问题，来了解这个概念所需的信息。

这就是未来的发展趋势。现在这个方法已经成功的使用了，让GPT模型比自然情况下更一致（aligned）。

Pieter Abbeel：我理解的对齐是可以用个性化的方式调整它们，从而与特定的要求保持一致。就像我可以教你遵循我的喜好一样。

Ilya Sutskever：这是肯定可以的，我提到的指令追踪模型是一个单一模型。它已经被对齐了，已经通过训练和激励来追踪你给出的指示。它是一个非常方便的界面，使用这些神经网络可以让它们做任何你想做的事，可以用任何你想用的方式来训练它们。你也可以用任何方式进行个性化设置，用户可以在段落中指定或使用它们过去的一些操作。几乎一切都是可能的。

Pieter Abbeel：最近你和OpenAI的合作者一起发布了可以在同一模型中处理视觉和语言的CLIP和DALL-E，并根据需要有效地在两者之间进行转换。你们是如何做到的？

Ilya Sutskever：我认为潜在的动机是，未来的神经网络不会同时处理视觉和语言，这似乎令人难以置信。至少在我看来，有大量证据表明如果把神经网络做得很大，并且有一个合适的数据集。如果它们能生成语言，为什么不生成图像的语言呢？也许我们应该把它看作是一种探索，在图像和文本中训练神经网络，并使用DALL-E作为语境。

DALL-E实际上是一个在文本上训练的GPT3，像图像的文本表示一样，因此使用这些tokens来表示图像。从模型的角度来看，它只是一种时髦的语言，就像你可以在英语和法语文本上训练GPT。

那并不重要。如果你有一种不同的语言，某些人类语言和图像语言，那DALL-E的工作方式完全符合你的预期，看到神经系统生成图像仍然很有趣。CLIP是一个相反方向的探索，它学习了大量的视觉语境概念，健壮性非常好。

Pieter Abbeel：CLIP数据集比ImageNet大了多少？

Ilya Sutskever：大了数百倍，它有开放式类别，这些类别只是自由格式的文本，但它确实有点大。它需要多样化数据，如果数据集来源很窄，就会损害神经网络。

拥有更强大的神经网络

Piter Abbeel：回顾自AlexNet突破以来的过去10年，似乎每年都有新突破。当你展望未来时，是否有一些令你感到特别兴奋的事情在未来几年里可能会发生？

Ilya Sutskever：从某种意义上来说，深度学习的传奇故事要比过去10年时间还要长久。如果读了Rosenblatt在60年代的一些介绍就会觉得很有趣，他发明了感知器，是最早的可以在真实计算机上学习有趣东西的神经网络之一。

Rosenblatt曾称，总有一天神经网络会看、听到和能翻译，并成为你的朋友。他试图筹集资金来建造越来越大的计算机，也招来了一些学者的批评，这导致神经网络发展的首个低潮期到来。

我认为这些想法还在思考中，只是环境还没准备好。因为一旦需要数据和计算准备就绪，就能够抓住这个机会实现进步。我相信进展会继续，我们会拥有更强大的神经网络。我不想把可能发生的事情说得太具体。

这些事情很难预测，但好的一点是我们的神经系统更可靠，你可以相信它们的输出。当它们遇到不会的，只会告诉你，可能会要求进行验证。我认为这是非常有影响力的，它们会比现在采取更多的行动。

我认为，我们的神经网络仍然是惰性和被动（inert and passive）的，它们的用处会继续增加。我肯定我们需要一些新的想法，即使这些想法中看待事物的方式可能与现在不同。但很多深度学习的主要进展都是以这种形式出现的。

例如，监督学习的最新进展，我们只是训练了更大的语言模型，但它们过去就存在，只是我们才意识到语言模型的方向一直都是正确的。我们眼前的东西实际上比我们预期的要更强大，我期望这些系统的能力可以继续提高，它们将在世界上变得越来越有影响力。我们将看到难以置信的革命性产品，可以想象很多人都会拥有非常强大的AI。最终，人们会进入一个享受AI工作的世界。

Pieter Abbeel：那真的很美好，你的模型在某种意义上反映了一种愿景，AI的好处可能是无限的。把无限的利益集中在一小群人身上对其他人来说并不好。很多人都在讨论AI的成本可能会变得越来越高。我在想是不是钱越多，模型越大，性能就越好，还是未来会不一样？

Ilya Sutskever：找到“钱”半功倍的方法提高模型效率，这种动力是很强大的，它影响着这个领域的每个人。我期望在未来，硬件成本会下降，相关的方法会更有效率，可以用一小部分成本来做更多的事情。同时我认为模型越来越大是更好的，现实就是如此。

我希望有一种不同模型做不同事情的规则，有一些非常强大的模型用于特定的任务，更小更专业的模型也仍然非常有用。我也希望，对于每个级别的计算都有一些最佳的使用方法，人们发现这种方法并创建非常有趣的应用程序。

Pieter Abbeel：过去10年甚至更早，你在AI领域有许多研究突破。你有哪些习惯或特质帮助你拥有强大的创造力和生产力？

Ilya Sutskever：给出笼统的建议是很难的。但这两个答案可能会有帮助，也就是节约时间和努力。你得面对困境，解决这些困难后就能得到你想要的。

Pieter Abbeel：节约的时间会做什么？

Ilya Sutskever：我有很多独立的工作，和一些人会进行非常重要且深入的研究性谈话。这是我主要在做的事。

Pieter Abbeel：我了解到你也是个艺术家，这对提高创造力有帮助吗?

Ilya Sutskever：很难说，但我认为是有帮助的。

（本文已获得编译授权，来源：https://www.youtube.com/watch?v=fCoavgGZ64Y&t=699s）

其他人都在看

OneFlow实习岗位热招
AI将如何重振摩尔定律的良性循环
黄仁勋口述：英伟达的发展之道和星辰大海
Tenstorrent虫洞分析：挑战英伟达的新玩家
计算机架构的新黄金时代，GPU能否继续保持辉煌
30年做成三家独角兽公司，AI芯片创业的底层逻辑

欢迎下载体验OneFlow新一代开源深度学习框架：https://github.com/Oneflow-Inc/oneflow/https://github.com/Oneflow-Inc/oneflow/

你可能感兴趣的:(业界观点,神经网络,算法,python,人工智能,深度学习)

机器学习与深度学习间关系与区别 ℒℴѵℯ心·动ꦿ໊ོ꫞ 人工智能学习深度学习 python
一、机器学习概述定义机器学习（MachineLearning,ML）是一种通过数据驱动的方法，利用统计学和计算算法来训练模型，使计算机能够从数据中学习并自动进行预测或决策。机器学习通过分析大量数据样本，识别其中的模式和规律，从而对新的数据进行判断。其核心在于通过训练过程，让模型不断优化和提升其预测准确性。主要类型1.监督学习（SupervisedLearning）监督学习是指在训练数据集中包含输入
理解Gunicorn：Python WSGI服务器的基石范范0825 ipython linux 运维
理解Gunicorn：PythonWSGI服务器的基石介绍Gunicorn，全称GreenUnicorn，是一个为PythonWSGI（WebServerGatewayInterface）应用设计的高效、轻量级HTTP服务器。作为PythonWeb应用部署的常用工具，Gunicorn以其高性能和易用性著称。本文将介绍Gunicorn的基本概念、安装和配置，帮助初学者快速上手。1.什么是Gunico
Python数据分析与可视化实战指南 William数据分析 python python 数据
在数据驱动的时代，Python因其简洁的语法、强大的库生态系统以及活跃的社区，成为了数据分析与可视化的首选语言。本文将通过一个详细的案例，带领大家学习如何使用Python进行数据分析，并通过可视化来直观呈现分析结果。一、环境准备1.1安装必要库在开始数据分析和可视化之前，我们需要安装一些常用的库。主要包括pandas、numpy、matplotlib和seaborn等。这些库分别用于数据处理、数学
python os.environ 江湖偌大 python 深度学习
os.environ['TF_CPP_MIN_LOG_LEVEL']='0'#默认值，输出所有信息os.environ['TF_CPP_MIN_LOG_LEVEL']='1'#屏蔽通知信息（INFO）os.environ['TF_CPP_MIN_LOG_LEVEL']='2'#屏蔽通知信息和警告信息（INFO\WARNING）os.environ['TF_CPP_MIN_LOG_LEVEL']='
Python中os.environ基本介绍及使用方法鹤冲天Pro #Python python 服务器开发语言
文章目录python中os.environos.environ简介os.environ进行环境变量的增删改查python中os.environ的使用详解1.简介2.key字段详解2.1常见key字段3.os.environ.get()用法4.环境变量的增删改查和判断是否存在4.1新增环境变量4.2更新环境变量4.3获取环境变量4.4删除环境变量4.5判断环境变量是否存在python中os.envi
Pyecharts数据可视化大屏：打造沉浸式数据分析体验我的运维人生信息可视化数据分析数据挖掘运维开发技术共享
Pyecharts数据可视化大屏：打造沉浸式数据分析体验在当今这个数据驱动的时代，如何将海量数据以直观、生动的方式展现出来，成为了数据分析师和企业决策者关注的焦点。Pyecharts，作为一款基于Python的开源数据可视化库，凭借其丰富的图表类型、灵活的配置选项以及高度的定制化能力，成为了构建数据可视化大屏的理想选择。本文将深入探讨如何利用Pyecharts打造数据可视化大屏，并通过实际代码案例
Goolge earth studio 进阶4——路径修改与平滑陟彼高冈yu Google earth studio 进阶教程旅游
如果我们希望在大约中途时获得更多的城市鸟瞰视角。可以将相机拖动到这里并创建一个新的关键帧。camera_target_clip_7EarthStudio会自动平滑我们的路径，所以当我们通过这个关键帧时，不是一个生硬的角度，而是一个平滑的曲线。camera_target_clip_8路径上有贝塞尔控制手柄，允许我们调整路径的形状。右键单击，我们可以选择“平滑路径”，这是默认的自动平滑算法，或者我们可
Python教程：一文了解使用Python处理XPath 旦莫 Python进阶 python 开发语言
目录1.环境准备1.1安装lxml1.2验证安装2.XPath基础2.1什么是XPath？2.2XPath语法2.3示例XML文档3.使用lxml解析XML3.1解析XML文档3.2查看解析结果4.XPath查询4.1基本路径查询4.2使用属性查询4.3查询多个节点5.XPath的高级用法5.1使用逻辑运算符5.2使用函数6.实战案例6.1从网页抓取数据6.1.1安装Requests库6.1.2代
python os.environ_python os.environ 读取和设置环境变量 weixin_39605414 python os.environ
>>>importos>>>os.environ.keys()['LC_NUMERIC','GOPATH','GOROOT','GOBIN','LESSOPEN','SSH_CLIENT','LOGNAME','USER','HOME','LC_PAPER','PATH','DISPLAY','LANG','TERM','SHELL','J2REDIR','LC_MONETARY','QT_QPA
将cmd中命令输出保存为txt文本文件落难Coder Windows cmd window
最近深度学习本地的训练中我们常常要在命令行中运行自己的代码，无可厚非，我们有必要保存我们的炼丹结果，但是复制命令行输出到txt是非常麻烦的，其实Windows下的命令行为我们提供了相应的操作。其基本的调用格式就是：运行指令>输出到的文件名称或者具体保存路径测试下，我打开cmd并且ping一下百度：pingwww.baidu.com>./data.txt看下相同目录下data.txt的输出：如果你再
基于社交网络算法优化的二维最大熵图像分割智能算法研学社（Jack旭）智能优化算法应用图像分割算法 php 开发语言
智能优化算法应用：基于社交网络优化的二维最大熵图像阈值分割-附代码文章目录智能优化算法应用：基于社交网络优化的二维最大熵图像阈值分割-附代码1.前言2.二维最大熵阈值分割原理3.基于社交网络优化的多阈值分割4.算法结果：5.参考文献：6.Matlab代码摘要：本文介绍基于最大熵的图像分割，并且应用社交网络算法进行阈值寻优。1.前言阅读此文章前，请阅读《图像分割：直方图区域划分及信息统计介绍》htt
探索OpenAI和LangChain的适配器集成：轻松切换模型提供商 nseejrukjhad langchain easyui 前端 python
#探索OpenAI和LangChain的适配器集成：轻松切换模型提供商##引言在人工智能和自然语言处理的世界中，OpenAI的模型提供了强大的能力。然而，随着技术的发展，许多人开始探索其他模型以满足特定需求。LangChain作为一个强大的工具，集成了多种模型提供商，通过提供适配器，简化了不同模型之间的转换。本篇文章将介绍如何使用LangChain的适配器与OpenAI集成，以便轻松切换模型提供商
使用Faiss进行高效相似度搜索 llzwxh888 faiss python
在现代AI应用中，快速和高效的相似度搜索是至关重要的。Faiss（FacebookAISimilaritySearch）是一个专门用于快速相似度搜索和聚类的库，特别适用于高维向量。本文将介绍如何使用Faiss来进行相似度搜索，并结合Python代码演示其基本用法。什么是Faiss？Faiss是一个由FacebookAIResearch团队开发的开源库，主要用于高维向量的相似性搜索和聚类。Faiss
python是什么意思中文-在python中%是什么意思编程大乐趣
Python中%有两种：1、数值运算：%代表取模，返回除法的余数。如：>>>7%212、%操作符（字符串格式化，stringformatting），说明如下：%[(name)][flags][width].[precision]typecode(name)为命名flags可以有+，-，''或0。+表示右对齐。-表示左对齐。''为一个空格，表示在正数的左侧填充一个空格，从而与负数对齐。0表示使用0填
深入理解 MultiQueryRetriever：提升向量数据库检索效果的强大工具 nseejrukjhad 数据库 python
深入理解MultiQueryRetriever：提升向量数据库检索效果的强大工具引言在人工智能和自然语言处理领域，高效准确的信息检索一直是一个关键挑战。传统的基于距离的向量数据库检索方法虽然广泛应用，但仍存在一些局限性。本文将介绍一种创新的解决方案：MultiQueryRetriever，它通过自动生成多个查询视角来增强检索效果，提高结果的相关性和多样性。MultiQueryRetriever的工
Day1笔记-Python简介&标识符和关键字&输入输出 ~在杰难逃~ Python python 开发语言大数据数据分析数据挖掘
大家好，从今天开始呢，杰哥开展一个新的专栏，当然，数据分析部分也会不定时更新的，这个新的专栏主要是讲解一些Python的基础语法和知识，帮助0基础的小伙伴入门和学习Python，感兴趣的小伙伴可以开始认真学习啦！一、Python简介【了解】1.计算机工作原理编程语言就是用来定义计算机程序的形式语言。我们通过编程语言来编写程序代码，再通过语言处理程序执行向计算机发送指令，让计算机完成对应的工作，编程
python八股文面试题分享及解析(1) Shawn________ python
#1.'''a=1b=2不用中间变量交换a和b'''#1.a=1b=2a,b=b,aprint(a)print(b)结果：21#2.ll=[]foriinrange(3):ll.append({'num':i})print(11)结果:#[{'num':0},{'num':1},{'num':2}]#3.kk=[]a={'num':0}foriinrange(3):#0,12#可变类型，不仅仅改变
121. 买卖股票的最佳时机薄荷糖的味道_fb40
给定一个数组，它的第i个元素是一支给定股票第i天的价格。如果你最多只允许完成一笔交易（即买入和卖出一支股票），设计一个算法来计算你所能获取的最大利润。注意你不能在买入股票前卖出股票。示例1:输入:[7,1,5,3,6,4]输出:5解释:在第2天（股票价格=1）的时候买入，在第5天（股票价格=6）的时候卖出，最大利润=6-1=5。注意利润不能是7-1=6,因为卖出价格需要大于买入价格。示例2:输入:
人工智能时代，程序员如何保持核心竞争力？ jmoych 人工智能
随着AIGC（如chatgpt、midjourney、claude等）大语言模型接二连三的涌现，AI辅助编程工具日益普及，程序员的工作方式正在发生深刻变革。有人担心AI可能取代部分编程工作，也有人认为AI是提高效率的得力助手。面对这一趋势,程序员应该如何应对?是专注于某个领域深耕细作，还是广泛学习以适应快速变化的技术环境?又或者，我们是否应该将重点转向AI无法轻易替代的软技能？让我们一起探讨程序员
每日算法&面试题，大厂特训二十八天——第二十天（树）肥学 ⚡算法题⚡面试题每日精进 java 算法数据结构
目录标题导读算法特训二十八天面试题点击直接资料领取导读肥友们为了更好的去帮助新同学适应算法和面试题，最近我们开始进行专项突击一步一步来。上一期我们完成了动态规划二十一天现在我们进行下一项对各类算法进行二十八天的一个小总结。还在等什么快来一起肥学进行二十八天挑战吧！！特别介绍小白练手专栏，适合刚入手的新人欢迎订阅编程小白进阶python有趣练手项目里面包括了像《机器人尬聊》《恶搞程序》这样的有趣文章
Python快速入门 —— 第三节：类与对象孤华暗香 Python快速入门 python 开发语言
第三节：类与对象目标：了解面向对象编程的基础概念，并学会如何定义类和创建对象。内容：类与对象：定义类：class关键字。类的构造函数：__init__()。类的属性和方法。对象的创建与使用。示例：classStudent:def__init__(self,name,age,major):self.name&#
pyecharts——绘制柱形图折线图 2224070247 信息可视化 python java 数据可视化
一、pyecharts概述自2013年6月百度EFE(ExcellentFrontEnd）数据可视化团队研发的ECharts1.0发布到GitHub网站以来，ECharts一直备受业界权威的关注并获得广泛好评，成为目前成熟且流行的数据可视化图表工具，被应用到诸多数据可视化的开发领域。Python作为数据分析领域最受欢迎的语言，也加入ECharts的使用行列，并研发出方便Python开发者使用的数据
回溯算法-重新安排行程 chirou_ 算法数据结构图论 c++图搜索
leetcode332.重新安排行程这题我还没自己ac过，只能现在凭着刚学完的热乎劲把我对题解的理解记下来。本题我认为对数据结构的考察比较多，用什么数据结构去存数据，去读取数据，都是很重要的。classSolution{private:unordered_map>targets;boolbacktracking(intticketNum,vector&result){//1.确定参数和返回值//2
Python 实现图片裁剪（附代码） | Python工具剑客阿良_ALiang
前言本文提供将图片按照自定义尺寸进行裁剪的工具方法，一如既往的实用主义。环境依赖ffmpeg环境安装，可以参考我的另一篇文章：windowsffmpeg安装部署_阿良的博客-CSDN博客本文主要使用到的不是ffmpeg，而是ffprobe也在上面这篇文章中的zip包中。ffmpy安装：pipinstallffmpy-ihttps://pypi.douban.com/simple代码不废话了，上代码
【华为OD技术面试真题 - 技术面】- python八股文真题题库（4) 算法大师华为od 面试 python
华为OD面试真题精选专栏：华为OD面试真题精选目录:2024华为OD面试手撕代码真题目录以及八股文真题目录文章目录华为OD面试真题精选**1.Python中的`with`**用途和功能自动资源管理示例：文件操作上下文管理协议示例代码工作流程解析优点2.\_\_new\_\_和**\_\_init\_\_**区别__new____init__区别总结3.**切片（Slicing）操作**基本切片语法
python os 环境变量 CV矿工 python 开发语言 numpy
环境变量：环境变量是程序和操作系统之间的通信方式。有些字符不宜明文写进代码里，比如数据库密码，个人账户密码，如果写进自己本机的环境变量里，程序用的时候通过os.environ.get（）取出来就行了。os.environ是一个环境变量的字典。环境变量的相关操作importos"""设置/修改环境变量：os.environ[‘环境变量名称’]=‘环境变量值’#其中key和value均为string类
Python爬虫解析工具之xpath使用详解 eqa11 python 爬虫开发语言
文章目录Python爬虫解析工具之xpath使用详解一、引言二、环境准备1、插件安装2、依赖库安装三、xpath语法详解1、路径表达式2、通配符3、谓语4、常用函数四、xpath在Python代码中的使用1、文档树的创建2、使用xpath表达式3、获取元素内容和属性五、总结Python爬虫解析工具之xpath使用详解一、引言在Python爬虫开发中，数据提取是一个至关重要的环节。xpath作为一门
Faiss：高效相似性搜索与聚类的利器网络·魚大数据 faiss
Faiss是一个针对大规模向量集合的相似性搜索库，由FacebookAIResearch开发。它提供了一系列高效的算法和数据结构，用于加速向量之间的相似性搜索，特别是在大规模数据集上。本文将介绍Faiss的原理、核心功能以及如何在实际项目中使用它。Faiss原理：近似最近邻搜索：Faiss的核心功能之一是近似最近邻搜索，它能够高效地在大规模数据集中找到与给定查询向量最相似的向量。这种搜索是近似的，
【华为OD技术面试真题 - 技术面】- python八股文真题题库（1）算法大师华为od 面试 python
华为OD面试真题精选专栏：华为OD面试真题精选目录:2024华为OD面试手撕代码真题目录以及八股文真题目录文章目录华为OD面试真题精选1.数据预处理流程数据预处理的主要步骤工具和库2.介绍线性回归、逻辑回归模型线性回归（LinearRegression）模型形式：关键点：逻辑回归（LogisticRegression）模型形式：关键点：参数估计与评估：3.python浅拷贝及深拷贝浅拷贝（Shal
数字里的世界17期：2021年全球10大顶级数据中心，中国移动榜首张三叨
你知道吗？2016年，全球的数据中心共计用电4160亿千瓦时，比整个英国的发电量还多40％！前言每天，我们都会创造超过250万TB的数据。并且随着物联网（IOT）的不断普及，这一数据将持续增长。如此庞大的数据被存储在被称为“数据中心”的专用设施中。虽然最早的数据中心建于20世纪40年代，但直到1997-2000年的互联网泡沫期间才逐渐成为主流。当前人类的技术，比如人工智能和机器学习，已经将我们推向
集合框架天子之骄 java 数据结构集合框架
集合框架集合框架可以理解为一个容器，该容器主要指映射(map)、集合(set)、数组(array)和列表(list)等抽象数据结构。从本质上来说，Java集合框架的主要组成是用来操作对象的接口。不同接口描述不同的数据类型。简单介绍： Collection接口是最基本的接口，它定义了List和Set，List又定义了LinkLi
Table Driven（表驱动）方法实例 bijian1013 java enum Table Driven 表驱动
实例一： /** * 驾驶人年龄段 * 保险行业，会对驾驶人的年龄做年龄段的区分判断 * 驾驶人年龄段：01-[18,25);02-[25,30);03-[30-35);04-[35,40);05-[40,45);06-[45,50);07-[50-55);08-[55,+∞) */ public class AgePeriodTest { //if...el
Jquery 总结 cuishikuan java jquery Ajax Web jquery方法
1.$.trim方法用于移除字符串头部和尾部多余的空格。如：$.trim(' Hello ') // Hello2.$.contains方法返回一个布尔值，表示某个DOM元素（第二个参数）是否为另一个DOM元素（第一个参数）的下级元素。如：$.contains(document.documentElement, document.body); 3.$
面向对象概念的提出麦田的设计者 java 面向对象面向过程
面向对象中，一切都是由对象展开的，组织代码，封装数据。在台湾面向对象被翻译为了面向物件编程，这充分说明了，这种编程强调实体。下面就结合编程语言的发展史，聊一聊面向过程和面向对象。 c语言由贝尔实
linux网口绑定被触发 linux
刚在一台IBM Xserver服务器上装了RedHat Linux Enterprise AS 4，为了提高网络的可靠性配置双网卡绑定。一、环境描述我的RedHat Linux Enterprise AS 4安装双口的Intel千兆网卡，通过ifconfig -a命令看到eth0和eth1两张网卡。二、双网卡绑定步骤： 2.1 修改/etc/sysconfig/network
XML基础语法肆无忌惮_ xml
一、什么是XML？ XML全称是Extensible Markup Language，可扩展标记语言。很类似HTML。XML的目的是传输数据而非显示数据。XML的标签没有被预定义，你需要自行定义标签。XML被设计为具有自我描述性。是W3C的推荐标准。二、为什么学习XML？用来解决程序间数据传输的格式问题做配置文件充当小型数据库三、XML与HTM
为网页添加自己喜欢的字体知了ing 字体秒表 css
@font-face { font-family: miaobiao;//定义字体名字 font-style: normal; font-weight: 400; src: url('font/DS-DIGI-e.eot');//字体文件 } 使用： <label style="font-size:18px;font-famil
redis范围查询应用-查找IP所在城市矮蛋蛋 redis
原文地址： http://www.tuicool.com/articles/BrURbqV 需求根据IP找到对应的城市原来的解决方案 oracle表（ip_country）：查询IP对应的城市： 1.把a.b.c.d这样格式的IP转为一个数字，例如为把210.21.224.34转为3524648994 2. select city from ip_
输入两个整数，计算百分比 alleni123 java
public static String getPercent(int x, int total){ double result=(x*1.0)/(total*1.0); System.out.println(result); DecimalFormat df1=new DecimalFormat("0.0000%");
百合——————>怎么学习计算机语言百合不是茶 java 移动开发
对于一个从没有接触过计算机语言的人来说，一上来就学面向对象，就算是心里上面接受的了，灵魂我觉得也应该是跟不上的，学不好是很正常的现象，计算机语言老师讲的再多，你在课堂上面跟着老师听的再多，我觉得你应该还是学不会的，最主要的原因是你根本没有想过该怎么来学习计算机编程语言，记得大一的时候金山网络公司在湖大招聘我们学校一个才来大学几天的被金山网络录取，一个刚到大学的就能够去和
linux下tomcat开机自启动 bijian1013 tomcat
方法一：修改Tomcat/bin/startup.sh 为: export JAVA_HOME=/home/java1.6.0_27 export CLASSPATH=$CLASSPATH:$JAVA_HOME/lib/tools.jar:$JAVA_HOME/lib/dt.jar:. export PATH=$JAVA_HOME/bin:$PATH export CATALINA_H
spring aop实例 bijian1013 java spring AOP
1.AdviceMethods.java package com.bijian.study.spring.aop.schema; public class AdviceMethods { public void preGreeting() { System.out.println("--how are you!--"); } } 2.beans.x
[Gson八]GsonBuilder序列化和反序列化选项enableComplexMapKeySerialization bit1129 serialization
enableComplexMapKeySerialization配置项的含义 Gson在序列化Map时，默认情况下，是调用Key的toString方法得到它的JSON字符串的Key，对于简单类型和字符串类型，这没有问题，但是对于复杂数据对象，如果对象没有覆写toString方法，那么默认的toString方法将得到这个对象的Hash地址。 GsonBuilder用于
【Spark九十一】Spark Streaming整合Kafka一些值得关注的问题 bit1129 Stream
包括Spark Streaming在内的实时计算数据可靠性指的是三种级别： 1. At most once，数据最多只能接受一次，有可能接收不到 2. At least once, 数据至少接受一次，有可能重复接收 3. Exactly once 数据保证被处理并且只被处理一次，具体的多读几遍http://spark.apache.org/docs/lates
shell脚本批量检测端口是否被占用脚本 ronin47
#!/bin/bash cat ports |while read line do#nc -z -w 10 $line nc -z -w 2 $line 58422>/dev/null2>&1if[ $?-eq 0]then echo $line:ok else echo $line:fail fi done 这里的ports 既可以是文件
java-2.设计包含min函数的栈 bylijinnan java
具体思路参见：http://zhedahht.blog.163.com/blog/static/25411174200712895228171/ import java.util.ArrayList; import java.util.List; public class MinStack { //maybe we can use origin array rathe
Netty源码学习-ChannelHandler bylijinnan java netty
一般来说，“有状态”的ChannelHandler不应该是“共享”的，“无状态”的ChannelHandler则可“共享” 例如ObjectEncoder是“共享”的, 但 ObjectDecoder 不是因为每一次调用decode方法时，可能数据未接收完全（incomplete），它与上一次decode时接收到的数据“累计”起来才有可能是完整的数据，是“有状态”的 p
java生成随机数 cngolon java
方法一： /** * 生成随机数 * @author [email protected] * @return */ public synchronized static String getChargeSequenceNum(String pre){ StringBuffer sequenceNum = new StringBuffer(); Date dateTime = new D
POI读写海量数据 ctrain 海量数据
import java.io.FileOutputStream; import java.io.OutputStream; import org.apache.poi.xssf.streaming.SXSSFRow; import org.apache.poi.xssf.streaming.SXSSFSheet; import org.apache.poi.xssf.streaming
mysql 日期格式化date_format详细使用 daizj mysql date_format 日期格式转换日期格式化
日期转换函数的详细使用说明 DATE_FORMAT(date,format) Formats the date value according to the format string. The following specifiers may be used in the format string. The&n
一个程序员分享8年的开发经验 dcj3sjt126com 程序员
在中国有很多人都认为IT行为是吃青春饭的，如果过了30岁就很难有机会再发展下去!其实现实并不是这样子的，在下从事.NET及JAVA方面的开发的也有8年的时间了，在这里在下想凭借自己的亲身经历，与大家一起探讨一下。明确入行的目的很多人干IT这一行都冲着“收入高”这一点的，因为只要学会一点HTML, DIV+CSS，要做一个页面开发人员并不是一件难事，而且做一个页面开发人员更容
android欢迎界面淡入淡出效果 dcj3sjt126com android
很多Android应用一开始都会有一个欢迎界面，淡入淡出效果也是用得非常多的，下面来实现一下。主要代码如下： package com.myaibang.activity; import android.app.Activity;import android.content.Intent;import android.os.Bundle;import android.os.CountDown
linux 复习笔记之常见压缩命令 eksliang tar解压 linux系统常见压缩命令 linux压缩命令 tar压缩
转载请出自出处:http://eksliang.iteye.com/blog/2109693 linux中常见压缩文件的拓展名 *.gz gzip程序压缩的文件 *.bz2 bzip程序压缩的文件 *.tar tar程序打包的数据，没有经过压缩 *.tar.gz tar程序打包后，并经过gzip程序压缩 *.tar.bz2 tar程序打包后，并经过bzip程序压缩 *.zi
Android 应用程序发送shell命令 gqdy365 android
项目中需要直接在APP中通过发送shell指令来控制lcd灯，其实按理说应该是方案公司在调好lcd灯驱动之后直接通过service送接口上来给APP，APP调用就可以控制了，这是正规流程，但我们项目的方案商用的mtk方案，方案公司又没人会改，只调好了驱动，让应用程序自己实现灯的控制，这不蛋疼嘛！！！！发就发吧！一、关于shell指令：我们知道，shell指令是Linux里面带的
java 无损读取文本文件 hw1287789687 读取文件无损读取读取文本文件 charset
java 如何无损读取文本文件呢？以下是有损的 @Deprecated public static String getFullContent(File file, String charset) { BufferedReader reader = null; if (!file.exists()) { System.out.println("getFull
Firebase 相关文章索引 justjavac firebase
Awesome Firebase 最近谷歌收购Firebase的新闻又将Firebase拉入了人们的视野，于是我做了这个 github 项目。 Firebase 是一个数据同步的云服务，不同于 Dropbox 的「文件」，Firebase 同步的是「数据」，服务对象是网站开发者，帮助他们开发具有「实时」（Real-Time）特性的应用。开发者只需引用一个 API 库文件就可以使用标准 RE
C++学习重点 lx.asymmetric C++笔记
1.c++面向对象的三个特性：封装性，继承性以及多态性。 2.标识符的命名规则：由字母和下划线开头，同时由字母、数字或下划线组成；不能与系统关键字重名。 3.c++语言常量包括整型常量、浮点型常量、布尔常量、字符型常量和字符串性常量。 4.运算符按其功能开以分为六类：算术运算符、位运算符、关系运算符、逻辑运算符、赋值运算符和条件运算符。 &n
java bean和xml相互转换 q821424508 java bean xml xml和bean转换 java bean和xml转换
这几天在做微信公众号做的过程中想找个java bean转xml的工具，找了几个用着不知道是配置不好还是怎么回事，都会有一些问题，然后脑子一热谢了一个javabean和xml的转换的工具里，自己用着还行，虽然有一些约束吧，还是贴出来记录一下顺便你提一下下，这个转换工具支持属性为集合、数组和非基本属性的对象。 packag
C 语言初级位运算 1140566087 位运算 c
第十章位运算 1、位运算对象只能是整形或字符型数据，在VC6.0中int型数据占4个字节 2、位运算符：运算符作用 ~ 按位求反 << 左移 >> 右移 & 按位与 ^ 按位异或 | 按位或他们的优先级从高到低； 3、位运算符的运算功能： a、按位取反： ~01001101 = 101
14点睛Spring4.1-脚本编程 wiselyman spring4
14.1 Scripting脚本编程脚本语言和java这类静态的语言的主要区别是:脚本语言无需编译,源码直接可运行; 如果我们经常需要修改的某些代码,每一次我们至少要进行编译,打包,重新部署的操作,步骤相当麻烦; 如果我们的应用不允许重启,这在现实的情况中也是很常见的; 在spring中使用脚本编程给上述的应用场景提供了解决方案,即动态加载bean; spring支持脚本