AI科技大本营

刘铁岩谈机器学习：随波逐流的太多，我们需要反思

嘉宾 | 刘铁岩

整理 | 阿司匹林

来源 | AI科技大本营在线公开课

人工智能正受到越来越多的关注，而这波人工智能浪潮背后的最大推手就是“机器学习”。机器学习从业者在当下需要掌握哪些前沿技术？展望未来，又会有哪些技术趋势值得期待？

近期，AI科技大本营联合华章科技特别邀请到了微软亚洲研究院副院长刘铁岩博士进行在线公开课分享，为我们带来微软研究院最新的研究成果，以及对机器学习领域未来发展趋势的展望。

以下是本次公开课的精彩内容，AI科技大本营整理。

大家好，我是刘铁岩，来自微软亚洲研究院。今天非常荣幸，能跟大家一起分享一下微软研究院在机器学习领域取得的一些最新研究成果。

大家都知道，最近这几年机器学习非常火，也取得了很多进展。这张图总结了机器学习领域的最新工作，比如 ResNet、胶囊网络、Seq2Seq Model、Attention Mechanism 、GAN、Deep Reinforcement Learning 等等。

这些成果推动了机器学习领域的飞速发展，但这并不意味着机器学习领域已经非常成熟，事实上仍然存在非常大的技术挑战。比如现在主流机器学习算法需要依赖大量的训练数据和计算资源，才能训练出性能比较好的机器学习模型。同时，虽然深度学习大行其道，但我们对深度学习的理解，尤其是理论方面的理解还非常有限。深度学习为什么会有效，深度学习优化的损失函数曲面是什么样子？经典优化算法的优化路径如何？最近一段时间，学者们在这个方向做了很多有益的尝试，比如讨论随机梯度下降法在什么条件下可以找到全局最优解，或者它所得到的局部最优解跟全局最优解之间存在何种关系。

再比如，最近很多学者开始用自动化的方式帮助机器学习尤其是深度学习来调节超参数、搜寻神经网络的结构，相关领域称为元学习。其基本思想是用一个机器学习算法去自动地指导另一个机器学习算法的训练过程。但是我们必须要承认，元学习其实并没有走出机器学习的基本框架。更有趣的问题是，如何能够让一个机器学习算法去帮助另一个算法突破机器学习的现有边界，让机器学习的效果更好呢？这都是我们需要去回答的问题。沿着这些挑战，在过去的这几年里，微软亚洲研究院做了一些非常有探索性的学术研究。

对偶学习解决机器学习对大量有标签数据的依赖

首先，我们看看对偶学习。对偶学习主要是为了解决现有深度学习方法对训练数据过度依赖的问题。当我们没有标注好的训练数据时，是否还能做有意义的机器学习？在过去的几年里，人们做了很多尝试，比如无监督学习、半监督学习等等。但是无论如何，大家心里要清楚，只有有信号、有反馈、才能实现有效的学习，如果我们对这个世界一无所知，我们是不能进行有效的学习的。

沿着这个思路，我们在思考：除了人为提供的标签以外，是不是存在其他有效的反馈信号，能够形成学习的闭环？我们发现很多机器学习任务其实天然有结构对偶性，可以形成天然的闭环。

比如机器翻译。一方面我们会关心从英文翻译到中文，另一方面我们一定也关心从中文翻译到英文，否则就无法实现两个语种人群之间的无缝交流。再比如语音处理。我们关心语音识别的同时一定也关心语音合成，否则人和机器之间就没有办法实现真正的双向对话。还有图像理解、对话引擎、搜索引擎等等，其实它们都包含具有对偶结构的一对任务。

如何更加准确地界定人工智能的结构对偶性呢？我们说：如果第一个任务的输入恰好是第二个任务的输出，而第一个任务的输出恰好是第二个任务的输入，那么这两个任务之间就形成了某种结构的“对偶性”。把它们放在一起就会形成学习的闭环，这就是“对偶学习”的基本思想。

有了这样的思想以后，我们可以把两个对偶任务放到一起学，提供有效的反馈信号。这样即便没有非常多的标注样本，我们仍然可以提取出有效的信号进行学习。

对偶学习背后其实有着严格的数学解释。当两个任务互为对偶时，我们可以建立如下的概率联系：

这里 X 和 Y 分别对应某个任务的输入空间和输出空间，在计算 X 和 Y 的联合概率分布时有两种分解方法，既可以分解成 P(x)P(y|x; f) ，也可以分解成 P(y)P(x|y; g)。这里，P(y|x; f) 对应了一个机器学习模型，当我们知道输入 x 时，通过这个模型可以预测输出 y 的概率，我们把这个模型叫主任务的机器学习模型，P(x|y; g) 则是反过来，称之为对偶任务的机器学习模型。

有了这个数学联系以后，我们既可以做有效的无监督学习，也可以做更好的有监督学习和推断。比如我们利用这个联系可以定义一个正则项，使得有监督学习有更好的泛化能力。再比如，根据 P(x)P(y|x; f) 我们可以得到一个推断的结果，反过来利用贝叶斯公式，我们还可以得到用反向模型 g 做的推断，综合两种推断，我们可以得到更准确的结果。我们把以上提到的对偶学习技术应用在了机器翻译上，取得了非常好的效果，在中英新闻翻译任务上超过了普通人类的水平。

解决机器学习对大计算量的依赖

轻量级机器学习

最近一段时间，在机器学习领域有一些不好的风气。有些论文里会使用非常多的计算资源，比如动辄就会用到几百块 GPU卡甚至更多的计算资源。这样的结果很难复现，而且在一定程度上导致了学术研究的垄断和马太效应。

那么人们可能会问这样的问题：是不是机器学习一定要用到那么多的计算资源？我们能不能在计算资源少几个数量级的情况下，仍然训练出有意义的机器学习模型？这就是轻量级机器学习的研究目标。

在过去的几年里，我们的研究组做了几个非常有趣的轻量级机器学习模型。比如在 2015 发表的 lightLDA 模型，它是一个非常高效的主题模型。在此之前，世界上已有的大规模主题模型一般会用到什么样的计算资源？比如 Google 的 LDA 使用上万个 CPU cores，才能够通过几十个小时的训练获得 10 万个主题。为了降低对计算资源的需求，我们设计了一个基于乘性分解的全新采样算法，把每一个 token 的平均采样复杂度降低到 O(1)，也就是说采样复杂度不随着主题数的变化而变化。因此即便我们使用这个主题模型去做非常大规模的主题分析，它的运算复杂度也是很低的。例如，我们只使用了 300 多个 CPU cores，也就是大概 8 台主流的机器，就可以实现超过 100 万个主题的主题分析。

这个例子告诉大家，其实有时我们不需要使用蛮力去解决问题，如果我们可以仔细分析这些算法背后的机理，做算法方面的创新，就可以在节省几个数量级计算资源的情况下做出更大、更有效的模型。

同样的思想我们应用到了神经网络上面，2016 年发表的 LightRNN算法是迄今为止循环神经网络里面最高效的实现。当我们用 LigthtRNN 做大规模的语言模型时，得到的模型规模比传统的 RNN 模型小好几个数量级。比如传统模型大小在100GB 时，LightRNN 模型只有50MB，并且训练时间大幅缩短。不仅如此，LightRNN模型的 perplexity比传统RNN还要更好。

可能有些同学会产生疑问：怎么可能又小又好呢？其实，这来源于我们在循环神经网络语言模型的算法上所做的创新设计。我们把对 vocabulary 的表达从一维变到了两维，并且允许不同的词之间共享某一部分的 embedding 。至于哪些部分共享、哪些不共享，我们使用了一个二分图匹配的算法来确定。

第三个轻量型机器学习的算法叫 LightGBM，这个工具是 GBDT 算法迄今为止最高效的实现。LightGBM的背后是两篇 NIPS 论文，其中同样包含了很多技术创新，比如 Gradient-based one-side sampling，可以有效减少对样本的依赖； Exclusive feature bundling，可以在特征非常多的情况下，把一些不会发生冲突的特征粘合成比较 dense 的少数特征，使得建立特征直方图非常高效。同时我们还提出了 Voting-based parallelization 机制，可以实现非常好的加速比。所有这些技巧合在一起，就成就了LightGBM的高效率和高精度。

分布式机器学习

虽然我们做了很多轻量级的机器学习算法，但是当训练数据和机器学习模型特别大的时候，可能还不能完全解决问题，这时我们需要研究怎样利用更多的计算节点实现分布式的机器学习。

我们刚刚出版了一本新书——《分布式机器学习：算法、理论与实践》，对分布式机器学习做了非常好的总结，也把我们很多研究成果在这本书里做了详尽的描述。下面，我挑其中几个点，跟大家分享。

分布式机器学习的关键是怎样把要处理的大数据或大模型进行切分，在多个机器上做并行训练。一旦把这些数据和模型放到多个计算节点之后就会涉及到两个基本问题：首先，怎样实现不同机器之间的通信和同步，使得它们可以协作把机器学习模型训练好。其次，当每个计算节点都能够训练出一个局部模型之后，怎样把这些局部模型做聚合，最终形成一个统一的机器学习模型。

数据切分

数据切分听起来很简单，其实有很多门道。举个例子，一个常见的方式就是把数据做随机切分。比如我们有很多训练数据，随机切分成 N 份，并且把其中一份放到某个局部的工作节点上去训练。这种切分到底有没有理论保证？

我们知道机器学习有一个基本的假设，就是学习过程中的数据是独立同分布采样得来的，才有理论保证。但是前面提到的数据切分其实并不是随机的数据采样。从某种意义上讲，独立同分布采样是有放回抽样，而数据切分对应于无放回抽样。一个很有趣的理论问题是，我们在做数据切分时，是不是可以像有放回抽样一样，对学习过程有一定的理论保证呢？这个问题在我们的研究发表之前，学术界是没有完整答案的。

我们证明了：如果我先对数据进行全局置乱，然后再做数据切分，那么它和有放回的随机采样在收敛率上是基本一致的。但是如果我们只能做局部的数据打乱，二者之间的收敛率是有差距的。所以如果我们只能做局部的数据打乱，就不能训练太多 epoch，否则就会与原来的分布偏离过远，使得最后的学习效果不好。

异步通信

说完数据切分，我们再讲讲各个工作节点之间的通信问题。大家知道，有很多流行的分布式框架，比如 MapReduce，可以实现不同工作节点之间的同步计算。但在机器学习过程中，如果不同机器之间要做同步通信，就会出现瓶颈：有的机器训练速度比较快，有的机器训练速度比较慢，而整个集群会被这个集群里最慢的机器拖垮。因为其他机器都要跟它完成同步之后，才能往前继续训练。

为了实现高效的分布式机器学习，人们越来越关注异步通信，从而避免整个集群被最慢的机器拖垮。在异步通信过程中，每台机器完成本地训练之后就把局部模型、局部梯度或模型更新推送到全局模型上去，并继续本地的训练过程，而不去等待其他的机器。

但是人们一直对异步通信心有余悸。因为做异步通信的时候，同样有一些机器运算比较快，有一些机器运算比较慢，当运算比较快的机器将其局部梯度或者模型更新叠加到全局模型上以后，全局模型的版本就被更新了，变成了很好的模型。但是过了一段时间，运算比较慢的机器又把陈旧的梯度或者模型更新，叠加到全局模型上，这就会把原来做得比较好的模型给毁掉。人们把这个问题称为“延迟更新”。不过在我们的研究之前，没有人定量地刻画这个延迟会带来多大的影响。

在去年 ICML 上我们发表了一篇论文，用泰勒展开式定量刻画了标准的随机梯度下降法和异步并行随机梯队下降法的差距，这个差距主要是由于延迟更新带来的。如果我们简单粗暴地使用异步 SGD，不去处理延迟更新，其实就是使用泰勒展开里零阶项作为真实的近似。既然它们之间的差距在于高阶项的缺失，如果我们有能力把这些高阶项通过某种算法补偿回来，就可以使那些看起来陈旧的延迟梯度焕发青春。这就是我们提出的带有延迟补偿的随机梯度下降法。

这件事说起来很简单，但实操起来有很大的难度。因为在梯度函数的泰勒展开中的一阶项其实对应于原损失函数的二阶项，也就是所谓的海森矩阵（Hessian Matrix）。当模型很大时，计算海森矩阵要使用的内存和计算量都会非常大，使得这个算法并不实用。在我们的论文里，提出了一个非常高效的对海森矩阵的近似。我们并不需要真正去计算非常高维的海森矩阵并存储它，只需要比较小的计算和存储代价就可以实现对海参矩阵相当精确的近似。在此基础上，我们就可以利用泰勒展开，实现对原来的延迟梯度的补偿。我们证明了有延迟补偿的异步随机梯度下降法的收敛率比普通的异步随机梯度下降法要好很多，而且各种实验也表明它的效果确实达到了我们的预期。

模型聚合

除了异步通信以外，每个局部节点计算出一个局部模型之后，怎样聚合在一起也是一个值得思考的问题。在业界里最常用的方式是把各个不同的局部模型做简单的参数平均。但是，从理论上讲，参数平均仅在凸问题上是合理的。如果大家对凸函数的性质有一些了解，就知道如果模型是凸的，那么我们对凸模型参数进行平均后得到的模型的性能，不会比每个模型性能的平均值差。

但是当我们用这样的方式去处理深层神经网络这类严重非凸的模型时，就不再有理论保证了。我们在 2017 年这几篇论文里指出了这个理论的缺失，并指出我们不应该做模型参数的平均，而是应该做模型输出的平均，这样才能获得性能的保障，因为虽然神经网络模型是非凸的，但是常用的损失函数本身是凸的。

但是模型输出的平均相当于做了模型的集成，它会使模型的尺寸变大很多倍。当机器学习不断迭代时，这种模型的集成就会导致模型尺寸爆炸的现象。为了保持凸性带来的好处，同时又不会受到模型尺寸爆炸的困扰，我们需要在整个机器学习流程里不仅做模型集成，还要做有效的模型压缩。

这就是我们提出的模型集成-压缩环路。通过模型集成，我们保持了凸性带来的好处，通过模型压缩，我们避免了模型尺寸的爆炸，所以最终会取得一个非常好的折中效果。

深度学习理论探索

接下来我们讲讲如何探索深度学习的理论边界。我们都知道深度学习很高效，任意一个连续函数，只要一个足够复杂的深度神经网络都可以逼近得很好。但是这并不表示机器就真能学到好的模型。因为当目标函数的界面太复杂时，我们可能掉入局部极小值的陷阱，无法得到我们想要的最好模型。当模型太复杂时，还容易出现过拟合，在优化过程中可能做的不错，可是当你把学到的模型应用到未知的测试数据上时，效果不一定很好。因此对于深度学习的优化过程进行深入研究是很有必要的。

g-Space

这个方向上，今年我们做了一个蛮有趣的工作，叫 g-Space Deep Learning。

这个工作研究的对象是图像处理任务里常用的一大类深度神经网络，这类网络的激活函数是ReLU函数。ReLU是一个分段线性函数，在负半轴取值为0，在正半轴则是一个线性函数。ReLU Network 有一个众所周知的特点，就是正尺度不变性，但我们对于这个特点对神经网络优化影响的理解非常有限。

那么什么是正尺度不变性呢？我们来举个例子。这是一个神经网络的局部，假设中间隐节点的激活函数是ReLU函数。当我们把这个神经元两条输入边上面的权重都乘以一个正常数 c，同时把输出边上的权重除以同样的正常数 c，就得到一个新的神经网络，因为它的参数发生了变化。但是如果我们把整个神经网络当成一个整体的黑盒子来看待，这个函数其实没有发生任何变化，也就是无论什么样的输入，输出结果都不变。这就是正尺度不变性。

这个不变性其实很麻烦，当激活函数是 ReLu函数时，很多参数完全不一样的神经网络，其实对应了同一个函数。这说明当我们用神经网络的原始参数来表达神经网络时，参数空间是高度冗余的空间，因为不同的参数可能对应了同一个网络。这种冗余的空间是不能准确表达神经网络的。同时在这样的冗余空间里可能存在很多假的极值点，它们是由空间冗余带来的，并不是原问题真实的极值点。我们平时在神经网络优化过程中遇到的梯度消减、梯度爆炸的现象，很多都跟冗余的表达有关系。

既然参数空间冗余有这么多缺点，我们能不能解决这个问题？如果不在参数空间里做梯度下降法，而是在一个更紧致的表达空间里进行优化，是不是就可以解决这些问题呢？这个愿望听起来很美好，但实际上做起来非常困难。因为深度神经网络是一个非常复杂的函数，想对它做精确的紧致表达，需要非常强的数学基础和几何表达能力。我们组里的研究员们做了非常多的努力，经过了一年多的时间，才对这个紧致的空间做了一个完整的描述，我们称其为 g-Space 。

g-Space 其实是由神经网络中一组线性无关的通路组成的，所谓通路就是从输入到输出所走过的一条不回头的通路，也就是其中一些边的连接集合。我们可以证明，如果把神经网络里的这些通路组成一个空间，这个空间里的基所组成的表达，其实就是对神经网络的紧致表达。

有了 g-Space 之后，我们就可以在其中计算梯度，同时也可以在 g-Space 里计算距离。有了这个距离之后，我们还可以在 g-Space 里定义一些正则项，防止神经网络过拟合。

我们的论文表明，在新的紧致空间里做梯度下降的计算复杂度并不高，跟在参数空间里面做典型的 BP 操作复杂度几乎是一样的。换言之，我们设计了一个巧妙的算法，它的复杂度并没有增加，但却回避了原来参数空间里的很多问题，获得了对于 ReLU Network 的紧致表达，并且计算了正确的梯度，实现了更好的模型优化。

有了这些东西之后，我们形成了一套新的深度学习优化框架。这个方法非常 general，它并没有改变目标函数，也没改变神经网络的结构，仅仅是换了一套优化方法，相当于整个机器学习工具包里面只换了底层，就可以训练出效果更好的模型来。

元学习的限制

第四个研究方向也非常有趣，我们管它叫 Learning to Teach，中文我没想到特别好的翻译，现在权且叫做“教学相长”。

我们提出 Learning to Teach 这个研究方向，是基于对现在机器学习框架的局限性的反思。这个式子虽然看起来很简单，但它可以描述一大类的或者说绝大部分机器学习问题。这个式子是什么意思？首先 (x, y) 是训练样本，它是从训练数据集 D 里采样出来的。 f(ω) 是模型，比如它可能代表了某一个神经网络。我们把 f(ω)作用在输入样本 x 上，就会得到一个对输入样本的预测。然后，我们把预测结果跟真值标签 y 进行比较，就可以定义一个损失函数 L。

现在绝大部分机器学习都是在模型空间里最小化损失函数。所以这个式子里有三个量，分别是训练数据 D，损失函数 L，还有模型空间 Ω。这三个量都是超参数，它们是人为设计好的，是不变的。绝大部分机器学习过程，是在这三样给定的情况下去做优化，找到最好的 ω，使得我们在训练数据集上能够最小化人为定义的损失函数。即便是这几年提出的 meta learning 或者 learning2learn，其实也没有跳出这个框架。因为机器学习框架本身从来就没有规定最小化过程只能用梯度下降的方法，你可以用任何方法，都超不出这个这个式子所表达的框架。

但是为什么训练数据集 D、损失函数 L 和模型参数空间 Ω 必须人为预先给定？如果不实现给定，而是在机器学习过程中动态调整，会变成什么样子？这就是所谓的 Learning to Teach。我们希望通过自动化的手段，自动调节训练数据集 D、损失函数 L 和模型参数空间 Ω，以期拓展现有机器学习的边界，帮助我们训练出更加强大的机器学习模型。

要实现这件事情其实并不简单，我们需要用全新的思路和视角。我们在今年连续发表了三篇文章，对于用自动化的方式去确定训练数据、函数空间和损失函数，做了非常系统的研究。

我给大家形象地描述一下我们的研究。比如我们怎么用自动化的方式去选择合适的数据？其实很简单。除了原来的机器学习的模型以外，我们还有一个教学模型 teacher model。这个模型会把原来的机器学习的过程、所处的阶段、效果好坏等作为输入，输出对下一阶段训练数据的选择。这个 teacher model 会根据原来的机器学习模型的进展过程，动态选择最适合的训练数据，最大限度提高性能。同时teacher model也会把机器学习在交叉验证集上的效果作为反馈，自我学习，自我提高。

同样 model teaching 的环路中也存在一个 teacher model ，它会根据原来的机器学习过程所处的阶段、训练的效果，选择合适的函数空间，让原来的机器学习扩大自己的搜索范围，这个过程也是自适应的、动态的。原来的机器学习模型我们叫 student model，和我们引入的教学模型 teacher model 之间进行互动，就可以将学习过程推向一个新的高度。

同样，teacher model也可以动态调整原来student model 所要优化的目标。比如，我们的学习目标可以从简到难，最开始的时候，一个简单的学习目标会让我们很快学到一些东西，但是这个学习目标可能和我们最终问题的评价准则相差很远。我们不断把简单平滑的目标，向着问题评价的复杂的非连续函数逼近，就会引导 student model 不断提高自己的能力，最后实现很好的学习效果。

总结一下，当我们有一个 teacher model，它可以动态地设计训练数据集、改变模型空间、调整目标函数时，就会使得原来“student model”的训练更宽泛、更有效，它的边界就会被放大。我们在三篇论文里面分别展示了很多不同数据集上的实验结果。

我自己认为 Learning to Teach 非常有潜力，它扩大了传统机器学习的边界。我们的三篇论文仅仅是抛砖引玉，告诉大家这件事情可以做，但前面路还很长。

到此为止，我把最近这一两年微软亚洲研究院在机器学习领域所做的一些研究成果跟大家做了分享，它们只是我们研究成果的一个小小的子集，但是我觉得这几个方向非常有趣，希望能够启发大家去做更有意义的研究。

展望未来

现在机器学习领域的会议越来越膨胀，有一点点不理智。每一年那么多论文，甚至都不知道该读哪些。人们在写论文、做研究的时候，有时也不知道重点该放在哪里。比如，如果整个学术界都在做 learning2learn，是不是我应该做一篇 learning2learn 的论文？大家都在用自动化的方式做 neural architecture search，我是不是也要做一篇呢？现在这种随波逐流、人云亦云的心态非常多。

我们其实应该反思：现在大家关注的热点是不是涵盖了所有值得研究的问题？有哪些重要的方向其实是被忽略的？我举个例子，比如轻量级的机器学习，比如 Learning to Teach，比如对于深度学习的一些理论探索，这些方面在如今火热的研究领域里面涉及的并不多，但这些方向其实非常重要。只有对这些方向有非常深刻的认识，我们才能真正推动机器学习的发展。希望大家能够把心思放到那些你坚信重要的研究方向上，即便当下它还不是学术界关注的主流。

接下来我们对机器学习未来的发展做一些展望，这些展望可能有些天马行空，但是却包含了一些有意义的哲学思考，希望对大家有所启发。

量子计算

第一个方面涉及机器学习和量子计算之间的关系。量子计算也是一个非常火的研究热点，但是当机器学习碰到量子计算，会产生什么样的火花？其实这是一个非常值得我们思考的问题。

目前学术界关注的问题之一是如何利用量子计算的计算力去加速机器学习的优化过程，这就是所谓的quantum speedup。但是，这是否是故事的全部呢？大家应该想一想，反过来作为一名机器学习的学者，我们是不是有可能帮助量子计算呢？或者当机器学习和量子计算各自往前走，碰到一起的时候会迸发出怎样的新火花？

其实在量子计算里有一些非常重要的核心问题，比如我们要去评估或者或者预测 quantum state（量子态），然后才能把量子计算的结果取出来。这个过程在传统理论里面已经证明，在最坏情况下，我们就需要指数级的采样，才能对 quantum state 做比较好的估计。但这件事情会带来负面影响，量子计算虽然很快，但是如果探测量子态耗费了大量时间来做采样，就会拖垮原来的加速效果，最后合在一起，并没有实现任何加速。

我们知道很多最坏情况下非常复杂的问题，比如 NP Complete问题，用机器学习的方法去解，其实可以在平均意义上取得非常好的效果。我们今年在ACML上获得最佳论文的工作就是用机器学习的方法来解travelling salesman问题，取得了比传统组合优化更高效的结果。沿着这个思路，我们是不是可以用机器学习帮助处理量子计算里的问题，比如quantum state prediction，是不是根本不需要指数级的采样，就可以得到一个相当好的估计？在线学习、强化学习等都能在这方面有所帮助。

同时，量子和机器学习理论相互碰撞时，会发生一些非常有趣的现象。我们知道，量子有不确定性，这种不确定性有的时候不见得是件坏事，因为在机器学习领域，我们通常希望有不确定性，甚至有时我们还会故意在数据里加噪声，在模型训练的过程中加噪声，以期获得更好的泛化性能。

从这个意义上讲，量子计算的不确定性是不是反而可以帮助机器学习获得更好的泛化性能？如果我们把量子计算的不确定性和机器学习的泛化放在一起，形成一个统一的理论框架，是不是可以告诉我们它的 Trade-off 在哪里？是不是我们对量子态的探测就不需要那么狠？因为探测得越狠可能越容易 overfit。是不是有一个比较好的折中？其实这些都是非常有趣的问题，也值得量子计算的研究人员和机器学习的研究人员共同花很多年的时间去探索。

以简治繁

第二个方向也很有趣，它涉及到我们应该以何种方式来看待训练数据。深度学习是一个以繁治繁的过程，为了去处理非常复杂的训练数据，它使用了一个几乎更复杂的模型。但这样做真的值得吗？跟我们过去几十年甚至上百年做基础科学的思路是不是一致的？

在物理、化学、生物这些领域，人们追求的是世界简单而美的规律。不管是量子物理，还是化学键，甚至经济学、遗传学，很多复杂的现象背后其实都是一个二阶偏微分方程，比如薛定谔方程，比如麦克斯韦方程组，等等。这些方程都告诉我们，看起来很复杂的世界，其实背后的数学模型都是简单而美的。这些以简治繁的思路，跟深度学习是大相径庭的。

机器学习的学者也要思考一下，以繁治繁的深度学习真的是对的吗？我们把数据看成上帝，用那么复杂的模型去拟合它，这样的思路真的对吗？是不是有一点舍本逐末了？以前的这种以简治繁的思路，从来都不认为数据是上帝，他们认为背后的规律是上帝，数据只是一个表象。

我们要学的是生成数据的规律，而不是数据本身，这个方向其实非常值得大家去思考。要想沿着这个方向做很好的研究，我们需要机器学习的学者扩大自己的知识面，更多地去了解动态系统或者是偏微分方程等，以及传统科学里的各种数学工具，而不是简单地使用一个非线性的模型去做数据拟合。

Improvisational Learning

第三个方向关乎的是我们人类到底是如何学习的。到今天为止，深度学习在很多领域的成功，其实都是做模式识别。模式识别听起来很神奇，其实是很简单的一件事情。几乎所有的动物都会模式识别。人之所以有高的智能，并不是因为我们会做模式识别，而是因为我们有知识，有常识。基于这个理念，Yann LeCun 一个新的研究方向叫 Predictive Learning（预测学习）。它的思想是什么？就是即便我们没有看到事物的全貌，因为我们有常识，有知识，我们仍然可以做一定程度的预测，并且基于这个预测去做决策。这件事情已经比传统的模式识别高明很多，它会涉及到人利用知识和常识去做预测的问题。

但是，反过来想一想，我们的世界真的是可以预测的吗？可能一些平凡的规律是可以预测的，但是我们每个人都可以体会到，我们的生活、我们的生命、我们的世界大部分都是不可预测的。所以这句名言很好，The only thing predictable about life is its unpredictability（人生中唯一能预测的就是其不可预测性）。

我们既然活在一个不可预测的世界里，那么我们到底是怎样从这个世界里学习，并且越来越强大？以下只是一家之言，我们猜测人类其实在做一件事情，叫 Improvisation，什么意思？就是我们每个人其实是为了生存在跟这个世界抗争。我们每天从世界里面学习的东西，都是为了应付将来未知的异常。当一件不幸的事情发生的时候，我们如何才能生存下来？其实是因为我们对这个世界有足够的了解，于是会利用已有的知识，即兴制定出一个方案，让我们规避风险，走过这个坎。

我们希望在我们的眼里，世界的熵在降低。我们对它了解越多，它在我们的眼里的熵越低。同时，我们希望当环境发生变化时，比如意外发生时，我们有能力即兴地去处理。这张PPT 里面描述的即兴学习框架就是我们在跟环境互动，以及在做各种思想实验，通过无监督的方式自我学习应对未知异常的能力。

从这个意义上讲，这个过程其实跟 Predictive Learning 不一样，跟强化学习也不一样，因为它没有既定的学习规律和学习目标，并且它是跟环境做交互，希望能够处理未来的未知环境。这其实就跟我们每个人积累一身本事一样，为的就是养兵千日用兵一时。当某件事情发生时，我怎么能够把一身的本事使出来，活下去。这个过程能不能用数学的语言描述？ Improvisational Learning 能不能变成一个新的机器学习研究方向？非常值得我们思考。

群体智慧

最后一个展望涉及到一个更哲学的思辨：人类的智能之所以这么高，到底是因为我们个体非常强大，还是因为我们群体非常强大？今天绝大部分的人工智能研究，包括深度学习，其实都在模仿人类个体的大脑，希望学会人类个体的学习能力。可是扪心自问，人类个体的学习能力真的比大猩猩等人类近亲高几个数量级吗？答案显然不是，但是今天人类文明发展的程度，跟猴子、跟大猩猩他们所处社区的文明的发展程度相比却有天壤之别。

所以我们坚信人类除了个体聪明以外，还有一些更加特殊的东西，那就是社会结构和社会机制，使得我们的智能突飞猛进。比如文字的产生，书籍的产生，它变成了知识的载体，使得某一个人获得的对世界的认知，可以迅速传播给全世界其他人，这个社会机制非常重要，会加速我们的进化。

再者，社会分工不同会使得每个人只要优化自己的目标，让自己变强大就可以了。各个领域里有各自的大师，而这些大师的互补作用，使得我们社会蓬勃发展。

所以社会的多样性，社会竞争、进化、革命、革新，这些可能都是人类有今天这种高智能的原因。而这些东西在今天的机器学习领域，鲜有人去做非常好的建模。我们坚信只有对这些事情做了非常深入的研究，我们才能真正了解了人的智能，真的了解了机器学习，把我们的研究推向新的高度。

（*本文由AI科技大本营整理，转载请联系微信1092722531）

你可能感兴趣的:(刘铁岩谈机器学习：随波逐流的太多，我们需要反思)

斤斤计较的婚姻到底有多难？白心之岂必有为
很多人私聊我会问到在哪个人群当中斤斤计较的人最多？我都会回答他，一般婚姻出现问题的斤斤计较的人士会非常多，以我多年经验，在婚姻落的一塌糊涂的人当中，斤斤计较的人数占比在20～30%以上，也就是说10个婚姻出现问题的斤斤计较的人有2-3个有多不减。在婚姻出问题当中，有大量的心理不平衡的、尖酸刻薄的怨妇。在婚姻中仅斤斤计较有两种类型：第一种是物质上的，另一种是精神上的。在物质与精神上抠门已经严重的影响
情绪觉察日记第37天露露_e800
今天是家庭关系规划师的第二阶最后一天，慧萍老师帮我做了个案，帮我处理了埋在心底好多年的一份恐惧，并给了我深深的力量！这几天出来学习，爸妈过来婆家帮我带小孩，妈妈出于爱帮我收拾东西，并跟我先生和婆婆产生矛盾，妈妈觉得他们没有照顾好我…。今晚回家见到妈妈，我很欣赏她并赞扬她，妈妈说今晚要跟我睡我说好，当我们俩躺在床上准备睡觉的时候，我握着妈妈的手对她说:妈妈这几天辛苦你了，你看你多利害把我们的家收拾得
芦花鞋一四许叶晗
又是在一个寒冷的夏日里，青铜和葵花决定今天一起去卖芦花鞋，奶奶亲手给他们做了一碗热乎乎的粥对他们说:“就靠你们两挣生活费了这碗粥赶紧趁热喝了吧！”于是青铜和葵花喝完了奶奶给她们做的粥，就准备去镇上卖卢花鞋，这回青铜和葵花穿着新的芦花鞋来到了镇上。青铜这回看到了很多人都在卖，用手势表达对葵花说:“这回有好多人在抢我们生意呢！我们必须得吆喝起来。”葵花点了点头。可是谁知他们也大声的叫，卖芦花喽！卖芦花
QQ群采集助手，精准引流必备神器 2401_87347160 其他经验分享
功能概述微信群查找与筛选工具是一款专为微信用户设计的辅助工具，它通过关键词搜索功能，帮助用户快速找到相关的微信群，并提供筛选是否需要验证的群组的功能。主要功能关键词搜索：用户可以输入关键词，工具将自动查找包含该关键词的微信群。筛选功能：工具提供筛选机制，用户可以选择是否只显示需要验证或不需要验证的群组。精准引流：通过上述功能，用户可以更精准地找到目标群组，进行有效的引流操作。3.设备需求该工具可以
关于沟通这件事，项目经理不需要每次都面对面进行流程大师兄
很多项目经理都会遇到这样的问题，项目中由于事情太多，根本没有足够的时间去召开会议，那在这种情况下如何去有效地管理项目中的利益相关者？当然，不建议电子邮件也不需要开会的话，建议可以采取下面几种方式来形成有效的沟通，这几种方式可以帮助你努力的通过各种办法来保持和各方面的联系。项目经理首先要问自己几个问题，项目中哪些利益相关者是必须要进行沟通的？可以列出项目中所有的利益相关者清单，同时也整理出项目中哪些
机器学习与深度学习间关系与区别 ℒℴѵℯ心·动ꦿ໊ོ꫞ 人工智能学习深度学习 python
一、机器学习概述定义机器学习（MachineLearning,ML）是一种通过数据驱动的方法，利用统计学和计算算法来训练模型，使计算机能够从数据中学习并自动进行预测或决策。机器学习通过分析大量数据样本，识别其中的模式和规律，从而对新的数据进行判断。其核心在于通过训练过程，让模型不断优化和提升其预测准确性。主要类型1.监督学习（SupervisedLearning）监督学习是指在训练数据集中包含输入
铭刻于星（四十二）随风至
69夜晚，绍敏同学做完功课后，看了眼房外，没听到动静才敢从书包的夹层里拿出那个心形纸团。折痕压得很深，都有些旧了，想来是已经写好很久了。绍敏同学慢慢地、轻轻地捏开折叠处，待到全部拆开后，又反复抚平纸张，然后仔细地一字字默看。只是开头的三个字是第一次看到，让她心漏跳了几拍。“亲爱的绍敏：从四年级的时候，我就喜欢你了，但是我一直不敢说，怕影响你学习。六年级的时候听说有人跟你表白，你接受了，我很难过，但
底层逆袭到底有多难，不甘平凡的你准备好了吗？让吴起给你说说造命者说
底层逆袭到底有多难，不甘平凡的你准备好了吗？让吴起给你说说我叫吴起，生于公元前440年的战国初期，正是群雄并起、天下纷争不断的时候。后人说我是军事家、政治家、改革家，是兵家代表人物。评价我一生历仕鲁、魏、楚三国，通晓兵家、法家、儒家三家思想，在内政军事上都有极高的成就。周安王二十一年（公元前381年），因变法得罪守旧贵族，被人乱箭射死。我出生在卫国一个“家累万金”的富有家庭，从年轻时候起就不甘平凡
2020-01-25 晴岚85
郑海燕坚持分享590天2020.1.24在生活中只存在两个问题。一个问题是：你知道想要达成的目标是什么，但却不知道如何才能达成；另一个问题是：你不知道你的目标是什么。前一个是行动的问题，后一个是结果的问题。通过制定具体的下一步行动，可以解决不知道如何开始行动的问题。而通过去想象结果，对结果做预估，可以解决找不着目标的问题。对于所有吸引我们注意力，想要完成的任务，你可以先想象一下，预期的结果究竟是什
随笔 | 仙一般的灵气海思沧海
仙岛今天，我看了你全部，似乎已经进入你的世界我不知道，这是否是梦幻，还是你仙一般的灵气吸引了我也许每一个人都要有一份属于自己的追求，这样才能够符合人生的梦想，生活才能够充满着阳光与快乐我不知道，我为什么会这样的感叹，是在感叹自己的人生，还是感叹自己一直没有孜孜不倦的追求只感觉虚度了光阴，每天活在自己的梦中，活在一个不真实的世界是在逃避自己，还是在逃避周围的一切有时候我嘲笑自己，嘲笑自己如此的虚无，
想家爆米花机
也许不同于大家对家乡的思念，我对家乡甚至是疯狂的不舍。还未踏出车站就感觉到幸福，我享受这里的夕阳、这里的浓烈柴火味、这里每一口家常菜。我是宅女，我贪恋家的安逸。刚刚踏出大学校门，初出茅庐，无法适应每年只能国庆和春节回家。我焦虑、失眠、无端发脾气，是无法适应工作的节奏，是无法接受我将一步步离开家乡的事实。我不想承认自己胸无大志，选择再次踏上征程。图片发自App
【iOS】MVC设计模式 Magnetic_h ios mvc 设计模式 objective-c 学习 ui
MVC前言如何设计一个程序的结构，这是一门专门的学问，叫做"架构模式"（architecturalpattern），属于编程的方法论。MVC模式就是架构模式的一种。它是Apple官方推荐的App开发架构，也是一般开发者最先遇到、最经典的架构。MVC各层controller层Controller/ViewController/VC（控制器）负责协调Model和View，处理大部分逻辑它将数据从Mod
OC语言多界面传值五大方式 Magnetic_h ios ui 学习 objective-c 开发语言
前言在完成暑假仿写项目时，遇到了许多需要用到多界面传值的地方，这篇博客来总结一下比较常用的五种多界面传值的方式。属性传值属性传值一般用前一个界面向后一个界面传值，简单地说就是通过访问后一个视图控制器的属性来为它赋值，通过这个属性来做到从前一个界面向后一个界面传值。首先在后一个界面中定义属性@interfaceBViewController:UIViewController@propertyNSSt
一百九十四章. 自相矛盾巨木擎天
唉！就这么一夜，林子感觉就像过了很多天似的，先是回了阳间家里，遇到了那么多不可思议的事情儿。特别是小伙伴们，第二次与自己见面时，僵硬的表情和恐怖的气氛，让自己如坐针毡，打从心眼里难受！还有东子，他现在还好吗？有没有被人欺负？护城河里的小鱼小虾们，还都在吗？水不会真的干枯了吧？那对相亲相爱漂亮的太平鸟儿，还好吧！春天了，到了做窝、下蛋、喂养小鸟宝宝的时候了，希望它们都能够平安啊！虽然没有看见家人，也
UI学习——cell的复用和自定义cell Magnetic_h ui 学习
目录cell的复用手动（非注册）自动（注册）自定义cellcell的复用在iOS开发中，单元格复用是一种提高表格（UITableView）和集合视图（UICollectionView）滚动性能的技术。当一个UITableViewCell或UICollectionViewCell首次需要显示时，如果没有可复用的单元格，则视图会创建一个新的单元格。一旦这个单元格滚动出屏幕，它就不会被销毁。相反，它被添
element实现动态路由+面包屑软件技术NINI vue案例 vue.js 前端
el-breadcrumb是ElementUI组件库中的一个面包屑导航组件，它用于显示当前页面的路径，帮助用户快速理解和导航到应用的各个部分。在Vue.js项目中，如果你已经安装了ElementUI，就可以很方便地使用el-breadcrumb组件。以下是一个基本的使用示例：安装ElementUI（如果你还没有安装的话）:你可以通过npm或yarn来安装ElementUI。bash复制代码npmi
10月|愿你的青春不负梦想-读书笔记-01 Tracy的小书斋
本书的作者是俞敏洪，大家都很熟悉他了吧。俞敏洪老师是我行业的领头羊吧，也是我事业上的偶像。本日摘录他书中第一章中的金句：『一个人如果什么目标都没有，就会浑浑噩噩，感觉生命中缺少能量。能给我们能量的，是对未来的期待。第一件事，我始终为了进步而努力。与其追寻全世界的骏马，不如种植丰美的草原，到时骏马自然会来。第二件事，我始终有阶段性的目标。什么东西能给我能量？答案是对未来的期待。』读到这里的时候，我便
C语言宏函数南林yan C语言 c语言
一、什么是宏函数？通过宏定义的函数是宏函数。如下，编译器在预处理阶段会将Add(x,y)替换为((x)*(y))#defineAdd(x,y)((x)*(y))#defineAdd(x,y)((x)*(y))intmain(){inta=10;intb=20;intd=10;intc=Add(a+d,b)*2;cout<
地推话术，如何应对地推过程中家长的拒绝校师学
相信校长们在做地推的时候经常遇到这种情况：市场专员反馈家长不接单，咨询师反馈难以邀约这些家长上门，校区地推疲软，招生难。为什么？仅从地推层面分析，一方面因为家长受到的信息轰炸越来越多，对信息越来越“免疫”；而另一方面地推人员的专业能力和营销话术没有提高，无法应对家长的拒绝，对有意向的家长也不知如何跟进，眼睁睁看着家长走远；对于家长的疑问，更不知道如何有技巧地回答，机会白白流失。由于回答没技巧和专业
谢谢你们，爱你们！鹿游儿
昨天家人去泡温泉，二个孩子也带着去，出发前一晚，匆匆下班，赶回家和孩子一起收拾。饭后，我拿出笔和本子（上次去澳门时做手帐的本子）写下了1\2\3\4\5\6\7\8\9,让后让小壹去思考，带什么出发去旅游呢？她在对应的数字旁边画上了，泳衣、泳圈、肖恩、内衣内裤、tapuy、拖鞋……画完后，就让她自己对着这个本子，将要带的，一一带上，没想到这次带的书还是这本《便便工厂》(晚上姑婆发照片过来，妹妹累得
C语言如何定义宏函数？小九格物 c语言
在C语言中，宏函数是通过预处理器定义的，它在编译之前替换代码中的宏调用。宏函数可以模拟函数的行为，但它们不是真正的函数，因为它们在编译时不会进行类型检查，也不会分配存储空间。宏函数的定义通常使用#define指令，后面跟着宏的名称和参数列表，以及宏展开后的代码。宏函数的定义方式：1.基本宏函数：这是最简单的宏函数形式，它直接定义一个表达式。#defineSQUARE(x)((x)*(x))2.带参
微服务下功能权限与数据权限的设计与实现 nbsaas-boot 微服务 java 架构
在微服务架构下，系统的功能权限和数据权限控制显得尤为重要。随着系统规模的扩大和微服务数量的增加，如何保证不同用户和服务之间的访问权限准确、细粒度地控制，成为设计安全策略的关键。本文将讨论如何在微服务体系中设计和实现功能权限与数据权限控制。1.功能权限与数据权限的定义功能权限：指用户或系统角色对特定功能的访问权限。通常是某个用户角色能否执行某个操作，比如查看订单、创建订单、修改用户资料等。数据权限：
理解Gunicorn：Python WSGI服务器的基石范范0825 ipython linux 运维
理解Gunicorn：PythonWSGI服务器的基石介绍Gunicorn，全称GreenUnicorn，是一个为PythonWSGI（WebServerGatewayInterface）应用设计的高效、轻量级HTTP服务器。作为PythonWeb应用部署的常用工具，Gunicorn以其高性能和易用性著称。本文将介绍Gunicorn的基本概念、安装和配置，帮助初学者快速上手。1.什么是Gunico
小丽成长记（四十三）玲玲54321
小丽发现，即使她好不容易调整好自己的心态下一秒总会有不确定的伤脑筋的事出现，一个接一个的问题，人生就没有停下的时候，小问题不断出现。不过她今天看的书，她接受了人生就是不确定的，厉害的人就是不断创造确定性，在Ta的领域比别人多的确定性就能让自己脱颖而出，显示价值从而获得的比别人多的利益。正是这样的原因，因为从前修炼自己太少，使得她现在在人生道路上打怪起来困难重重，她似乎永远摆脱不了那种无力感，有种习
学点心理知识，呵护孩子健康静候花开_7090
昨天听了华中师范大学教育管理学系副教授张玲老师的《哪里才是学生心理健康的最后庇护所，超越教育与技术的思考》的讲座。今天又重新学习了一遍，收获匪浅。张玲博士也注意到了当今社会上的孩子由于心理问题导致的自残、自杀及伤害他人等恶性事件。她向我们普及了一个重要的命题，她说心理健康的一些基本命题，我们与我们通常的一些教育命题是不同的，她还举了几个例子，让我们明白我们原来以为的健康并非心理学上的健康。比如如果
2021年12月19日，春蕾教育集团团建活动感受——黄晓丹黄错错加油
感受:1.从陌生到熟悉的过程。游戏环节让我们在轻松的氛围中得到了锻炼，也增长了不少知识。2.游戏过程中，我们贡献的是个人力量，展现的是团队的力量。它磨合的往往不止是工作的熟悉，更是观念上契合度的贴近。3.这和工作是一样的道理。在各自的岗位上，每个人摆正自己的位置、各司其职充分发挥才能，并团结一致劲往一处使，才能实现最大的成功。新知:1.团队精神需要不断地创新。过去，人们把创新看作是冒风险，现在人们
Cell Insight | 单细胞测序技术又一新发现，可用于HIV-1和Mtb共感染个体诊断尐尐呅
结核病是艾滋病合并其他疾病中导致患者死亡的主要原因。其中结核病由结核分枝杆菌（Mycobacteriumtuberculosis,Mtb）感染引起，获得性免疫缺陷综合症（艾滋病）由人免疫缺陷病毒（Humanimmunodeficiencyvirustype1,HIV-1）感染引起。国家感染性疾病临床医学研究中心/深圳市第三人民医院张国良团队携手深圳华大生命科学研究院吴靓团队，共同研究得出单细胞测序
c++ 的iostream 和 c++的stdio的区别和联系黄卷青灯77 c++算法开发语言 iostream stdio
在C++中，iostream和C语言的stdio.h都是用于处理输入输出的库，但它们在设计、用法和功能上有许多不同。以下是两者的区别和联系：区别1.编程风格iostream（C++风格）：C++标准库中的输入输出流类库，支持面向对象的输入输出操作。典型用法是cin（输入）和cout（输出），使用>操作符来处理数据。更加类型安全，支持用户自定义类型的输入输出。#includeintmain(){in
瑶池防线谜影梦蝶
冥华虽然逃过了影梦的军队，但他是一个忠臣，他选择上报战况。败给影梦后成逃兵，高层亡尔还活着，七重天失守......随便一条，即可处死冥华。冥华自然是知道以仙界高层的习性此信一发自己必死无疑，但他还选择上报实情，因为责任。同样此信送到仙宫后，知道此事的人，大多数人都认定冥华要完了，所以上到仙界高层，下到扫大街的，包括冥华自己，全都准备好迎接冥华之死。如果仙界现在还属于两方之争的话，冥华必死无疑。然而
爬山后遗症璃绛
爬山，攀登，一步一步走向制高点，是一种挑战。成功抵达是一种无法言语的快乐，在山顶吹吹风，看看风景，这是从未有过的体验。然而，爬山一时爽，下山腿打颤，颠簸的路，一路向下走，腿部力量不够，走起来抖到不行，停不下来了！第二天必定腿疼，浑身酸痛，坐立难安！
apache ftpserver-CentOS config gengzg apache
<server xmlns="http://mina.apache.org/ftpserver/spring/v1" xmlns:xsi="http://www.w3.org/2001/XMLSchema-instance" xsi:schemaLocation=" http://mina.apache.o
优化MySQL数据库性能的八种方法 AILIKES sql mysql
1、选取最适用的字段属性　　MySQL可以很好的支持大数据量的存取，但是一般说来，数据库中的表越小，在它上面执行的查询也就会越快。因此，在创建表的时候，为了获得更好的性能，我们可以将表中字段的宽度设得尽可能小。例如，在定义邮政编码这个字段时，如果将其设置为CHAR(255),显然给数据库增加了不必要的空间，甚至使用VARCHAR这种类型也是多余的，因为CHAR(6)就可以很
JeeSite 企业信息化快速开发平台 Kai_Ge JeeSite
JeeSite 企业信息化快速开发平台平台简介 JeeSite是基于多个优秀的开源项目，高度整合封装而成的高效，高性能，强安全性的开源Java EE快速开发平台。 JeeSite本身是以Spring Framework为核心容器，Spring MVC为模型视图控制器，MyBatis为数据访问层， Apache Shiro为权限授权层，Ehcahe对常用数据进行缓存，Activit为工作流
通过Spring Mail Api发送邮件 120153216 邮件 main
原文地址：http://www.open-open.com/lib/view/open1346857871615.html 使用Java Mail API来发送邮件也很容易实现，但是最近公司一个同事封装的邮件API实在让我无法接受，于是便打算改用Spring Mail API来发送邮件，顺便记录下这篇文章。【Spring Mail API】 Spring Mail API都在org.spri
Pysvn 程序员使用指南 2002wmj SVN
源文件:http://ju.outofmemory.cn/entry/35762 这是一篇关于pysvn模块的指南. 完整和详细的API请参考 http://pysvn.tigris.org/docs/pysvn_prog_ref.html. pysvn是操作Subversion版本控制的Python接口模块. 这个API接口可以管理一个工作副本, 查询档案库, 和同步两个. 该
在SQLSERVER中查找被阻塞和正在被阻塞的SQL 357029540 SQL Server
SELECT R.session_id AS BlockedSessionID , S.session_id AS BlockingSessionID , Q1.text AS Block
Intent 常用的用法备忘 7454103 .net android Google Blog F#
Intent 应该算是Android中特有的东西。你可以在Intent中指定程序要执行的动作（比如：view,edit,dial），以及程序执行到该动作时所需要的资料。都指定好后，只要调用startActivity()，Android系统会自动寻找最符合你指定要求的应用程序，并执行该程序。下面列出几种Intent 的用法显示网页:
Spring定时器时间配置 adminjun spring 时间配置定时器
红圈中的值由6个数字组成，中间用空格分隔。第一个数字表示定时任务执行时间的秒，第二个数字表示分钟，第三个数字表示小时，后面三个数字表示日，月，年，< xmlnamespace prefix ="o" ns ="urn:schemas-microsoft-com:office:office" /> 测试的时候，由于是每天定时执行，所以后面三个数
POJ 2421 Constructing Roads 最小生成树 aijuans 最小生成树
来源：http://poj.org/problem?id=2421 题意：还是给你n个点，然后求最小生成树。特殊之处在于有一些点之间已经连上了边。思路：对于已经有边的点，特殊标记一下，加边的时候把这些边的权值赋值为0即可。这样就可以既保证这些边一定存在，又保证了所求的结果正确。代码： #include <iostream> #include <cstdio>
重构笔记——提取方法（Extract Method） ayaoxinchao java 重构提炼函数局部变量提取方法
提取方法（Extract Method）是最常用的重构手法之一。当看到一个方法过长或者方法很难让人理解其意图的时候，这时候就可以用提取方法这种重构手法。下面是我学习这个重构手法的笔记：提取方法看起来好像仅仅是将被提取方法中的一段代码，放到目标方法中。其实，当方法足够复杂的时候，提取方法也会变得复杂。当然，如果提取方法这种重构手法无法进行时，就可能需要选择其他
为UILabel添加点击事件 bewithme UILabel
默认情况下UILabel是不支持点击事件的，网上查了查居然没有一个是完整的答案，现在我提供一个完整的代码。 UILabel *l = [[UILabel alloc] initWithFrame:CGRectMake(60, 0, listV.frame.size.width - 60, listV.frame.size.height)]
NoSQL数据库之Redis数据库管理(PHP-REDIS实例) bijian1013 redis 数据库 NoSQL
一.redis.php <?php //实例化 $redis = new Redis(); //连接服务器 $redis->connect("localhost"); //授权 $redis->auth("lamplijie"); //相关操
SecureCRT使用备注 bingyingao secureCRT 每页行数
SecureCRT日志和卷屏行数设置一、使用securecrt时，设置自动日志记录功能。 1、在C:\Program Files\SecureCRT\下新建一个文件夹(也就是你的CRT可执行文件的路径），命名为Logs； 2、点击Options -> Global Options -> Default Session -> Edite Default Sett
【Scala九】Scala核心三：泛型 bit1129 scala
泛型类 package spark.examples.scala.generics class GenericClass[K, V](val k: K, val v: V) { def print() { println(k + "," + v) } } object GenericClass { def main(args: Arr
素数与音乐 bookjovi 素数数学 haskell
由于一直在看haskell，不可避免的接触到了很多数学知识，其中数论最多，如素数，斐波那契数列等，很多在学生时代无法理解的数学现在似乎也能领悟到那么一点。闲暇之余，从图书馆找了<<The music of primes>>和<<世界数学通史>>读了几遍。其中素数的音乐这本书与软件界熟知的&l
Java-Collections Framework学习与总结-IdentityHashMap BrokenDreams Collections
这篇总结一下java.util.IdentityHashMap。从类名上可以猜到，这个类本质应该还是一个散列表，只是前面有Identity修饰，是一种特殊的HashMap。简单的说，IdentityHashMap和HashM
读《研磨设计模式》-代码笔记-享元模式-Flyweight bylijinnan java 设计模式
声明：本文只为方便我个人查阅和理解，详细的分析以及源代码请移步原作者的博客http://chjavach.iteye.com/ import java.util.ArrayList; import java.util.Collection; import java.util.HashMap; import java.util.List; import java
PS人像润饰&调色教程集锦 cherishLC PS
1、仿制图章沿轮廓润饰——柔化图像，凸显轮廓 http://www.howzhi.com/course/retouching/ 新建一个透明图层，使用仿制图章不断Alt+鼠标左键选点，设置透明度为21%，大小为修饰区域的1/3左右（比如胳膊宽度的1/3），再沿纹理方向（比如胳膊方向）进行修饰。所有修饰完成后，对该润饰图层添加噪声，噪声大小应该和
更新多个字段的UPDATE语句 crabdave update
更新多个字段的UPDATE语句 update tableA a set (a.v1, a.v2, a.v3, a.v4) = --使用括号确定更新的字段范围
hive实例讲解实现in和not in子句 daizj hive not in in
本文转自：http://www.cnblogs.com/ggjucheng/archive/2013/01/03/2842855.html 当前hive不支持 in或not in 中包含查询子句的语法，所以只能通过left join实现。假设有一个登陆表login(当天登陆记录,只有一个uid),和一个用户注册表regusers(当天注册用户，字段只有一个uid)，这两个表都包含
一道24点的10+种非人类解法（2,3,10,10） dsjt 算法
这是人类算24点的方法？！！！事件缘由：今天晚上突然看到一条24点状态，当时惊为天人，这NM叫人啊？以下是那条状态朱明西 : 24点，算2 3 10 10，我LX炮狗等面对四张牌痛不欲生，结果跑跑同学扫了一眼说，算出来了，2的10次方减10的3次方。。我草这是人类的算24点啊。。然后么。。。我就在深夜很得瑟的问室友求室友算刚出完题，文哥的暴走之旅开始了 5秒后
关于YII的菜单插件 CMenu和面包末breadcrumbs路径管理插件的一些使用问题 dcj3sjt126com yii framework
在使用 YIi的路径管理工具时，发现了一个问题。 <?php
对象与关系之间的矛盾：“阻抗失配”效应[转] come_for_dream 对象
概述 “阻抗失配”这一词组通常用来描述面向对象应用向传统的关系数据库（RDBMS）存放数据时所遇到的数据表述不一致问题。C++程序员已经被这个问题困扰了好多年，而现在的Java程序员和其它面向对象开发人员也对这个问题深感头痛。 “阻抗失配”产生的原因是因为对象模型与关系模型之间缺乏固有的亲合力。“阻抗失配”所带来的问题包括：类的层次关系必须绑定为关系模式（将对象
学习编程那点事 gcq511120594 编程互联网
一年前的夏天，我还在纠结要不要改行，要不要去学php？能学到真本事吗？改行能成功吗？太多的问题，我终于不顾一切，下定决心，辞去了工作，来到传说中的帝都。老师给的乘车方式还算有效，很顺利的就到了学校，赶巧了，正好学校搬到了新校区。先安顿了下来，过了个轻松的周末，第一次到帝都，逛逛吧！接下来的周一，是我噩梦的开始，学习内容对我这个零基础的人来说，除了勉强完成老师布置的作业外，我已经没有时间和精力去
Reverse Linked List II hcx2013 list
Reverse a linked list from position m to n. Do it in-place and in one-pass. For example:Given 1->2->3->4->5->NULL, m = 2 and n = 4, return
Spring4.1新特性——页面自动化测试框架Spring MVC Test HtmlUnit简介 jinnianshilongnian spring 4.1
目录 Spring4.1新特性——综述 Spring4.1新特性——Spring核心部分及其他 Spring4.1新特性——Spring缓存框架增强 Spring4.1新特性——异步调用和事件机制的异常处理 Spring4.1新特性——数据库集成测试脚本初始化 Spring4.1新特性——Spring MVC增强 Spring4.1新特性——页面自动化测试框架Spring MVC T
Hadoop集群工具distcp liyonghui160com
1. 环境描述两个集群：rock 和 stone rock无kerberos权限认证，stone有要求认证。 1. 从rock复制到stone，采用hdfs Hadoop distcp -i hdfs://rock-nn:8020/user/cxz/input hdfs://stone-nn:8020/user/cxz/运行在rock端，即源端问题：报版本
一个备份MySQL数据库的简单Shell脚本 pda158 mysql 脚本
　　主脚本（用于备份mysql数据库）：　　该Shell脚本可以自动备份数据库。只要复制粘贴本脚本到文本编辑器中，输入数据库用户名、密码以及数据库名即可。我备份数据库使用的是mysqlump 命令。后面会对每行脚本命令进行说明。　　 1. 分别建立目录“backup”和“oldbackup” 　　#mkdir /backup 　　#mkdir /oldbackup 　
300个涵盖IT各方面的免费资源（中）——设计与编码篇 shoothao IT资源图标库图片库色彩板字体
A. 免费的设计资源 Freebbble:来自于Dribbble的免费的高质量作品。 Dribbble:Dribbble上“免费”的搜索结果——这是巨大的宝藏。 Graphic Burger:每个像素点都做得很细的绝佳的设计资源。 Pixel Buddha:免费和优质资源的专业社区。 Premium Pixels:为那些有创意的人提供免费的素材。
thrift总结 - 跨语言服务开发 uule thrift
官网官网JAVA例子 thrift入门介绍 IBM-Apache Thrift - 可伸缩的跨语言服务开发框架 Thrift入门及Java实例演示 thrift的使用介绍 RPC POM： <dependency> <groupId>org.apache.thrift</groupId>