AI科技大本营

重磅 | 李飞飞最新演讲：ImageNet后，我专注于这五件事——视觉理解、场景图，段落整合、视频分割及CLEVR数据集

2017中国计算机大会（CNCC2017）于10月26日在福州海峡国际会展中心开幕，大会为期3天。

而就在今天上午，李飞飞、沈向洋、汤道生、马维英等重磅大咖纷纷登台演讲。

据悉，斯坦福大学人工智能实验室和视觉实验室主任李飞飞此前已被邀请两届，今年终于来参会，带来了其实验室的最新研究成果——实时视频描述。李飞飞从5.4亿年前的寒武纪大爆发开始讲起，强调了视觉是智能的基石；而作为微软全球执行副总裁微软五名核心成员之一的沈向洋博士也参加了会议，他也带来了犀利的观点：得语音者得天下。

AI科技大本营第一时间将李飞飞英文演讲及沈向洋的中文演讲整理出来，附PPT截图，希望对你有帮助。

李飞飞：ImageNet之后，计算机视觉何去何从？

今天，我就想和大家来分享实验室的思考和一些比较新的工作。

由于我在国外生活的时间比较长，我可能说英文比说中文要好一点儿。所以，我就要用英文来做这个演讲，偶尔会插一些中文词。谢谢大家。

今天我的主题演讲主要是关于计算机视觉。

要聊这个话题，首先，让我们先从5.4亿年前说起。

那个时候，地球基本上没有陆地，全是海洋。为数不多的低等的生物就生活在海洋里，当有食物漂过来时，这些生物就赶紧将其吃掉以维持生命。

自那起的1000万年间，动物的种类和数量迎来了大爆发。生物的种类从少有的几种，迅速增长为几千种之多。这在历史上被称为“寒武纪大爆发”。那么，是什么引起了这场大爆发呢？

几年前，澳大利亚的科学家 Andrew Parker找到了答案。

大约在5.4亿年前，有的动物开始进化出了简陋的眼睛。对于一个个体来说，这没有什么大不了，不就是多了一个小孔，这个小孔能接收光线，仅此而已。但这对于整个地球而言，可就是一件改变整个生命历程的大事。

就因为有眼睛，动物们看得见食物了。他们可以从被动获取食物，变成主动寻找食物。他们学会了隐藏，学会了伺机而动，也学会了快速出击。

于是，动物的存活率大大提升，而大幅提升的存活率又大大促进了生物的进化。可以这么说，正是因为视觉的诞生，才有了寒武纪大爆发。

从那以后，动物们开始进化出各种各样的视觉系统。实际上，视觉已经变成了动物大脑中最为重要的感知神经系统。因为发达的视觉系统，让他们的生命不断延续，种类不断增多。

将目光收回到人类。

视觉让人们看到这个世界，看懂这个世界，让人们有能力不停地交流、合作、互动。

在人类的大脑中，视觉神经系统非常重要。甚至可以这么说，视觉是人类智能的基石。

正因为如此，我对于计算机视觉这项工作才尤为着迷。这可是人工智能的关键环节啊。可是，计算机视觉应该从哪些地方模仿人类的视觉呢？哪些才是能影响到计算机视觉的里程碑式的事件呢？而且人类对目标识别到底有多擅长？

早在60年代和70年代，认知心理学家以及视觉科学家就指出，人类拥有的视觉系统无与伦比。

有一个来自麻省理工大学的著名实验是这样的，我现在要向大家连续播放多帧画面，每帧的显示时间仅100微秒。其中，只有一帧的画面里有人。你们能找出来吗？可以举手示意我一下。

这可不是一个IQ测试，大家尽可以放轻松。

实验的结果是：大多数的人都可以找到这一帧，看出在这一帧中，有个人立在那里。这太让人惊叹了！

实验之前，你不会知道这个人长什么样，是男人还是女人，这个人穿着什么衣服，是什么姿态。但是，你的视觉系统却能在如此短的时间内快速地找到这个信息。

1996年，神经学家Simon J. Thorpe及团队发布了一项研究，通过脑电波来观察人脑对于图像识别的速度。他发现，仅需 100 微秒，大脑就会发出一道区分信号，对画面中的物体是否为动物做出判断。对于复杂目标对象的处理能力，构成了人类视觉系统的基础。

这个实验对于计算机视觉的影响巨大。回望20年前，我们能清楚地看到，正是对目标物体的识别的研究促进了整个计算机视觉的大发展。

最近，大家都很了解与ImageNet有关的先进的图像识别。其实，从2010年到2017年，ImageNet挑战了传统的图像分类。这八年间，我们的社区取得了令人瞩目的成绩，将错误率从 28% 降低到了2.3%。在攻克图像识别的难题的征途上，计算机视觉的研究者们共同努力，取得了非凡的成绩。当然，解决图像识别难题的重要里程碑之一是在 2012 年，这是 CNN 第一次在利用大数据进行监督学习领域展现出令人印象深刻的能力。从这一点出发，我们开始进入深度学习革命的新纪元。

但是，我今天的主题并不在ImageNet。固然，ImageNet对人工智能有重要的贡献，但是我们必须往前看，看看有什么技术可以超越ImageNet。图像是视觉体验的基本要素。但是，在图像之上，还有一些需要探索的东西。

视觉关系理解

比如，有两张图片，当我遮挡住其余部分，只留出一两个要素时，你会觉得它们很相似。但是，当你看到整张图片时，你会发现，它们呈现了两个完全不同的场景。

这说明图像理解非常关键。它超越了ImageNet，和其所代表的图像识别。

那么，视觉关系的预测或者理解难在哪？

当我们给计算机一张图片，我们需要算法通过识别关键对象来定位对象的位置以及预测对象之间的关系，这就是视觉关系预测的任务。

过去有一些针对视觉关系的深度研究。但是大部分此方向的研究都局限于一些特定的或者普遍的关系。而现在，由于计算机在数据和深度学习能力上的提高，我们可以对视觉关系进行更深层次的研究。

我们使用了一个卷积神经网络视觉表示的联结，以及一个估计交互式视觉组件之间关系的语言模块。

我不会深入这个模型的细节，只是简单地介绍其结果。我们的模型去年发表在ECCV，能够估计特殊关系，对比关系，非对称关系，动词和动作关系，以及位置关系。因此，我们能够估算出场景的丰富关系，不只是简单的感知对象。

相比于目前最先进的技术，我们对基本测试有很好的性能表现。我们不仅能够进行关系预测，实际上还能对未知的关系进行理解（zero-shot understanding）。例如，在我们的训练数据集中，我们能发现坐在椅子上的人或者站在地面上的消防队员。但在测试时，我们有人坐在消防栓上等类似的关系的图片，而实际训练时很难收集大量的训练实例。但我们的模型可以做到对未知东西的学习及理解。这里还有一个例子，马戴帽子，实际上另一个关系人骑马或人戴帽子更为常见。自从我们去年发表在ECCV的工作以来，关系预测的工作已经雨后春笋般发展起来。有些工作的效果已经超过了我们一年前的结果，但我个人很高兴看到社区不再局限于ImageNet提供的内容，而去思考更丰富的场景理解。

但为了做到这一点，我们必须用基准数据集来支持社区。我们已经看到了ImageNet对物体识别做出了特别大的贡献，但作为一个数据集，这是一个有局限的数据集。它只有一个信息位，就是场景中的主要对象。ImageNet之后，社区的同事提出了许多关于数据集的有趣想法。Harry（沈向洋）已经提到的微软的COCO框架可以识别场景中的更多对象，以及用一个简短的句子进行描述。但是，还有更多的内容需要解决，特别是物体间的关系，问答，及针对图像场景的问答。

自动生成场景图

三年前，我们开始收集有关的数据集，目的为了深入场景内容。我们真正关心的是关系，我们将视觉世界视为相互关联的场景图。

场景图是表示对象和关系的基本方式。

通过三年的努力，我们做出了一些通用的数据集。这个通用的视觉数据集包含10w多张图像和对其进行的420万个图像描述，180万对问答，140万标注好的对象，150万个关系和170万个属性。因此，这是一个非常丰富的数据集，其目的是推动我们超越名词，开展关系理解，纹理推理等研究。

我们已经展示了关系表示，还有什么其他事情可以做，或者视觉数据集是用来做什么的？

我要告诉你另一个称为“场景检索”的项目。

这实际上是计算机视觉中的一个老问题，很多人都研究过。这是一个相对已经成熟的产品，有点像谷歌图像搜索。

当我在Google输入“男人穿套装”或者“可爱的狗狗”这个词后，系统会返回给你漂亮的照片。你可以看看结果，非常有说服力。

但我用更复杂的句子，比如“男人穿西装，抱着可爱的狗”呢？效果就很难说了。

我们希望对我们得到的东西有更多的控制，更丰富的场景检索。然后，场景检索模型就没法实现了，因为它是基于对象的，它并不真正地理解关系。

这里有一个例子。我想获得一个男人坐在长凳上的场景，如果我只是基于对象搜索它，我会得到分离的对象或者错误的关系。也许我可以添加一些属性，但它会丢失对象和其他东西。但是当我添加关系和对象时，我可以立刻得到更加有意义和精确的场景。这就是场景检索的理念。

我们之前的一个研究是如何表示非常复杂的检索请求，就像这个描述：一个满头灰发的老女人戴着她的眼镜，穿着一个敞怀的的黄夹克，等等等。一旦我们有这样的场景图，它就变得更容易，成为了一个图匹配问题。此前我们有在专有设备上训练过它。完全可以想象，我们最近几年可以用深度学习技术将其发扬光大。需要特别注意的是，场景图是描述复杂场景中丰富内容的基础。

下面是有关卧室的另一个例子，以及如何使用场景图来检索它。这一切都是可行的，它用新的方式来表示复杂的意义和连接的场景。

但是，你们至少应该先问我个问题，她是怎么得到这些场景图的？这看起来不容易。

事实上，这在实际应用环境中是完全不可想象的。当我去百度搜索，或者Bing搜索，或者谷歌搜索询问一个图像时，你如何构造场景图呢？所以我们真正需要做的是自动生成场景图。

关于自动生成场景图的论文我们发表在 2017 CVPR 上。

我们使用了一个自动场景图生成模型来验证传递进行的查询消息，感兴趣可以查看我们的论文。相比于其他基准模型（baseline），此模型更接近于真实的场景图处理。

我们很兴奋地看到这个通用的视觉数据集向世界传达了场景图表示的概念，我们正在使用这个基准并且鼓励社区去审视有关关系条件，场景检索生成等问题。但这些只是越过ImageNet的一些早期问题，它仍然相对简单。他们只是有关场景的。当你睁开眼睛时，你首先看到的是物体、关系。但视觉智能或人工智能比我们要强，那么，超越早期对像素的感知外还有什么呢？

给大家展示一下 10 年前我在研究生时期做的一个实验，这个实验是关于人类认知的。我让参与测试的实验对象坐在电脑屏幕的前方，然后让他们看一张闪烁地非常快的图片，然后这张图片很快就会被壁纸遮挡起来，此处的遮挡是为了控制图片在屏幕上停留的时长，停留的时间其实非常短。一小时我给他们 10 美元，然后他们在看过图片之后，需要写出自己所能记得的关于这张图片的所有描述。

可以看到，这里的场景切换非常之快，其中最短的图片展示时间只有 27 毫秒，也就是 1/45 秒，而图片停留的最常时间也只有 500 毫秒，也就是 0.5 秒。让人惊奇的是，我们发现人类能够将图片场景描述的非常详细。只需要 500 毫秒，人类就能够识别出非常多的内容，比如任务、动作、穿着、情绪、事件、社会角色等等。就算只有 40 毫秒，人类也能够对（图片）环境有大致的理解。因此，在视觉系统和描述场景的能力或者语言的能力之间，有一种不寻常的联系。我们的实验室现在正在研究的已经不只是单纯的“感知器”，视觉和语言之间的联系、视觉和推理之间的联系非常非常深，现在的研究还只是开始。

从句子整合到段落

我们最早开始做人类和语言相关的工作可以追溯到 2015 年。

当时，世界上还很少有实验室用和我们一样的想法做图像描述：用 CNN 来表示像素空间，用 RNN 或者 LSTM 来表示序列模型、生成语言。

当时刚刚兴起了第一波算法浪潮，可以根据现有图片自动生成描述的句子。在这个特殊的例子中，穿着橘色马甲的建筑工人正在路上工作，穿着蓝色T恤的人正在弹吉他。这是一个让人印象深刻的例子，但是一个视觉场景并不是短短的一句话能够描述的，而是可以分成不同的组成部分，因此我们接下来就做了“dense captioning”：给定一个场景，我们不仅仅只看这张图片中的整体内容，而是看不同的部分，看感兴趣的区域，然后尝试用语言来描述。

这里有一个例子，这张图片的描述由很多不同的部分组成：一部分是关于人骑在大象上，一部分是关于人坐在长椅上，一部分是关于大象本身的描述，一部分是关于大象身后的森林。比起短短的一句话，这种描述方式，能够提供更多的图片信息。

这是去年发布的，今年，就在几个月以前，我们又往前进了一步，开始生成段落。

当然，你可以说只要先生成句子，然后将句子串联起来就成了段落，但是通过这种方式生成的段落并不能令人满意。我们并不想随意地将句子组合起来，我们必须思考如何将句子组合起来，如何让句子之间的过度更加自然，这些就是这篇论文背后的想法。尽管我们已经可以生成段落，但是结果仍然不能令人满意，但是这种方式可以完整地描述场景内容。

自动分割视频关键部分

就在几天前，我的学生在威尼斯举行的 ICCV 大会上展示了我们的工作。我们将原来静态图片上的工作延伸到了视频上，在这个领域，如何检索视频是一个问题。目前，大部分关于视频的工作，要么是通过一些关键目标来进行检索，或者对一个事件（如打篮球）进行整体描述。

但是在绝大多数的长视频中，里面发生的事件不只一个。于是我们建立了一个包含 20000 段视频的数据集，并对每个视频进行注释，平均每个视频 3.6 个句子。然后我们提出了一种能够在整段视频中临时查看的算法，它能够自动分割视频中的关键部分，然后用句子描述出来。

对于其完整的模型结构，不过我不打算细讲。这个模型的开始的部分是对视频中的 C3D 特征进行特征编码，剩下的部分则是如何找到关键部分并生成描述。

我们跟其他的方法进行了对比，尽管我们是第一个这样做的，但是和其他的方法相比，我们的方法展现了非常不错的前景。

这种工作才刚刚起步，但是我非常兴奋，因为在计算机视觉领域，人们对视频的研究还不够，而这种将视频和自然语言处理连接起来的能力将会创造非常多的可能和应用领域。

从SHRDLU到CLEVR：模块世界+自然语言

演讲的最后部分仍然是关于视觉理解和自然语言处理的，但是在这个特殊的实例里，我想将语言当作推理的媒介，不仅仅是生成描述，而是去推理视觉主题的组成性质。

让我们回到 40 年前，当时 Terry Winograd 创建了一个早期的 AI，叫作 SHRDLU。SHRDLU 是一个“Block World”。人类提出一个问题：“ the blue pyramid is nice. I like blocks which are not red, but I don’t like many thing which supports a pyramid. Do I like the grey box?”，在这个世界里，人类会问出非常复杂的问题，而算法 SHRDLU 需要生成答案：“ No.（ Because it supports the pyramid. ）”因此这个过程里面涉及到很多的推理。在那个时候，SHRDLU 还是一个局域规则的系统。如今，我们将这种想法用现代的方法重现，在simulation engine（模拟引擎）中使用现代的图片创造另一个数据集——“CLEVR”。

“CLEVR”是一个拥有无限多对象模块的数据集合，我们可能产生不同类型的问题。我们生成了各种各样的问题：一些问题可能是关于attribute（属性）的，比如“有没有哪些大型物体和金属球的数量相同？”；一些问题跟counting（计算）相关，比如“有多少红色的物体？”；一些问题和comparison（比较）相关；还有一些问题与special relationship（特殊关系）相关，等等。

“CLEVR”是一个非常丰富的数据集，由问答集组成，与场景中内容的含义有关。我们如何看待我们的模型呢？与人进行比较。我们发现仅仅使用venilla，CNN，LSTM作为训练模型，人类仍然比机器好得多。当机器的平均性能小于70%时，人类可以达到93%左右的精度。

所以有一个巨大的差距。我认为我们差距的原因在于我们的模型不能明确推理。我们把相关的研究也发表在刚刚结束的2017ICCV大会上。

大致原理是，模型首先提取问题并通过自然语言训练生成器。然后我们利用这个模型进行推理，最后得出这些答案。总的来看，是训练一个生成器模型。然后，训练模型和其预测的答案。最后，联合查找及模型，可以对最后的QA给出合理的结果。我们的模型比执行基线(baseline)好很多。

由于李飞飞在演讲中提到了自然语言处理与视觉识别的结合，也提到了微软研究院沈向洋对于自然语言的描述等研究，因此，我们也将沈向阳的演讲内容整理如下，希望对你有所启发。

沈向洋：自然语言中的描述、对话和隐喻

最近我一直讲的一句话就是“懂语言者，得天下”，只有我们切身明白自然语言是怎么回事才能够真正把人工智能讲清楚。

在这里，我侧重三方面内容，主要讲讲如何一步步深入研究自然语言：

第一步，表述方面：通俗来说，就是如何利用自然语言技术表述一个事件。如今关于表述的研究，已经发展得非常好了。

第二步对话及智能：相对而言，这个比较难一点。对话即智能，这是目前来说非常强调的一点。

第三步机器意境：相比以上两点，这点比较悬疑，就是说整个机器意识，到底应该如何理解？意境到底是怎么回事？延伸来说，为什么有些人讲的东西你觉得比较有深度？

刚刚提到的三点实际是可以理解为三个层次，正如小学、初中、高中所训练的作文写作一样。

第一层次：小学老师说，你要把一件事情清楚写出来，这就是记叙文。

第二层次：可以总结为正论文。也就是对话层面，简单来说就是要把一个问题讲清楚，论点、论据、论证缺一不可。其实我们大多数的科研论文都是处在这样一个level。

第三层次：当你的文章开始写得有点水平时，老师说可以写诗歌、写散文，写一些表达自己心境、情怀的文章，运用到我们研究的自然语言理解中，也就是机器意境这个层次。

下面，我会通过具体的案例来详细解析这三个层次的研究。

首先，讲一讲如何用机器学习来做自然语言表述。这里我用一个比较特别的例子——降低视觉和自然语言结合，同大家解释一下。

想表述清楚这个问题，就要提一下我们一直以来推出的微软认知服务（Microsoft Cognitive Services），其中有一个很特别的东西，名为Traction ball。就是说，上传一张照片后，它可以直观告诉你，这张照片中到底有什么以及如何描述这张照片。

此后，基于这个技术，我们做了一个应用软件——Saying AI，它可以为盲人服务。

回到照片描述的这个问题上，也就是我刚才提到的Traction ball。这个特殊的技术，最基本的原理就是计算机视觉的API，称为Image Capture。

例如，配上一张照片，一个人游泳的照片，在这张照片中我们能够得到什么样的表述呢？能不能检测到说照片中的人数，人的动作、表情等很多信息？卖个关子，如果大家有兴趣的话，可以到微软的网页上浏览，会有很多技术涉及到这方面。当然我们除了Traction ball之外，还有很多其他的类似的视觉服务，这只是一个很好的具有代表性的例子。

值得一提的是，我们在做Traction的服务时，专门做了一个标准数据集，叫做Microsoft COCO。在COCO的研发中，我们也一直与其他的系统做过可行性的比较。实践表明，过去一年的时间内，我们做Traction是比较出色的，但从数据的角度出发，如今微软研究院做的系统大概是26.8%的准确率，人类目标希望达到63.8%，我们确实还有很长的一段路要走。

如果深入了解的话，Traction的服务除了标准数据集之外，还会涉及图像描述。图像描述主要想解决什么问题？实际上可以定义为计算机视觉和计算机语言交汇的地方。首先要具备一个语意空间，随后就可以将整个图像的空间和特色投影到文字表述，通过字、句、段来呈现。

例如，这是一个网球场，一个人拿着球牌，在机器表述中还有没有表现出来的要素，这些都是我们技术提升的方向。所以语意空间是连接图像和文字的有效工具，于是我们做了一个深度结构语意的模型DSCM，在这方面又有了巨大的空间提升。

谈一谈有关表述的产品发布出去后还会有什么问题呢？

所谓Diploma dreamer research，最重要的一点就是你发布出去之后，用户会在两方面进行辅助，提供更多的用户数据以及提供建议，帮助你意识到这个系统的问题在哪里。早期，更多是用户觉得系统或者是产品如何；现在更多是我们自己讲，我们觉得系统怎样，如果做一个correlation，就会对比清楚明了。

问题一：有一些做的真好，我们说好，用户也说好，这些通常是一些很自然的场景，叫做In natural photo，一些common objects，例如城市的一些雕塑等。

问题二：我们觉得做的不太好，但用户觉得做的好，有一些很自然的场景，就是加上这种类型的照片，一定程度上可是我们的confidence比较低，但用户觉得挺好。相反，有时候我们觉得还行，但是用户觉得不行。

问题三：我们也觉得不行，用户也觉得不行。例如一开始做raiseman分析的时候，一些照片从图像特征分析开始就有问题。

做完这个对比分析后，我们得出了什么重要结论呢？在做大数据的时候，在做这样AI的问题中，大家一定要明白，要分析数据，就是You know want you know、You know want you don't know、You don't know want you know and You don't know want you don't know，所以你要做这样一个分析。

如今，相关产品不断迭代，技术不断更新，模型架构不断趋于精准，那么基于这类技术，落地应用情况又如何？

例如，在我们的办公室软件中，用户数量非常大。例如Power point，今天如果你做PPT的话需要上传一张照片，我就可以告诉你，这张照片大致上可以说用怎样的Image Capture。如果觉得不是很perfect的话，可以建议其中用一些什么样的object，也可以考虑要不要这样去用。此外还有之前提及的SAYING AI，它是专门为是为有挑战的人士（盲人）准备的。

一直以来，我们不断思考人工智能最后的目的是什么？人工智能的目的是打败人类还是帮助人类？对于微软来说，我们觉得人工智能的目的是帮助有需要的人类。在此基础上，我来讲讲对话与智能。

对话就是智能，智能在于对话，你问我，这样表述到底是什么意思？其实回答这个问题之前，应该了解两件事：机器阅读理解其实是从从回答问题到提出问题；问答对话生成是从一问一答到提出问题。

目前深度学习确实在语言智能方面帮助很大，我们现在可以用很多深度学习的方法去完成对语言的深度理解，不仅能够回答问题，还能够提出问题。那么问题来了，怎么去提出问题？读一段书，你要从文本里面找到关键点，然后要围绕这些关键点的话，这就可以生成问题。

最近我在加拿大买了一家做的很不错的AI公司，叫做Mover。主要是在做reading、capture，他们最近发表了一篇论文就解释了如何找到问题并提出。

当然不能光提问题，提问题的意义就是现在还知道答案，答案是three，这是我们现在很努力在做的事情。AI提了一个很有趣的问题，就是说“How many breakers？或者record？

不仅仅是回答问题以及询问问题，更重要的事情是要具备一个连续对话的系统。现在我们用微软聊天完成小冰的架构，主要就是要做一个对话深层模型，其中包括一个记忆机制。做之前要知道谈话的内容、观点以及主题，做这样一件事情之前，首先要有一个record，接下来要有一个attention，attention这样一个model。

谈到现在的关注点，整个过程中，要对对话整体的情绪和情感做一个建模，对用户的画像，也就是用户要有足够的理解。在这上面，综合用户的上下文和AI的上下文，再加上整个用户当前的输入，你就可以预测接下来应该讲什么。但问题还远没有那么简单，当你有这样一个连续对话，长程对话的时候，应该想到必须要有一个引导机制，不然整个聊天会没有方向。

所以，应该有这样一个focus，要加上一个话题引导机制，同时还要有相关的兴趣话题在里面。所以满足这两个非常重要的方面，就是对话即智能。

相对来讲，我们提出的问题，并不是那种可以给出很多答案的问题。当我们在机器的描述到机器的对话，到底智能体现在哪里呢？仅仅是能够规划，那还不算是真正的智能，真正的智能最应该体现在这个对话中。

以图片举例，图片能够被诠释成Capture，但这些Capture到现在为止仅仅是一个客观描述；也许更加有突破性的事儿，就是一张照片出现之后，不仅仅具备客观描述，更重要的是对它有一个主观评价。甚至说，一张图表示一个意境，可以从这张图片出发做诗，意境到底体现在哪里？什么是天马行空的意境？为什么古人讲只可意会，不可言传，怎么体现出来的？

由此展开对机器意境的一个详细的解释。我觉得我们可以建一个模型，可以讲的很清楚AI到底要解决什么样的问题。到现在为止，通过自然输入，语音也好、语言也好、手写也好、键盘也好，机器把这些自然输入做成机器的representation，在做这样一个深度学习，就出现了一些机器意境的结果。

今天绝大多数人工智能的科研都停留在这一步，机器的结果出现后就结束了，真正有意义的实际上是要继续下一步，也就是反向推理。要把机器的结果，通过反向推理，让人可以理解，让人能够感觉讲的到底是什么。

下面，我来讲讲我们是如何将以上三个层次的技术与理解应用到小冰上。比如说诗歌这件事情，每个人写，每个人读，意境不同，理解可能都很不一样，为什么？

让我们看看小冰的图片评论，例如今天大家用小冰聊天机器人。如果描述的话，一只肿了的脚，这就很了不起，但评论说伤的这么重，疼不疼？这太神奇了，怎么能够知道呢？

图中有两只猫，这也很了不起，很多人都可以做到。但评论说，小眼神太犀利了，真了不起。

第三个，表述比萨斜塔，这能做出来也很了不起，谁知道这是不是比萨，评论说你要不要我帮你扶着？我们需要的就是这个结果。所以一定要在补充最后一步，才可以让人更好的理解机器。

最近微软做了一个非常激动人心的工作，小冰写诗。上线了大概几个月，在微信上，全国的网民（小冰的fans）一共发表了22万首诗，这是个什么概念呢？就是中华人民共和国到现在真正发表的诗歌可能还没有这个数字。

通常大家都觉得，自己的诗写的不够好，还没到到真正刊登的程度，只在自己的微信朋友圈发布就可以了。

小冰是如何作诗的？

首先，通过tool把整个照片的意思搞清楚，这是街道、城市、红绿灯，很繁忙。第一步是先要生成单首诗、一句诗，做法是一个前向的RNN，再加上反向RNN的模型。我们现在正在写这篇论文，应该很快可以发表，到时候大家可以再批评。

一句诗出来后，再加一个基于递归神经网络的一个laid generation approach，例如从这张照片出发，我们可以产生一首诗，大意是城市在他身后缓缓的流动，我的生活忙碌，我们在没人知道的地方寂静，嘴边挂着虚假的笑容。你问我这个人到底讲什么？我说我也不知道这个人到底讲了什么。

我自己觉得，AI最了不起的，就是做人脑的延伸，对于人脑的理解，最重要是有两个方向，一个叫做IQ，一个叫做EQ。小冰写诗就是这个意思。

任何一个科技时代，我们都会去想改变我们的事。当年的PC时代，是操作系统和应用软件；后来的互联网时代，是浏览器加上搜索引擎；后来的移动时代，APP为王；现在AI时代就说到了对IQ、EQ的理解。

我们非常高兴小冰这个产品已经登陆中国、日本、美国、印度、印尼五个国家，目前有上亿用户。我自己非常自豪这个产品从北京做起，走向世界，我觉得其中最重要的一方面就是在人工智能的发展过程中对自然语言的理解。

最后，我还是要强调，接下来的研究方向就是自然语言，就像非常了不起的一首诗所言，“懂语言得天下，不要人夸颜色好，只留清晰满乾坤”。

SDCC 2017

10 月 28 日（本周六），SDCC 2017“人工智能技术实战线上峰会”将在CSDN学院以直播互动的方式举行。

作为SDCC系列技术峰会的一部分，来自阿里巴巴、微软、商汤科技、第四范式、微博、出门问问、菱歌科技的AI专家，将针对机器学习平台、系统架构、对话机器人、芯片、推荐系统、Keras、分布式系统、NLP等热点话题进行分享。

先行者们正在关注哪些关键技术？如何从理论跨越到企业创新实践？你将从本次峰会找到答案。每个演讲时段均设有答疑交流环节，与会者和讲师可零距离互动。

扫描下方二维码，入群交流

你可能感兴趣的:(重磅 | 李飞飞最新演讲：ImageNet后，我专注于这五件事——视觉理解、场景图，段落整合、视频分割及CLEVR数据集)

斤斤计较的婚姻到底有多难？白心之岂必有为
很多人私聊我会问到在哪个人群当中斤斤计较的人最多？我都会回答他，一般婚姻出现问题的斤斤计较的人士会非常多，以我多年经验，在婚姻落的一塌糊涂的人当中，斤斤计较的人数占比在20～30%以上，也就是说10个婚姻出现问题的斤斤计较的人有2-3个有多不减。在婚姻出问题当中，有大量的心理不平衡的、尖酸刻薄的怨妇。在婚姻中仅斤斤计较有两种类型：第一种是物质上的，另一种是精神上的。在物质与精神上抠门已经严重的影响
情绪觉察日记第37天露露_e800
今天是家庭关系规划师的第二阶最后一天，慧萍老师帮我做了个案，帮我处理了埋在心底好多年的一份恐惧，并给了我深深的力量！这几天出来学习，爸妈过来婆家帮我带小孩，妈妈出于爱帮我收拾东西，并跟我先生和婆婆产生矛盾，妈妈觉得他们没有照顾好我…。今晚回家见到妈妈，我很欣赏她并赞扬她，妈妈说今晚要跟我睡我说好，当我们俩躺在床上准备睡觉的时候，我握着妈妈的手对她说:妈妈这几天辛苦你了，你看你多利害把我们的家收拾得
芦花鞋一四许叶晗
又是在一个寒冷的夏日里，青铜和葵花决定今天一起去卖芦花鞋，奶奶亲手给他们做了一碗热乎乎的粥对他们说:“就靠你们两挣生活费了这碗粥赶紧趁热喝了吧！”于是青铜和葵花喝完了奶奶给她们做的粥，就准备去镇上卖卢花鞋，这回青铜和葵花穿着新的芦花鞋来到了镇上。青铜这回看到了很多人都在卖，用手势表达对葵花说:“这回有好多人在抢我们生意呢！我们必须得吆喝起来。”葵花点了点头。可是谁知他们也大声的叫，卖芦花喽！卖芦花
关于沟通这件事，项目经理不需要每次都面对面进行流程大师兄
很多项目经理都会遇到这样的问题，项目中由于事情太多，根本没有足够的时间去召开会议，那在这种情况下如何去有效地管理项目中的利益相关者？当然，不建议电子邮件也不需要开会的话，建议可以采取下面几种方式来形成有效的沟通，这几种方式可以帮助你努力的通过各种办法来保持和各方面的联系。项目经理首先要问自己几个问题，项目中哪些利益相关者是必须要进行沟通的？可以列出项目中所有的利益相关者清单，同时也整理出项目中哪些
机器学习与深度学习间关系与区别 ℒℴѵℯ心·动ꦿ໊ོ꫞ 人工智能学习深度学习 python
一、机器学习概述定义机器学习（MachineLearning,ML）是一种通过数据驱动的方法，利用统计学和计算算法来训练模型，使计算机能够从数据中学习并自动进行预测或决策。机器学习通过分析大量数据样本，识别其中的模式和规律，从而对新的数据进行判断。其核心在于通过训练过程，让模型不断优化和提升其预测准确性。主要类型1.监督学习（SupervisedLearning）监督学习是指在训练数据集中包含输入
android系统selinux中添加新属性property 辉色投像
1.定位/android/system/sepolicy/private/property_contexts声明属性开头：persist.charge声明属性类型：u:object_r:system_prop:s0图12.定位到android/system/sepolicy/public/domain.te删除neverallow{domain-init}default_prop:property
铭刻于星（四十二）随风至
69夜晚，绍敏同学做完功课后，看了眼房外，没听到动静才敢从书包的夹层里拿出那个心形纸团。折痕压得很深，都有些旧了，想来是已经写好很久了。绍敏同学慢慢地、轻轻地捏开折叠处，待到全部拆开后，又反复抚平纸张，然后仔细地一字字默看。只是开头的三个字是第一次看到，让她心漏跳了几拍。“亲爱的绍敏：从四年级的时候，我就喜欢你了，但是我一直不敢说，怕影响你学习。六年级的时候听说有人跟你表白，你接受了，我很难过，但
底层逆袭到底有多难，不甘平凡的你准备好了吗？让吴起给你说说造命者说
底层逆袭到底有多难，不甘平凡的你准备好了吗？让吴起给你说说我叫吴起，生于公元前440年的战国初期，正是群雄并起、天下纷争不断的时候。后人说我是军事家、政治家、改革家，是兵家代表人物。评价我一生历仕鲁、魏、楚三国，通晓兵家、法家、儒家三家思想，在内政军事上都有极高的成就。周安王二十一年（公元前381年），因变法得罪守旧贵族，被人乱箭射死。我出生在卫国一个“家累万金”的富有家庭，从年轻时候起就不甘平凡
2020-01-25 晴岚85
郑海燕坚持分享590天2020.1.24在生活中只存在两个问题。一个问题是：你知道想要达成的目标是什么，但却不知道如何才能达成；另一个问题是：你不知道你的目标是什么。前一个是行动的问题，后一个是结果的问题。通过制定具体的下一步行动，可以解决不知道如何开始行动的问题。而通过去想象结果，对结果做预估，可以解决找不着目标的问题。对于所有吸引我们注意力，想要完成的任务，你可以先想象一下，预期的结果究竟是什
随笔 | 仙一般的灵气海思沧海
仙岛今天，我看了你全部，似乎已经进入你的世界我不知道，这是否是梦幻，还是你仙一般的灵气吸引了我也许每一个人都要有一份属于自己的追求，这样才能够符合人生的梦想，生活才能够充满着阳光与快乐我不知道，我为什么会这样的感叹，是在感叹自己的人生，还是感叹自己一直没有孜孜不倦的追求只感觉虚度了光阴，每天活在自己的梦中，活在一个不真实的世界是在逃避自己，还是在逃避周围的一切有时候我嘲笑自己，嘲笑自己如此的虚无，
想家爆米花机
也许不同于大家对家乡的思念，我对家乡甚至是疯狂的不舍。还未踏出车站就感觉到幸福，我享受这里的夕阳、这里的浓烈柴火味、这里每一口家常菜。我是宅女，我贪恋家的安逸。刚刚踏出大学校门，初出茅庐，无法适应每年只能国庆和春节回家。我焦虑、失眠、无端发脾气，是无法适应工作的节奏，是无法接受我将一步步离开家乡的事实。我不想承认自己胸无大志，选择再次踏上征程。图片发自App
OC语言多界面传值五大方式 Magnetic_h ios ui 学习 objective-c 开发语言
前言在完成暑假仿写项目时，遇到了许多需要用到多界面传值的地方，这篇博客来总结一下比较常用的五种多界面传值的方式。属性传值属性传值一般用前一个界面向后一个界面传值，简单地说就是通过访问后一个视图控制器的属性来为它赋值，通过这个属性来做到从前一个界面向后一个界面传值。首先在后一个界面中定义属性@interfaceBViewController:UIViewController@propertyNSSt
element实现动态路由+面包屑软件技术NINI vue案例 vue.js 前端
el-breadcrumb是ElementUI组件库中的一个面包屑导航组件，它用于显示当前页面的路径，帮助用户快速理解和导航到应用的各个部分。在Vue.js项目中，如果你已经安装了ElementUI，就可以很方便地使用el-breadcrumb组件。以下是一个基本的使用示例：安装ElementUI（如果你还没有安装的话）:你可以通过npm或yarn来安装ElementUI。bash复制代码npmi
10月|愿你的青春不负梦想-读书笔记-01 Tracy的小书斋
本书的作者是俞敏洪，大家都很熟悉他了吧。俞敏洪老师是我行业的领头羊吧，也是我事业上的偶像。本日摘录他书中第一章中的金句：『一个人如果什么目标都没有，就会浑浑噩噩，感觉生命中缺少能量。能给我们能量的，是对未来的期待。第一件事，我始终为了进步而努力。与其追寻全世界的骏马，不如种植丰美的草原，到时骏马自然会来。第二件事，我始终有阶段性的目标。什么东西能给我能量？答案是对未来的期待。』读到这里的时候，我便
谢谢你们，爱你们！鹿游儿
昨天家人去泡温泉，二个孩子也带着去，出发前一晚，匆匆下班，赶回家和孩子一起收拾。饭后，我拿出笔和本子（上次去澳门时做手帐的本子）写下了1\2\3\4\5\6\7\8\9,让后让小壹去思考，带什么出发去旅游呢？她在对应的数字旁边画上了，泳衣、泳圈、肖恩、内衣内裤、tapuy、拖鞋……画完后，就让她自己对着这个本子，将要带的，一一带上，没想到这次带的书还是这本《便便工厂》(晚上姑婆发照片过来，妹妹累得
C语言如何定义宏函数？小九格物 c语言
在C语言中，宏函数是通过预处理器定义的，它在编译之前替换代码中的宏调用。宏函数可以模拟函数的行为，但它们不是真正的函数，因为它们在编译时不会进行类型检查，也不会分配存储空间。宏函数的定义通常使用#define指令，后面跟着宏的名称和参数列表，以及宏展开后的代码。宏函数的定义方式：1.基本宏函数：这是最简单的宏函数形式，它直接定义一个表达式。#defineSQUARE(x)((x)*(x))2.带参
理解Gunicorn：Python WSGI服务器的基石范范0825 ipython linux 运维
理解Gunicorn：PythonWSGI服务器的基石介绍Gunicorn，全称GreenUnicorn，是一个为PythonWSGI（WebServerGatewayInterface）应用设计的高效、轻量级HTTP服务器。作为PythonWeb应用部署的常用工具，Gunicorn以其高性能和易用性著称。本文将介绍Gunicorn的基本概念、安装和配置，帮助初学者快速上手。1.什么是Gunico
学点心理知识，呵护孩子健康静候花开_7090
昨天听了华中师范大学教育管理学系副教授张玲老师的《哪里才是学生心理健康的最后庇护所，超越教育与技术的思考》的讲座。今天又重新学习了一遍，收获匪浅。张玲博士也注意到了当今社会上的孩子由于心理问题导致的自残、自杀及伤害他人等恶性事件。她向我们普及了一个重要的命题，她说心理健康的一些基本命题，我们与我们通常的一些教育命题是不同的，她还举了几个例子，让我们明白我们原来以为的健康并非心理学上的健康。比如如果
2021年12月19日，春蕾教育集团团建活动感受——黄晓丹黄错错加油
感受:1.从陌生到熟悉的过程。游戏环节让我们在轻松的氛围中得到了锻炼，也增长了不少知识。2.游戏过程中，我们贡献的是个人力量，展现的是团队的力量。它磨合的往往不止是工作的熟悉，更是观念上契合度的贴近。3.这和工作是一样的道理。在各自的岗位上，每个人摆正自己的位置、各司其职充分发挥才能，并团结一致劲往一处使，才能实现最大的成功。新知:1.团队精神需要不断地创新。过去，人们把创新看作是冒风险，现在人们
瑶池防线谜影梦蝶
冥华虽然逃过了影梦的军队，但他是一个忠臣，他选择上报战况。败给影梦后成逃兵，高层亡尔还活着，七重天失守......随便一条，即可处死冥华。冥华自然是知道以仙界高层的习性此信一发自己必死无疑，但他还选择上报实情，因为责任。同样此信送到仙宫后，知道此事的人，大多数人都认定冥华要完了，所以上到仙界高层，下到扫大街的，包括冥华自己，全都准备好迎接冥华之死。如果仙界现在还属于两方之争的话，冥华必死无疑。然而
《策划经理回忆录之二》路基雅虎
话说三年变六年，飘了，飘了……眨眼，2013年5月，老吴回到了他的家乡——油城从新开启他的工作幻想症生涯。很庆幸，这是一家很有追求，同时敢于尝试的，且实力不容低调的新星房企——金源置业(前身泰源置业)更值得庆幸的是第一个盘就是油城十路的标杆之一:金源盛世。2013年5月，到2015年11月，两年的陪伴，迎来了一场大爆发。2000个筹，5万/筹，直接回笼1个亿！！！这……让我开始认真审视这座看似五线
如何在 Fork 的 GitHub 项目中保留自己的修改并同步上游更新？github_fork_update iBaoxing github
如何在Fork的GitHub项目中保留自己的修改并同步上游更新？在GitHub上Fork了一个项目后，你可能会对项目进行一些修改，同时原作者也在不断更新。如果想要在保留自己修改的基础上，同步原作者的最新更新，很多人会不知所措。本文将详细讲解如何在不丢失自己改动的情况下，将上游仓库的更新合并到自己的仓库中。问题描述假设你在GitHub上Fork了一个项目，并基于该项目做了一些修改，随后你发现原作者对
绘本讲师训练营【24期】8/21阅读原创《独生小孩》 1784e22615e0
24016-孟娟《独生小孩》图片发自App今天我想分享一个蛮特别的绘本，讲的是一个特殊的群体，我也是属于这个群体，80后的独生小孩。这是一本中国绘本，作者郭婧，也是一个80厚。全书一百多页，均为铅笔绘制，虽然为黑白色调，但并不显得沉闷。全书没有文字，犹如“默片”，但并不影响读者对该作品的理解，反而显得神秘，梦幻，給读者留下想象的空间。作者在前蝴蝶页这样写到：“我更希望父母和孩子一起分享这本书，使他
30天风格练习-DAY2 黄希夷
Day2（重义）在一个周日/一周的最后一天，我来到位于市中心/市区繁华地带的一家购物中心/商场，中心内人很多/熙熙攘攘。我注意到/看见一个独行/孤身一人的年轻女孩/，留着一头引人注目/长过腰际的头发，上身穿一件暗红色/比正红色更深的衣服/穿在身体上的东西。走下扶梯的时候，她摔倒了/跌向地面，在她正要站起来/让身体离开地面的时候，过长/超过一般人长度的头发被支撑身体/躯干的手掌压/按在下面，她赶紧用
我校举行新老教师师徒结对仪式暨名师专业工作室工作交流活动李蕾1229
为促进我校教师专业发展，发挥骨干教师的引领带头作用，11月6日下午，我校举行新老教师师徒结对仪式暨名师专业工作室工作交流活动。图片发自App会议由教师发展处李蕾主任主持，首先，由范校长宣读新老教师结对名单及双方承担职责。随后，两位新调入教师陈玉萍、莫正杰分别和他们的师傅鲍元美、刘召彬老师签订了师徒结对协议书。图片发自App图片发自App师徒拥抱、握手。有了师傅就有了目标有了方向，相信两位新教师在师
向内而求陈陈_19b4
10月27日，阴。阅读书目:《次第花开》。作者:希阿荣博堪布，是当今藏传佛家宁玛派最伟大的上师法王，如意宝晋美彭措仁波切颇具影响力的弟子之一。多年以来，赴海内外各地弘扬佛法，以正式授课、现场开示、发表文章等多种方法指导佛学弟子修行佛法。代表作《寂静之道》、《生命这出戏》、《透过佛法看世界》自出版以来一直是佛教类书籍中的畅销书。图片发自App金句:1.佛陀说，一切痛苦的根源在于我们长期以来对自身及外
消息中间件有哪些常见类型 xmh-sxh-1314 java
消息中间件根据其设计理念和用途，可以大致分为以下几种常见类型：点对点消息队列（Point-to-PointMessagingQueues）：在这种模型中，消息被发送到特定的队列中，消费者从队列中取出并处理消息。队列中的消息只能被一个消费者消费，消费后即被删除。常见的实现包括IBM的MQSeries、RabbitMQ的部分使用场景等。适用于任务分发、负载均衡等场景。发布/订阅消息模型（Pub/Sub
ArcGIS栅格计算器常见公式（赋值、0和空值的转换、补充栅格空值）研学随笔 arcgis 经验分享
我们在使用ArcGIS时通常经常用到栅格计算器，今天主要给大家介绍我日常中经常用到的几个公式，供大家参考学习。将特定值（-9999）赋值为0，例如-9999.Con("raster"==-9999,0,"raster")2.给空值赋予特定的值（如0）Con(IsNull("raster"),0,"raster")3.将特定的栅格值(如1)赋值为空值，其他保留原值SetNull("raster"==
那个抄袭的大张伟猫小努
最近一直在追《即刻电音》这个综艺，除了觉得出场节目的音乐制作人有意思之外，也觉得有两个导师挺有趣的（另外一个就忽略了吧）。孙艺兴在上一篇文章里面已经说过了，那么这篇就说说我们的大老师，大张伟吧。其实在节目刚开始大张伟出来的时候，我以为他是属于导师里面来活跃气氛负责搞笑的，毕竟孙艺兴属于卖萌卖傻卖老实的，尚雯婕一般负责装逼耍狠的，而大张伟一贯以来上综艺的形象基本上都是蹦蹦跳跳带动气氛的。谁知道，两期
2018-07-23-催眠日作业-#不一样的31天#-66小鹿小鹿_33
预言日：人总是在逃避命运的路上，与之不期而遇。心理学上有个著名的名词，叫做自证预言；经济学上也有一个很著名的定律叫做，墨菲定律；在灵修派上，还有一个很著名的法则，叫做吸引力法则。这3个领域的词，虽然看起来不太一样，但是他们都在告诉人们一个现象：你越担心什么，就越有可能会发生什么。同样的道理，你越想得到什么，就应该要积极地去创造什么。无论是自证预言，墨菲定律还是吸引力法则，对人都有正反2个维度的影响
[黑洞与暗粒子]没有光的世界 comsci
无论是相对论还是其它现代物理学,都显然有个缺陷,那就是必须有光才能够计算但是,我相信,在我们的世界和宇宙平面中,肯定存在没有光的世界.... 那么,在没有光的世界,光子和其它粒子的规律无法被应用和考察,那么以光速为核心的 &nbs
jQuery Lazy Load 图片延迟加载 aijuans jquery
基于 jQuery 的图片延迟加载插件，在用户滚动页面到图片之后才进行加载。对于有较多的图片的网页，使用图片延迟加载，能有效的提高页面加载速度。版本： jQuery v1.4.4+ jQuery Lazy Load v1.7.2 注意事项：需要真正实现图片延迟加载，必须将真实图片地址写在 data-original 属性中。若 src
使用Jodd的优点 Kai_Ge jodd
1. 简化和统一 controller ，抛弃 extends SimpleFormController ，统一使用 implements Controller 的方式。 2. 简化 JSP 页面的 bind, 不需要一个字段一个字段的绑定。 3. 对 bean 没有任何要求，可以使用任意的 bean 做为 formBean。使用方法简介
jpa Query转hibernate Query 120153216 Hibernate
public List<Map> getMapList(String hql, Map map) { org.hibernate.Query jpaQuery = entityManager.createQuery(hql); if (null != map) { for (String parameter : map.keySet()) { jp
Django_Python3添加MySQL/MariaDB支持 2002wmj mariaDB
现状首先，[email protected] 中默认的引擎为 django.db.backends.mysql 。但是在Python3中如果这样写的话，会发现 django.db.backends.mysql 依赖 MySQLdb[5] ，而 MySQLdb 又不兼容 Python3 于是要找一种新的方式来继续使用MySQL。 MySQL官方的方案首先据MySQL文档[3]说，自从MySQL
在SQLSERVER中查找消耗IO最多的SQL 357029540 SQL Server
返回做IO数目最多的50条语句以及它们的执行计划。 select top 50 (total_logical_reads/execution_count) as avg_logical_reads, (total_logical_writes/execution_count) as avg_logical_writes, (tot
spring UnChecked 异常官方定义！ 7454103 spring
如果你接触过spring的事物管理！那么你必须明白 spring的非捕获异常！即 unchecked 异常！因为 spring 默认这类异常事物自动回滚！！ public static boolean isCheckedException(Throwable ex) { return !(ex instanceof RuntimeExcep
mongoDB 入门指南、示例 adminjun java mongodb 操作
一、准备工作 1、下载mongoDB 下载地址：http://www.mongodb.org/downloads 选择合适你的版本相关文档：http://www.mongodb.org/display/DOCS/Tutorial 2、安装mongoDB A、不解压模式：将下载下来的mongoDB-xxx.zip打开，找到bin目录，运行mongod.exe就可以启动服务，默
CUDA 5 Release Candidate Now Available aijuans CUDA
The CUDA 5 Release Candidate is now available at http://developer.nvidia.com/<wbr></wbr>cuda/cuda-pre-production. Now applicable to a broader set of algorithms, CUDA 5 has advanced fe
Essential Studio for WinRT网格控件测评 Axiba JavaScript html5
Essential Studio for WinRT界面控件包含了商业平板应用程序开发中所需的所有控件，如市场上运行速度最快的grid 和chart、地图、RDL报表查看器、丰富的文本查看器及图表等等。同时，该控件还包含了一组独特的库，用于从WinRT应用程序中生成Excel、Word以及PDF格式的文件。此文将对其另外一个强大的控件——网格控件进行专门的测评详述。网格控件功能 1、
java 获取windows系统安装的证书或证书链 bewithme windows
有时需要获取windows系统安装的证书或证书链，比如说你要通过证书来创建java的密钥库。有关证书链的解释可以查看此处。 public static void main(String[] args) { SunMSCAPI providerMSCAPI = new SunMSCAPI(); S
NoSQL数据库之Redis数据库管理(set类型和zset类型) bijian1013 redis 数据库 NoSQL
4.sets类型 Set是集合，它是string类型的无序集合。set是通过hash table实现的，添加、删除和查找的复杂度都是O(1)。对集合我们可以取并集、交集、差集。通过这些操作我们可以实现sns中的好友推荐和blog的tag功能。 sadd：向名称为key的set中添加元
异常捕获何时用Exception，何时用Throwable bingyingao
用Exception的情况 try { //可能发生空指针、数组溢出等异常 } catch (Exception e) {
【Kafka四】Kakfa伪分布式安装 bit1129 kafka
在http://bit1129.iteye.com/blog/2174791一文中，实现了单Kafka服务器的安装，在Kafka中，每个Kafka服务器称为一个broker。本文简单介绍下，在单机环境下Kafka的伪分布式安装和测试验证 1. 安装步骤 Kafka伪分布式安装的思路跟Zookeeper的伪分布式安装思路完全一样，不过比Zookeeper稍微简单些(不
Project Euler bookjovi haskell
Project Euler是个数学问题求解网站，网站设计的很有意思，有很多problem，在未提交正确答案前不能查看problem的overview，也不能查看关于problem的discussion thread，只能看到现在problem已经被多少人解决了，人数越多往往代表问题越容易。看看problem 1吧： Add all the natural num
Java-Collections Framework学习与总结-ArrayDeque BrokenDreams Collections
表、栈和队列是三种基本的数据结构，前面总结的ArrayList和LinkedList可以作为任意一种数据结构来使用，当然由于实现方式的不同，操作的效率也会不同。这篇要看一下java.util.ArrayDeque。从命名上看
读《研磨设计模式》-代码笔记-装饰模式-Decorator bylijinnan java 设计模式
声明：本文只为方便我个人查阅和理解，详细的分析以及源代码请移步原作者的博客http://chjavach.iteye.com/ import java.io.BufferedOutputStream; import java.io.DataOutputStream; import java.io.FileOutputStream; import java.io.Fi
Maven学习(一) chenyu19891124 Maven私服
学习一门技术和工具总得花费一段时间，5月底6月初自己学习了一些工具，maven+Hudson+nexus的搭建，对于maven以前只是听说，顺便再自己的电脑上搭建了一个maven环境，但是完全不了解maven这一强大的构建工具，还有ant也是一个构建工具，但ant就没有maven那么的简单方便，其实简单点说maven是一个运用命令行就能完成构建，测试，打包，发布一系列功
[原创]JWFD工作流引擎设计----节点匹配搜索算法(用于初步解决条件异步汇聚问题) 补充 comsci 算法工作 PHP 搜索引擎嵌入式
本文主要介绍在JWFD工作流引擎设计中遇到的一个实际问题的解决方案，请参考我的博文"带条件选择的并行汇聚路由问题"中图例A2描述的情况(http://comsci.iteye.com/blog/339756),我现在把我对图例A2的一个解决方案公布出来，请大家多指点节点匹配搜索算法(用于解决标准对称流程图条件汇聚点运行控制参数的算法) 需要解决的问题：已知分支
Linux中用shell获取昨天、明天或多天前的日期 daizj linux shell 上几年昨天获取上几个月
在Linux中可以通过date命令获取昨天、明天、上个月、下个月、上一年和下一年 # 获取昨天 date -d 'yesterday' # 或 date -d 'last day' # 获取明天 date -d 'tomorrow' # 或 date -d 'next day' # 获取上个月 date -d 'last month' #
我所理解的云计算 dongwei_6688 云计算
在刚开始接触到一个概念时，人们往往都会去探寻这个概念的含义，以达到对其有一个感性的认知，在Wikipedia上关于“云计算”是这么定义的，它说： Cloud computing is a phrase used to describe a variety of computing co
YII CMenu配置 dcj3sjt126com yii
Adding id and class names to CMenu We use the id and htmlOptions to accomplish this. Watch. //in your view $this->widget('zii.widgets.CMenu', array( 'id'=>'myMenu', 'items'=>$this-&g
设计模式之静态代理与动态代理 come_for_dream 设计模式
静态代理与动态代理代理模式是java开发中用到的相对比较多的设计模式，其中的思想就是主业务和相关业务分离。所谓的代理设计就是指由一个代理主题来操作真实主题，真实主题执行具体的业务操作，而代理主题负责其他相关业务的处理。比如我们在进行删除操作的时候需要检验一下用户是否登陆，我们可以删除看成主业务，而把检验用户是否登陆看成其相关业务
【转】理解Javascript 系列 gcc2ge JavaScript
理解Javascript_13_执行模型详解摘要: 在《理解Javascript_12_执行模型浅析》一文中,我们初步的了解了执行上下文与作用域的概念，那么这一篇将深入分析执行上下文的构建过程，了解执行上下文、函数对象、作用域三者之间的关系。函数执行环境简单的代码:当调用say方法时，第一步是创建其执行环境，在创建执行环境的过程中，会按照定义的先后顺序完成一系列操作:1.首先会创建一个
Subsets II hcx2013 set
Given a collection of integers that might contain duplicates, nums, return all possible subsets. Note: Elements in a subset must be in non-descending order. The solution set must not conta
Spring4.1新特性——Spring缓存框架增强 jinnianshilongnian spring4
目录 Spring4.1新特性——综述 Spring4.1新特性——Spring核心部分及其他 Spring4.1新特性——Spring缓存框架增强 Spring4.1新特性——异步调用和事件机制的异常处理 Spring4.1新特性——数据库集成测试脚本初始化 Spring4.1新特性——Spring MVC增强 Spring4.1新特性——页面自动化测试框架Spring MVC T
shell嵌套expect执行命令 liyonghui160com
一直都想把expect的操作写到bash脚本里,这样就不用我再写两个脚本来执行了,搞了一下午终于有点小成就,给大家看看吧. 系统:centos 5.x 1.先安装expect yum -y install expect 2.脚本内容: cat auto_svn.sh #!/bin/bash
Linux实用命令整理 pda158 linux
0. 基本命令　　linux 基本命令整理　　1. 压缩解压　　tar -zcvf a.tar.gz a #把a压缩成a.tar.gz 　　tar -zxvf a.tar.gz #把a.tar.gz解压成a 　　2. vim小结　　2.1 vim替换　　:m,ns/word_1/word_2/gc
独立开发人员通向成功的29个小贴士 shoothao 独立开发
概述：本文收集了关于独立开发人员通向成功需要注意的一些东西,对于具体的每个贴士的注解有兴趣的朋友可以查看下面标注的原文地址。明白你从事独立开发的原因和目的。保持坚持制定计划的好习惯。万事开头难，第一份订单是关键。培养多元化业务技能。提供卓越的服务和品质。谨小慎微。营销是必备技能。学会组织，有条理的工作才是最有效率的。 “独立
JAVA中堆栈和内存分配原理 uule java
1、栈、堆 1.寄存器：最快的存储区, 由编译器根据需求进行分配,我们在程序中无法控制.2. 栈：存放基本类型的变量数据和对象的引用，但对象本身不存放在栈中，而是存放在堆（new 出来的对象）或者常量池中（字符串常量对象存放在常量池中。）3. 堆：存放所有new出来的对象。4. 静态域：存放静态成员（static定义的）5. 常量池：存放字符串常量和基本类型常量（public static f