ZhiningLiu

译：深度学习，自然语言处理及特征表示方法 Deep Learning, NLP, and Representations

from: http://colah.github.io/posts/2014-07-NLP-RNNs-Representations/

Intro

过去数年间，深度神经网络（DNN）已经统治了模式识别领域，尤其在计算机视觉领域，DNN几乎将此前的旧有方法全部赶出了竞争舞台，语音识别领域的情况也在向同样的方向发展。但暂且抛开表面结果，为什么DNN会获得如此大的成功？

这篇博文回顾了在DNN在自然语言处理（NLP）领域的应用中数种极具代表性的方法及其结果。此举的目的是想通过尽量优雅简洁的方式，帮助各位更好地理解DNN之所以如此work的原因。

One hidden layer neural networks

我们已知道单隐层NN具有一条性质：给定足够多的隐层单元，单隐层网络可以1/n的精度逼近任意函数。这是一个经常被提及——但不幸的是被更多人错误理解了的一条结论。

直观来看这条定理的确是正确的，因为我们可以将隐层以查找表的方式来使用 (used as a lookup table)。

为了简洁起见，考虑一个感知机网络。我们知道感知机是一个非常简单的神经元，在达到某一阈值的时候被激活，在未达到的时候不激活。一个感知机网络接收0-1的二值化输入并给出二值的输出。

注意此处只有有限种可能的输入（由于是二值的，有n^2个可能输入）。为每一个可能的输入，我们可构建一个神经元被且仅被该输入激活，而后我们可以利用该神经元与输出层的连接权值来控制该输入情况下的输出。

由上可知，单隐层网络的确是具有普适性的逼近能力，但拥有这个能力并不稀奇。模型能做到跟查编码表一样的功能并不会是一个证明模型优越性的有力论据：这只意味着你的模型并不能很好地完成现实任务。

普适性意味着一个网络可以拟合任意给定的训练数据，但并不意味着该网络对未知的新数据有很好的泛化预测能力。

所以我们得到了一个结论，普适逼近的能力并不能解释为什么神经网络有如此良好的表现，看起来真实的原因隐藏的更深。。。为了理解它，我们首先需要了解一些确切的结论。

Word Embeddings

首先引入一个深度学习研究的分支：词嵌入作为一个确切的例子来开始整篇文章。以我个人的观点来看，词嵌入是当前最激动人心的深度学习研究领域之一，尽管在十多年前Bengio等人就提出了其基础理论[3]。在这之外，我认为这也是一个极佳的可以用来解释DL高效性的领域。

词嵌入 W : words -> Rn 是一个参数化的函数，可将某种语言中的一个词汇映射为一个n维实数空间中的向量（可能有200-500维）。举个栗子:

（一般来说，此函数为一个由参数矩阵θ决定的矩阵，每行对应一个词）

一般对于每一个词生成一个随机向量来初始化 W，其在最优化某些目标的过程中完成学习，最终生成有意义的词向量。

举个栗子，我们可能想要训练一个网络来预测一个5-gram（五个词汇构成的序列）是否是“有效的”。我们可以很轻易地从维基百科上得到很多5-gram（如："cat sat on the mat"）然后通过随机替换某一个词（如："cat sat song the mat"）来将它们"破坏"，如此我们可以让替换后的5-gram变得无意义，得到一些无意义的句子。

我们要训练的模型会在输入的5-gram的每一个单词上运行得到对应该单词的向量，然后这些向量将会传递给另一个模块（此处记做R），R将会尝试预测输入的5-gram是“有效的(valid)”还是“被破坏过的(broken)”。

译：深度学习，自然语言处理及特征表示方法 Deep Learning, NLP, and Representations_第4张图片

为了实现这些值的正确预测，网络需要为模型 W 和 R 都学习到较好的参数。

目前看来，这个任务本身并不是非常的有意思。它可能可以用来检测文档中语法错误或者别的什么，仅此而已。但真正有趣的，也是我们真正关心的是 W。（实际上，对我们来说，上述任务的关键点就在于学习W。我们还可以使用别的一些什么任务——另一个常被使用的是预测句子中的下一个词。但我们并不关心任务本身。在本节的余下部分里会讨论很多词嵌入的结果，并且此处对不同方法间的差异不做过多区分。）

先来做一件事：使用一种复杂的可视化高维数据的技术t-SNE，来可视化词嵌入的向量空间，感觉一下词嵌入究竟在做什么。

t-SNE的词嵌入可视化结果 From Turian et al. (2010)

这样的词图可以让我们更直观的看到词嵌入在做什么：相似的词位置会相对靠近。我们也可以观察与一个给定的词的嵌入结果最相近的词（下图），一般来说这些词的含义会趋于相似。

数个给定词的“嵌入最近”词表，From Collobert et al. (2011)

网络给意思相近的词汇赋予一个相近的向量是很自然的行为。如果将一个句子中的词替换为它的同义词（例："a few people sing well" -> "a couple people sing well"），这个句子的有效性并没有被改变。但是单纯观察原始输入的句子，一个词的替换是很大的改变了，如果我们训练的 W 可以将同义词以及近义词映射为距离比较近的向量，那么在决策器 R 看来，R接受的输入并不会有太大的改变。

上述特性是一个非常有用的特性，一种语言中可能的5-grams组合的数目十分庞大，相比之下，我们只有数目非常有限的训练样本可供学习使用。相似词汇的映射接近性可以让我们把对一个句子的处理方式和结果，推广到与其相似的该类句子集合上去。此处所说的推广并不只意味着将一个词替换为同义词，我们也可以处理讲一个词替换为同一类词的情况（例："the wall is blue" -> "the wall is red"）。更进一步地，我们还可以推广到多个同类词的替换（例："the wall is blue" -> "the ceiling is red"）。随着单词数量的提升，这种推广效应可处理的同类句子数量会呈指数级上升。

现在我们知道了 W 所做的工作非常具有现实意义，但是 W 是如何实现这个学习过程的呢？有时在处理类似于“墙是红色的”这种句子之前，模型已经处理过类似的句子，例如“墙是蓝色的”，并且得到了该句子是有效的结论，这种情况在训练过程中会经常出现。既然如此，我们发现将“红色”的嵌入结果向“蓝色”对应的向量稍微靠近一些可以让系统表现的更好。

在模型中，我们仍需要处理每一个样本，但是类推的能力可以赋予模型更好的泛化能力，能让模型把已有的知识应用于没遇到过的句子的分类中去。以人类为例，你见到一个新单词就会理解一个新单词，但当你见到一个新句子，可以理解很多个与其类似的新句子，即使这些句子此前你并没有遇到过。我们尝试赋予网络的就是这个能力。

词嵌入还表现出了一个更加令人称奇的特性：词与词之间的类推关系似乎被编码在了词汇间的差异向量（向量的差值）之中。举个栗子，我们可以看到此处似乎生成了一个表示“男女差异”的一致的差异向量（constant male-female difference vector）。

其中：

可能这个结果看起来没什么大不了的。但是我们做一下思考，由于性别代词的存在。使得这种有男女差异性词汇的不当使用可以造成句子的语法错误。比如我们会说“她是姑姑”与“他是舅舅”，相似地“他是国王”和“她是女王”也是如此。如果我们看到“她是舅舅”这样一个句子，一般会认为这个句子存在语法上的错误。在本节讨论的问题中我们会随机替换一个词，上述不当替换情况出现的可能性会非常大。

“那是当然！”可能会有人这样说“词嵌入当然可以学习如何编码性别之间的差异，要我说，很有可能最后的向量空间里有一个维度就是专门描述性别的，单数/复数可能也是这么区分出来的！分辨这种简单特征我上我也行！”

但实验结果表明，很多比性别复杂的多的关系也同样可以以这种方式编码，实在是很神奇。

在词嵌入中可以找到的关系对 From Mikolov et al.(2013b).

注意：所有这些有利特性其实都是“附带效应”，我们并未显式地约束词嵌入模型应该让相似的词汇彼此靠近，也没有让它将词汇间的类比关系编码在差异向量中。任务自始至终都非常简单，比如判断一个句子是否有效。所有这些有利的特性或多或少都是在最优化过程中自然形成的。

此处我们可以看到神经网络的一大优势：神经网络模型可以自动地学习如何更好地表示数据（由低级特征解离出高层特征）。而更好的数据表示，目前来看是解决很多机器学习问题的关键。词嵌入只是一个展现NN特征学习表示能力的，特别显著的例子。

Shared representations

词嵌入模型所表现出的特性的确非常有趣，但是我们能不能利用这些特性做一些实际的事情呢？而不是预测一些，比如一个5-grams是否是有效的，这种愚蠢的问题。

我们是为了在一个简单任务中得到更好地表现而学习的词嵌入模型，但基于我们观察到的词嵌入模型的良好表现，你可能会设想将其应用到一些更实际的NLP问题当中去。实际上，类似于此的词表示方法是非常非常重要的：

"词表示方法的应用...已经成为了今年很多NLP系统取得成功的"致胜秘诀（secret sauce）"，其应用范围涵盖命名实体识别，词性标注，词义解析和语义角色标注。(Luong et al. (2013))

这种泛用性的策略——在任务A上学习良好的表示而后在任务B上再次使用它——是深度学习工具使用的主要窍门（trick）之一。取决于任务细节的不同它也有不同的名字：预训练、迁移学习和多任务学习。此种方法的关键优势之一是其可以从多于一种的数据中学习其表示。

学习W，F以处理任务A，之后G可以在W的基础上学习以处理任务B

这个trick有一个与之对应的想法。我们可以学习一种将多种数据映射为单一表示的方法，而不是学习如何表示一种数据并使用它来执行多种任务。

Socher et al. (2013a) 提出的双语词嵌入系统是一个非常好的例子。我们可以学习如何将来自两种不同语言的单词映射到一个共享的特征空间去。此处我们学习如何在同一个空间中嵌入英文和中文单词。

我们以上述方式训练两个词嵌入模型Wen和Wzh，此处我们还知道一些先验知识：已知的一些英语词汇与中文词汇有相似的含义。所以在求解最优化问题时，我们可以加上相应的罚项来使这些已知的双语词汇对的词向量互相尽可能地靠近。

最终我们可以观察到那些我们已知的翻译词汇对的词向量会比较接近，由于我们在最优化问题中加入了这一目标，所以这个结果是合理的。但是有趣的事情发生了：那些我们未知的翻译词汇对的词向量也十分接近。

鉴于我们此前观察到的词嵌入模型的特点，这个结论可能并不是特别令人惊讶。词嵌入模型会将相似的词的向量聚集在一起，所以如果我们给定一个英语词汇与中文词汇的对应关系，则两个词在各自语言中的同义词也会彼此接近。此外我们还知道词汇之间的类别差异会趋向于被一个一致的差异向量所表示，所以如果我们在两种语言不同类的词汇中给定足够多的翻译配对，应该就可以强制英语词嵌入和中文词嵌入模型生成相似的类别差异向量。带来的结果就是，如果我们给定一对“男性版本”词汇的翻译配对，模型应该可以由此学习出“女性版本”词汇的翻译配对。

直观来看这个过程，可以理解为对于一部分类别，给定这些类别的一些词在两种语言中的对应关系，从而固定两种语言中这些类别的词向量位置，此后再由这些固定位置的类别与差异向量产生其他类别的位置，最终使两种语言的嵌入有着类似的“形状”。

t-SNE可视化的双语词嵌入结果，绿色为中文，黄色为英文 (Socher et al. (2013a))

在双语词嵌入中，我们为两种非常相似的数据学习了一个共享的表示方法。但进一步地，我们还可以学习如何将两种非常不同的数据映射到同一个特征空间中去。

最近，深度学习的相关研究已经开始探索可以将图像与词汇映射为同一种表示的模型。

其用来分类图像基础想法是模型对一个图像输出一个词向量。狗的图像的词向量会被映射到“狗”这个词的词向量附近，马的的图像映射到“马”附近，车的图像映射到“车”附近，以此类推。

该模型有趣的部分在于使用它尝试分类一种它从未见过的图像的时候。举个栗子，假设该模型从未被训练过检测含有猫的图像——即未被告知过猫的图像应该被映射在“猫”的词向量附近——那么当我们尝试使用这个模型分类猫的图像时，会发生什么呢？

(Socher et al. (2013b))

从结果来看，网络仍然能够给这些未见过的新一类图像一个合理的分类结果。含有猫的图像并未被映射到语义空间的随机点，相反，这些猫的图像会趋向于被映射到“狗”的词簇的词向量范围附近，并且实际上更靠近“猫”向量。同样地，卡车的图像被映射到“汽车”附近，并且相比之下更靠近“卡车”向量。

(Socher et al. (2013b))

斯坦福NLP组的成员仅使用了8个已知类（和两个未知的类）就得到了上图所示的结果，已经令人印象十分深刻。但是由于已知的类很少，所以只有很有限个点能够用来表示图像和语义空间之间的映射关系（不是很理解，原文：But with so few known classes, there are very few points to interpolate the relationship between images and semantic space off of.）。

几乎与此同时Google的组做了一个更大规模的实验——他们用了1000个类，而非8个(Frome et al. (2013))，并且此后又有了新的变种(Norouzi et al. (2014))。这些方法都基于同一个非常强力的图像分类模型(Krizehvsky et al. (2012))，但在将图像嵌入到语义空间时所用的方法有一些小小的偏差。

实验结果是令人印象深刻的。即便模型不一定能够给所有未见类的图像都映射一个完全精确的代表该类的向量，但其能够保证至少映射到正确类的近邻类中去。所以，如果你使用该模型来分类数个不同的未见类图像，且其各自所属的类之间差别巨大，该模型的分类结果能够分辨出这种差别。

即便我之前从没见过Aesculapian蛇和Armadillo（犰狳），但如果你给我看这两种动物的照片，我仍然能够告诉你哪个是哪个，因为我对于可能与这两个词分别相关的其他动物有一个大致的判断，然后根据相关的已知动物的样子做出最终判断。这个网络所做的事与此差不多。

（这些结果都是利用某种“这些词类似”的推理规则得到的，但似乎基于单词之间的关系来推导可能会有更好的结果。在我们的词嵌入空间中，男性版本词汇和女性版本词汇之间存在一致的差异向量。而在图像空间中，男性和女性之间则有着一致的区别特征，络腮胡、小胡子、秃头都是某种显而易见的且强烈的男性特征，而乳房、长头发、化妆和珠宝则是显而易见的女性指标。即使你以前从未见过国王，但如果皇后都喜欢戴王冠或者突然都留起了络腮胡，则此时认为“皇后”是一个男性版本的词汇也是合理的。）

共享数据表示是一个非常令人令人兴奋的研究领域，并且它也阐释了为什么关注于数据表示的深度学习方法能受到如此大的关注。

Recursive Neural Networks

（关于递归神经网络RNN与其变体LSTM，见之前转载的简要理解LSTM）

我们以如下的网络结构开展关于词嵌入的讨论：

学习词嵌入模型的模块化网络(From Bottou (2011))

上图表示了一个可写作R(W(w1), W(w2), W(w3), W(w4), W(w5))的模块化网络（Modular network）。其主要包含两个模块 R 和 W。这种将小的神经网络拼接形成总体神经网络结构的方法并未得到非常广泛的应用，但其在NLP领域获得了巨大的成功。

上图所示的模型很强大，但不幸的是有一个限制条件：只能接受固定个数的输入。

可以通过添加关联模块A来解决这个问题，该模块可取得两个单词或短语的表示并将它们融合。

(From Bottou (2011))

通过不断合并单词序列，A将单词的表示转化为短语的表示，甚至最终得到整个句子的表示！同时因为我们可以合并不同数量的单词，所以我们不必拥有固定数量的输入。

考虑到线性地组合句子中的单词并不一定有意义，比如考虑句子“The cat sat on the mat”，根据语义可以做如下分解：“((the cat) (sat (on (the mat))))”。我们基于此分解来应用模型A：

(From Bottou (2011))

这种模型通常被称为“递归神经网络”，因为一个模块的输出经常会被输入给一个相同类型的模块。它们有时也被称为“树状结构的神经网络”。

RNN已经在相当数量的NLP任务中取得了巨大成功。例如Socher et al. (2013c)使用一个递归神经网络来预测句子的情绪：

还有一个主要的目标是创建一个可逆的句子表示，利用这个表示可以重构一个实际的句子，其意义与原句大致相同。例如，尝试引入一个解码器 D （A为编码器），它尝试完成的是 A 的逆操作：

(From Bottou (2011))

如果我们能完成类似的工作，这将会是一个非常强力的工具，比如我们可以尝试建立一个双语的，以句子为输入的表示，并可用其来进行机器翻译。

但不幸的是这个目标非常难以实现，非常非常难以实现（注：本文写于2014年，相关知识可参见AutoEncoder,与16年刘铁岩博士组提出的对偶学习于神经机器翻译的应用）。但考虑到它所能带来的美好愿景，很多研究者都在进行相关的工作。

最近Cho et al. (2014)在短语表示的工作上取得了一些进展，实现了一个可以编码英语短语并解码为法语的模型。我们来看一看它所学到的短语表示：

t-SNE可视化的短语表示结果的一小部分(From Cho et al. (2014))

Criticsms

我曾听到过一些批评上述结论的声音，大部分来自其他领域的研究者，主要地，来自自然语言处理以及（计算）语言学。重点不在于这些结果本身，而是从这些结果中我们能够得到的结论，以及这些技术与其他技术的横向对比。

我不认为我有资格评判这些观点谁是谁非，但我鼓励各位有相似担忧或者其他想法的读者在评论中留下你们的想法。

Conclusion

深度学习模型强大的抽象表现能力是一个强有力的观点，这似乎可以回答DNN为何有效这个问题。在这之上，我认为其中隐藏着一些非常美妙的性质：为什么NN如此有效？原因是更好的数据表示方法，更有意义的高级特征，可以在分层模型的最优化过程中慢慢浮现出来。

深度学习是一个非常年轻的领域，其还没有扎实的理论基础，并且各种观点在飞快地更替。也就是说，以表示为中心的神经网络在当下非常流行仅仅是我个人的观点。

这篇文章回顾了很多我认为非常exciting的研究成果，但我的主要动机是为将来阐明深度学习、类型理论与函数式编程之间的关系打好基础。如果你感兴趣可以订阅我的rss feed，以便在在我发布新博文的第一时间收到通知。

（我非常乐意听取各位的意见和想法：对于错别字、技术错误或者希望添加的说明等等，都欢迎在评论中提出，或在github上pull request）

Acknowledgments

I’m grateful to Eliana Lorch, Yoshua Bengio, Michael Nielsen, Laura Ball, Rob Gilson, and Jacob Steinhardt for their comments and support.

Constructing a case for every possible input requires 2n hidden neurons, when you have n input neurons. In reality, the situation isn’t usually that bad. You can have cases that encompass multiple inputs. And you can have overlapping cases that add together to achieve the right input on their intersection.↩
(It isn’t only perceptron networks that have universality. Networks of sigmoid neurons (and other activation functions) are also universal: give enough hidden neurons, they can approximate any continuous function arbitrarily well. Seeing this is significantly trickier because you can’t just isolate inputs.)↩
Word embeddings were originally developed in (Bengio et al, 2001; Bengio et al, 2003), a few years before the 2006 deep learning renewal, at a time when neural networks were out of fashion. The idea of distributed representations for symbols is even older, e.g. (Hinton 1986)."↩
The seminal paper, A Neural Probabilistic Language Model (Bengio, et al. 2003) has a great deal of insight about why word embeddings are powerful.↩
Previous work has been done modeling the joint distributions of tags and images, but it took a very different perspective.↩
I’m very conscious that physical indicators of gender can be misleading. I don’t mean to imply, for example, that everyone who is bald is male or everyone who has breasts is female. Just that these often indicate such, and greatly adjust our prior.↩

今天有点丧，但是…… 无名的心情杂货铺
总有一段难熬的日子，让你自我怀疑。不过当你再经历多一点，会发现，那只是生活的常态。无名：今天有些丧，来的莫名其妙，但是就是什么也不想做，甚至手机都不愿意打开，每个月总有那么几天？好吧，手机插上耳机，打开喜马拉雅电台听一些鸡汤吧。听着听着就听到了一些感觉特别的话，与你们分享一下。你已经做的很好了，别听别人瞎扯。要心地善良，要温柔活着，要对得起自己说的每一句话，别成为别人心头落的那一朵雪花，别质疑自己
你的科三是怎么挂的呢？爱叨叨的Ziye
果然，毫无悬念的挂了。虽然是在意料之中，但还是有点不开心啦。想起今天傻头傻脑的自己，真的还是有点无语又无奈呀。取完号在排队的时候，头脑还是感觉空白的，3条路线记了又忘，记了又忘。在等待区拿着图纸想着临时抱佛脚再几多几次。旁边协助考生取号的工作人员大哥反而还过来跟我瞎扯安慰我别紧张，哈哈哈。“别紧张，不用太刻意记的，随机应变，放轻松就好啦。”“我路痴，真的记不了路线，第一天记好了1号线，第二天记好了
《daddy》果迷吸猫
果糖养父果x养子其02田柾国半夜回来了。看见闵玧其张着小嘴在自己床上心里软得一塌糊涂，草草的洗了个澡，屁颠屁颠的回到床上，把小孩搂进自己怀里，充电。“卧槽！你干嘛抱着我恶不恶心啊田柾国！”闵玧其一大早清嗓子，吼得田柾国的脑子嗡嗡嗡。田柾国不耐烦地撩了下兔毛，不屑地看着闵玧其“咋了，你爸抱抱你都不行了？小时候你老喜欢我抱你了，抱完还要亲….”闵玧其的耳根子都红了“得得得，你闭嘴吧，不听你瞎扯，抱就抱
2021.07.22简单日记谢谋淦
2021.07.22晴热，当高温来的时候，天气预报，报今天仍然报33摄氏度，这就是继续纯粹瞎扯淡。早饭八宝粥加牛奶一瓶，然后去开门做生意，没生意赶集买小米10块钱红枣10块钱西瓜16块钱，回来西瓜半个分给房客。去客户门店安装摄像头。午饭客户请吃盒饭。吃完了睡午觉。回家烧开水喝顺便吃片西瓜，感觉午饭没吃饱肚子空空的！去牛肉汤馆吃牛肉汤加两个饼12块钱。股市收盘三大指数涨跌不一，个股涨一片，我的股票涨
力挺素分析夫妻感情好的原因，只有这点最真实，其他都是瞎扯！易熙
引言：从人性的角度看，任何感情都有懈怠期，哪怕再相爱，对彼此的身体都会审美疲劳。假如换一个人，就能产生新鲜感。但为了这点新鲜感，一直换人吗？人终究是感情的动物，而爱情又与性息息相关，性与爱，容易混淆起来。我有一个认识十年的女性朋友，她最初给我的印象，酷酷的，不食人间烟火，她最鄙视那些为了爱情死去活来的女生。“不就是个男人么，至于么？”有一次，她喝醉了，曾指着我的鼻子说：“你们男人，没有一个好东西，
三十不豪，四十不富，五十将相寻死路果仁儿
听过许多音乐，也喜欢过很多音乐人，然而能形容我此刻心情的，还是李宗盛的歌，乐评人对李宗盛的评价不可谓不高：“年少不识李宗盛，再听已是曲中人！”他的歌词总有一种无奈的洒脱，就像他的演唱会主题：“既然青春留不住，还是做个大叔好！”以前总是哼哼：想得却不可得，你奈人生何，该舍得舍不得，只顾着跟往事瞎扯……，歌词不甚华丽，但却总能一针见血字字戳心，我最初听时，并不是被李宗盛那洒脱的嗓音所吸引，而是被这谱写
90-7-8 活着才有资格说未来胡永群
最近，遇见从职场转型出来的小伙伴，理想很丰满，现实很骨感，我竟然从一个被批评理想化的人，被磨成了超现实的存在，大牙说了一句大实话，活着才有资格说未来，其他都是瞎扯淡！在这样的经济形势下，创业人大都都会在坚持“活着”，我也不例外。中午和一位咨询师朋友吃饭，聊到了项目的出口和入口，流程，产品，合作机制，团队，培育，其实全案管理咨询的思维逻辑已经是非常严谨完整了，只是，我们在项目初创的时候，得活下来先。
婆媳斗争是怎么炼成的疯子乙
可能很多人认为，我一还没结婚的老男人，谈不得婆媳关系的话题，毕竟没经验啊，能瞎扯什么。没吃过猪肉也可以见过猪跑的，为什么现在很多年轻人恐婚？原因之一也是看透了这个问题，不愿过早地往火坑里跳。但逃避并不代表不关心，甚至旁观者还看得更清。所以，未婚老男人也还是可以说几句的。以我看过的猪跑，哦不，是见过的婆媳斗争，成因大概可以归结为三种：1.媳妇熬成婆2.中间人立场不正3.人品问题1.第一种，媳妇熬成婆
2023-02-05 以后断更啦
刚刚结束了四人组推迟已久的聚会，各自有各自的规划，目标都是一致的。喝了酒后发现自己也不再社恐，也可以侃侃而谈～聊了很多没用的话，中间也聊到了关于她的一些话题，自己的脸当时立马阴沉下来，把手中的筷子甩到对面的人，没有犹豫，没有迟疑。。氛围一度尴尬，他们对我来说可有可无，但是她不行。我不允许别人有任何的谈资。以前从没有想到过谈天论地的瞎扯会扯到这些。自己就是一个恋爱脑，也许改不了。真正认识她有三年，新
我们一起玩AI 5 —— 偏导数与梯度下降 ASRay明日丽科技
5秒导读，本文将讲述偏导数，梯度，方向导数，与线性回归权重向量θ的求法大家好，我是玩ai时长两年半的个人程序猿ASRay，喜欢读，写，编程，数学....板砖！要理解什么是偏导数，就必须先明白“鸡你太美”的奥义，这可不是瞎扯！因为偏导数指的是多元函数对某个自变量如y或x的导数，而鸡的眼睛长在侧边，当鸡看一个立体的函数，它只能看见一个面，所以鸡眼多元函数的导数正是偏导数！不过在开始偏导数前我们先回顾一
精忠报国的岳飞，为什么会含冤而死？均哥看历史
1142年，在宋金议和过程中，含冤入狱的岳飞被以莫须有的罪名杀害。可以说，岳飞的惨死也是南宋走向没落开端，而千百年来，宋高宗赵构为什么要处死岳飞，也一直为史学爱好者争论的焦点。近几年，很多历史博主、网文作者和专家提出，岳飞的死是因为功高震主、情商低、不听话……造成的。这其实这是天大的瞎扯和误解，这种诛心之论也这着实让小编震惊，这不是把岳飞冤死的责任又推到了岳飞头上吗？就小编来说这完全就是胡说八道…
你抽不出时间来提升么？全是瞎扯！山野村翁
夜里所有的一切似乎都睡了：风停了，白天工作的嘈杂声消失了，门前杏树上那嘤嘤嗡嗡的蜜蜂也不知去向，人们次第进入梦想，睡个好觉，明天重新迎接新一天的太阳。而我却没有入睡，独在异乡的乡愁已经开始汹涌澎湃；年过不惑仍在四处漂泊，似乎已成习惯，喜欢写点东西的我终于能在此刻静下心来，写写东西，听听老师的讲课。图片发自App忙着，得让自己忙着，忙得目标明确，忙得有所收获。紧张劳累的工作已让很多人学习成了奢侈，抽
我有点饿了莫南向下
这个点了，我有点饿了。再有一个小时十五分钟过去，我就差点断更了，好不容易躺下，抓紧把今天的日更写完。其实每天过的平平淡淡，并没有什么想说的话，肚子里也没什么墨水，辞藻匮乏，坚持日更也是瞎扯些文字。唯一的一个想写的感受就是：这个时代，或者说这个社会，每个人的倾诉欲都那么强，所以我可能更适合做一个倾听者吧。
我与特朗普――摘自我的原创《认真瞎扯集》惊风洞主
特朗普大选获胜那年，邀请我去白宫参加就职典礼，被我回绝了。原因很简单，十几年前我就在媒体上表态说我两个地场合坚决不去，一个是诺贝尔颁奖现场，一个就是白宫。但是我所在的城市政府的官员却接二连三地开始造访我，目的只有一个，就是动员我接受邀请，害怕我此举会给中美之间的国际政治关系带来负面影响。我还是不同意。后来我们省里的一位秘书长亲自来了，耐心地疏导我一个下午，见我态度异常坚决，他感觉非常遗憾；最后还不
陈波：如何以最快的速度去拥有透过现象看本质的能力？陈波的频道
向上的路，并不拥挤拥挤是因为，大部分人选择了安逸每当看到这句话小聪就想起来，他在读大学的时候他们那个系的36个男生，就有35个都在打lol而只有小聪一个人在那死磕学习各种书籍还有各种各样大师的分享…他们一起毕业以后小聪还是会每天早上抽出1到2小时时间继续读读书一直坚持到现在，还是保留着这个习惯然而小聪就发现他身边的人不是在刷抖音，就是在瞎扯蛋，或者看电视剧…而没有一个人愿意去继续深造自己，不愿意在
北大毕业送外卖？少瞎扯淡了！李罗伯
你看到了，这两天，一个北大毕业生送外卖的文章，引起大家的转发和热议。是的，文章作者的目的达到了，通过“名校”和“底层”的强烈反差和对比：头顶名校的光环，消费了底层，销售了自己。不愧是出自一个读文科人的手笔，作者大篇幅都在讲故事，这讲故事的能力还是不错的，至于故事当中，有多少是虚构的成分，就不得而知了。反正，其通过各位的手和各平台的转发，成功地收获了阅读量（流量）。1别总拿名校说事，蹭名校热度，OK
随笔为游而生
今天忙忙碌碌一天，来到金华培训，今天上课上了的感觉这个老师水平没有，只会瞎扯，基本上没有讲到有用的东西，讲的全都是没用的，看来还是要自己去弄啊，要去找个鉴定中心认识的，要题库了，要不然感觉难度有点大，明天晚上再去听一下，如果还是这样的，一点用都没有的话，就准备回去了，把东西交掉，回去自己好好看书吧，明天下午过去跟那边的老师问下能不能拿到题库，自己好好复习，快11点了，小宝贝儿，洗洗睡觉了，晚安，爱
为什么我们不喜欢写毕业论文？道格儿
（原作作于2015年3月，本科毕业答辩前几个月）这个问题是在看公开课《公正》的时候想到的。在开题答辩的时候，我也曾想过，到底要不要提我这个研究的创新点，但后来还是没有提。关于这个问题我是这样想的，尽管鼓励创新，但是创新并不是凭空瞎扯，真正如何做研究还都没做到，如何谈创新呢？尽管初生牛犊可能会有更多的想法，但是还是需要基础。在跟同学讨论我的毕设题目的时候，有同学也质疑，问我的研究与之前的相比进步在哪
2018-12-18遭遇毫不讲理的审图公司谦这武器
今天遇上了一个非常刁钻的审图公司。这家审图公司就跟官老爷一样难伺候。分明没具体在工地干过活，尽提一些不着边际的纸上谈兵的瞎扯淡的事情，真正关键的地方他却没有看出来。专业倒是有两把刷子，说什么周期折减系数啊、施工模拟加载啊，都是些云里雾里的的东西。跟这个加固没任何干系。真是个傻逼。马上12点了，赶紧日更今天的作业。晚安！
高考之后，他们在民政局排队晴人梅
我的一个朋友玲在民政局上班。昨天约她出来吃饭，她说最近忙死了，累得慌，不去了，下班回家睡觉。骗谁呢，有那么多人离婚吗？你在离婚登记处上班，又不是在结婚登记处。你不知道，每年高考分数出来的这个时候，我们民政局这边特别忙。瞎扯什么呀！高考分数出来，人家邮政局忙吧，各大院校通知书要寄。你哪里知道，现在高考分数一出来，父母们都扎堆过来办离婚。我一听愣了半晌，脑海里蹦出五个字：中国式离婚。等孩子考完再离，对
我都不知道怎么爱自己凭什么让我来爱你小宝妈_b9af
图片发自App看到这张图上你有何感受呢？我看到这张图的时候，马上被吸引。好形象啊！印证了那句话我都不知道怎么吃自己，凭什么让我来爱你！我是一位二胎妈妈，双亲都在的单亲家庭，上班下班带俩孩子。可想而知有多么话想说，所说不出来。也许你会说，那是你的问题，如果有问题你可以自己争取解决，在这里瞎扯有什么用。问题就在这里，从原生家庭带来的心理创伤，在我的生命里烙下的印记，已经形成了这样一个回避的模式，而我有
平胸A哥的故事-影响刘狗蛋一生的那些女性的故事(1) 刘狗蛋爱蹦跶
大家好，我是刘狗蛋。不是名人，不是好人，只是一个普通人。还年轻，一生也还没过完。就是想写故事，不瞎扯别的。但是到目前为止，我一生中出现过对我产生影响比较巨大的几位女性。她们有的是我的好友，有的曾经是我的好友，还有的曾经跟我有过一些模棱两可的关系。而现在，她们之中有的成了我的榜样，有的到达了我可能真的活完这一生都无法企及的高度；还有的成了我讨厌、唾弃的人，恨不得见着一面就抄起平底锅当场拍扁的那种人；
随笔风萧萧_兮
昨天跟发小爬山她问那你和你男朋友要异地了吗我说不用我没有男朋友她说为什么会分啊我说可能我不够好吧她说瞎扯到底为什么我说不知道啊就分了她一脸担心的看着我我接着把后来那段时间发生的事情以一种极其平淡的语气叙述了一遍她也安静的听完“所以你们现在没有联系了？”“是吧也没有必要了呀”其实我也很惊讶我知道我迟早有一天一定能够以一种极其平淡的语气把这段感情的结束以一个仿佛是旁观者的角度叙述出来，但我没有想到会是
我与布丁先生神奇的第二次会面！巴德贝
今天，我想给大家隆重的介绍一下布丁，布丁是谁呢，真可谓是一员虎将啊，实际呢布丁是毛毛家一条神奇的狗子，只所以说它神奇呢那也是有道可循的，话说那是五月下旬的一天晚上，嗯，其实也就是昨天晚上吧，在毛毛德德家楼下，那会儿天气有点炎热，我和毛毛德德正在车里谈人生论理想，当然你也可以说是在那瞎扯淡吧，毕竟我们俩也没谈什么宏伟理想伟大抱负，前面说了天气比较炎热么，所以车门两面都开着了，正当我两在那谈论的热火朝
单店不盈利，做连锁！？这是什么笑话？？连锁工坊味精老师
《万利连锁》：单店盈利到复制盈利，复制盈利到模式裂变。模式裂变到平台运营，平台运营到品牌生态。做企业，特别是连锁，在经营过程中，除了脚踏实地干活，也需要会仰望星空。星空就是对企业经营战略创新的思考，而对单店盈利模型的设计，不断提升门店的盈利能力，就是脚踏实地的过程。无论是做加盟，还是直营，单店不盈利，所有的模式创新都是瞎扯。接下来，味精老师就和大家简单的谈谈单店盈利这个问题。从0到1如何设计单店盈
《昆虫记》阅读交流体会热爱生活的徐买买
一、阅读的感受号称一部“昆虫的史诗”这是一部写于一百多年前的书，作者写的东西没有丝毫言之无物的套话，没有丝毫不懂装懂、不求甚解的胡诌瞎扯，有的只是准确无误的记录下来的、观察到的真情实况，既末胡乱添加，也末挂一漏万。有的人为了活而吃，而有的人而为吃而活。一直以为自己是一个吃货，但是看到圣甲虫可以整整十二个小时，不停止的咀嚼，始终待在餐厅同一个地点一动不动的吃个没完，一边吃还不停的排泄，可消化掉几乎与
谁说婚姻是爱情的坟墓，瞎扯！晴人梅
婚姻是爱情的坟墓，这是一句剧毒无比的，毒鸡汤。说它毒，是因为我曾身中此毒，无药可解。长久以来我都信以为真，所以畏首畏尾，不敢恋爱，更别谈婚姻了。直到看到我闺蜜的爱情，我才“药到病除”。很多人说，婚姻是爱情的坟墓，这句话出自钱钟书的小说《围城》。其实钱老根本没说过这句话，钱老在《围城》里说的是：“婚姻是一座城，城外的人想进来，城里的人想出去。”下面就说说我闺蜜她的爱情故事吧。沈静，活泼开朗，人不如其
离题说明：变形非村
第十期主题写作【变形】已经过去大半个月，一共收录到投稿作品32部，已投稿作品除了排期冲突的几篇会放在下一期审核外，其余已经基本完成审稿，12篇选入伯乐推荐（一篇为联盟推荐作品）。脑洞作品其实我个人一直都不算太喜欢，但是非主题一直尝试各种题材和类型的写作，我想着总得来一期。不过看投稿的反应，这个题目大概出得比较难，收到的出彩作品也不是特别多。分享一下我这个月的审稿状态：皱眉，妈呀，这什么瞎扯，这不是
《吾的一天》25.走访杏花村吾的一天
2018年8月2日晴“今天开始我们要开展走村入企的活动。了解农村需求，建立农户档案，助力农业发展。发挥三水精神，再创南城辉煌。”李行长在晨会上慷慨激扬的发言。小吾偷偷的问我：“三水是什么水？汗水、泪水……还有……口水？”我听他这么一解释，差点在会上笑出声来，低头和小吾说：“你别在会上讲笑话好吗？什么口水？三水是早上的雾水，中午的泥水，晚上的汗水。讲的是老一辈起早贪黑，行走田头的那份精神，别TM瞎扯
2022-01-16 AnSYoga抬头看见太阳花
第一句:怕什么，就做什么。第二句:事情能做成，要么是因为有利益，要么是因为被强迫。所谓无为而成，无心而成，都是瞎扯。曾国藩教子，净说大实话。判断一个事儿能否成，三原则:一、让不让干?二、会不会干?三、想不想干?想干的主要原因有两个:有所贪有所利，做好之后，有权钱色在等着你;有所激有所逼，做不好，轻则没饭吃，重则没命。反思：判断一个事能否成，三原则：第一，让不让干？内外部环境分析：政策、经济环境、形
遍历dom 并且存储（将每一层的DOM元素存在数组中）换个号韩国红果果 JavaScript html
数组从0开始！！ var a=[],i=0; for(var j=0;j<30;j++){ a[j]=[];//数组里套数组，且第i层存储在第a[i]中 } function walkDOM(n){ do{ if(n.nodeType!==3)//筛选去除#text类型 a[i].push(n); //con
Android+Jquery Mobile学习系列(9)-总结和代码分享白糖_ JQuery Mobile
目录导航经过一个多月的边学习边练手，学会了Android基于Web开发的毛皮，其实开发过程中用Android原生API不是很多，更多的是HTML/Javascript/Css。个人觉得基于WebView的Jquery Mobile开发有以下优点： 1、对于刚从Java Web转型过来的同学非常适合，只要懂得HTML开发就可以上手做事。 2、jquerym
impala参考资料 dayutianfei impala
记录一些有用的Impala资料 1. 入门资料 >>官网翻译： http://my.oschina.net/weiqingbin/blog?catalog=423691 2. 实用进阶 >>代码&架构分析： Impala/Hive现状分析与前景展望：http
JAVA 静态变量与非静态变量初始化顺序之新解周凡杨 java 静态非静态顺序
今天和同事争论一问题，关于静态变量与非静态变量的初始化顺序，谁先谁后，最终想整理出来！测试代码： import java.util.Map; public class T { public static T t = new T(); private Map map = new HashMap(); public T(){ System.out.println(&quo
跳出iframe返回外层页面 g21121 iframe
在web开发过程中难免要用到iframe，但当连接超时或跳转到公共页面时就会出现超时页面显示在iframe中，这时我们就需要跳出这个iframe到达一个公共页面去。首先跳转到一个中间页，这个页面用于判断是否在iframe中，在页面加载的过程中调用如下代码： <script type="text/javascript"> //<!-- function
JAVA多线程监听JMS、MQ队列 510888780 java多线程
背景：消息队列中有非常多的消息需要处理，并且监听器onMessage（）方法中的业务逻辑也相对比较复杂，为了加快队列消息的读取、处理速度。可以通过加快读取速度和加快处理速度来考虑。因此从这两个方面都使用多线程来处理。对于消息处理的业务处理逻辑用线程池来做。对于加快消息监听读取速度可以使用1.使用多个监听器监听一个队列；2.使用一个监听器开启多线程监听。对于上面提到的方法2使用一个监听器开启多线
第一个SpringMvc例子布衣凌宇 spring mvc
第一步：导入需要的包；第二步：配置web.xml文件 <?xml version="1.0" encoding="UTF-8"?> <web-app version="2.5" xmlns="http://java.sun.com/xml/ns/javaee" xmlns:xsi=
我的spring学习笔记15-容器扩展点之PropertyOverrideConfigurer aijuans Spring3
PropertyOverrideConfigurer类似于PropertyPlaceholderConfigurer，但是与后者相比，前者对于bean属性可以有缺省值或者根本没有值。也就是说如果properties文件中没有某个bean属性的内容，那么将使用上下文（配置的xml文件）中相应定义的值。如果properties文件中有bean属性的内容，那么就用properties文件中的值来代替上下
通过XSD验证XML antlove xml schema xsd validation SchemaFactory
1. XmlValidation.java package xml.validation; import java.io.InputStream; import javax.xml.XMLConstants; import javax.xml.transform.stream.StreamSource; import javax.xml.validation.Schem
文本流与字符集百合不是茶 PrintWrite()的使用字符集名字别名获取
文本数据的输入输出; 输入;数据流,缓冲流输出;介绍向文本打印格式化的输出PrintWrite(); package 文本流; import java.io.FileNotFound
ibatis模糊查询sqlmap-mapping-**.xml配置 bijian1013 ibatis
正常我们写ibatis的sqlmap-mapping-*.xml文件时，传入的参数都用##标识，如下所示： <resultMap id="personInfo" class="com.bijian.study.dto.PersonDTO"> <res
java jvm常用命令工具——jdb命令(The Java Debugger) bijian1013 java jvm jdb
用来对core文件和正在运行的Java进程进行实时地调试，里面包含了丰富的命令帮助您进行调试，它的功能和Sun studio里面所带的dbx非常相似，但 jdb是专门用来针对Java应用程序的。现在应该说日常的开发中很少用到JDB了，因为现在的IDE已经帮我们封装好了，如使用ECLI
【Spring框架二】Spring常用注解之Component、Repository、Service和Controller注解 bit1129 controller
在Spring常用注解第一步部分【Spring框架一】Spring常用注解之Autowired和Resource注解（http://bit1129.iteye.com/blog/2114084）中介绍了Autowired和Resource两个注解的功能，它们用于将依赖根据名称或者类型进行自动的注入，这简化了在XML中，依赖注入部分的XML的编写，但是UserDao和UserService两个bea
cxf wsdl2java生成代码super出错,构造函数不匹配 bitray super
由于过去对于soap协议的cxf接触的不是很多,所以遇到了也是迷糊了一会.后来经过查找资料才得以解决. 初始原因一般是由于jaxws2.2规范和jdk6及以上不兼容导致的.所以要强制降为jaxws2.1进行编译生成.我们需要少量的修改: 我们原来的代码 wsdl2java com.test.xxx -client http://..... 修改后的代
动态页面正文部分中文乱码排障一例 ronin47
公司网站一部分动态页面，早先使用apache+resin的架构运行，考虑到高并发访问下的响应性能问题，在前不久逐步开始用nginx替换掉了apache。不过随后发现了一个问题，随意进入某一有分页的网页，第一页是正常的（因为静态化过了）；点“下一页”，出来的页面两边正常，中间部分的标题、关键字等也正常，唯独每个标题下的正文无法正常显示。因为有做过系统调整，所以第一反应就是新上
java-54- 调整数组顺序使奇数位于偶数前面 bylijinnan java
import java.util.Arrays; import java.util.Random; import ljn.help.Helper; public class OddBeforeEven { /** * Q 54 调整数组顺序使奇数位于偶数前面 * 输入一个整数数组，调整数组中数字的顺序，使得所有奇数位于数组的前半部分，所有偶数位于数组的后半
从100PV到1亿级PV网站架构演变 cfyme 网站架构
一个网站就像一个人，存在一个从小到大的过程。养一个网站和养一个人一样，不同时期需要不同的方法，不同的方法下有共同的原则。本文结合我自已14年网站人的经历记录一些架构演变中的体会。 1：积累是必不可少的架构师不是一天练成的。 1999年，我作了一个个人主页，在学校内的虚拟空间，参加了一次主页大赛，几个DREAMWEAVER的页面，几个TABLE作布局，一个DB连接，几行PHP的代码嵌入在HTM
[宇宙时代]宇宙时代的GIS是什么？ comsci Gis
我们都知道一个事实，在行星内部的时候，因为地理信息的坐标都是相对固定的，所以我们获取一组GIS数据之后，就可以存储到硬盘中，长久使用。。。但是，请注意，这种经验在宇宙时代是不能够被继续使用的宇宙是一个高维时空
详解create database命令 czmmiao database
完整命令 CREATE DATABASE mynewdb USER SYS IDENTIFIED BY sys_password USER SYSTEM IDENTIFIED BY system_password LOGFILE GROUP 1 ('/u01/logs/my/redo01a.log','/u02/logs/m
几句不中听却不得不认可的话 datageek
1、人丑就该多读书。 2、你不快乐是因为：你可以像猪一样懒，却无法像只猪一样懒得心安理得。 3、如果你太在意别人的看法，那么你的生活将变成一件裤衩，别人放什么屁，你都得接着。 4、你的问题主要在于：读书不多而买书太多，读书太少又特爱思考，还他妈话痨。 5、与禽兽搏斗的三种结局：(1)、赢了，比禽兽还禽兽。(2)、输了，禽兽不如。(3)、平了，跟禽兽没两样。结论：选择正确的对手很重要。 6
1 14:00 PHP中的“syntax error, unexpected T_PAAMAYIM_NEKUDOTAYIM”错误 dcj3sjt126com PHP
原文地址：http://www.kafka0102.com/2010/08/281.html 因为需要，今天晚些在本机使用PHP做些测试，PHP脚本依赖了一堆我也不清楚做什么用的库。结果一跑起来，就报出类似下面的错误：“Parse error: syntax error, unexpected T_PAAMAYIM_NEKUDOTAYIM in /home/kafka/test/
xcode6 Auto layout and size classes dcj3sjt126com ios
官方GUI https://developer.apple.com/library/ios/documentation/UserExperience/Conceptual/AutolayoutPG/Introduction/Introduction.html iOS中使用自动布局（一） http://www.cocoachina.com/ind
通过PreparedStatement批量执行sql语句【sql语句相同，值不同】梦见x光 sql 事务批量执行
比如说：我有一个List需要添加到数据库中，那么我该如何通过PreparedStatement来操作呢？ public void addCustomerByCommit(Connection conn , List<Customer> customerList) { String sql = "inseret into customer(id
程序员必知必会----linux常用命令之十【系统相关】 hanqunfeng Linux常用命令
一.linux快捷键 Ctrl+C : 终止当前命令 Ctrl+S : 暂停屏幕输出 Ctrl+Q : 恢复屏幕输出 Ctrl+U : 删除当前行光标前的所有字符 Ctrl+Z : 挂起当前正在执行的进程 Ctrl+L : 清除终端屏幕，相当于clear 二.终端命令 clear : 清除终端屏幕 reset : 重置视窗，当屏幕编码混乱时使用 time com
NGINX IXHONG nginx
pcre 编译安装 nginx conf/vhost/test.conf upstream admin { server 127.0.0.1:8080; } server { listen 80; &
设计模式--工厂模式 kerryg 设计模式
工厂方式模式分为三种： 1、普通工厂模式：建立一个工厂类，对实现了同一个接口的一些类进行实例的创建。 2、多个工厂方法的模式：就是对普通工厂方法模式的改进，在普通工厂方法模式中，如果传递的字符串出错，则不能正确创建对象，而多个工厂方法模式就是提供多个工厂方法，分别创建对象。 3、静态工厂方法模式：就是将上面的多个工厂方法模式里的方法置为静态，
Spring InitializingBean/init-method和DisposableBean/destroy-method mx_xiehd java spring bean xml
1.initializingBean/init-method 实现org.springframework.beans.factory.InitializingBean接口允许一个bean在它的所有必须属性被BeanFactory设置后，来执行初始化的工作，InitialzingBean仅仅指定了一个方法。通常InitializingBean接口的使用是能够被避免的，（不鼓励使用，因为没有必要
解决Centos下vim粘贴内容格式混乱问题 qindongliang1922 centos vim
有时候，我们在向vim打开的一个xml，或者任意文件中，拷贝粘贴的代码时，格式莫名其毛的就混乱了，然后自己一个个再重新，把格式排列好，非常耗时，而且很不爽，那么有没有办法避免呢？答案是肯定的，设置下缩进格式就可以了，非常简单：在用户的根目录下直接vi ~/.vimrc文件然后将set pastetoggle=<F9> 写入这个文件中，保存退出，重新登录，
netty大并发请求问题 tianzhihehe netty
多线程并发使用同一个channel java.nio.BufferOverflowException: null at java.nio.HeapByteBuffer.put(HeapByteBuffer.java:183) ~[na:1.7.0_60-ea] at java.nio.ByteBuffer.put(ByteBuffer.java:832) ~[na:1.7.0_60-ea]
Hadoop NameNode单点问题解决方案之一 AvatarNode wyz2009107220 NameNode
我们遇到的情况 Hadoop NameNode存在单点问题。这个问题会影响分布式平台24*7运行。先说说我们的情况吧。我们的团队负责管理一个1200节点的集群(总大小12PB)，目前是运行版本为Hadoop 0.20，transaction logs写入一个共享的NFS filer(注：NetApp NFS Filer)。经常遇到需要中断服务的问题是给hadoop打补丁。 DataNod

译：深度学习，自然语言处理及特征表示方法 Deep Learning, NLP, and Representations

你可能感兴趣的:(瞎扯)