2016.4.15 nature deep learning review[1]

今天,我本来想膜一下,所以找到了上古时期发表再nature上的反向传播的论文,但是没看下去。。。所以,翻出来了15年发表在nature上的deep learning,相当于一个review,来阅读一下,而且感觉引文会比较重要,所以这篇中枢值较高的文献拿来学一学。













第一段其实是在讲一个大框架,ml的传统方法是,如果为了去做分类等等的人物,需要自己去提特征,然后进行后续的任务,但是这种方法需要很多专业的知识,不容易再工程上上手。于是有个representation learning这个领域,就是输入数据之后,学习到一些为了目标容易区分的特征,或者说讲原始数据换一个表达方式,使得方便后面的分类啊等等的处理。Deep learning这个工具就很牛逼,我虽然什么都不知道,但是我还是能够从不同的层次抽象出来不同的特征,从而进行学习。现在呢,已经广泛应用再各个领域中了。




多层结构的反向传播一段讲了通过反向传播算法能够训练网络,但是在就是年代的时候,人们因为认为很少的先验知识推断出有用的特征是在扯淡,而且认为容易陷入局部最优解,所以神经网络逐渐受到冷落。但是大数据使得局部最有很少,由于初始情况不同,最后仅有很少的差异。不过本世纪初,深度网络重燃战火,是因为CIFAR采用无监督学习到了特征去初始化网络,然后采用bpfine-fune,效果非常好,尤其是在手写数字识别和行人检测的应用上。所以当时的训练如果有大量label的数据,那就训吧,但是如果label的数据比较少,还是建议先用没有label 的数据pre-training一下。卷积神经网络近些年来也逐渐兴起,尤其在cv方面。



使用ReLU从而避免unsupervised pre-training

34. Ranzato, M., Poultney, C., Chopra, S. & LeCun, Y. Efficient learning of sparse representations with an energy-based model. In Proc. Advances in Neural Information Processing Systems 19 1137–1144 (2006).

无监督初始化,bp fine-tune

小数据上采用pre-training + fine-tune进行手写数字识别和行人检测

小数据集上pre-training 防止过拟合

回溯1990年代,有很多对于time-delay neural networks(1d convent)的应用,比如说语音识别和文档阅读上。文档阅读系统使用convnet训练一个概率模型,能够实现语言的约束到某一个范围。到了90年代后期,这个系统已经识别了超过10%的支票,基于convnet的光学媳妇识别和手写数字识别被微软研究。在90年代初期,convnet用在了在自然图片上进行检测,比如说面部和手部的检测,以及面部识别。


