前言:Deep Learning (DL深度学习)是近几年来最火的一种机器学习方法,由Hinton(多伦多大学)提出。主要有两分支:Geoffery Hinton和Joshua Bengio这一支用RBM组成deep architecture的研究。另一支是以Yann LeCun和Andrew Ng的(deep) convolutional networks,用convolutional network组成deep architecture的研究。
这篇博文主要介绍Hinton第一分支中最基础的算法RBM(受限玻尔兹曼机),DBN(深信度神经网络)是由其叠加而成。
Deep Learning 是无监督学习,也就是自动的提取信号特征,并由浅入深。理想情况是,由深层特征能100%还原最初的原始信号。由此,我们是否想到,其间的代价函数是失真差呢?
正文:废话不多说了哈!
这里:只截取了RBM的程序片段,弄清楚这个,基本DBN就差不多了! Deep Learning Tool (matlab版,下载)
function rbm = rbmtrain(rbm, x, opts) assert(isfloat(x), 'x must be a float'); assert(all(x(:)>=0) && all(x(:)<=1), 'all data in x must be in [0:1]'); m = size(x, 1); numbatches = m / opts.batchsize; assert(rem(numbatches, 1) == 0, 'numbatches not integer'); for i = 1 : opts.numepochs kk = randperm(m);%随机产生1-m内的数 err = 0; for l = 1 : numbatches % 这里很重要,参数W,b,c 的更新是以batchsize为单位,更新numbatches次(后面的NN训练中,也是这样) batch = x(kk((l - 1) * opts.batchsize + 1 : l * opts.batchsize), :);%这种表示法可以选取指定行列的数组(重要!) v1 = batch; h1 = sigmrnd(repmat(rbm.c', opts.batchsize, 1) + v1 * rbm.W'); %Ref110,Hinton-guide-3.1里有介绍,“the hidden unit turns on if this probability is greater than a random number uniformly distributed between 0 and 1.” v2 = sigmrnd(repmat(rbm.b', opts.batchsize, 1) + h1 * rbm.W); h2 = sigm(repmat(rbm.c', opts.batchsize, 1) + v2 * rbm.W'); c1 = h1' * v1; c2 = h2' * v2; rbm.vW = rbm.momentum * rbm.vW + rbm.alpha * (c1 - c2) / opts.batchsize; rbm.vb = rbm.momentum * rbm.vb + rbm.alpha * sum(v1 - v2)' / opts.batchsize; rbm.vc = rbm.momentum * rbm.vc + rbm.alpha * sum(h1 - h2)' / opts.batchsize; rbm.W = rbm.W + rbm.vW; rbm.b = rbm.b + rbm.vb; rbm.c = rbm.c + rbm.vc; err = err + sum(sum((v1 - v2) .^ 2)) / opts.batchsize; end disp(['epoch ' num2str(i) '/' num2str(opts.numepochs) '. Average reconstruction error is: ' num2str(err / numbatches)]); end end
伪代码:(Ref9-Bengio-5.3.1)
附:8,9,10 文献作为经典,必读!(点击下载)
个人认为开始阅读Hinton的文章有点难,建议先看中文的参考,然后再细读其文章,这样收获会很多,其文章阐述了问啥要这样做?怎么想到的?等~即大师啦!
Bengio的文章是overview,有更综合的DL描述,就是有点长,但是可以先看重点!
在代码方面,Ref2,Dark的代码讲解不错,(但是还是建议先把算法弄明白)。
对于DBNs的理解,开始看Hinton的文章不太明白,其实后来发现就是RBM的堆叠,只要把RBM弄清楚了,要理解DBN不难!
参考资料:1.zouxy09的博文,其DL讲解非常不错,强烈推荐哈!
2.Dark的面向代码的讲解,不错!
3.tornadomeet的DL讲解很详细,值得学习
4.celery chen 的DBN有简单易懂的模型
5. 关于玻尔兹曼能量分布的ppt,讲解很详细
6. peghoty的博文,介绍RBM非常详细,值得一看!
7.DBN的matlab代码,工具包(还有CNN,NN,SAE等),很不错,直接可以运行
8. A fast learning algorithm for deep belief nets(Hinton)下载
9. Learning Deep Architectures for AI (Bengio)
10. A Practical Guide to Training Restricted Boltzmann Machines(Hinton)
11. DBN的tutorial教学(原版,很简单)
12. 极度世界的CSDN的博客,有UFLDL的练习,可以看一下