贴一下汇总贴:论文阅读记录
论文链接:《Traffic Flow Prediction With Big Data:A Deep Learning Approach》
准确、及时的交通流信息对智能交通系统的成功部署至关重要。在过去的几年里,交通数据呈爆炸式增长,我们真正进入了交通大数据时代。现有的交通流预测方法主要采用浅层交通预测模型,在许多实际应用中仍不满足要求。这一情况促使我们重新思考基于大交通数据的深度架构模型的交通流预测问题。本文提出了一种基于深度学习的交通流预测方法,该方法考虑了交通流的时空相关性。一种堆叠的自动编码器模型用于学习通用的交通流特征,并以一种贪婪的分层方式进行训练。据我们所知,这是第一次使用自动编码器作为构建块应用深度架构模型来表示用于预测的交通流特征。实验结果表明,所提出的交通流预测方法具有较好的预测性能。
使用深度学习架构,嵌入Stacked AutoEncoder(SAE)堆叠自编码器作为主体网络结构块来预测交通流。
深度学习的优势:深度学习算法利用多层或深度神经网络体系结构,从最低层次到最高层次逐渐提取数据的固有特征,能够发现数据中大量的内在结构特征。
基于SAE模型的深度学习方法用于交通流预测,与以往只考虑交通数据浅层结构的方法不同,该方法能够成功地从交通数据中发现潜在的交通流特征表示,如非线性时空相关性。
采用贪婪分层无监督学习算法对深度网络进行预训练,然后对模型参数进行微调,以提高模型的预测性能。在PeMS数据集上评价了该方法的性能,并与BP神经网络、RW模型、支持向量机模型和RBF神经网络模型进行了比较,结果表明该方法优于其他竞争方法。
可能的研究方向:
Stacked Autoencoder(SAE)模型是一个由多层稀疏自编码器组成的深度神经网络模型,其前一层自编码器的输出作为其后一层自编码器的输入,最后一层是个分类器(logistic分类器或者softmax分类器)。
sparse autoencoder是一种非监督学习算法,需要满足以下两种约束
J ( W , b ) = [ 1 m ∑ i = 1 m ( 1 2 ∣ ∣ h W , b ( x ( i ) ) − y ( i ) ∣ ∣ 2 ) ] + λ 2 ∑ l = 1 n l − 1 ∑ i = 1 s l ∑ j = 1 s l + 1 ( W j i ( l ) ) 2 + β ∑ j = 1 s 2 K L ( p ∣ ∣ p ^ j ) J(W,b)=\Big[\frac1m\sum_{i=1}^m\Big(\frac12||h_{W,b}(x^{(i)})-y^{(i)}||^2\Big)\Big]+\frac{\lambda}2\sum_{l=1}^{n_l-1}\sum_{i=1}^{s_l}\sum_{j=1}^{s_l+1}(W_{ji}^{(l)})^2+\beta\sum_{j=1}^{s_2}KL(p||\hat p_j) J(W,b)=[m1i=1∑m(21∣∣hW,b(x(i))−y(i)∣∣2)]+2λl=1∑nl−1i=1∑slj=1∑sl+1(Wji(l))2+βj=1∑s2KL(p∣∣p^j)其中 y ( i ) = x ( i ) y^{(i)}=x^{(i)} y(i)=x(i)
该约束函数是一个非凸函数,采用批量梯度下降算法
W i j ( l ) = W i j ( l ) − α ∂ ∂ W i j ( l ) J ( W , b ) b i ( l ) = b i ( l ) − α ∂ ∂ b i ( l ) J ( W , b ) W_{ij}^{(l)}=W_{ij}^{(l)}-\alpha\frac{\partial}{\partial W_{ij}^{(l)}}J(W,b)\\b_i^{(l)}=b_i^{(l)}-\alpha\frac{\partial}{\partial b_i^{(l)}}J(W,b) Wij(l)=Wij(l)−α∂Wij(l)∂J(W,b)bi(l)=bi(l)−α∂bi(l)∂J(W,b)
其中 ∂ ∂ W i j ( l ) J ( W , b ) = [ 1 m ∑ i = 1 m ∂ ∂ W i j ( l ) J ( W , b ; x ( i ) , y ( i ) ) ] + λ W i j ( l ) ∂ ∂ b i ( l ) J ( W , b ) = 1 m ∑ i = 1 m ∂ ∂ b i ( l ) J ( W , b ; x ( i ) , y ( i ) ) \frac{\partial}{\partial W_{ij}^{(l)}}J(W,b)=\Big[\frac1m\sum_{i=1}^m \frac{\partial}{\partial W_{ij}^{(l)}}J(W,b;x^{(i)},y^{(i)})\Big]+\lambda W_{ij}^{(l)}\\\frac{\partial}{\partial b_i^{(l)}}J(W,b)=\frac1m\sum_{i=1}^m \frac{\partial}{\partial b_i^{(l)}}J(W,b;x^{(i)},y^{(i)}) ∂Wij(l)∂J(W,b)=[m1i=1∑m∂Wij(l)∂J(W,b;x(i),y(i))]+λWij(l)∂bi(l)∂J(W,b)=m1i=1∑m∂bi(l)∂J(W,b;x(i),y(i))
至于梯度可以用backpropagation(BP)算法来求解;
softmax回归分类器适用于k个互斥的类别的分类;k个logistic回归分类器适用k个并不完全互斥的类别的分类。
下图便是这篇文章中使用的交通流预测的深度架构模型。采用SAE模型提取交通流特征,采用logistic回归层进行预测。
基于梯度优化技术的BP方法训练深度网络是很简单的。不幸的是,众所周知,用这种方式训练的深度网络性能很差。所以本文采用贪婪分层无监督学习算法的关键是采用自底向上的方式逐层对深层网络进行预训练。在预训练阶段结束后,可以使用BP进行微调,从上至下对模型参数进行微调,同时得到更好的结果。
贪婪分层无监督学习算法: