使用深卷积神经网络的高光谱图像的光谱空间分类

使用深卷积神经网络的高光谱图像的光谱空间分类

摘要

本文中,提出了一个用于光谱和空间特征的高光谱图像分类的新颖的深度学习框架。 该框架是主成分分析,深卷积神经网络(DCNN)和逻辑回归(LR)的混合。 用于分层提取深度特征的DCNN首次被引入高光谱图像分类。 所提出的技术包括两个步骤。 首先,提出特征图生成算法,生成光谱和空间特征图。 其次,对DCNNs-LR分类器进行训练,以获得有用的高级特征并对整个模型进行微调。 在广泛使用的高光谱数据上进行的比较实验表明,建立在此提出的深度学习框架中的DCNN-LR分类器比以前的高光谱分类方法提供了更好的分类精度。

 

简介

高光谱遥感技术能够同时收集具有光谱和空间特征的连续图像。 高光谱是目前地球观测最重要的数据之一。 在处理高光谱图像方面有巨大的任务,每个像素的分类是这些应用中的常见技术(LiBioucas-DiasPlaza 2013)。 然而,由于光谱通道数量众多,训练样本有限,空间变异性大,高光谱数据分类仍然是一项具有挑战性的任务(陈林林等,2014)。

在过去十年中,与机器学习算法相关的几种图像处理技术已被应用于高光谱数据分类(Plaza et al。,2009)。 支持向量机(SVM)引入了用于高光谱数据分类的最大化高维特征空间边缘的样本的核方法。 基于SVM的分类方法是长期以来最先进的方法(MelganiBruzzone 2004)。 多项式Logistic回归(MLR)已经被应用于超光谱图像分类(JunBioucas-DiasPlaza 2010),后者分布代替联合概率分布。

在高光谱数据分类中,空间特征变得越来越重要,因为相邻像素更可能属于同一类。 空间光谱分类方法提供了更好的分类精度Bioucas-Dias等,2013)。 为了利用空间特征,已经开发了许多基于光谱空间的高光谱图像分类技术。 马可夫随机场模型Tarabalka等,2010; LiBioucas-DiasPlaza 2012)已经通过合并空间和光谱特征被引入高光谱数据分类。 利用神经网络框架的遗传信念传播和主动学习同时利用空间和频谱信息LiBioucas-DiasPlaza 2013)。 已经提出空间光谱核稀疏表示是通过使用相邻的滤波核来加强高光谱图像的分类Liu等,2013)。

分类器如逻辑回归和线性SVM可以被认为是单层分类器,而具有内核和决策树的SVM是具有两层的分类器(BengioCourvilleVincent 2013)。然而,由于其多层结构从视网膜到皮质,人脑在诸如脸部识别等许多任务中提供了良好的表现(Kruger等,2013)。类似地,用多层处理的分类器可以提取更多的不变和抽象特征。与图像,语言和语音识别领域中的浅层传统分类器相比,基于多层的分类器导致更高的分类精度(ChenLinet al。,2014)。深卷积神经网络(DCNN)是一个深度学习架构,由卷积层和下采样层组成,可提供卓越的性能。已经引入了图像分类,实现了手写字符和交通标志识别的最先进的表现(ChenXianget al。,2014)。

在本研究中,提出了一种用于高光谱图像分类的新型光谱空间深度学习框架。 提出了一种提取光谱和空间特征图的新方法,并首次引入了用于高光谱数据分类的DCNN。 所提出的方法包括两个步骤。 首先,生成光谱和空间特征图。 其次,使用每个特征图独立地训练一个DCNNs-LR分类器,以获得有用的高级特征。 由于多个特征图,多数投票是基于在步骤2中获得的多重分类图来分配每个像素的单个类别。 通过这种光谱空间深度学习架构可以获得更好的分类结果。

 

2.1 提出的方法

DCNNs-LR分类与光谱特征图

提取强大的深度光谱特征在高光谱数据分类中至关重要。然而,在捕获这些功能时存在许多挑战。常见的因素如传感器的旋转和不同的大气散射条件都可能导致不同的光谱特性。此外,由于大尺度场景下照明条件复杂,同一类别的物体在不同的方向和位置显示出不同的辐射特性。根据这些光谱变化,某一类在特征空间中的多个条件下具有很大的变异,并且难以通过一种常规方法进行区分。因此,存在着获得不变性更强健特征的强烈需求,并且在复杂的实际情况下逐像素分析的原始方法已经不再有用了。在这种情况下,相信深层次的学习架构可能会在较高的层次上提取更多的抽象和不变特征ChenLinet al2014; BengioCourvilleVincent 2013)。

为了有效提取高级不变特征并处理上述问题,应用DCNNs模型。 可以逐层逐步学习高光谱数据的深度光谱特征,提取高级特征。 然后,构建基于高级特征的逻辑回归分类器进行分类。 以下将介绍高级特征提取和分类的细节。

1)特征图的光谱特征

首先,生成来自1D光谱特征的特征图。 原始频谱矢量被分为具有偏移τ的η个基本频谱矢量。 基本谱矢量可以表示为

 

其中bi是具有长度w的第i个基本光谱向量。 v是原始光谱矢量。 为了得到光谱特征图,我们将两个基本光谱矢量设置为独立变量。 然后由特征图给出

 

其中Mk是第k个光谱特征图,n是我们终于得到的特征图的数量。 因此,我们从1D光谱向量获得n个光谱特征图,而不会损失光谱信息,然后将这些2D光谱特征图设置为DCNN的输入。

2)DCNN训练和逻辑回归分类器

DCNN有两种层:卷积层和下采样层。 卷积层的正向传播可以表示为

 

其中alj表示层l中输出特征图j的激活值,Q表示输入图的选择,klij是将层l -1中的输入特征图i与层l中的输出特征图j链接的内核,blj 与层l中的输出特征图j相关的偏差。 '*'表示卷积乘法。 f(·)S形函数。

下采样层的正向传播可以表示为

 

其中down(·)代表子抽样函数。 通常,该函数将在输入特征图中的每个不同的补丁相加,以便输出特征图在两个空间维度上都是x倍。 每个输出图给出其自己的乘法偏差和加法偏差。 βlj是层l中输出特征图j的乘法偏置。 blj是层l中输出特征图j的加性偏差。

为了计算卷积层的灵敏度,我们对下采样层的灵敏度图进行上采样,并将其与层l上的激活导数图相乘。 它可以配制成

 

其中''表示元素乘法,δlj是卷积层l中特征图j的灵敏度值, 表示上采样操作,ulj表示层l中的映射j的输入的总加权和。现在我们具有卷积层的灵敏度,偏差和核重量的梯度可以计算如下:

 

其中E是平方误差,(uv)是卷积图alj中的坐标,(pl-1i)uv是在正向传播期间乘以klij的层al-1i中的补丁以计算在输出卷积图alj中坐标( uv)处的元素。

为了计算下采样层的灵敏度,我们使用卷积层的内核完全卷积,并将其与第l层元素的激活导数图相乘。

 

其中Δl+1j是与下采样层中的输入特征图相同的大小的扩展灵敏度映射。 由于下采样层的灵敏度产生,我们可以使用公式(6)计算加法偏差b。 乘法偏差β涉及在过渡期间在当前层计算的原始下采样图。 让我们定义

 

然后给出乘法偏差β的梯度

 

为了训练卷积神经网络,在特征提取层的顶部添加逻辑回归分类器。 反向传播算法用于微调整个模型。 逻辑回归分类器是指针对多分类任务的软最大回归。 如上所述,输入特征VDCNN的输出特征平滑化,则属于类i的输入特征的概率由下式给出:

 

其中W是权重,b是偏差,Wibi表示i类输出单元的权重和偏差连接,Y是分类结果,sSoftmax函数。 输出层的单位编号是总数。 输入层设置为与最后一层DCNN相同的维度。 它被合并到深层学习框架中,形成一个称为DCNNs-LR分类器的深分类器。 然后,每个像素将被分类为由大多数DCNN / LR分类器生成的标签。

 

2.2 基于DCNNs-LR的光谱空间分类

传统的高光谱图像空间特征提取方法只能使用四个或八个相邻的像素丢失了大量的信息。 堆叠自动编码器(SAE)算法设计用于对空间分布特征进行1D数据的特征提取。 平滑空间图的基于SAE的方法(ChenLinet al。,2014)忽视了空间分布格局。 我们提出一个新的深层框架,将邻域中的所有体素作为二维图像考虑,让DCNN自动学习空间特征。 在该方法中,2D信息被保留在算法中。 高光谱图像总是有数百个通道数量过大。 因此,存在大量冗余和主成分分析(PCA),以减少维数,同时保持空间信息的完整性。

 

基于光谱和空间主导特征,提出了联合光谱 - 空间分类框架。 为了区分不同种类的地面类别,我们首先考虑每个像素的光谱特征。 然后,应用PCA算法来减少光谱信息的冗余度。 提取空间邻域的前几个主要组成部分以供给DCNN。 在训练DCNNs-LR之后,每个像素的标签将通过多数表决产生。

 

3.实验

在本节中,对真正的高光谱图像进行了一系列实验。将分类精度与先前的方法进行比较,包括支持向量机,与多级逻辑(MLL)模型(LiBioucas-DiasPlaza 2012)相关的分析分析和堆栈自动编码器逻辑回归(SAE-LR)(ChenLinet al2014)。 SVM可以最小化经验分类误差,同时最大化高维空间中每个类别的边际。判别分析方法可以有效地学习特征空间中每个类的分布和边界。 MLL方法采用空间特征来生成先验信息。然而,与MLL模型相关的SVM和判别分析不能分级学习深层光谱和光谱特征。随着DCNN的引入,分类过程中可以产生抽象和不变的光谱和空间特征。基于SAE的高光谱分类算法,平坦化了2D空间图像,完全忽略了对图像分类至关重要的空间分布模式。相比之下,我们通过引入DCNN解决了这个问题,整个特征提取过程处于2D情况。因此,可以充分考虑邻近地区的体素。在这封信中,我们使用两个频谱空间特征同时作为SSDCNN来简化所提出的基于DCNN的方法。

通过计算总体精度(OA),平均精度(AA)和κ系数来评估SSDCNN的性能。 我们得到的这些测量值越高,分类精度越高。

本实验中考虑的真正的高光谱图像是2001年反射光学系统成像光谱仪(ROSIS)收集的。意大利帕维亚市的图像尺寸大小为610×340像素。 由于噪音和吸水性,12个带被去除。 结果,保留了103个通道。 本实验采用9个土地覆盖类别,共3921个培训样本,共检测样本为42,776个。

610×340高光谱图像,使用上述算法生成三个光谱特征图和三个空间特征图。 PCA103个通道中提取出三个PC,相邻区域的大小和像素的光谱特征图为42×42。图1显示了SSDCNN的结构。 在该图中,Cn表示第n卷积层,Sn表示第n个子采样层。 C1的像素中的卷积核大小为5×5C2的卷积核大小为6×6C3的卷积核大小为4×4S1S2的子采样滤波器尺寸为2×2

 

目前,没有这样的推荐参数选择方法(ChenLinet al2014; Farabet et al2013; ChenXianget al。,2014)。因此,卷积核心大小是通过试错法来选择的。 SSDCNN的权重应该足够小,以便激活函数以其最大梯度的线性方式运行。这样可以使信息流畅,减少层之间的差异。因此,初始权重通过范围为[-0.1,0.1]的均匀随机分布进行初始化。使用反向传播算法训练SSDCNN,将初始偏差初始化为零。学习率为1,批量为3,时代数为30.我们实验中的培训样本数为3721个,最大批量为3.学习率是时间的递减函数。它控制收敛的速度。通过反复试验,将学习速率和时代数量设置为130可以确保训练的融合。虽然参数组合是变化的,但是一旦达到收敛,训练结果将保持不变。

2a)显示了图像的假色复合图,而图2b)显示了9个地面真相等级,其中包括城市特征以及土壤和植被特征。 图2c)显示了通过提出的方法获得的地面实况和分类图。

为了比较我们的分类准确性与以往研究的分类准确性,其原始论文中分类方法产生的类别特异性准确度以及每个土地覆盖类别的培训和测试样本数量列于表1中。在所有实验中 培训样本和测试样本的数量分别为392142,776。 如表1所示,SSDCNN获得的结果在OAAA和κ系数方面比用扩展形态特征(SVM / EMP)训练的基于SVM的分类器获得的精度更高(Fauvel et al2008), 用MLL空间先验(QDAMLL),MLL空间先验(logDAMLL)的对数判别分析,MLL空间先验(LDAMLL)的线性判别分析,MLL空间先验(MLRsubMLL)的子空间MLRLiBioucas -DiasPlaza 2012)和SAE-LRChenLinet al。,2014)。

 

 

4.讨论和结论

提取深层特征对于提高分类器的性能至关重要。 在这项工作中,提出了一种用于高光谱数据分类的新颖的深入学习框架。 它通过DCNN分级学习深层次的光谱和空间特征,随后采用逻辑回归分类器。 用Pavia数据进行的实验研究表明,OA95.18%,κ系数为93.64%,远优于以前的方法。

对于高光谱图像分类,难以同时考虑光谱和空间信息,而不会丢失任何信息。 在我们的方法中,通过将光谱和空间特征图放入DCNN-LR分类器中,提取深度特征,获得较高的分类精度。 然而,深层学习框架可以看作是一个自动提取特征的黑盒子。 因此,无法确定所有课程的准确性,未来研究中应该更加注意这个问题。

 

你可能感兴趣的:(神经网络,高光谱遥感)