高光谱图像输入卷积神经网络的维度问题

现在处理高光谱影像大多使用3D-CNN,对于高斯光谱数据而言,输入网络模型的shape是(x,y,z)这种形式,x,y是长宽尺寸,而z是光谱维度,IN数据集一般是200,UP数据集一般是103。

keras中Conv2D的输入张量尺寸:(samples, rows, cols, channels)

Conv3D的输入张量尺寸:(samples, conv_dim1, conv_dim2, conv_dim3, channels)

Conv2D的输入应该是一个4D,第一维是batch,后面三维是长,宽,三基色,这个在高分影像数据集上就是这样,和普通光学影像的输入没有什么区别。

Conv3D的输入是一个5D,第一维也是batch,最后一维也是通道,通道通常会和后面的滤波器的核的个数相关联,卷积核数目的变化就在这个维度上,对于高光谱数据来说,输入的channel,我们通常处理成1,以IN为例的话,也就是(1,224,224,200),batch这个维度在实际运算中会有体现。

Conv3D的卷积核操作和Conv2D是有区别的,Conv2D利用一个滑窗在卷积上滑动,产生feature map,有多少个核就产生多少个feature map。但是Conv3D是沿着光谱维度进行运算,同时在空间上进行滑窗操作,产生的同样是三维的feature map,有多少核就产生多少个feature map。

你可能感兴趣的:(深度学习处理遥感影像)