标题: 利用深度卷积神经网络估算热带气旋强度
作者: Ritesh Pradhan , Ramazan S. Aygun, Senior Member , IEEE, M a n i l M a s k e y , Member , IEEE, Rahul Ramachandran, Senior Member , IEEE, and Daniel J. Cecil
热带气旋强度估算并非一件易事,因为在 提取特征、显著预处理、从卫星获得的各种参数集以及人为干预分析 时,需要领域知识。而 结果的不一致性、数据的大量预处理、问题域的复杂性和可泛化性问题 都是强度估计的相关问题。本文利用图形处理单元设计了一个深度卷积神经网络架构,用于 基于强度的飓风分类。该研究的模型仅使用卫星图像就获得了更好的精度和更低的均方根误差,还提出了 学习到的各层特征的可视化及其反卷积 来帮助理解。
Index Terms——深度学习,图像处理,卷积神经网络,热带气旋分类和强度估计;
因为飓风是一种灾难性现象,所以研究飓风的各个阶段对确定其影响有着十分重要的作用。从科学的角度来讲则是出于以下原因:
本文使用萨菲尔-辛普森飓风风量表(SSHWS)以及热带风暴和热带低压的强度分类作为热带气旋(TC)强度类别。由于风俗强度是基于最大风速(MWS)的,所以仅利用图像来进行估计不太容易;
一旦在24小时内检测到一种模式,就会进一步分析风暴的长度和带状等特征,以得出特定的t值
不难看出,这种决策模式无法探测那些未曾探索过的气象。而先进的Dvorak技术以客观的方式提供了几乎瞬时的TC强度估计,它消除了过程中固有的大量主观性,并在大多数情况下产生类似于人类的错误;
本文专注于获得更高的精度和更低的均方根(RMS)强度误差;
先前方法的主要问题是不一致、大量预处理、复杂性和可泛化性:
本文提出了一种深度卷积网络架构来估算热带气旋强度,在提取特征时不依赖领域知识、显著预处理、从卫星收集的数据以及人为干预分析:
它会自动从卷积的每一步生成的特征图中提取出需要的关键特征。而且卷积的速度也很快,还适用于所有区域。总之,该方法不仅获得了较好的精度,而且获得了较低的RMS强度误差值;
本文的深层CNN的体系结构如下图所示:
而具体的输入形状、过滤器形状、步幅、填充、输出尺寸和参数列于下表中:
xij是位置(i, j)的输出单元,K * K是滤波器的大小,wab是位置(a, b)的加权核的值,yl−1 (i+a)(j+b)是位置(i+a)的接收场,(j+b)来自层l−1,Bl是层l的偏移;
在不同的层上,过滤器的大小等超参数可能不同;
Wi是输入体积大小,k是应用了跨步s和填充p的核的大小
n为局部区域的大小,α和β为基本参数。位于相同位置但来自不同通道的单元以这种方式归一化
yn是输入xn的实际标签,fk是班级成绩向量的第Kth个元素,fyn是xn对应第ynth列的类别成绩
其中L(W)是目标的随机逼近,fw (xi)是数据实例xi的损失,r(W)是正则化项,λ是正则化项的权值衰减。SGD通过结合以前的权重和损失的负梯度来更新权重
方程6、学习速率(α)的重量负梯度和动量(μ)是其先前的更新值(Vt)的重量;而在式7中,Wt+1是使用之前的权重(Wt)乘以新的更新值(Vt+1)的新的更新权重。这些超参数在我们的工作中被用作经验法则的基础
有两个组成部分:i)红外(IR)飓风图像和ii)飓风数据。通过以下方式形成数据集:i)从不同的资源收集具有不同采样率的信息;ii)将数据融合到单个数据集;iii)为图像插入飓风数据;iv)通过转换增加额外的图像;
为了验证,本文在上图中提供了两个小时间隔时的样本图像差异及其结构相似指数测度(SSIM)和均方根误差(RMSE)值
然后我们应用5个图像转换(水平和垂直翻转,以及90°、180°和270°的旋转,如上图所示),将图像的数量增加到48,828张。我们在这些变换后的图像中使用了与原始图像相同的飓风数据
将48,828张图像的数据集分成互不相容的训练集、测试集和验证集,如表IV所示:
每个转换后的图像都保持在与其原始图像相同的集合中。然而,由于这些集合之间的分割比例(百分比),可能会有一些转换后的图像与原始图像分离。然而,这应该不会对训练和整体准确性有任何重大影响
该研究在训练数据集中生成图像的平均图像。从均值图像中减去所有训练图像。这使得我们的模型对于图像对比度的变化更加稳健;
图5显示了每个训练迭代的验证精度、验证损失和训练损失的关系图
随着时期数量的增加,模型学习效果更好。这可以通过在每个历元之后精度的逐渐增加和损失的减少来观察
输入图像以及从第一次卷积、归一化和池化的特征映射依次显示。每个过滤器产生一个不同的映射
第7个特征图通过缩放得到。从第一次卷积得到的激活图像易于解释。其他更高层次的可视化显示在图7中。在这些特征图中很难分析激活的原因:
从conv2生成的第113和第39个特征映射如图8所示:
特征图39以飓风结构的上曲率激活,而特征图113则以输入飓风图像的整体弯曲形状激活。这表明每个特征映射从相同的输入学习不同的结构和特征
每个图像对应fc8层中的一个代表类别的单元,可观察到 H1、H2 和 H3 类别的圆周运动,NC、TD和TS的随机结构,而合成的 H4 和 H5 图像具有平滑的纹理,突出的飓风眼几乎位于中心;
给出了实验结果,并以此来与以往的强度估计技术的性能进行了比较:
- 考虑表V中的模型M1和M3,尽管缺少M1的第五个池化层(P5),但M3的精度略高于M1的精度;
- 与M1相比,M2增加了第四个池化层(P4)。在M2中,第一和第二卷积层中使用的内核数量略少。尽管在M2中使用了P4,但其精度甚至低于M1的精度。池化层P4并没有提高M4的性能;
- 比较模型M3和M4, M4的卷积层多一层,而M4的初始核数比M3多,其余略有不同。在第二个池化层(P2)之后,M4在第六卷积层(P6)之后只有池化层。这产生了表5中模型中最低的精度。M4中学习到的参数数量明显高于M3;
剩下的模型是在56,095次迭代结束时拍摄的最终快照(相当于65个周期),为最佳模型获得了大约90%的验证精度;
任何类别的正确分类图像的数量为对角线上的数字。从上表中我们可以看到,飓风更容易被错误地分类为较近的一类(强度差低),而不是较远的一类(强度差高)。观察到一些接近失误(即被单个类错误分类)
表VII给出的精确度、召回率和f1得分在0.8左右。这表明模型是稳健的,不偏向于回忆或精确度。对于纯侦察数据集,这些度量值在0.73左右
还通过提供 top-1 和 top-2 精度来分析我们模型的性能。 表 VIII 显示了相应类别是分类为顶级还是二级:
Exact-hit是飓风的正确分类,置信度最高。 2nd-hit 是具有第二高置信度的正确分类。 Top-1 度量是精确命中的数量,而 top-2 是精确命中和第二次命中的总和
对于类别TD到H4,估计的速度是由两个最高类别相对于其概率的加权平均值确定的。否则,将使用概率最高的类别的平均速度
该研究的结果表明,在大西洋和太平洋地区,与之前的技术相比,有了显著的改进。不仅总体RMSE值提高了,而且每个类别的RMSE值也更好了。表IX显示了我们的方法在RMSE (kt)方面与最近的DAVT技术在大西洋和太平洋区域的每个类别的比较:
本文提出了一种利用深度卷积神经网络估算热带气旋强度的可靠且鲁棒的方法。估计新飓风样本的强度类别可以在几秒钟内完成,只需很少的人力。而且该模型在RMSE值和可泛化性方面都有显著改善;
在本文的方法中,有各种各样的小任务可以提高精度和降低RMSE强度值:
所有类别的正确分类飓风图像显示在图10中:
如 (h),H5飓风图像被正确分类为H5,置信度为58.26%
图11则提供了具有第二高置信度的正确标签(第二次命中)的图像:
如,图11 (e)中的H2飓风被分类为H2,置信度第二高(41.37%)
这些图片不属于前1或前2的点击。该研究的模型无法为这些图像提供良好的分类。根据这些样本图像得出的结论可能具有误导性
此外,本研究并未使用任何关于类别的时间信息,而且用它们还能提高准确度。
基于错误分类的深度CNN调整是非常具有挑战性的,因为很难解释它的模型。