物理增强的深度学习模型改善卫星图像对热带气旋强度和大小估计(翻译)

提示:系学习使用,侵删

文章目录

  • 前言
  • 一、摘要
  • 二、结论
  • 三、介绍
  • 四、数据和方法
    • 1. 数据
    • 2. DeepTCNet架构的选择
    • 3. DeepTCNet的开发和评估
  • 五、用于强度估计的DeepTCNet
  • 六、用于风半径估算的DeepTCNet
  • 七、讨论


前言

师兄在我做实验期间推荐的文章

Physics-augmented Deep Learning to Improve Tropical Cyclone Intensity and Size Estimation from Satellite Imagery
文章利用红外图像估计热带气旋强度和风半径
文章链接


一、摘要

介绍了一种基于深度学习的方法,称为(DeepTCNet)。该方法利用热带气旋(TCs)的先验知识,从北大西洋上空的红外(IR)图像估计热带气旋强度和风半径。虽然标准的深度学习实践与传统的分析方法相比有许多优点,可以产生可靠的TCs估计值,但由机器可读的TCs物理知识提供信息的数据驱动模型可以实现更高的性能。为此,我们探索了两种开发物理增强型DeepTCNet的方法:(i)将TCs的辅助物理信息注入单任务学习模型中;(ii)学习辅助物理任务以进行多任务学习。

更具体地说,通过TC丰满度的辅助信息(TC风场的径向衰减的测量值)的增强,DeepTCNet在估计TC强度方面比未增强的提高了12%。通过同时学习TC风半径和辅助TC强度任务,模型的风半径估计技能比仅学习个四个风半径任务提高了6%,比单独学习一个风半径任务提高了9%。评估结果表明,DeepTCNet与卫星共识技术(SATCON)一致,但在所有强度等级上系统性地优于先进的Dvorak技术(ADT),TC强度估计平均提高39%。DeepTCNet还超过了多平台热带气旋地面风分析技术(MTCSWA),平均风速半径估计提高了32%。

二、结论

DeepTCNet是一种深度卷积神经网络,作为一种后端方法,设计用于利用TCs的物理知识,从红外图像生成准确的TCs强度(MSW和MSLP)和风半径估计值(R34、R50、R64和RMW)。引入辅助物理信息是改进强度估计模型的有效途径。研究表明,将描述TCs临界结构的TC 丰满度(TC fullness)引入模型可以显著提高其强度估计性能。多任务学习具有任务之间共享不同和更一般特征的优点,用于改进风半径估计模型。我们的研究结果表明,同时学习多个风半径任务比单独学习风半径任务可以得到更准确的风半径估计。此外,我们还发现,训练的估计两个强度测量值(MSW和MSLP)和四个临界风场测量值(R34、R50、R64和RMW)的模型,同时产生最佳的风半径估计值。由这些任务近似得出的固有风压关系可能是一个原因。此外,结果表明,包括近几次的连续红外图像有利于强度估计模型。

基于同质测试样本的评估结果表明,DeepTCNet与SATCON一致,但系统性能优于ADT,MSW改善了39%,MSLP估计改善了33%。在TC强度估计方面,DeepTCNet 也超过了Dvorak方法。此外,DeepTCNet在估算TCs的临界风半径方面也超过了MTCSWA,RMW、R64、R50和R34的临界风半径分别提高了32%、25%、28%和38%。这些结果表明,DeepTCNet可以从根本上改进用于TC强度和风半径估计的红外图像挖掘。因此,有理由相信,DeepTCNet方法可以用于提高其他个TCs观测值的利用率。

更高质量的训练样本,以建立深度学习模型,例如飞机观测,对于强度和尺寸估计尤其重要。然而,深度学习方法的数据限制的困境在短期内将是艰难的,尤其是在TCs等极端天气系统的研究领域。因此,探索和开发种合适的方法,将TCs的物理知识整合到深度学习算法中,是必要的进一步方向。此外,将基于微波传感器的观测引入DeepTCNet可能对产生更准确的估计至关重要。


三、介绍

估算热带气旋(TCs)的强度和风力半径是监测和预测这些破坏性系统的第一步。然而,准确估计热带气旋强度和大小一直是热带气象学的一个长期挑战,并且受到现有观测和技术的限制(例如,Landsea和Franklin 2013;Knaff和Sampson 2015)。此外,全球TC预警中心通常需要对TC特征进行多种测量。这包括TC强度的两个度量,最大持续表面风(MSW)和最小海平面气压(MSLP),以及不同的TC大小度量,通常由预测中心提供为“风半径”,包括大风(34 kt;1 kt 5 0.51 m s21;R34)、暴雨(50 kt;R50),以及飓风力(64kT;R64)在地理象限(即东北、东南、西南和西北方向)的风力半径,以及最大风力半径(RMW)。实时生成如此大量的估计值可能既困难又耗时(Sampson等人,2018年)。

运行中的TC强度估计仍然主要依赖于Dvorak技术(Velden et al.2006),该技术使用红外(IR)和/或可见卫星图像中的云特征来分配TC强度。由于复杂的TC动力学已被全面抽象为云特征,Dvorak技术可以提供相对可靠的强度估计,并且是40多年来用于TC分析的最成功的卫星应用之一(Velden et al.2006)。尽管如此,这种技术是主观的,因此其估计精度取决于分析师的技能。为了提高基于红外的强度分析的客观性和自动化程度,已经提出了Dvorak技术的高级版本(例如,Olander and Velden 2007;2019)和许多其他算法(例如,Kossin等人2007;Ritchie等人2012;F e t a n a t a l.2 0 1 3)。然而,事实证明,这些算法中的大多数都不如Dvorak技术可靠,主要是因为它们基于常规算法,如主成分分析,该算法仅从卫星数据中提取非常有限的特征。在其他基于卫星的TC强度估计方法中,情况类似(例如Demoth等人,2004年、2006年;Jiang等人,2019年)。目前,在TC强度估计中具有最佳精度的方法是卫星一致性技术(SATCON),这是一种加权一致性算法,旨在优化基于红外和微波的多种技术(Velden和Herndon 2020)的优势并最小化其劣势。德沃夏克技术、ADT和SATCON的典型定性不确定性水平在风力强度方面约为10千吨(Knaff等人,2010年;奥兰德和维尔登2019年;维尔登和赫恩登2020年)。

基于卫星的TC风半径估计更加困难。考虑到对流和风场之间的物理关系不太清楚(例如Lajoie和Walsh,2008),没有德沃夏克方法这样广泛应用的技术来估算风半径。外核风半径(如R34)属于更易于控制的TC风半径,散射计是估算外核风半径的最佳星载仪器之一(如Brennan等人,2009)。

在Ku波段运行的散射计测量存在一个问题,即TCs中的大雨会影响散射计测量结果,并在50 kt附近的风速下饱和(Brennan等人,2009年),但较低的C波段频率对降雨不太敏感,在接近70 kt的稍高风速下饱和(Stoffelen 1998;Stoffelen等人,2017年)。L波段辐射计在强风时不受信号饱和影响,受降雨影响最小,是确定TCs中R34、R50和R64的重要工具(例如,Reul等人,2017年)。其他在推导TC风半径方面表现出技巧的方法包括红外表示法(如穆勒等人2006年;科辛等人2007年;纳夫等人2016年;多林等人2016年)、微波测深仪代理(如德米特等人2006年)、多卫星平台分析(纳夫等人2011年)和基于反射的技术(莫里斯和鲁夫2017年)。然而,最大风力半径的估计仍然是一个挑战,因为TC内核的湍流性质(例如Chavas et al.2015)给观测带来了困难。

最佳赛道强度的误差估计为:;10%–20%,最佳轨迹风半径的误差可能高达40%,这取决于可用观测的质量和数量(Landsea和Franklin 2013;Knaff和Sampson 2015)。然而,准确的TC强度和风半径估计对于预测和减轻TC相关危害造成的损失至关重要(如Sampson等人2010年;Trift and Snyder 2012年;DeMaria等人2014年;Bender等人2017年),并转化为风速概率等后处理指南(如DeMaria等人2013年)。因此,仍然迫切需要更准确地估计TC强度和风半径。此外,随着TCs卫星观测的最新进展,更新分析技术,尤其是能够从卫星观测中解释复杂TC动态的客观算法至关重要。

深度学习是一种人工智能算法,它彻底改变了计算机视觉、语言识别、游戏策略和许多研究领域(如Hinton et al.2012;LeCun et al.2015;Silver et al.2016;Krizhevsky et al.2017)。最近,深度学习还为大气科学提供了广泛应用的见解,包括模式检测、物理参数化和状态预测(例如,Rasp等人2018年;Ham等人2019年;Reichstein等人2019年)。最近的工作也开始将深度学习应用于TC强度估计。Pradhan等人(2018年)是最早利用深度学习从红外图像估计TC强度的应用之一。然而,这项工作有些不完整,因为他们没有使用独立的数据集进行评估。Chen等人(2019年)使用了比Pradhan等人(2018年)更多的数据集(全球TC案例),并利用红外图像和被动微波反演降水来训练深度学习模型。然而,由于需要间歇性微波降雨率数据和分析后平滑处理,Chen等人(2019)的最佳估计值无法实时获得。Wimmers等人(2019年)通过被动微波图像估计了TC强度,这在显示TC的对流特征方面具有重大优势。然而,目前还没有深度学习应用于TC大小估计。此外,尽管深度学习面临诸多挑战,例如数据采集的成本很高,并且由于缺乏对世界的任何一般知识而在对人类来说微不足道的事情上犯错误,但很少有人成功地利用物理或先前的知识来改进TC应用的深度学习。本研究的主要目标是利用深度学习,从红外图像中更准确地估计TC强度和风半径。此外,我们还试图通过将TCs的先验知识融入到深度学习模型中来扩充深度学习模型。

本文的其余部分组织如下。在下一节中,我们将介绍我们为构建方法而选择的数据和深度学习主干。然后,我们在第3节中描述了增强深度学习模型以进行强度估计和评估模型性能的方法。第4节为风半径估计和评估提供了增强的深度学习。第5节和第6节介绍了对我们方法的讨论和研究结果的总结。

四、数据和方法

1. 数据

建立输入-输出对以训练深度学习模型需要必要的信息。在本文中,模型的输出标签是季后赛最终最佳赛道数据集中的TC强度(MSW和MSLP)和风半径(R34、R50、R64和RMW)。这些数据来自IBTrACS数据库(Knapp et al.2010)。模型的主要输入是以TC为中心的红外图像,这些图像来自飓风卫星数据集(HURSATB1;3小时间隔;8公里分辨率;Knapp和Kossin 2007)。由于HURSAT-B1图像仅在2016年之前可用,因此从那时起,我们使用了GridSat-B1存档(Knapp et al.2011)中的红外图像。GridSat-B1的时间和空间分辨率与HURSAT-B1相同,但在全球范围内。地球静止卫星红外图像因其实时可用性和高时空分辨率而被使用。我们还使用辅助风暴信息作为输入。其中包括TC丰满度(郭和谭2017)、风暴的位置和运动。TC丰满度是TC结构的一个新概念,定义为外部核心风裙的标准化范围,即(R34 2 RMW)/R34。辅助信息来自用于初始化数值天气预报模型指南的热带气旋运行生命数据库(TC Vitals1)(例如Tallapragada等人2014;Bender等人2017)。对于根据TC Vitals估算的风半径无效的情况,相应的TC丰满度设置为零。仅考虑寿命最大强度至少为34 kt(即热带风暴)的北大西洋热带气旋。温带系统和热带海浪被移除。

在数据预处理中,通过减去平均值并除以标准差,对红外图像进行特定样本的归一化。然后对红外图像进行裁剪,只包括中心区域。对于强度估计,使用了58 3 58像素的图像,这在我们的实践中被发现工作良好且有效。对于大小估计,使用了156 3 156像素的较大图像来包含外部范围云信息,这对于生成高质量的外部核心风半径估计是必要的。鉴于在IBTrACS数据库中记录了每个象限(东北、东南、西南和西北)的R34、R50和R64,应用非零方位平均值来获得风半径标签。请注意,R34、R50和R64表示下文中的方位平均风半径数据。由于无法保证IBTrACS的所有风半径标签在物理上是一致的;例如,R50可能比R64小,尽管这种布置在物理上是不可能的。因此,不满足关系R34的风半径标签。R50。删除了R64和R34 R M W 、 R 50 RMW、R50 RMWR50RMW和R64$RMW(Kossin等人,2007年)。

然后将数据分为三个部分(表1):包括2005-15例病例的训练集;由2016年和2018年案例组成的验证集;测试集由2017和2019个案例组成。2005年,当IBTrACS中的RMW可用时,被选为训练数据的一致开始季节。IBTrACS中提供的1990年至2004年的MSW和MSLP标签用于测试训练数据量的影响,并建立最终强度估计模型(第3c和3d节)。最佳航迹修正在测试集中的3小时内(以下简称为侦察)有飞机侦察观测,其质量较高,因此在第3d和4b节中被用作“地面实况”,以评估DeepTCNet的性能。

2. DeepTCNet架构的选择

物理增强的深度学习模型改善卫星图像对热带气旋强度和大小估计(翻译)_第1张图片

3. DeepTCNet的开发和评估

如图1所示,DeepTCNet构建在单任务(STL)和多任务学习(MTL)框架中。STL是一种标准的方法,它可以训练深度学习模型,使其针对一个期望的任务进行优化,并且通常在给定大量训练数据的情况下表现良好。然而,MTL同时学习多个任务。MTL的独特优势在于,它可以利用共享信息和/或相关任务中包含的关系。因此,MTL可以提高模型的准确性和通用性,尤其是在训练数据稀缺的情况下(例如,Zhang和Yang 2017)。在本研究中,STL用于强度(MSW和MSLP)估计,MTL用于临界风半径(RMW、R64、R50和R34)估计,因为可用于训练的高质量TC强度样本比TC风半径(表1)多。此外,使用MTL训练模型以同时学习风半径也可以受益于整体TC风场结构的潜在物理关系。在MTL中,完全连接的层被分成多个流,以学习特定于任务的模型参数,这对于考虑内部和外部核心风半径任务之间的独立特征至关重要(例如Weatherford and Gray 1988;Chavas et al.2015)。然而,**MTL中完全连接层之前的子网在任务之间共享相同的参数,以便在不同任务之间学习可转移的特征。**如图1所示,辅助输入\信息(如果存在)被连接到第一个完全连接的层中的模型。

所有模型均通过最小化损失函数(即网络输出和最佳轨迹标签之间的平均绝对误差(MAE))进行训练。我们使用MAE作为损失函数,因为它对异常数据具有鲁棒性。对于基于MTL的网络,使用了多个任务损失的加权和,其权重是可训练的,并在训练期间自我更新(Cipolla et al.2018)。这种损失的优点是,它可以使所有损失达到相同的规模,以避免一项任务主导总体损失。此外,多任务学习模型学习输出从内到外的核心风半径,这意味着每个数据情况都需要一个多任务标签。因此,当风暴未达到特定的风阈值时,缺失的半径标签被设置为RMW。例如,如果箱子的强度为60 kt,则相应的多任务标签设置为[RMW,RMW,R50,R34]。在这种情况下,多任务学习模型仍然学习搜索能够产生可靠的内外风半径估计的适当特征。

物理增强的深度学习模型改善卫星图像对热带气旋强度和大小估计(翻译)_第2张图片

五、用于强度估计的DeepTCNet

在上一节中用于选择DeepTCNet体系结构的灵敏度测试已经证明了一种基线配置,即具有13层和非常小的3个卷积核的VGGNet可以从红外图像中获得可靠的TCs强度估计。然而,这种模型可能数据效率低下,这意味着它们基本上依赖于训练数据的数量和质量,但缺乏对自然界的物理知识。为了改进估计TC强度的模型,我们首先在本节中提出了一种将TCs的辅助物理信息纳入增强的方法。然后引入代表连续TC发展的序列红外图像来改进强度估计。此外,还讨论了训练数据量的影响。最后,我们将最终整合所有正面设置,建立一个用于TC强度估计的最佳DeepTCNet模型。

六、用于风半径估算的DeepTCNet

本节设置了DeepTCNet,以根据红外图像估计TCs的临界风半径(R34、R50、R64和RMW)。 虽然在我们应用TC强度估计时,通过训练四个独立的网络可以分别获得四个风半径估计值,并且还可以加入增强信息来增强模型,但我们探索了另一种基于多任务学习(MTL)的方法。选择MTL是因为其在利用多个相关学习任务中包含的有用信息方面的优势(Zhang和Yang 2017),这将有助于缓解风半径估计中的数据稀疏问题。在本节的其余部分中,首先探讨MTL的有效性,然后评估DeepTCNet在风半径估计方面的性能。请注意,旋转数据增强已应用于训练所有风半径估计模型。

七、讨论

物理增强的深度学习模型改善卫星图像对热带气旋强度和大小估计(翻译)_第3张图片
DeepTCNet的(左上)输入图像和(a)-(l)解释热图,用于估算强度和风半径。通过(a)-(f)SmoothGrad(Smilkov等人,2017年)和(g)-(l)LRP(Montavon等人,2018年)获得了2017年9月5日协调世界时0900时飓风Irma的热量图,强度为142 kt。插入的框表示DeepTCNet-I的小红外图像和相应的热图[(a)、(b)、(g)、(h)],而较大的框表示DeepTCNet-R。在(c)-(f)和(I)-(l)中的黑色环和蓝色环分别代表最佳轨道风半径和DeepTCNet估计的风半径。与最佳轨迹观测相比,每个估计参数的相对误差为1%。LRP和显著性图是使用InInvestigate软件包(Alber等人2019)计算的,LRP应用于A5 1和B5 0。

物理增强的深度学习模型改善卫星图像对热带气旋强度和大小估计(翻译)_第4张图片

DeepTCNet-R的合成平均红外亮温和LRP热图,用于估算(左)小TC和(右)大TC的R34。在recon辅助测试数据集中,R34的25%分位数样本用于组成小TCs(N5 110,M5 54 N mi),而75%分位数样本用于组成大TCs(N5 112,M5 165 N mi)。LRP中的黑环和蓝环分别代表平均最佳轨迹R34和平均DeepTCNet估计的R34。

你可能感兴趣的:(海洋大气,深度学习,人工智能,深度学习)