文 / Nal Kalchbrenner 和 Casper Sønderby, Google Research
准确预测未来数分钟到数周内的天气情况是一项基础科学挑战,会对社会的众多领域产生广泛的影响。目前,许多气象机构均采用基于大气的物理模型作为预报方法。尽管此类模型在过去几十年间有了很大的改进,但这需要庞大的算力支撑,而且还对所依赖的物理定律的近似值非常敏感。另一种天气预报方法能克服其中一些限制,即使用深度神经网络 (DNN):DNN 无需对物理定律进行编码,而是从数据中发现模式,并在强大的专用硬件(如 GPU 和 TPU)上执行并行计算,进而学习从输入到期望输出的复杂转换。
基于先前对降水即时预报的研究,我们提出了“MetNet:用于降水预报的神经网络天气模型”(MetNet: A Neural Weather Model for Precipitation Forecasting),这种 DNN 能够以 2 分钟的时间间隔和 1 公里的分辨率来预测未来 8 小时内的降水情况。
MetNet:用于降水预报的神经网络天气模型
https://drive.google.com/open?id=15vUBadsK004U7HQ7dLlHuq-oe5uVbUN4
NOAA 目前采用基于物理的最前沿 (SOTA) 模型,在预测全美降水量时需耗费一小时。MetNet 则要优于该模型,不仅能在几秒钟内完成预测,而且可将预测时间提前 7 到 8 小时。并且 MetNet 的输入可自动从雷达站和卫星网络获取,无需人工标注。模型输出的是一个概率分布,我们用它来推断每个地理区域最可能的降水率和相关的不确定性。下图显示 MetNet 对美国大陆的降水预测示例。
NOAA
https://www.noaa.gov/
MetNet 模型预测结果与 NOAA 多雷达/多传感器系统 (MRMS) 测量的地面实况对比:MetNet 模型(上)显示了预测未来 2 分钟至 480 分钟内达到每小时 1 毫米降水量的概率,而 MRMS 数据(下)显示了在同一时段内实际降水量至少达到每小时 1 毫米的区域
神经网络天气模型
MetNet 不依赖于大气动力学领域中明确的物理定律,而是通过反向传播学习,直接从观测数据中预测天气。它使用的降水量估计值来自由多雷达/多传感器系统 (MRMS) 组成的地面雷达站,以及 NOAA 地球静止环境观测卫星系统的测量值(该系统提供了自上而下的大气层云图)。这两类数据源均覆盖美国大陆,并提供了可被网络有效处理的类似图像的输入。
多雷达/多传感器系统
https://www.nssl.noaa.gov/projects/mrms/
该模型以 1 公里分辨率,针对全美的 64 x 64 平方公里区域执行计算。然而,相对于这些单个输出区域,输入数据的实际物理覆盖范围要大得多:需要考虑到在预测的时间段内,云层和降水场可能会出现的移动情况。例如,假设云层以最高每小时 60 公里的速度移动,为了有效预测未来 8 小时内的大气层的时间动态,该模型需要获取各个方向上 60 x 8 = 480 公里的全方位空间上下文信息。因此,要实现这一级别的数据,我们需要 1024 x 1024 平方公里区域内的信息,才能对 64 x 64 平方公里的中心区块进行预测。
包含卫星和雷达图像(外框:1024 x 1024 平方公里)的输入区块大小,以及输出预测的雷达图像的大小(内框:64 x 64 平方公里)
由于以全分辨率处理 1024 x1024 平方公里的区域需要大量内存,因此我们使用空间降采样器(通过减少输入区块的空间维度来降低内存消耗),同时在输入中查找并保持相关的天气模式。
然后,我们沿降采样输入数据的时间维度应用时间编码器(采用适合图像序列的卷积 LSTM 实现),以 15 分钟为间隔,对来自输入数据前 90 分钟的 7 个快照进行编码。
卷积 LSTM
https://arxiv.org/abs/1506.04214
随后,我们将时间编码器的输出传递至空间聚集器,该聚集器使用轴向自注意力机制有效捕获数据中的远程空间依赖性,并根据输入目标时间提供可变的上下文量,从而对 64 x 64 平方公里区域的输出进行预测。
轴向自注意力机制
https://arxiv.org/abs/1912.12180
该模型架构的输出是一个离散的概率分布,用以预估美国大陆每平方公里达到给定降水率的概率。
神经网络天气模型 MetNet 的架构:输入的卫星和雷达图像首先通过空间降采样器以降低内存消耗。接着,在 90 分钟的输入数据中,将由卷积 LSTM 按 15 分钟的时间间隔处理这些图像。然后,模型利用轴向注意层让网络看到整个输入图像
结果
我们根据降水率预测基准对 MetNet 进行评估,并将结果与两个基线模型进行比较:一是 NOAA 高分辨率快速刷新系统(HRRR 系统 ,目前在美国流行的物理天气预测模型);另一个是预估降水场移动情况(即光流)的基线模型,这种方法在预测时间少于 2 小时的情况下表现良好。
降水率预测基准
https://arxiv.org/abs/1912.12132
高分辨率快速刷新系统
https://rapidrefresh.noaa.gov/hrrr/
基线模型
https://www.geosci-model-dev.net/12/1387/2019/
我们的神经网络天气模型有一个显著优势,即针对密集和并行计算进行了优化,非常适合在特定硬件(如 TPU)上运行。因此,无论是针对纽约市这样的特定地点还是整个美国,我们的模型都能在几秒钟内并行完成预测,而诸如 HRRR 这类的物理模型则需在超级计算机上运行约一小时。
如下图所示,我们量化了 MetNet、HRRR 和光流基线模型之间的性能差异。在这里,我们展示了使用 F1 分数:在 1.0mm/h 降水率阈值(对应小雨)下评估这三个模型所实现的性能对比。MetNet 神经网络天气模型在 8 小时预测时间内的性能优于 NOAA-HRRR 系统,并且始终优于光流基线模型。
1.0 mm/h 降水率下按 F1 分数评估的预测效果 (分数越高越好),在长达 8 小时的预测时段内,神经网络天气模型 (MetNet) 的性能优于目前在美国使用的基于物理定律的模型 (HRRR)
由于大气运动的随机性,未来实际天气状况的不确定性会随着预测时间的延长而增加。因为 MetNet 是概率模型,所以随着预测时间的延长,预测的不确定性在可视化效果中表现为预测的日益平滑。相反,HRRR 并不直接进行概率预测,而是会对未来可能的降水情况进行 单一 预测。下图对比了 MetNet 模型和 HRRR 模型的输出。
MetNet (上)和 HRRR(下)的模型输出与从 NOAA MRMS 系统获取的地面实况(中)的对比。需注意的是,虽然 HRRR 模型预测得出的结构看起来更接近于地面实况的结构,但该结构可能存在严重错误
与 MetNet 模型相比,HRRR 物理模型的预测结果看起来更清晰和结构化,但由于初始条件及模型参数的不确定性,其结构(尤其是结构预测的确切时间和位置)的准确度较低。
HRRR(左)预测了许多可能结果中单个潜在的未来结果(红色),而 MetNet(右)通过分配未来结果的概率来直接处理不确定性
关于 HRRR 和 MetNet 模型之间更全面的对比,请观看下方视频:
前景展望
我们正在积极研究如何改进全球天气预报,尤其是在受气候快速变化影响严重的地区。虽然我们目前展示的是用于预测美国大陆天气情况的 MetNet 模型,但也可将该模型的应用范围扩展到可获取足够雷达和光学卫星数据的任何地区。本文介绍的工作只是这一计划中的小里程碑,我们希望未来能与气象界进一步合作,从而带来更大的改进。
致谢
本项目在 Lasse Espeholt、Jonathan Heek、Mostafa Dehghani、Avital Oliver、Tim Salimans、Shreya Agrawal 和 Jason Hickey 的联合帮助下完成。
此外,我们还要感谢 Manoj Kumar、Wendy Shang、Dick Weissenborn、Cenk Gazen、John Burge、Stephen Hoyer、Lak Lakshmanan、Rob Carver、Carla Bromberg 和 Aaron Bell提供的实用意见,并感谢 Tom Small 所做的可视化工作。
更多 AI 相关阅读:
基于 MediaPipe 的移动端实时 3D 对象检测
发布 Open Images V6:新增局部叙事标注
2020 年 TensorFlow 开发者峰会总结
推出 AutoFlip:智能视频重构的开源框架