参考论文:郭山川,杜培军,蒙亚平,王欣,唐鹏飞,林聪,夏俊士.2021.时序Sentinel-1A数据支持的长江中下游汛情动态监测.遥感学报,25(10): 2127- 2141
合成孔径雷达(SAR) 因其对地观测全天候、全天时优势,成为多云多雨天气限制下洪水动态监测中不可或缺的数据来源之–。由于GEE(GoogleEathEngine)云计算平台的兴起和短重访Sentinel-1数据的可获取性,洪水监测与灾害评估目前正面向动态化、广域化快速发展。顾及洪水淹没区土地覆盖变化的复杂性和发生时间的不确定性,基于时序Sentinel-1A卫星数据提出了针对大尺度范围、连续长期的汛情自动检测及动态监测方法。该方法首先,利用图像二值化分割时序SAR数据实现水体时空分布粗制图,逐像素计算时间序列中被识别为水体候选点的频率。然后,利用Sentinel-2光学影像对精度较粗的初期SAR水体提取结果进行校正,得到精细的水体分布图。最后,针对不同频率区间的淹没特点,采用差异化的时序异常检测策略识别淹没范围:对低频覆水区利用欧氏距离检测时序断点,以提取扰动强度大、淹没时间短的洪涝灾害区;对高频覆水区利用标准分数(Z-Score)检测时序断点,以提取季节性水体覆盖区。在GEE平台上利用该方法,实现了2020-05- -10长江中下游地区全域洪水淹没范围时空信息的自动、快速、有效监测,揭示了不同区域汛情发展模式的差异性。本文提出的洪水快速监测方法对大尺度下的汛情动态监测、灾害定量评估和快速预警响应具有重要的现实意义。
1、研究区概况
长江中下游地区位于南岭以北,秦岭淮河以南,东临东海、黄海,西接巫山;行政区划包含鄂、湘、赣、皖、苏、浙、沪等7省市,总面积达91.4万km2;地范围为(24° 29’N- -35° 20’N,108°22’E- -123° 10E)。域内地貌类型多样,既包含长江三角洲平原、江汉平原、鄱阳湖平原等平原,也包含大别山、雪峰山、罗霄山等山脉,山脉间夹杂着广阔的丘陵和盆地。长江中下游区域是中国水资源最丰富的区域,天然水系和人工河渠纵横交错,其中年平均径流量超过500亿m’的长江、淮河、湘江、汉江和赣江分布于此;中国五大湖中的鄱阳湖、洞庭湖、太湖、洪泽湖也坐落在内。2020-06- -07,长江中下游地区出现极端降雨气候事件,连续41 d发布暴雨预警,流域降水量达到410.4mm较往年同期增加45.3%,河流和湖泊连续超过历史水位线,全区面临流域性的暴洪、内涝、溃堤等灾害风险。
2、数据和GEE平台
GEE是一个旨在存储、处理、分析和可视化地理空间数据的云计算平台。该平台的出现使遥感大数据处理与分析模式发生转变(Tamiminia等, 2020),广泛应用在时间序列分析或大范围制图等环境遥感领域。GEE的优势在于提供了: (1)海量的遥感开放数据集,(2)众多的遥感影像处理算法,(3) 强大的数据云计算能力,(4) 通用编程语言的支持(JavaSeript、 Python)。 GEE能够极大地提高时序SAR数据处理和分析效率,为广域、动态、长期的汛情监测研究提供了巨大机遇(DeVries 等,2020)。
Sentinel-1是欧空局哥白尼全球对地观测任务研发的新一代双极化C波段星载SAR系统,由2014-04发射的Sentinel-1A和2016-04发射的Sentinel-1B组成。GEE存储了干涉宽幅模式(IW)、超宽幅模式(EW)、条带模式(SM)下的Sentinel-1 GRD数据,并且每日更新、发布最新生产的数据。每期数据发布前利用欧空局SNAP软件包进行了包括轨道文件导人、热噪声去除、辐射定标和正射校正等预处理(Tiwari 等,2020)。 长江中下游地区Sentinel-1B卫星拍摄范围覆盖不足10%且条带不连续,而Sentinel-1A数据覆盖全范围且形成了12d固定周期的数据积累,因此采用了Sentinel-1A数据,采用Sentinel-1A数据的主要参数如表1所示。覆盖长江中下游区域的Sentinel-1AGRD数据涉及8个相对轨道号,其覆盖范围如图1所示。表2列出了2020- -05-02- -10-27 期间研究区Sentinel-1A数据的成像日期及其相对轨道号。
Sentinel-2是欧空局哥白尼计划的宽扫描、中高分辨率、多光谱成像卫星,包含2A和2B两颗卫星。Sentinel-2 卫星携带多光谱仪器(MSI), 覆盖13个光谱波段,地面分辨率为10 m、20 m和60n。GEE支持Sentinel-2 Level-2A 地表反射率产品(Sen2Cor校正)的处理与分析(Louis等, 2016)。本文联合T1期的Sentinel-1和Sentinel-2卫星数据反演高精度水体分布信息,以此为基础分析洪水
淹没范围,因此使用的Sentinel-2数据观测时间应接近T1期Sentinel-1A数据观测时间。研究区覆盖范围广,为得到全覆盖的光学影像,需要不同时期拍摄的影像拼接而成。同时考虑到云层覆盖可能造成的影响,因此所需Sentinel-2影像的拍摄时间放宽到水体较为稳定的2020-03- -05期间。
数字高程模型(DEM)和水文模型用来去除山体阴影造成的误识别。DEM采用的是30m空间分辨率美国航天飞机雷达地形测绘计划SRTM(Shuttle Radar Topography Mission) 数据;水文模型采用的是流域相对高程模型HAND(Height.Above the Nearest Drainage) (Nobre等, 2011)。
3、方法与实现
洪水淹没导致的地表覆盖类型突变,使地表散射体的雷达后向散射系数在时序上呈现出异常波动。因此,基于时序异常检测理论,本文提出了洪水自动检测与动态监测方法。该方法的主要内容包括:基于GEE的数据预处理、水体时空分
布粗提取、首期水体精提取、洪水事件检测与淹没分析,整体技术流程如图2所示。在数据预处理阶段,面向监测需求确定数据筛选规则,再对时序数据分组、滤波、镶嵌和裁剪以构建研究区全覆盖的时序SAR数据集;水体时空分布粗提取阶段,参考最大类间方差法(Otsu) 确定SAR影像水陆分割阈值,利用坡度和HAND数据去除阴影区虛检水体,实现水体时间序列信息粗提取;在水体精细提取阶段,联合Sentinel-2光学数据改进首期水体粗提取结果,以精准提取初时相的水体信息;洪水检测和淹没分析阶段,利用水体时空分布数据逐一计算每个像元被识别为水体的频率,基于不同的频率区间构建不同的洪水事件检测策略,最终分别提取短暂淹没区和持续淹没区,并分析淹没区的时序变化特征。
4、数据预处理
GEE存储整个预处理后Sentinel-1GRD数据库,并允许用户直接访问、调用,因此规避了下载、本地存储、预处理大量数据的负担。针对研究的数据需求,Sentinel-1A 数据的筛选条件设定为: (1)观测范围覆盖长江中下游地区; (2)成像时间包含在2020-05-10间; (3)极化方式为双极化。共查询到697幅Sentinel-1A SAR影像满足以上条件。以Sentinel-1A卫星重访周期为基准,将查询到时序数据划分为15组数据子集。采用3x3窗口对每个数据子集内的数据进行中值滤波,以减小SAR影像相干斑点噪声产生的误差(Lee,1981;杜培军,2002), 最后通过镶嵌、裁剪得到15期(间隔期为12d)的区域全覆盖SAR影像。Sentinel-2数据用于首期水体信息精提取,因此筛选条件有: (1) 观测范围与研究区保持- -致;(2) 拍摄时间为2020-03- -05间,与首期SAR影像接近; (3) 云层覆盖比例小于30%,以控制云覆盖对Sentinel-2数据质量的影响。查询到符合上述条件的影像数目共1177景,使用Sentinel-2数据自带的QA60波段实现去云处理。
5、水体时空分布粗提取
交叉极化图像主要反映了体散射信息,而对镜面反射的敏感程度较低。水体由于表面光滑、均质性较强,在交叉极化图像中的噪声水平较低,具有较小的类内方差。与同极化数据相比,水体与非水体的重叠区域更小、可分离性更高,更适合水体信息提取(谷鑫志等,2019)。 因此,本文采用VH交叉极化图像提取水体信息。对于长江中.下游地区,由于土地覆盖类型的复杂性、大量山区阴影干扰和大尺度下水体占比相对很少,通过全域的后向散射系数直方图统计分析较难得到有效的水陆分割阈值(Martinis 等,2009)。 本文以局部区域(太湖流域、巢湖流域、武汉市)的后向散射系数直方图统计为基础,如图3所示,利用Otsu算法(Otsu, 1979) 计算局部区域的最佳水陆分割阈值,分别为-22.88 dB,-22.84 dB, -20.92 dB。参考典型区水体和陆地在Sentinel-1A影像中体现出的后向散射差异性,最终确定VH极化后向散射系数水体提取全局阈值T。为-23dB,该阈值也在相关文献中得到使用和验证(DeVries等, 2020;Huth等,2020; Kaplan 和Avdan, 2018; Li等,2020)。
针对山体阴影区的低后向散射率特点而产生的水体误识别问题,可利用SRTM提取坡度信息以掩膜坡度较大的非水体区。理论上,持续性积水存在于小坡度区域,而山体阴影存在于坡度较大的区域,因此二者分离阈值的取值范围较宽。顾及洪水滞留区坡度特征和研究区Sentinel-1A影像人射角范围30.52°–46.29所能形成阴影区的坡度条件,本文的坡度阈值确定为10° (Lu等, 2017)。
该阈值既能有效掩膜SAR侧视成像造成的山体阴影区,又保留了洪水滞留区信息。在利用HAND模型掩膜方面,长江中下游地区降雨充沛、水网密度高,HAND阈值可选择较大值以减少洪水淹没区漏识别。因此HAND阈值确定为20m以掩膜距最近水系的垂直距离大于20m的平坦地区阴影区(Tsyganskaya等,2018)。 综上,提取水体多因素规则为(1) σh≤-23dB,(2) slope<10*, (3) HAND<20m。然后利用该规则从预处理后的时序SAR影像中的提取到长江中下游地区水体分布时序信息,并建立水体时空分布数据。由于长江中下游地区复杂的地表覆盖,利用后向散射特性提取的粗精度水体数据仍受到低雷达散射区域的影响,因而.
存在较多的误提取现象。如图4所示,长江中下游地区,主要的误识别区域包括: (1) 沿江沙丘、待开发空地等干旱裸地,(2)机场、道路等表面光滑的人工地表,(3)成熟期前的小麦种植地(Veloso等,2017)。
6、初期水体精提取
通过水体时空分布结果提取在全时序中被识别为水体的区域,去除初期水体分布区,即可得潜在汛情发生区域。顾及汛情前后土地覆盖变化带来的后向散射系数显著变化特征,再采用时序异常检测方法可识别洪水淹没范围和淹没时间。因此,本节结合Sentinel-2光学数据,利用归一化水体指数NDWI (Normalized Difference WaterIndex)校正SAR水体初提取结果,以反演可靠、精确的初期水体分布信息。由于水体在绿光波段反射率高和近红外波段反射率低的特性,两者反射值之差与其之和的比.值能够有效地反映出地表水体信息。利用NDWI在Sentinel-2影像中提取水体的流程主要包括:(1)通过监测范围和监测时间筛选Sentinel-2光学影像; (2)利用波段运算计算每一期影像的NDWI值; (3) 像元在2020-03-05期间的NDWI值取该期内所有NDWI最大值。去除初期水体SAR提取结果中的NDWI负值区,完成水体提取结果的精校正。
7、洪水事件自动检测
通过检测水体变化识别洪水事件受限于SAR水体提取的精度不高,同时云雨天气也限制了光学影像同步校正时序的水体提取结果。因此本文提出了一种基于时序频率的洪水事件检测方法以适应大尺度范围的洪水动态监测。
随机选取王家坝蓄洪区、皖北小麦种植地各50个点,统计分析其时序的后向散射系数和欧氏距离,如图7所示。尽管小麦地在小麦成熟期前的后向散射系数较低达到水体提取阈值,但是其波动变化是一个持续、较缓慢的过程。而洪水事件在T7期对王家坝蓄洪区的地表覆盖产生的扰动使其后向散射系数强度变化较为显著。可以发现,当Dis为-12 dB时,能够较好地检测到洪水事件引起的时序异常。所以对于快速淹没-退洪模式的水体变化检测策略为: σ≤-23dB,同时Dis≤-12dB持续淹没模式的洪水事件多发生在调节长江洪水的吞吐型或过水型湖泊及其周边生态湿地,这些区域本身受到长江枯水期和丰水期的调节,存在季节性的水位变化。2020年汛期,由于全流域的持续降水,长江水位连续突破历史极值,使水体覆盖范围增大,淹没持续时间长,因而在时序上被识别水体的频率较高(f.≥0.5)。 利用初期水体精提取结果掩膜水体频率图后,高频覆水区包括了持续淹没区域的同时,还有表面光滑的人工地表。从高频覆水区中检测洪水事件关键点在于区分人工地表和淹没范围。相较于前者稳定的后向散射强度时序特征,持续淹没区淹没前后地表覆盖类型的转换会造成后向散射系数的变化。因此可利用该特性,提取持续淹没范围。在石白湖区域随机选取50个淹没点以试验分
析淹没区的时序特征,其VH、VV极化的后向散射系数和欧氏距离如图8 (a)、图8 (b)、图8 (e)所示。试验发现,由于淹没区存在水生植物,VV极化的后向散射系数变化滞后于VH极化后向散射系数的变化。直至T7期水位上升至完全淹没水生植物时,VV后向散射系数才达到最小值。
8、水体精提取结果及精度评价
图9显示了利用Sentinel-1A和Sentinel-2提取2020- -05长江中下游地区水体分布的结果。对比数据采用了欧盟委员会联合研究中心(JRC)利用Landsat数据反演的全球水体覆盖时序产品CSW(Global Surface Water) (Pekel 等,2016)。 分别从水体分布密度低、中、高的皖北耕地区域、洞庭湖区域和阳澄湖区域随机选择了均匀分布的样本各1000个,用来评价本文提取水体结果与同期GSW产品的精度,如表4和图10所示。总体上,本文提取的水体结果的总体精度(OA) 和Kappa系数均高于GSW。具体地,在地表水体分布密度较低的皖北耕地区域,由于分辨率优势,线型水体在本文提取的结果里能被更精细、准确地提取;在洞庭湖区域,GSW产品由于遥感数据质量问题存在明显的条带缺失,因而导致精度较低,而本文提出的结合Sentinel-1A和Sentinel-2水体提取方法有效地规避了光学对地观测在云雨天气下失效问题;在水体分布密度高、类别复杂、破碎度高的阳澄湖水产养殖区,可以发现本文提取的结果对细碎水产养殖用地的几何信息的表达更精细、完整。
9、洪水事件自动检测及分析
2020- -05- -10期间, 长江中下游地区洪水发生区域分布如图11所示。按照淹没时间的长短,长.江中下游地区的洪水事件可划分为洪涝灾害模式和汛期持续淹没模式。整体上,表现为快速淹没一退水特征的洪涝灾害区域主要分布在淮河流域、新沂河流域、巢湖流域和洞庭湖流域,其洪水淹没范围分别如图11所示。该模式下的淹没区域原为耕地、水产养殖地等人类生产生活用地。因此虽然淹没时间短,但其影响人口众多,造成社会经济损失大,而且扰动了区域生态环境。汛期持续淹没区主要分布在长江中下游湖泊及其周边区域,如鄱阳湖、洞庭湖、石白湖、菜子湖等(图11)。由于2020年汛期的流域性持续强降水引起了长江水位持续上升,江水倒灌湖泊的量能增高,加上区域强降雨双重影响,可以发现图11中,长江中下游湖泊水面覆盖范围均有-定程度的扩大。与淮河流域通过行蓄洪区减缓整体洪涝灾害相比,长江流域本身拥有众多与长江连通的天然吞吐型湖泊,这些湖泊承担了重要的蓄洪、防洪任务,使得长江中下游地区有足够的空间和时间来防范和疏导洪水,从而减小洪灾带来的经济和生态损失。但是,即
使有数目众多的天然蓄洪区,面对2020年“百年-遇”的汛情,长江中下游多数湖泊的覆盖范围和水位连续突破历史极值,面临着巨大的防洪压力。甚至部分湖泊( 如巢湖流域)还发生了洪涝灾害。
10、洪水淹没动态监测
以快速淹没一退水的洪涝灾害模式为主的淮河流域中游和季节持续淹没为主的鄱阳湖流域为例,通过跟踪洪水淹没范围演变,以揭示两个区域汛情发展差异。由图1可知,Sentinel-1A 在淮河中游采集数据的相对轨道号为40(西段)和142(东段)。因此通过查询表2,可将不同时相的监测结果定期到具体成像日期。从图12 (a)中可以发现,淮河颍上段在T5阶段(2020-06-26) 就已检测到洪水淹没,主要的淹没期是T7 (2020-07-20)和T8 (2020-08-01) 两期。可以发现王家坝在2020-07-20 T 8:32开闸后,Sentienl-1A 卫星在当天下午18 :20过境时监测到蒙洼蓄洪区的外缘首先被淹没,2020-08-01 监测到整个蒙洼蓄洪区几乎全被淹没;淮河颍上段的蓄洪区继蒙洼蓄洪区启用后,也在2020-07-20陆续开闸泄洪,同样可以在图12(a)中监测到该段蓄洪区2020-07-20被淹没一部分,2020-08-01监测到近被全淹。对于淮河中游东段(142轨道号),在T8期(2020-07-25)被监测到有大量区域被洪水淹没。利用Z分数监测退水过程结果如图12 (b),可以发现蒙洼段洪水在T8 (2020-08-01) 、T9 ( 2020- -08-13)、T10 (2020-08-25) 被监测到逐渐退去,颍上段退洪过程相对滞后为T10 (2020-08-25) 、T11(2020-09-06)、T12 ( 2020-09-18)。
鄱阳湖水体覆盖变化监测结果如图13所示。覆盖鄱阳湖流域的SAR影像相对轨道号为40,则其水体变化过程为:水体覆盖范围在T3期(2020-06-02)被观测到开始扩张;主要扩张期为T3期一T7期(2020-06-02- 2020-07-20); 在T7期- -T14.
期(2020-07-20- -2020-10-12) 稳定在高水位状态; T15期(2020-10-24) 水体覆盖范围呈现出较小程度的萎缩。