遥感卫星大数据高精度一体化处理技术

遥感卫星大数据高精度一体化处理技术

仇晓兰1, 胡玉新1, 上官松涛2, 付琨1

1 中国科学院空天信息创新研究院

2 苏州空天信息研究院

 摘要我国空天信息获取技术飞速发展,空天数据呈现出数据量大、种类多、增长快、价值密度相对较低的大数据特点。遥感卫星数据是空天大数据的重要组成部分,如何利用遥感卫星数据的规模效应和异构数据互补优势,提升处理精度并提高处理效率,是遥感卫星大数据处理系统需要解决的关键问题。简要回顾了我国遥感卫星数据地面处理系统的发展历程,指出了地面处理系统面临的核心难点,提出了基于稳定特性挖掘的遥感卫星大数据高精度处理技术的思路,并给出了初步的实现方法,以期为我国空天大数据处理系统的发展提供有益参考。

关键词遥感卫星大数据 ; 地面处理系统 ; 大数据稳定特性挖掘 ; 高效处理架构

4a2fc69eb2c3c83cfc67d34649f53730.png

论文引用格式:

仇晓兰, 胡玉新, 上官松涛, 等. 遥感卫星大数据高精度一体化处理技术[J]. 大数据, 2022, 8(2): 15-27.

QIU X L, HU Y X, SHANGGUAN S T, et al. Remote sensing satellite big data high-recision integration processing technology[J]. Big Data Research, 2022, 8(2): 15-27.

e1a7d94204295650f6febb0632222b04.png

0 引言

卫星遥感技术是衡量一个国家科技发展水平和综合实力的重要标志,具有广阔的市场前景。目前,国外遥感卫星技术的发展非常迅速,尤其近年来商业遥感卫星发展迅猛。在光学卫星遥感领域,美国的DigitalGlobe公司具有QuickBird、WorldView和GeoEye等多个系列卫星群,其卫星图像的分辨率大多在0.3~0.5 m,且光谱信息丰富,具备业界领先的定位精度,是商业领域光学卫星遥感技术的领军者。在合成孔径雷达(synthetic aperture radar,SAR)卫星遥感领域,近年来小型化低成本SAR卫星的发展掀起了热潮。2018年1月,芬兰的ICEYE公司率先发射了国际首颗质量低于100 kg的SAR卫星,获得了优于1 m分辨率的SAR图像,并于2019年实现了0.25 m分辨率,其计划发射10余颗ICEYE卫星,以实现在全球任何地方每天进行干涉测量和相干变化检测的能力。美国的Capella Space公司于2020年8月发射了商业化SAR小卫星,图像分辨率为0.5 m,并具备60 s长时间凝视的能力,是分辨率极高的商用SAR,Capella Space公司也计划发射多颗SAR小卫星组成星群,以实现更强大的全天时全天候监测服务能力。

近年来我国遥感卫星系统技术高速发展,每年发射遥感卫星近10颗,其中民商(即民用和商用)遥感卫星也频频发射。2015年10月,中国自主研发的首颗商用遥感卫星吉林一号发射成功,开创了中国商业卫星应用的先河。吉林一号星座计划由138颗涵盖高分辨、大幅宽、视频、多光谱等系列的高性能光学遥感卫星组成,光学影像分辨率优于1 m并具备获取4K高清彩色视频影像的能力,目前已通过10次发射将25颗吉林一号卫星送入太空,建成了我国目前最大的商业遥感卫星星座。2016年发射的高景一号卫星由两颗0.5 m分辨率的光学卫星组成,具有专业级的图像质量、高敏捷的机动性能和丰富的成像模式,目前已形成四星组网格局。在SAR方面,我国首颗商业SAR卫星海丝一号于2020年12月发射并成功获得SAR图像,其具备3 m分辨率条带和1 m分辨率聚束工作模式。此外,2021年4月齐鲁一号卫星成功发射,其为Ku波段高分辨率SAR商业小卫星,主要为山东的国土、城建、农业、林业、能源、防灾减灾等相关部门提供遥感服务。随着我国遥感卫星数量的爆发式增长,目前我国遥感卫星数据总量正以超过10 TB/天的速率不断获取与积累,遥感卫星数据已快速步入了大数据时代。

然而,相比遥感卫星数据获取技术的发展,我国遥感卫星数据处理技术的发展呈现出滞后性。并且,我国遥感卫星数据虽然在图像分辨率方面与国外相当,但在遥感数据产品的几何、辐射等精度和稳定度方面还存在一定的差距。以SAR辐射精度为例,国外TerraSAR-X卫星图像产品的绝对辐射精度可以达到0.6 dB(RMS), RADARSAT-2的绝对辐射精度为0.81 dB(RMS),Sentinel-1的端到端绝对辐射精度为1 dB(3σ),而目前我国高分三号(GF-3)SAR卫星的绝对辐射精度设计值为2.5 dB(3σ),并且产品的辐射质量监测也比较有限。以SAR卫星图像产品的几何定位精度为例,Curlander J C提出的适用于SAR卫星的距离多普勒(range-Doppler, RD)模型是目前应用非常广泛的SAR严密几何模型。针对RD模型中的轨道参数、斜距参数误差源的分析,目前已经发展出一套较成熟的几何精度提升方法,如精密轨道数据的获取、系统时延与大气时延误差的校正、地球运动因素补偿等。加拿大的RADARSAT-2和意大利的COSMOSkyMed卫星在使用精密轨道数据并校正大气、地球运动因素影响后,聚束模式下的角反射器定位精度均优于2 m;德国TerraSAR-X卫星的高分辨率模式则已达分米级的定位精度。我国GF-3卫星经过全链路系统误差分析,采用厘米级精密轨道数据,通过系统时延消除、大气时延修正等多方面的补偿工作,其定位精度可达3 m。然而由于高精度数字高程模型(digital elevation model,DEM)数据缺乏等原因,GF-3卫星图像产品的精度仍为几十米量级,图像产品几何精度的一致性仍然有待提升。

可以说,我国卫星遥感数据产品定量化精度还存在很大的提升空间,不同传感器、不同时相的产品质量的一致性和稳定性也存在不足,这影响了遥感信息提取和物理参数定量化反演的能力。例如,受重访周期等的限制,单颗卫星无法满足灾害监测、目标监视等时效性要求高的应用需求,必须通过多星甚至多传感器的接力配合,而遥感数据产品在几何、辐射等精度方面不一致会影响目标位置、状态等信息提取的准确性。当前,我国卫星遥感领域“大数据小价值、大事业小市场”的矛盾非常突出,已成为制约遥感产业发展的关键瓶颈。

因此,有必要提出针对多星多传感器多模式的遥感卫星数据高精度一体化处理技术。一方面通过一体化的处理方式和方法,提升多星多传感器数据产品质量的一致性和稳定性;另一方面,通过一体化的处理,充分发挥遥感卫星数据的规模化优势和互补性优势,提升处理精度,为遥感图像联合信息挖掘和应用提供关键技术支撑。

1 遥感卫星大数据处理难点

遥感卫星数据从星上数据获取到产品生产再到按需分发应用是一个较长的链路,包括数据接收、定标及产品生产、信息提取、共享应用等多个环节。其中,遥感数据产品生产环节至关重要,其通过对传感器获取的原始数据进行成像、辐射校正、几何校正等处理,恢复观测地物的位置信息和定量的辐射/散射等信息的过程。遥感数据产品是遥感卫星地面处理系统的核心任务。我国遥感卫星数据地面处理系统已从“一星一议”发展到“多星处理系统一体化”的阶段,笔者认为后续还将朝着“处理算法一体化”的方向发展。

在我国遥感卫星发展初期,卫星数量少,用户部门往往针对每颗卫星的特点和应用需求,单独论证和构建地面处理系统,是一种“一星一议”的模式。随着卫星数量的增多,一个用户部门拥有不同类型的多颗卫星,“一星一议”的烟囱式建设模式存在建设成本高、产品规范不一致、难以联合应用、阻碍共享分发等问题。为此,在国家高分辨率对地观测系统重大专项等相关项目支持下,通过科学工作流建模和资源虚拟化技术(如图1所示),实现处理过程插件化、处理流程定制化、作业资源虚拟管理与统一调度,进而实现了多星多传感器处理系统的一体化构建;建立了统一的处理算法体系、统一的数据产品格式等一系列标准规范,使得不同部门、不同卫星、不同传感器的遥感数据能在统一的地面处理系统中进行处理,并得到标准化的数据产品,为多星多传感器数据综合应用能力的提升奠定了基础。

遥感卫星大数据高精度一体化处理技术_第1张图片

图1   科学工作流建模和资源虚拟化技术概念

上述系统虽然实现了处理系统架构的一体化,但不同卫星数据处理的工作流之间是独立的,且当前数据和历史数据之间也基本不相关,并没有真正发挥多源多时相数据的互补优势和遥感大数据的规模效应。为此,需要从处理算法的角度真正进行一体化的考虑,以挖掘遥感大数据的潜力,提高数据产品的精度和质量的一致性、稳定性。

然而,多星多传感器处理算法的一体化设计存在很多难点,主要包括如下两点。

● 多星多传感器的成像机理、数据类型和模式不同,处理数据时依据的物理模型也不同,相互协同难。例如,SAR是主动微波成像,获得的是地物目标的微波散射信息,而可见光传感器是被动光学成像,获得地物目标的光学辐射特性,二者成像机理差异很大。SAR和可见光卫星的辐射校正、几何校正物理模型也存在很大差异,能否挖掘出其互补优势并进行协同处理本身就是一个需要研究的问题。

● 遥感大数据在一体化协同处理方面涉及数据种类多、数量大问题,高效处理难。遥感大数据一体化处理拟挖掘蕴含在多星多传感器多时相数据中的互补信息,以提升处理精度。然而当前各类应用对数据产品的时效性要求不断提高,实现遥感多维时空大数据的高效组织分析以及高精度产品的快速生产面临很大的挑战。

由于上述原因,遥感大数据条件下的多星一体化高精度处理技术的研究还处在起步阶段。本文提出了基于稳定特性挖掘的高精度一体化处理技术思路,并主要以SAR数据处理为例,从辐射校正、极化校正、几何校正等方面给出了初步的处理方法,通过挖掘多源遥感大数据的稳定特性,实现常态化、低成本的数据质量监测和系统误差估计,从而达到提升数据产品精度和稳定性的目的。

2 基于稳定特性挖掘的遥感数据高精度一体化处理

2.1 技术思路

为了提升遥感卫星数据产品的几何、辐射等精度和产品质量的稳定性,通常需要进行周期性的人工外场定标,即通过在满足一定条件的定标场布设特性已知的人工定标器,对比遥感影像中获取的定标器特性与实际的定标器特性,从而实现遥感卫星系统误差参数的计算,然后将获得的这些系统误差参数用于产品生产,实现误差的校正,从而获得高精度的数据产品。这种方法存在以下几点不足,导致其在多载荷多模式的遥感大数据产品生产中面临越来越大的压力。

● 人工定标器的研制和布设需要大量人力物力成本,定标器数量比较有限,因此高精度误差参数的获取对定标器本身的特性和精度有很高的要求。比如为了满足信噪比要求,P波段辐射定标的三面角反射器边长需要达到5 m;同时三面角反射器的夹角制造偏差大于1°即可引起0.2~1 dB的雷达后向散射变化,因此对定标器的加工也提出了很高的要求。

● 系统的误差特性会随运行时间发生漂移,标定参数也会随之发生改变,但人工定标方式难以做到时间上的连续性。例如,定标场会受到雨雪等天气因素影响,这限制了其执行任务的时间区间;定标器的每次布设和调整耗时耗力,虽然也发展出远程操控定标器等技术[16],但由于布设地点的限制,在卫星执行任务期间频繁经过定标场仍会影响执行其他任务的效率,因此仍然难以做到时间上的高频次。

为此,从多源多时相遥感大数据自身出发,通过充分挖掘其中蕴含的稳定基准来替代人工定标器,实现系统误差的估计或标校,具有重要的意义,这也是提升处理精度和稳定度的一个可行途径。为此,拟首先对各类传感器系统的误差源进行统一梳理,一体化地考虑误差源的建模和估计问题;然后从多源多时相遥感大数据中挖掘可作为基准的稳定特性;最后,以稳定特性为基准,对各类误差或误差的模型参数进行估计或联合估计,从而提高遥感数据产品的精度和稳定度,并实现不同传感器误差模型的相互借鉴,以实现互补提升。上述技术思路如图2所示。

如图2所示,将误差梳理为:①目标场景自身未知状态引起的误差ε,可以包括未知的速度、高程等参数;②传感器误差α,包括系统增益、系统时延等测量误差;③平台误差β,包括轨道位置和速度、平台姿态等测量误差;④电离层和大气层的误差γ,包括电离层电子浓度、大气温湿压等的误差。

遥感卫星大数据高精度一体化处理技术_第2张图片

图2   基于稳定特性挖掘的遥感数据高精度一体化处理技术思路

以可见光和SAR为例,按照来源将误差梳理分类,见表1。

遥感卫星大数据高精度一体化处理技术_第3张图片

各类误差按变化特点可以分为固定误差、规律性变化误差、随机误差3个主要类别,见表2。其中,固定误差适合通过少数几次定标场和人工定标器来进行标定,规律性变化误差参数适合通过基于遥感大数据稳定特性挖掘的方式进行常态化监测,随机误差适合通过增加观测数量等方式降低随机误差的影响。

遥感卫星大数据高精度一体化处理技术_第4张图片

从表2可知, 虽然可见光和SAR的成像机理不同,但其涉及的误差类型和误差变化规律具有一定的共通性。其中,几何方面的误差在物理上是共性的,可以在统一的框架下进行一体化建模;辐射方面的误差虽然涉及的具体物理量不同,但在影响因素、变化规律方面具有共性,可在数学模型构建时相互借鉴甚至一体化建模。此外,对于不同卫星观测的同一个目标或场景而言,虽然不同卫星类型得到的辐射或散射物理量不同,但只要观测对象的材质、温度、结构、位置等自身属性未发生改变,目标本身的特性之间就会具有一定的内在联系或一致性。这些是多源遥感数据高精度一体化处理的重要基础。

2.2 遥感大数据高精度处理方法

在上述技术思路下,在将误差统一梳理和建模的基础上,本节以SAR的辐射校正、极化校正、几何校正为例,给出遥感大数据高精度处理的初步实例。

2.2.1 辐射校正

首先以SAR的辐射校正为例,阐述基于稳定特性挖掘的高精度处理方法。

为了实现常态化的辐射质量监测和校正,摆脱对定标场和定标器的依赖, Yang J T等人基于Sentinel-1卫星的重轨观测多时序图像,挖掘具备时间稳定特性的地物散射统计量。该方法利用中分辨率成像光谱仪(moderate-resolution imaging spectroradiometer,MODIS)的全球17类地物分类结果,利用Sentinel-1卫星的SAR产品数据,构建了一个包含17类712万个地物切片的散射样本库,研究发现城区地物的散射中值这一统计量具备很高的辐射稳定性,其辐射稳定性在时域上的标准差可以达到0.3 dB(1σ)。Shangguan S T等人将Sentinel-1双极化SAR数据作为输入,通过构建合适的深度神经网络,实现了城区类内辐射稳定区域的高精度提取,提取后城区中值重心的时间稳定性进一步达到了0.2 dB(1σ)的水平,与人工定标器的精度相当。

此外,Yang J T等人分析了SAR图像上具备辐射稳定性的区域在光学图像中的表现,发现其地物类型和图像纹理具有一定的独特性,可以作为SAR散射稳定区域提取的辅助支撑。为此,Yang J T等人提出了一种基于SqueezeNet的异构神经网络,以光学遥感图像切片和对应的SAR图像切片为联合输入,实现了异源数据一体化的散射稳定区域筛选,最终城区中值重心的时间稳定性达到0.19 dB(1σ),可以作为SAR系统长期定标的参考。整个方法的具体流程如图3所示。

遥感卫星大数据高精度一体化处理技术_第5张图片

图3   基于光学-SAR协同辐射稳定特性基准提取的SAR辐射校正参数获取流程

2.2.2 极化校正

本节以SAR极化误差参数估计及校正为例,阐述基于遥感卫星大数据稳定特性挖掘的处理方法。

多极化是SAR对地观测遥感的一种常用的模式,其可以通过传感器发射和接收雷达波的极化信息得到地物目标的结构、组织、朝向等丰富的地物特征。然而,面对极化通道间的串扰和通道不平衡等系统失真情况,需要进行基于人工定标器的极化定标,从而通过校正处理得到准确的极化SAR数据产品。

随着研究人员对地物极化散射特性的研究,近年来基于自然地物而无须依赖人工定标器或热带雨林的高精度极化定标技术也有了长足的发展。基于Quegan方法或Anisworth方法定标出串扰和交叉通道不平衡后,Shi L等人提出了基于裸土等具有Bragg散射特点的地物的自主定标方法,可以完成同极化通道不平衡的估计。还有学者发展了基于类似角反射器的地物强点目标来求解极化失真的方法,以消除对角反射器的依赖。此外,为了快速实现对国产GF-3数据全极化的极化失真参数估计,Jiang S等人提出了一种基于普通分布目标的极化失真参数快速估计方法,验证大部分林木覆盖区域在单站SAR下满足互易性条件和同极化与交叉极化弱相关的条件,可以用于估计极化幅相误差和极化隔离度。该方法选取林地数据进行估计,并计算大量林地数据估计结果的重心,从而得到比较稳定准确的极化定标结果。上述方法中符合特定极化散射特性的地物目标的自动提取是一个亟待解决的问题,而通过多星多传感器数据的联合,可以为该类地物提取提供更加丰富的信息,实现提取的自动化并提高提取的精度。

Shangguan S T等人为了解决GF-3全极化数据中存在的极化通道不平衡等问题,在遥感卫星大数据和多星信息协同方面做出了有益的尝试。他们基于Jiang S等人提出的基于普通分布目标的极化失真参数快速估计方法,利用GF-3海量全极化数据,使用深度学习技术实现了特定极化散射特性的分布目标的自动提取。特别地,卷积神经网络在与GF-3数据波段相同、参数相近的RADARSAT-2全极化产品数据产品上进行预训练,再在人工辅助选取的十余幅GF-3林区场景图像上做迁移学习,其实现流程如图4所示。针对极化数据存在极化失真时会影响网络提取特定分布目标的正确性的问题,在数据预处理部分采用独立归一化的方式予以应对,通过基于RADARSAT-2数据加入极化失真等误差后的仿真实验,验证网络对极化误差的鲁棒性。实验将构建的深度学习网络应用于超过300景(即300张图像)的GF-3全极化数据中,用于在复杂多变的SAR场景中实现自动化的极化失真参数估计,利 用极化失真估计结果进行补偿后,极化幅度不平衡的波动在±0.3 dB以内,相位不平衡的波动在±3 °以内,实验验证了该自动化极化参数评估方法的有效性。

遥感卫星大数据高精度一体化处理技术_第6张图片

图4   RADARSAT-2协同GF-3 SAR场景极化失真自动化提取流程

上述方法利用了来自不同卫星但参数相近的RADARSAT-2数据辅助GF-3数据的极化稳定地物提取,这为在遥感卫星大数据条件下实现SAR极化失真的常态化监测提供了可行的思路。进一步可以使用光学影像等多星异源数据,提升SAR极化稳定地物的提取,从而进一步提高SAR极化失真估计处理的精度。总体来说,基于多传感器联合的极化畸变求解方法为极化数据的质量统一化提供了一种新思路。

2.2.3 几何校正

在遥感卫星的几何定标方面,基于不同卫星影像数据的交叉定标方法已普遍应用于光学卫星的定标任务中。利用同一颗卫星大量的具有重叠区域的影像进行大区域联合平差也已得到了充分的研究。目前,如何利用不同卫星不同传感器数据进行一体化的联合几何校正,从而提高几何校正的精度,还有较大的研究空间。

针对这一问题,笔者所在课题组针对误差特性不同的SAR卫星的联合几何定位进行了研究。将路灯灯柱、旗杆等散射特性不随方位角变化的稳定地物点作为连接点,提出了适用于多角度多源数据的加权统一量纲RD模型和基于误差源分布特性的优化配权方法,并基于最优化理论进行求解,无须外源DEM数据支撑即可求得目标点的三维位置,进而得到高精度的多源多角度数据立体定位结果。所提定位模型如下:

遥感卫星大数据高精度一体化处理技术_第7张图片

其中,76c40207002d9dcc5d546ae99dd51817.png为待求的目标点三维位置,5616d9dd2b9c9bbca10b989961580a62.png、 83bdeecc4b3602216877059838e34ede.png、Ri、fDi、λi分别为第i个观测点对应的卫星位置、速度、斜距、多普勒中心频率和波长,aeb90bca05b136a2ae78ea8f36374c63.pngb382bea017e9e673c784a48b00efa5cc.png分别是距离方程和多普勒方程残差的方差,可通过蒙特卡洛实验仿真计算得到,具体计算方法参照参考文献。

基于上述方法,利用苏州地区的3幅GF-3影像和1幅TerraSAR-X影像开展立体定位实验,SAR图像信息见表3。实验中选取路灯作为定位目标。这类地物目标具有良好的散射特性,且周围无遮盖,方便多星多角度观测。立体定位精度结果见表4。

遥感卫星大数据高精度一体化处理技术_第8张图片

遥感卫星大数据高精度一体化处理技术_第9张图片

实验结果表明,相比于传统的立体定位方法,加权统一量纲RD模型可以在使用多源多角度数据时有效提升立体定位精度。该立体定位方法无须外源DEM数据支撑,且三维定位精度达到了与基于单幅SAR图像中高程已知定标器的定位结果相当的精度。

3 总结与展望

本文着眼于遥感卫星大数据条件下地面处理系统的发展,指出了地面系统从体系架构一体化到处理算法一体化统筹考虑的发展趋势,提出了基于多源遥感大数据挖掘稳定特性进行误差参数估计的处理思路,以提高处理的精度和产品质量的时空稳定性。在此基础上,本文以SAR为例,阐述了基于该技术思路开展的辐射校正、极化校正和几何校正的相关工作,验证了上述技术思路的可行性。

未来,随着遥感卫星数量的进一步增加和遥感数据应用技术的进一步发展,遥感卫星大数据处理系统将进一步朝着多源一体化协同的方向发展,需要从如何将数据转化为信息的根本问题出发,从源头上进行统筹考虑,结合人工智能等领域的研究成果,打破不同卫星不同传感器数据处理之间的壁垒,更好地实现信息的综合利用。

作者简介

仇晓兰(1982-),女,博士,中国科学院空天信息创新研究院研究员,主要研究方向为SAR信号处理与信息提取。

胡玉新(1981-),男,博士,中国科学院空天信息创新研究院研究员,主要研究方向为空间信息处理系统技术。

上官松涛(1993-),男,博士,苏州空天信息研究院助理研究员,主要研究方向为SAR大数据分析与质量评价。

付琨(1974-),男,博士,中国科学院空天信息创新研究院研究员,主要研究方向为空天信息处理与应用技术研究。

联系我们:

Tel:010-81055448

       010-81055490

       010-81055534

E-mail:[email protected] 

http://www.infocomm-journal.com/bdr

http://www.j-bigdataresearch.com.cn/

转载、合作:010-81055307

大数据期刊

《大数据(Big Data Research,BDR)》双月刊是由中华人民共和国工业和信息化部主管,人民邮电出版社主办,中国计算机学会大数据专家委员会学术指导,北京信通传媒有限责任公司出版的期刊,已成功入选中国科技核心期刊、中国计算机学会会刊、中国计算机学会推荐中文科技期刊,以及信息通信领域高质量科技期刊分级目录、计算领域高质量科技期刊分级目录,并多次被评为国家哲学社会科学文献中心学术期刊数据库“综合性人文社会科学”学科最受欢迎期刊。

遥感卫星大数据高精度一体化处理技术_第10张图片

关注《大数据》期刊微信公众号,获取更多内容

你可能感兴趣的:(大数据,编程语言,机器学习,人工智能,数据分析)