武大学报
2022年 第47卷 第1期
空间和地理数据及空间计算是大数据和人工智能(artificial intelligence,AI)研究的一个主要组成领域,也为社会科学从本体论、方法论和认识论层面提供了一个进行定量和定性研究的重要维度。但是空间如何与计算社会科学结合仍处于探索阶段。通过邀请实证社会研究、地理信息科学、计算机科学等多个领域在计算社会学方向的代表学者,对大数据和AI时代新的研究和技术范式下空间和地理计算与社会计算相结合的重要议题或实现路径等阐述各自观点,希望能够对空间社会计算的发展提供研究思路。讨论认为,空间与地理研究和社会研究具有相同的底层原理,基于空间大数据的新范式为重启宏观社会学空间研究带来了重要机遇,而且空间大数据的可获得性使得中国学者能以更为主动的姿态和清晰的视野来审视和参与影响人类命运共同体的重大现实问题。但是在此过程中,还需进一步思考基础理论和框架,解决数据、计算和伦理等一系列问题,需要社会科学、地理信息科学和计算科学的共同合作和努力,以学科的进步促进社会的健康发展。
大规模敏感数据的共享
城市空间结构与社会阶层的相互作用
使用大数据和和空间计算分析社会分层与社会流动
2021年 第46卷 第11期
利用大规模、高分辨率可见光遥感图像探测舰船目标一直是遥感领域的研究热点,其在军事和民用领域发挥着重要作用。舰船目标背景的复杂多变性,舰船目标的多尺度、多种类、多姿态类内差异性,以及检测模型的局限性等问题,都给大范围的高分辨率可见光遥感图像舰船目标探测带来了极大的挑战。首先对利用遥感技术进行舰船检测的方法体系进行总结归纳,然后在此基础上聚焦当前研究热点,对2010—2020年高分可见光遥感图像舰船目标的检测技术体系与发展历程进行概述,并对主流的检测方法进行详细论述,以期推动高分辨率可见光遥感影像舰船检测更加深入的研究和更加广泛的应用。
从早期的聚焦于海面影像的舰船定位与提取(包括云、海面、海浪等主题)逐渐转向复杂环境下的舰船检测(包括复杂场景、多尺度、类内变化多样等主题)研究;检测方法从人工设计、层层筛选定位检测(如疑似区域、部件、虚警等主题)发展为当前主流的基于卷积神经网络、一体化定位检测(包括深层特征、包围框、锚点等主题)
基于人工特征建模的舰船检测方法
基于深度特征学习的舰船目标检测方法
近年来,基于深度学习的超分辨率重建技术已经广泛应用于多时相高光谱影像、高分影像超分辨率重建等领域。多角度遥感影像之间具有丰富的互补信息,可用于超分辨率重建。针对高分辨率多角度遥感影像提出了一种基于动态上采样滤波网络的超分辨率重建方法。该方法的网络结构为端到端双路网络,其中一个分支网络通过动态上采样滤波模块来实现分辨率提升,另一个分支网络用来学习影像中的高频信息,将两个分支网络输出的结果相加即可得到最终的超分辨率重建影像。为了验证该方法的有效性,利用WorldView-2美国亚特兰大地区和巴西里约热内卢地区多角度遥感影像数据分别进行了2倍、3倍、4倍超分辨率重建模拟实验和真实实验,并进行了多组对比实验。实验结果表明,所提方法可以在顾及多角度影像角度维信息的同时有效提升目标影像空间分辨率,并且较好地保持了影像的细节信息。
首先将多个角度遥感影像输入MVSR-Net网络中;然后利用输入的多角度遥感影像提取高维特征,并堆叠为一个高维特征立方体,将提取的高维特征分别输入残差学习网络和动态上采样滤波网络,并输出高频影像和动态上采样影像;最后将高频影像与动态上采样影像相加即可得到超分辨率重建的影像。
在MVSR-Net网络框架中,对原始影像进行信息提取的卷积层包含64个滤波器,其卷积核大小都为3×3。密集网络框架总共包含6个密集网络单元,每个密集网络单元依次包含一个批归一化层、一个ReLU激活层、一个1×1×1卷积层、一个批归一化层、一个ReLU激活层及一个大小为3×3×3的3D卷积层。在第一个密集网络模块中,共有64个1×1×1卷积层和32个3D-CNN卷积层,每个密集网络模块卷积层输出层数依次为96、128、160、192、224和256。动态上采样滤波模块以及残差影像生成模块的网络设置见图 1,输入网络的低分辨率影像的大小分别为96×96、128×128和192×192,分别对应4倍、3倍和2倍影像重建网络结构。网络训练的批处理大小设置为6,输入的影像都经过了归一化处理。后续研究中,将进一步提高算法的泛化能力和效率,并且能够融合更多角度的信息。
2021年 第46卷 第10期
中国西部山区灾难性滑坡事件频繁发生,滑坡敏感性分析已成为灾前科学预警和主动防范的必要手段。传统滑坡敏感性分析方法中单一知识驱动模型对滑坡灾害环境因子定权主观性强,数据驱动模型过分依赖样本数据的质量及数量。针对上述问题,提出了一种环境因子空间关联特征与启发式模糊逻辑模型耦合的区域滑坡敏感性分析方法,通过灾害环境因子滑坡频率比与信息熵权等空间统计指标,显式描述滑坡灾害环境因子的贡献度与空间分布特征,以此约束多因子耦合的区域滑坡敏感性计算。选择中国重庆市奉节县内的灾害多发地带进行验证评估,实验结果表明,所提方法优于单一的信息量模型、信息量-逻辑回归模型方法。
当前最常用的滑坡敏感性分析方法有:(1)知识驱动类型,包括模糊逻辑法、模糊综合评判法、层次分析法和专家系统法等;(2)数据驱动类型,包括信息量、熵值数、支持向量机、随机森林、人工神经网络。两种方法各有其优缺点:略
核心步骤:环境因子空间特征分析、滑坡敏感性模糊逻辑分析
环境因子(坡度、地质岩层、断裂带构造、道路、水系、植被覆盖)
进一步的研究将探索局部回归分析模式,针对不同灾害环境构建局部灾害环境研究单元,建立统一的滑坡敏感性分析模型,并融入外部诱发因子探究滑坡灾害的动态影响规律,以实现滑坡灾害的时空态势预测。
遥感对地观测技术具有响应快、观测范围大、表达地表信息客观等特点,是监测洪涝灾害的有效手段之一。洪涝灾害发生时常常伴随云雨天气,灾害前后获取的时间序列数据来源多样,利用多模态多时相遥感影像对洪涝灾害进行一体化监测是大势所趋。然而,不同传感器类型的数据处理平台不同、处理流程不一,多源数据协同处理链路长、智能化水平低导致时效性难以满足应急响应的需求。提出了一种多模态序列遥感影像一体化配准与洪涝灾害自动变化监测方法,利用深度特征和语义信息实现灾前光学影像和灾后合成孔径雷达(synthetic aperture radar,SAR)影像的自动、高精度配准,基于先验基础地理信息和时间序列遥感影像实现洪水变化监测和灾损信息提取。所提方法在2020年7月中国安徽洪涝灾害和2021年7月中国河南洪涝灾害监测中得到了有效验证,能够实现小时级的灾害应急信息提取。
顾及深度特征和语义信息的光学与SAR遥感影像配准方法
本文提出了一种顾及深度特征和语义信息的光学与SAR序列遥感影像配准方法。相较于传统匹配算法,该方法不仅能够保证光学与SAR序列遥感影像的配准效率,而且能显著提高光学与SAR序列遥感影像的配准准确率。具体步骤为:首先通过特征提取神经网络对输入图像进行稠密特征提取,得到多模态显著特征点集并结合显著特征点的梯度信息和维度信息构建特征描述符;其次,设计用于神经网络训练的三元组损失函数,提升神经网络提取特征点和描述特征的准确度;然后,根据特征点描述值使用Flann特征匹配,再通过随机抽样一致性(random sample consensus,RANSAC)算法进行筛选,得到匹配初步结果;最后,结合语义信息对匹配结果进行判别,得到最终结果。
多源序列遥感影像洪涝范围提取
Deep U-Net-CRF-RR模型[进行灾前光学影像的水体全自动提取。
域网络模型(dual-domain network,DD-Net)有效地实现了非监督的SAR影像变化检测。
洪涝灾损信息提取
种融合深度学习与导航数据的道路网提取方法,为洪涝灾害发生区域提供高精度的基础道路本底数据。
采用一种关注空间上下文结构的道路提取网络(boundary and topological-aware road extraction network,BT-RoadNet)进行道路网提取,样本集利用预先标注好的道路样本集训练BT-RoadNet。
2021年 第9期
在基于视频的多目标运动跟踪中,目标检测和重识别具有很强的相关性。目前常将目标检测和重识别网络分别进行训练和使用,因此实时跟踪速度不能达到要求。针对多目标跟踪(multiple object tracking,MOT)中行人身份切换和跟踪丢失问题,将行人重识别模块进行遮挡优化并嵌入行人检测网络,由此提出了一种基于中心点检测和重识别的多行人跟踪算法。首先建立了行人运动模型,通过中心点检测得到行人最优状态估计;然后根据深层特征融合的行人重识别模型,利用马氏距离和余弦距离增强行人身份辨别能力;最后利用匈牙利算法进行在线数据关联,同时利用卡尔曼滤波剔除不准确的结果,对未关联的丢失目标做运动预测。利用所提算法和其他跟踪算法分别在MOT15、MOT16、MOT17数据集上进行多行人跟踪对比实验,结果表明,所提算法的多目标跟踪精度(multiple object tracking accuracy,MOTA)分别为63.5、72.4、70.9, 正确识别的检测和计算的检测数的比值(identity F1?measure,IDF1)最优, 且保证了实时跟踪速率, 验证了所提跟踪算法的有效性。
本文提出的多行人跟踪算法属于单步法在线跟踪,不使用未来帧的信息即可预测行人轨迹。实验结果表明,本文对行人重识别模块的优化使得行人身份切换大大减少,并且两个网络一体化使得跟踪速度达到了视频实时速率。然而,本文在建立运动模型时忽视了行人的碰撞体积,没有建立行人交互模型和排斥模型,对行人突然变向加速预测不准,容易导致轨迹丢失。未来的工作将围绕拥挤人群遮挡和强光照变化等难点展开。
2021年 第8期
针对传统规则化知识的栅格数字高程模型(digital elevation model, DEM)微地形分类方法自动化程度低、分类不完全等缺陷,构建了一种适用于栅格DEM微地形自动分类的卷积神经网络(convolutional neural network, CNN)模型。借助该模型具有自动深入学习样本数据和挖掘隐含分类信息的优势,提出了栅格DEM微地形分类的卷积神经网络方法并创建了其自动化实现流程。以山体部位分类为典型样例进行实验验证分析,实验结果统计显示:在山体部位分出的山顶、山肩、背坡、麓坡、趾坡和冲积地6类微地形中,分类精准程度最高的为冲积地,最低的为趾坡,准确率分别达到了99.64%和92.95%;栅格DEM数据的像元大小影响其分类准确率,5 m×5 m的栅格DEM比2.5 m×2.5 m和10 m×10 m更适应山体部位分类的卷积神经网络法。
如何提升网络模型对时域信息的理解能力,是基于3D卷积神经网络视频行人动作分类方法需要解决的问题之一。提出一种主导层优化模块,在网络训练过程中,利用当前时域动态信息学习能力最强的卷积层作为主导层来引导网络权重参数的更新,使各卷积层对动态信息的学习能力逐渐增强,从而改进卷积神经网络模型对时域动态信息的理解能力。仿真结果显示,添加主导层优化模块后的ResNeXt-50网络与ResNeXt-101网络在UCF-101和HMDB-51数据库上的训练收敛速度都有所增加,测试结果的准确率均有不同程度提升。
随着城镇化进程的加快与城市人口的迅速膨胀,街道尺度的人口数据在城市经济、社会、资源与环境发展等方面都发挥着愈发重要的作用。研究如何利用高分辨率遥感影像进行城市街道尺度上的人口估算,对促进城市可持续发展具有十分重要的理论意义与实际价值。利用遥感影像建筑物信息与人口普查数据,分析街道建筑物信息与人口数量之间的关联性,提出基于建筑物信息的城市街道尺度人口估算模型,通过多元逐步回归法与赤池信息准则确定建筑物显著特征变量,建立了建筑物数量、几何特征与人口数量的估算模型。实验证明,提出的人口估算模型能够以较高的精度估算街道尺度的人口数量。
提出了一种基于金字塔场景解析网络(pyramid scene parsing net,PSP Net)的深度学习算法。以湖北省遥感影像为实验数据,借助PSP Net的上下文场景解析能力,研究湖北省30 m分辨率的土地覆盖。实验使用了湖北省Landsat卫星影像中507景900×600像素的标准分幅影像,通过预处理生成了适用于深度学习的样本集。选择其中300景为样本,包括训练集240个、预测集44个和验证集16个。使用快速特征嵌入卷积结构(convolutional architecture for fast feature embedding,CAFFE)下的PSP Net模型对样本数据进行训练,设置了10×10-10的学习率,选择了第100万次的训练模型, 很好地防止了数据的过拟合。通过模型的泛化和样本的泛化与迭代,对湖北省2000年、2005年、2010年3期的Landsat卫星影像土地覆盖进行分类,分类精度分别达到82.2%、83.4%和83.7%。研究结果表明,基于PSP Net的深度学习算法可以快速、有效和精确地实现大范围的遥感影像土地覆盖分类。
感觉有点…
人脸年龄分析是一个非常具有挑战性的工作: 相对于其他的面部变化,人脸年龄变化不仅受内在因素(如基因)的影响, 还受外在因素(如生活条件)的影响,很难找到准确刻画年龄变化的特征,因此,提出多层次稀疏表达的鲁棒性人脸年龄分析方法。该方法充分考虑人类对象识别的思维方式、相邻年龄相似性和信号稀疏表达分类原理,并融合主动表观模型、局部二元模式和仿生特征的各自特点。另外,为了降低人脸身份因子的干扰,提出了两因子分析方法进行人脸身份因子分离。实验结果表明, 提出的方法具有很强的鉴别性和鲁棒性,在FG-NET和Morph2年龄库上平均绝对误差分别在4.65岁和3.64岁以内,证明了多层次稀疏表达的人脸年龄估计方法的有效性。
人脸年龄分析是一个非常具有挑战性的工作: 相对于其他的面部变化,人脸年龄变化不仅受内在因素(如基因)的影响, 还受外在因素(如生活条件)的影响,很难找到准确刻画年龄变化的特征,因此,提出多层次稀疏表达的鲁棒性人脸年龄分析方法。该方法充分考虑人类对象识别的思维方式、相邻年龄相似性和信号稀疏表达分类原理,并融合主动表观模型、局部二元模式和仿生特征的各自特点。另外,为了降低人脸身份因子的干扰,提出了两因子分析方法进行人脸身份因子分离。实验结果表明, 提出的方法具有很强的鉴别性和鲁棒性,在FG-NET和Morph2年龄库上平均绝对误差分别在4.65岁和3.64岁以内,证明了多层次稀疏表达的人脸年龄估计方法的有效性。
自动化学报
2021年 第47卷 第11期
基于深度学习的非均匀运动图像去模糊方法已经获得了较好的效果. 然而, 现有的方法通常存在对边缘恢复不清晰的问题. 因此, 本文提出一种强边缘提取网络(Strong-edge extraction network, SEEN), 用于提取非均匀运动模糊图像的强边缘以提高图像边缘复原质量. 设计的强边缘提取网络由两个子网络SEEN-1和SEEN-2组成, SEEN-1实现双边滤波器的功能, 用于提取滤除了细节信息后的图像边缘. SEEN-2实现L0平滑滤波器的功能, 用于提取模糊图像的强边缘. 本文还将对应网络层提取的强边缘特征图与模糊特征图叠加, 进一步利用强边缘特征. 最后, 本文在GoPro数据集上进行了验证实验, 结果表明: 本文提出的网络可以较好地提取非均匀运动模糊图像的强边缘, 复原图像在客观和主观上都可以达到较好的效果.
生成网络包括: 模糊特征提取网络(Features extract net, FEN), 用于提高网络的感受野, 使其在较大的感受野下有效提取模糊图像的模糊特征. 强边缘提取网络(Strong-edge extraction network, SEEN)是本文的核心, 包括子网络SEEN-1和SEEN-2, 用于在梯度域滤除模糊图像细节信息, 提取非均匀运动模糊图像的强边缘特征图. 特征融合网络(Features mix net, FMN), 用于融合FEN提取的特征图和SEEN提取的强边缘特征图.
判别网络由4个基本的卷积层组成, 使用LeakyReLU作为激活函数, 通过卷积层不断降维, 最后输出0或1来对输入的图像进行判别, 判定生成网络复原的潜在清晰图像与输入的真实清晰图像的接近程度. 判别网络要尽可能准确识别出输入的图像是否为生成网络所生成, 从而约束生成网络的训练过程, 使生成网络尽可能生成使判别网络判别结果接近于真的图像, 通过不断的对抗训练, 提高生成网络复原图像的效果.
2021年 第47卷 第10期
单幅图像超分辨率(Single image super-resolution, SISR)重建是计算机视觉领域上的一个重要问题, 在安防视频监控、飞机航拍以及卫星遥感等方面具有重要的研究意义和应用价值. 近年来, 深度学习在图像分类、检测、识别等诸多领域中取得了突破性进展, 也推动着图像超分辨率重建技术的发展. 本文首先介绍单幅图像超分辨率重建的常用公共图像数据集; 然后, 重点阐述基于深度学习的单幅图像超分辨率重建方向的创新与进展; 最后, 讨论了单幅图像超分辨率重建方向上存在的困难和挑战, 并对未来的发展趋势进行了思考与展望.
在深度学习未兴起前, 经典的单幅图像超分辨率算法占据主导地位, Lanczos重采样和双三次插值得到了广泛的应用, 但采用插值方法有时会导致图像边缘和细节模糊, 因此其他传统算法也被相继提出, 有效地增强了图像的质量. 经典的超分辨率重建算法需要很多先验知识, 且要求研究者具有深厚的专业知识储备. 随着深度学习的兴起, 由于该技术不需要过多的先验知识, 且重建后的图像质量优于传统算法, 因此得到了广泛的关注. Dong等首先将卷积神经网络应用到图像超分辨率重建技术中, 提出了超分辨率重建卷积神经网络(Super-resolution convolutional neural network, SRCNN), 下图为SRCNN的模型框架图, 虽然只有三层神经网络, 但相比于经典超分辨率算法, 取得了显著的效果. SRCNN的出现, 吸引了国内外学者将神经网络的各种变体应用到图像超分辨率研究中, 包括卷积神经网络、对抗神经网络以及二者的结合等.
超分辨率图像公共基准数据集, 如使用较为广泛的Set5、Set14、Urban100、General-100、BSDS300、BSDS500、Manga109、T91等,还有DIV2K、L20、OutdoorScene、PIRM、ImageNet、MS-COCO、VOC2012、CelebA、LSUN、WED、Flickr2K、City100和SR-RAW等.
有监督
弱监督、无监督用的比较少.
虽然从深度学习出现之后, 在单幅图像超分辨率算法上得到了很大的进步与改良. 但许多算法模型应用到现实场景中, 往往得不到预期的效果, 甚至有时比传统算法得到的图像质量还要差. 如何提升模型的泛化能力, 将其早日应用到实践当中是当前最为重要的问题. 未来的发展趋势将会是传统算法与神经网络的结合, 既能发挥传统算法先验知识的重要性, 又能实现端到端高层语义特征的学习, 更好的解决现实场景中图像超分辨率重建的问题.
测绘学报
2022年 第1期
针对卷积神经网络在提取建筑物的过程中,存在建筑物边界不准确和建筑物内部空洞等问题,提出以RSU模块(residual U-block)为核心的MPRSU-Net(multi-path residual U-block network)。该模块利用编码器-解码器结构和残差连接,实现了局部特征和多尺度特征的融合。由于一个RSU模块提取的信息有限,MPRSU-Net进一步通过多路径结构并行了不同尺度的RSU模块,并在这些模块之间进行信息交换,提高了特征聚集效率。在分辨率为0.3 m的WHU和Inria建筑物数据集上进行试验,精度分别达95.65%和88.63%,IoU分别达91.17%和79.31%,验证了本文方法的有效性。此外,本文方法相较于U2 Net,计算量明显降低,模型参数量减少68.63%,表明本文方法具有一定的应用价值
受 HRNet和 U2Net启发,本文提出了一种基于 RSU 模块的高分辨率遥感影像建筑物提取方法:MPRSUGNet,能够在保持高分辨率语义信息的同时,融入全局特征,从而改善大型建筑物存在空洞、边缘分割不完整的问题.MPRSUGNet通过并行和级联 RSU 模块融合多尺度特征,之后将多个尺度的预测结果融合得到最终提取结果. 在 WHU 和Inria建筑物数据集上的试验结果表明,本文方法提取建筑物精度高、边缘清晰、结构完整,相较其他主流方法泛化能力更强,参数较少.
个人评价:万变不离其宗,unet
本文方法是基于像素级别的建筑物提取,结果会存在一些非建筑物斑块,如何将建筑物实体作为提取对象将是下一步研究方向。
随着5G/6G、云计算、物联网和人工智能等新技术的发展,人类已经进入了万物互联时代。本文探讨万物互联时代地球空间信息技术的五大特点:定位技术从GNSS和地面测量走向无所不在的PNT服务体系;遥感技术从孤立的遥感卫星走向空天地传感网络;地理信息服务从地图数据库为主走向真三维实景和数字孪生;3S集成从移动测量发展到智能机器人服务;学科研究范围从对地观测走向物联监测和对人类活动的感知。作者基于这些特点进一步剖析新时代面临的挑战,并提出新时代地球空间信息学发展亟待解决的三大科学技术问题:**测绘学科如何服务人与机器人的共同需求?遥感影像解译的机理是什么和如何突破实现技术的瓶颈?如何利用时空大数据挖掘人与自然的关系,从空间感知走向空间认知?**万物互联时代的地球空间信息学,必须且完全可能为万物互联的数字地球和智慧社会做出更大的贡献!
2021年 第50卷 第11期
同时定位和地图构建(SLAM)凭借其高能效和低功耗等特点在诸多领域应用前景广阔。然而,在传统的SLAM系统中仍存在一些问题:传统的视觉里程计中关键帧并不包含语义信息,移动机器人获取的图像信息较为单一,且在实际场景中关键帧总包含大量误匹配点和动态点。针对以上问题,本文提出一种语义SLAM思路。首先,为了能够匹配到正确且对应的特征点,摒弃动态点和误匹配点的干扰,提出了一种基于Lucas-Kanade光流法的相邻帧特征状态判别法,将这项功能作为新的线程加入ORB-SLAM3的视觉里程计部分,完成对部分传统SLAM框架的优化和改进工作。其次,针对传统SLAM系统前端视觉里程计获取的图像帧不包含任何语义信息的问题,使用基于YOLOV4的目标检测算法和融合全连接条件随机场CRF的Mask R-CNN语义分割算法对ORB-SLAM3中的关键帧图像进行处理,有效提高了机器人等智能设备对室内环境的感知能力。
随着人工智能应用的进步与深度学习的兴起,在同时定位与地图构建(simultaneous localization and mapping,SLAM)中加入机器学习的思想已然成为探索未知环境自主建图方面极有潜力的研究点。
在自动驾驶场景中,视觉相机能够实现低成本的定位与环境感知,但是场景中的动态目标会影响视觉定位的轨迹。对此,本文提出了语素关联约束的动态环境视觉定位优化方法。首先,利用目标检测和语义分割提取环境中的语义实体;然后,通过语素关联模型识别出动态语素;最后,建立动态语素的特征掩膜,用于特征匹配过程中的动态目标特征点过滤,从而提高视觉定位效果。本文基于视觉机器人平台在校园道路开展了试验,发现了动态目标通过关键点影响视觉定位结果的规律——在转弯时或者目标在视野中横向移动时影响较大。试验结果表明,本文方法的动态语义要素识别的平均精度F1约为87%,并且在语素关联优化前后,局部区域最大轨迹距离差为2.463 m,与真值对比RMSE降低了38%。
笔者提出了基于语素关联的方法,并且基于经典的ORB-SLAM方法建立了动态环境中的视觉定位优化流程。
基于语义要素关联优化的动态环境定位流程(下图)
实验略
视觉定位是自动驾驶场景定位方案的重要补充,但环境中的动态目标不是影响其的唯一因素,图像匹配误差、相机标定误差和深度估计误差都会影响视觉定位结果。另外,由于语义识别耗时,当前方法无法达到实时优化效果,并且受平台限制本文未能讨论其在城市级道路的定位提升能力。在更复杂的无人驾驶场景中,如何更好地优化视觉定位结果仍有待深入研究。
利用浮动车GNSS轨迹数据可以实时获取和预测城市交通状态,且覆盖范围广、部署成本低,对自动驾驶路线决策、交通拥堵治理具有重要的支撑作用。现阶段,利用浮动车GNSS轨迹数据预测的信息仅包含路段上的交通速度、状态,而忽略了交叉口内不同行驶方向上的交通流差异;且交通信息准确性受到GNSS采样频率的限制。本文提出一种基于图卷积网络和低频GNSS轨迹数据的转向级交通预测方法:首先,顾及轨迹点间车辆运动模式提出一种排队起始点估计模型;然后,基于对偶图理论构建转向连通关系的图结构;最后,基于图卷积网络提出一种顾及转向时空模式的交通预测模型。试验结果显示,本文方法能准确地获取和预测转向级交通速度、排队长度信息,交通预测准确性全面优于基准方法。
图卷积(graph convolutional network,GCN),直接对图上特征进行学习。
总体流程(下图)
2021年 第50卷 第10期
现有的基于卷积神经网络的高光谱影像分类方法通常对影像的规则正方形区域进行卷积,无法普遍适应具有不同地物分布和几何外观的影像局部区域,因此在小样本情况下的分类性能较差,而图卷积网络能对图拓扑信息所代表的不规则影像区域进行卷积。为此,本文提出基于图卷积网络的高光谱影像分类方法。该方法在构建拓扑图的过程中考虑了影像的空间光谱信息,并利用图卷积网络聚合邻居节点的特征信息。在Pavia大学、Indian Pines和Salinas 3个数据集上的试验结果表明,该方法能在训练样本较少的情况下取得较高的分类精度。
总体流程,对于原始高光谱影像,首先,通过主成分分析(PCA)将影像降维至3个波段;然后,提取3个波段的LBP纹理特征,并利用K近邻方法对影像进行构图;最后,使用图卷积网络提取图节点的特征,并利用softmax函数生成每个节点的预测标签,进而得到影像的分类结果图。(下图)
虽然本文提出的方法在小样本条件下取得了一定的成效,但影像的构图方法直接决定了各像素点之间的邻接关系,进而决定图卷积模型从邻居节点中聚合到的特征信息的优劣,最终影响影像的分类精度。进一步的研究工作将结合更加有效的影像构图方法和图卷积模型,以期在每类地物选取5个样本的条件下,获得更高的分类精度。
地表水监测是遥感的重要基础应用。光学遥感水体提取的原理是基于不同的地物具有不同的光谱反射特性,某些地物(冰雪、阴影、云)因为与水体具有相似的反射特性导致提取分类失败。本文针对传统水体指数在水体提取时出现错分、漏分的问题,提出一种归一化多波段水体指数NDMBWI。分别用3个试验对本文指数的稳定性进行测试。试验1的区域为西藏林芝地区,数据源为同一时相的Landsat 8、Sentinel 2卫星影像,试验结果验证了本文指数抑制冰雪的能力,本文指数的Kappa系数为0.86、总体精度为0.93、错分误差为0.03、漏分误差为0.12、制图精度为0.97、生产者精度为0.88,均优于已有的指数。试验2的数据源为高分一号,以香港迪士尼为试验区域,在存在少量云的环境下进行水体提取,证明了本文指数能抑制云及其云下阴影。试验3提取了多个地区的水体,验证了本文水体指数的稳定性。本文使用多源光学遥感影像验证了NDMBWI的可行性,不需额外借助辅助数据,即可排除雪、云、阴影的影响,能够更加有效地自动化提取水体,可推广到海岸带资源研究、冰川变化、内陆湖泊变化等领域。(深度学习提取雨雪)
总体技术路线
采样点(下图)
拟合多个地物的反射率曲线(下图)
光谱关系(下图)
从理论上,任何的水体指数都无法保证提取所有的水体,本文提出水体指数虽然在某些情况下能得到较高的精度,并在冰雪、阴影、建筑、云等区分具有一定的优势,然而因为自然水体的复杂性,并不是任意一种水体指数能区分所有水体。也就是说,NDMBWI的最优阈值不能一直保持在0,例如在钱塘江悬浮泥沙较多的出海口地区提取水体时,NDMBWI的阈值应该适当降低。目前主流的水体指数的研究大多数是固定阈值。本文的下一步工作是:基于原有的水体指数模型,构建动态阈值的模型。例如,以NDVI作为NDMBWI的阈值,使用NDMBWI与NDVI模型进行双通道并行处理,在NDMBWI的矩阵中,大于NDVI的像素点可以归为水体,反之为非水体。本文方法稳健,可以作为基于深度学习的水体检测分类的基础,解决难以区分雪、水的问题。
2021年 第9期
地图制图学包含地图制作与地图应用两大任务,分别与人工智能技术有不解之缘。经历了符号主义智能表达的地图制图专家系统、行为主义智能表达的空间优化决策后,地图制图面临与连接主义下的深度学习的结合,以提升地图制图的智能化水平。本文针对“深度学习+地图制图”命题讨论了3个问题。一是从深度学习方法与地图空间问题解答策略思想的一致性,基于梯度下降、局部相关、特征降维和非线性化性质,回答了两者结合的可行性;二是从地图学独特的学科特点和技术环境分析了两者结合面临的挑战,涉及地图数据组织的非规范性、样本建立的专业需求、几何与地理特征的融合,以及地图固有的空间尺度性;三是分别讨论了地图制作与地图应用融入深度学习的切入点和具体方法。
“千言万语不如一张图”是对地图空间表达能力的一种诠释。为实现该目标,只有将地图与智能技术结合,让地图具备智能化分析、理解的能力,将隐藏在地图背后的知识挖掘出来,才能真正体现。地图学包含的地图制作和地图应用两大任务,一直保持与人工智能不同技术成果的结合,在经历了符号主义阶段的制图专家系统、行为主义阶段空间优化决策,目前面临着连接主义下的以深度学习为代表的智能技术结合的问题。一方面,深度学习与地图空间问题的解答存在诸多思想一致的策略,表明两者结合是可行的;另一方面该结合又面临一系列挑战,与地图学的邻近学科遥感影像处理相比,地图深度学习的数据对象、样本建立、参量定义、尺度选择面临一定的难题。从应用角度,地图的深度学习是普适性DL模型与空间智能思维具体化的应用。如何提升深度学习的智能化水平,越来越多的专家逐渐抛弃单纯依赖数据驱动的认识,转向领域知识与数据驱动并行的策略。基于该思想,地图DL有赖于地图专家及其他地学专家的知识支持,积极主动地确立地图空间的智能化问题,将相关领域知识融入到DL模型中,使得计算机制图系统的创意设计能力向人的大脑行为逼近,让地图分析系统具备人脑类似的智能水平,任重道远。
随着地理空间科学、人工智能、高性能计算技术的迅速发展,地理空间智能已成为处理和分析地理空间大数据的主要手段,并将在地球科学、空间认知、智慧城市、智慧社会等科学研究、工程建设和社会发展中发挥越来越重要的作用。地理空间智能作为地理空间科学和人工智能深度融合的交叉领域,其发展受到多学科的驱动,目前已在算力增强软硬件研制、系统开发、数据与模型共享、服务与应用方面不断取得进展,显示出巨大的活力和潜能,同时难题和挑战也相生相伴。本文首先阐述地理空间智能的概念演进、若干技术系统构建思路和国内外科学研究现状,然后梳理地理空间智能的典型应用,分析地理空间智能面临的问题和挑战,最后对其重要的发展方向及趋势予以展望。
本文提出了测量机器人概念,重点分析了测量机器人的组成框架及关键技术,聚焦定位与建图、场景感知、路径规划及多机协同等测量机器人前沿研究领域,综述了最新研究进展,并剖析了当前面临的技术难题,简述了测量机器人的发展机遇。
关键技术
研究方向
2021年 第8期
我国遥感对地观测等项目顺利实施, 获取了大量时效性强、覆盖范围广、信息量丰富的遥感数据。但遥感影像智能化自动处理技术发展仍相对滞后, 无法满足区域/全球大范围地物信息快速提取的需求。近年来, 人们利用深度学习技术显著提高了影像特征提取成效, 但由于所使用的深度学习样本数量和类型有限, 对于多源遥感影像的自动解译能力仍然不足。本文面向大范围多源遥感影像地物信息智能解译需求, 在分析现有样本集现状及问题的基础上, 研究提出遥感影像智能解译样本库设计方案, 并在此基础上设计了基于互联网的样本协同采集与共享服务框架。本文将为多源遥感影像样本库建设提供参考, 为大范围遥感影像智能解译提供支持。
耕地是丘陵山区稀缺的土地资源,具有地形条件复杂、种植结构多样的特点,导致了山地耕地信息难以快速、准确获取,并且基于传统的遥感数据及遥感监测方法开展山区耕地信息快速自动提取比较困难。针对这一问题,本文以西南山区贵州省息烽县作为试验区,根据地理空间异质性特征,提出分区控制、分层提取的耕地形态信息提取思路,构建了一种地貌单元约束条件下的分区分层耕地形态信息的提取方法。该方法首先根据地貌-植被特征将试验区划分为平坝区、山坡区、林草区3类地理分区;然后在每类分区基础上,根据耕地所呈现的视觉特征划分为不同的类型,对不同类型的耕地分别设计不同的深度学习模型进行分层提取。试验结果证明,该方法对山区复杂地形背景噪声具有较好的抑制作用,所提取的耕地地块信息相比于传统方法更符合实际耕地的实际分布形态,有效地减少了漏提率和错提率。
对于规则耕地,该类型耕地形态较为规则,边界清晰,排列紧凑。本文采用了holistically-nested edge detection (HED)网络进行提取。该网络可以进行端到端的边缘预测,其构造是在VGG网络的基础上,增加了多个侧向输出层,并与每个卷积池化阶段(stage)的最后一个卷积层相连,将网络中每层学习到的结果通过侧向层输出,并采用一个权重融合层来综合利用这些侧向输出的结果,实现了对影像多尺度特征的学习。另外,其在多层网络中不断继承和学习边缘特征,最终可得到更加精准的耕地边界线,经过“线构面”后得到规则耕地图斑也更加可靠。
山地区的梯田分布较广,边缘特征也十分明显,内部纹理均匀,但相对于规则耕地,其形态更为狭小细长,因此对于边缘特征提取的要求更为精准。对此,本文采用RCF网络模型进行梯田的提取。在HED模型的基础上,RCF模型充分利用了每个池化阶段的所有卷积层的输出特征,并且通过去掉第3级池化层来实现对更为精细边缘线的提取与生成,因而可以捕捉更多的边缘特征。最后,再通过数学形态学处理方法和自适应对象生成的算法来得到梯田图斑。
山区的山地坡面上土地质量较差,存在大量种植比较随意的坡耕地,这类耕地内部常有杂树杂草生长,撂荒随时,边缘形态较模糊,但其往往具有独特的纹理特征。在高分辨率遥感影像上主要通过内部的纹理特征进行区分。在技术上,本文采用了D_LinkNet的语义分割模型提取坡耕地信息,D_LinkNet网络是以LinkNet为主体,通过在中心部分增加膨胀卷积层,扩大接受域,从而能够综合多尺度特征,有助于处理坡耕地复杂性的问题。
在山区成片的林草用地中也会有零散分布的耕地,边缘一般较为模糊,视觉特征与草地接近,但仍具有独特的纹理特征,直接提取会存在诸多错提与漏提。因此,本文采用分步提取的方法,逐步识别林间耕地。由于U_net网络通过一个下采样过程进行特征的提取,并在上采样过程中联合了下采样提取的特征信息,从而将多尺度特征融合在一起,减少了信息的损失,十分适合用于超大影像分割任务,因此本文首先利用U_net网络,在语义上通过大尺度分割对零散耕地和林草地之间进行区分,再在分割图斑的基础上,针对大量零散图斑,利用Inception纹理模型训练林间耕地的纹理特征,识别各个图斑的耕地/非耕地属性,从而实现针对每个零散图斑进行耕地类型的判别。具体提取流程下图所示。
遥感学报
2022年第1期
湖泊遥感作为一门新型交叉学科,是湖泊科学和遥感科学的重要分支。本文探讨了湖泊遥感科学的研究对象、内容和方法,通过梳理国内外总体研究进展,总结出湖泊遥感的5个发展趋势:(1)关注问题,从兴趣导向发展到问题导向;(2)观测手段,从地基遥感/中分辨率卫星发展到高分辨率/高光谱/无人机;(3)算法算力,从单机版经验/机理模型发展到云计算机器算法;(4)研究维度,从水体表层发展到垂向剖面;(5)研究区域,从单一/区域湖泊发展到国家/大洲/全球尺度。最后,指出了湖泊遥感学科未来的重点发展方向:(1)研制满足湖泊观测特点的静止卫星或小卫星集群;(2)发展湖泊水色遥感标准算法,建设全球湖泊卫星遥感监测网络;(3)加强全球变化背景下的湖泊盐度、温度和碳循环等遥感研究;(4)开展全流域统筹的湖泊天空地遥感监测和模拟研究。
湖泊碳循环是全球碳循环过程中的重要环节,随着全球碳循环研究的不断深入,湖泊碳循环对全球碳循环的影响,以及其对全球气候变化的调节作用越来越受到关注。然而,由于湖泊分布的破碎性(大于0.002 km2的湖泊约有1.17×108个,并零星地分布在全球)和多样性(流域生态多样性,湖泊类型多样性,分布的气候带多样性等),使得全面监测和研究全球湖泊碳循环具有较大的挑战性。具有大面积同步连续观测优势的遥感技术可以克服传统观测方法的局限,可为全球湖泊碳循环研究提供大面积同步观测数据的支撑。同时,由于光谱在物质识别和探测方面的优势,使得遥感技术在有机质类型反演方面与地球化学方法存在结合的可能。本文回顾了目前水环境遥感研究中与湖泊碳循环相关的湖泊不同类型碳浓度、水体理化参数等遥感反演算法及其应用的现状,结合湖泊碳循环中有机碳迁移转化的生物地球化学过程,以及湖泊碳循环研究、遥感大数据和人工智能的发展,探讨了湖泊碳循环研究中遥感技术应用的机遇和挑战。
遥感技术在湖泊碳循环研究中的应用主要包含了以下3个方面:
2021年第12期
全球世界文化遗产本体及其环境数据是遗产价值认知和保护的基础,更是大数据时代遗产研究、展示以及可持续利用的依据。本文基于网络和地球大数据,利用自然语言处理、空间分析、领域知识图谱等技术,构建了包括领域知识图谱5万个节点,94万条三元组的全球世界文化遗产知识图谱,支持世界文化遗产的属性、节点关系查询以及图结构表达。基于知识图谱,进行世界文化遗产的景观特征、文化延续性、土地覆被状态以及遗产与城市、社区的空间关系特征分析。研究表明:世界文化遗产具有沿着山脉、水系分布的特点,因此可参考地理单元,形成区域特色的文化遗产管理和保护体系,促进以区域为整体的遗产可持续发展;通过文化的延续性分析可以发现遗产所具有的特定历史文化时代属性,揭示遗产所蕴含的文化多样性,为遗产的整体保护提供新的切入点;遗产和城市与社区的空间关系变化可分为3个阶段:1990年—2000年的匀速靠近期,2000年—2015年的放缓靠近期和2015年—2018年的加速逼近期,因此未来需要持续关注城市和遗产空间关系变化对遗产可持续发展的影响。
全球气候变化引起的极端降雨、洪涝灾害是导致不可移动文物受损的重要破坏因素。合成孔径雷达SAR(Synthetic Aperture Radar)具有全天时、全天候、大范围周期性对地观测的优势,是大区域水体监测的重要手段,对不可移动文物水域淹没及风险监测具有重要意义。本文利用时间序列SAR图像提出基于残差U-Net的不可移动文物水域淹没及风险监测框架。首先,基于双峰阈值分割法结合专家知识辅助进行水体样本生成,提高样本制作效率;其次,引入残差模块建立U型卷积网络,综合残差结构及U-Net的特点,缓解梯度更新时的弥散、消失等现象,通过卷积层之间累加和跳跃链接,保留多尺度的地物特征信息,以实现水体快速、高精度的语义分割;最后通过将结果与不可移动文物点位进行空间叠加分析,实现对不可移动文物水淹状况的监测。选取鄱阳湖及南昌市昌邑北垱遗址作为试验研究对象。获取了21景覆盖鄱阳湖区域不同时相Sentinel-1 SAR图像,并结合Sentinel-2光学图像进行结果分析与评价。实验结果表明:本文方法在鄱阳湖试验区对水体提取总精度优于95%,相较于FCN(Fully Convolutional Networks)与U-Net方法具有更好的精度。利用不同时相SAR图像获得时间序列水体分布范围变化图,与昌邑北垱遗址点位进行空间叠加分析,得到不可移动文物水域淹没长时间序列监测结果。实验结果表明本文提出的方法可以有效提取水体范围,对不可移动文物水域淹没及风险监测可以提供有力支撑。
基于深度学习的中分辨率SAR图像大范围水体提取框架,实现无手工标记样本制作,水体快速和准确提取。使用双峰阈值分割方法进行水体样本的制作,提高样本制作效率。将残差模块引入U-Net网络,网络结构简单易行,实现了SAR图像中水体的快速和准确提取,实验区水体提取精度在95%以上。上述结果表明:
(1)基于双峰阈值方法进行水体样本的自动化制作,结合深度学习方法可以实现大区域水体的智能化快速监测,可为水文监测、防洪减灾等应用提供技术支撑。
(2)SAR图像全天时、全天候可获取数据的优势,以及水体在SAR图像所表现的独特特征,为SAR图像在不可移动文物水淹监测及风险预警提供巨大应用潜力。
(3)通过不同时相SAR图像获取水域范围时序分布,与不可移动文物位置进行叠加分析,可以得到不可移动文物水淹前后过程信息。该信息可以为不可移动文物水淹之前提供风险预警,相关单位可以根据情况采取措施将不可移动文物损失降低到最小。水淹之后可以获取水淹时间、范围等信息为不可移动文物损失评估提供分析与决策支持。
地理与地理信息科学
2022年第1期
研究城市大规模人群对疫情的情感响应时空特征,对于安抚人们情感状态以及优化防控措施具有重要意义。该文以带有地理标签的新浪微博数据为主要数据源,结合实地调查问卷,提出疫情场景下城市用户群体多维情感响应时空特征分析框架,该框架重点构建了城市用户群体对于疫情的多维情感强度的精确评估方法;在此基础上,分析疫情情感响应在时空维度上的变化特征,解析情感响应的显著影响因子。研究结果表明:1)该文提出的疫情情感响应评估方法,可准确量化疫情场景下城市群体多维情感响应强度;2)疫情防控期间政府采取的防控措施能够有效安抚城市群体愤怒、恐惧等负面情感;3)喜悦情感是疫情防控期间城市群体情感响应的主体情感;4)面对疫情再次发生,城市群体负面情感强度上升幅度会显著下降。该研究可为政府部门增强疫情情感监测能力、提升情感治理水平提供方法参考和决策依据。
本文构建城市用户群体的多维情感时序指标(H)、多维情感 空 间 指 标(K)和 主体 情感空间指标(Q),在时空维度上研究城市用户群体疫情情感变化特征。其中,H 反映用户每天各维度的情感强度,可刻画用户群体的情感时序变化趋势,由每天城市 用户群体各维度情感强度总值与当天反映该情感微博总数之比计算(式(3));K 可定量反映用户各维情感在空间单元上的分布强度,由每个空间单元内用户群体各维度情感强度总值与该单元内反映该情感微博总数之比计算(式(4))
今后研究
需重点考虑以下两方面:1)引入更多维度情感,对城市用户群体产生的疫情情感响应类型进行全面描述;2)综合多种数据源(如面部表情数据、视频监控数据等)挖掘人们的情感强度信息,从而支撑空间指标的时序动态分析。