效率神器!!!遥感影像和普通图片样本半自动标注

       半自动解译是一个古老的话题。在深度学习攻城略地之前,在遥感领域,学术界大都是各种基于传统图像处理算法和传统机器学习的遥感信息自动提取,自娱自乐,也基本没有实际工程价值(十分不好意思的是,我也曾是其中一员)。相较之下,半自动信息提取是工业界更愿意接受的,因为提取过程是人为可控的,也希望半自动提取能提高个20%~30%的遥感信息解译效率。实际情况是,面对几千、几万甚至几十万平方公里的实际遥感解译任务,纯人工夹杂半自动提取的作业模式显得非常鸡肋,并不能显著提升解译效率,还扰乱了正常的作业流程,导致一些很好的半自动提取软件也不能真正推广开来。到现在我还认为,相比灌水的自动提取,半自动提取才是遥感地理信息数据处理技术的集大成者。

       2015年以后,深度学习开始火爆(我2014年初通过百度少帅计划了解到深度学习,很遗憾的是,一直没有正儿八经研究过深度学习),也很快蔓延到遥感领域。历史是惊人的相似,故事也都是从论文灌水开始,现在遥感信息提取文献里,已经很难找到不是利用深度学习做的了,这景象真是汗了牛又充了栋。坦率地说,99.99%都是没有实际工程价值的,跟十年前的利用传统图像处理和机器学习做分割分类的论文没有本质区别,相反,我觉得十年前的文献更有智慧,里面闪耀着算法设计的小心思,跟现在二话不说甩个神经网络图的论文相比,真还有点怀旧了,导致前段时间测绘学报发了一篇利用传统方法提取道路的论文,我仔细研读了好几遍。

       在样本标注里融入自动提取,在现在大环境里,最先想到的是深度学习,我也是,所以最先在GeoLabel里面加入了基于深度学习的自动标注,已经做完了,但带来两个问题:1)相比现在的100多M,软件瞬间大了好几个G,对于想做个小而美的工具的我来说,太不划算了,也不利于传播;2)深度学习模型的泛化能力是不能回避的问题,换一个场景换一类图像,模型很可能就不能work了,还要去训练模型,这就涉及到先有鸡还是先有蛋的问题。基于以上两点,暂时就将深度学习版的自动标注拿掉,然后开始复习自己的硕士论文,很快设计出一套基于传统图像处理方法的半自动标注,也就是本文要介绍的内容。

         相比于做大范围的遥感解译,半自动提取用于做样本标注我感觉非常适合,主要原因:1)样本标注一般是稀疏目标标注,这也是半自动提取大概率能做好的;2)就算提取结果不好,切换个工具,人工标注就好,不会改变作业流程,不增加额外工作量。当然,虽然现在集成的是基于传统图像算法的半自动标注,我还是相信大趋势仍然是基于深度学习的(半)自动标注,所以我写完这篇文章后还得继续研究深度学习标注,当然,是非常工程化的实现。

       言归正传,下面讲GeoLabel最新版本集成的半自动标注功能,坦白讲,还不十分完善,但效果某种程度我是觉得超过我设计时的预期的,总之,还在进步,方案也都在脑子里了。

一、总体设计

在界面上,就只在“编辑-快捷图形编辑工具”里增加了一个工具,如下图所示:

效率神器!!!遥感影像和普通图片样本半自动标注_第1张图片

正常启动编辑之后,点击该工具,即可进入半自动提取状态。

二、启动半自动标注

点击半自动提取工具后,会弹出工具面板,用于动态调整参数(一般实用的半自动提取工具都有这么个东西)

效率神器!!!遥感影像和普通图片样本半自动标注_第2张图片

简单讲一下里面涉及参数的含义,其中标注模式有相似聚类和精细提取两种。

相似聚类

精细提取

用于提取面积较大、形状不规则或边界较为模糊的地物(如林地、草地、湖泊等)

用于提取面积较小、形状较为规则、与周边地物差别较为明显的地物(如高层住宅、工业厂房、耕地、坑塘等)。

下面就相似聚类和精细提取两类需要设置的参数分别介绍。

相似聚类

精细提取

窗口尺寸:提取的范围,以像素为单位颜色距离/纹理距离:窗口内其他像素与种子线划过像素的在颜色和纹理上的距离,不同应用参数稍有差别,可以具体调整
化简级别:提取出来的要素是否要对边缘进行化简,分为三个级别
允许多个:是否允许提取出来的要素有多个,如果选“不允许”,就只保留一个要素,即与种子线相交的那个。

化简级别:提取出来的要素是否要对边缘进行化简,分为三个级别(只对“一般”规则化有效,对“矩形”和“圆形”规则化无效)
一般:提取结果不规则化
矩形:将提取出来的范围规则化为四个角点的矩形,矩形一般用于建筑标注
圆形:将提取出来的范围规则化为圆形,一般用于油罐等圆顶地物的提取。

启动标注视频演示:

1.启动半自动编辑

三、典型操作模式介绍

不管提取什么,都很简单,只需要在要提取的地物上按住鼠标左键划一下,松开鼠标左键,就开始提取。另外,鼠标左键会根据数据不同,自动切换为图形合并功能,鼠标右键可以对提取出的图形进行微调,分为向内划和向外划两种。标注过程中,如果半自动标注不满意,可以直接切换到其他编辑工具进行标注。

效率神器!!!遥感影像和普通图片样本半自动标注_第3张图片

【图形内向图形外滑动,扩张】

效率神器!!!遥感影像和普通图片样本半自动标注_第4张图片

【图形外向图形内滑动,收缩】

四、典型地物半自动标注

主要介绍高层房屋建筑、工业厂房、湖泊河流、坑塘、耕地、林地的半自动标注。

  1. 住房建筑半自动标注

住房建筑标注

2. 工业厂房半自动标注

工业厂房提取

3. 水面精细标注

水面精细标注

4. 耕地半自动标注

耕地半自动标注

5. 大片水域半自动标注

大面积水域标注

6. 林地半自动标注

林地标注

五、后续改进方向

【1】建筑物矩形规则化里加入更多约束,让建筑物矩形方向更为准确,同时,增加L形、U形建筑物的规则化。

【2】整体优化算法,提升准确性,提高运行效率,以及更加稳妥的图形拓扑维持。

【3】对整张标准样本的功能定制(现在是通用的半自动标注,没有对标准样本进行定制)

【4】深度学习(半)自动标注。

你可能感兴趣的:(GeoLabel软件,深度学习,人工智能)