GLC_Info是一款基于C#+ArcEngine平台设计实现的遥感影像分类软件,其核心为GLC分类器,该分类器采用了当下最为流行的C5.0决策树分类算法为模型,并进行了算法改进,使分类器更加适用于遥感影像分类。依托该分类器,软件可以独立实现基于像元的遥感影像分类,在获得易康(eCognition)或者ENVI EX分割结果的基础上,软件可以实现对分割结果的全自动分类,突破了以往分类树或分类规则的构建要利用分类者的生态学和遥感先验知识的确定,不仅提高了效率,而且大大降低了对操作员的要求。此外该软件还提供了一些辅助分类功能和统计分析工具。
图1 GLC_Info主界面
WorldView-2卫星于2009年10月由美国Digital Global公司发射,可提供0.46m的全色影像和8个波段(包括海岸带波段、蓝色、绿色、红色、黄色、红边波段及两个近红外波段)的1.8m多光谱影像,与其他影像相比,WorldView-2的空间分辨率更高,多光谱波段更丰富,为用户提供进行精确变化变化检测和制图的能力。
表1 WorldView-2数据介绍
波段 |
波长范围(nm) |
应用价值 |
C海岸波段 |
400-450 |
海水侵蚀,浅海岸海底测量、含水量植物检测 |
B蓝波段 |
450-510 |
含水地物监测、矿产监测、大气监测 |
G绿波段 |
510-580 |
植被检测 |
Y黄波段 |
585-625 |
叶绿素不同监测不同植被,二氧化碳监测、大气监测、真彩色增强 |
R红波段 |
630-690 |
植被长势监测、植被检测 |
RE红边波段 |
705-745 |
植被健康度监测、含水量监测、植被种类分辨 |
近红外1 |
770-895 |
植被区别、土地利用类别 |
近红外2 |
860-1040 |
细化土地利用、植被细类辨别 |
结合待分类地区影像特征建立解译标志。
采用eCognition)或者ENVI EX完成影像分割和分割结果的特征计算,然后利用GLC_Info完成样本采集并将分割结果输入,完成对分割结果的分类。具体流程见图2。
图2单景地表覆盖分类流程图
(1) 基于易康(eCognition)的影像分割与特征计算
Ø 影像分割
易康采用了多尺度分割算法,这种分割方法是根据特定规则将影像分割成异质性最小的独立区域的过程,综合遥感影像的光谱特征和形状特征,计算影像中每个波段的光谱异质性与形状异质性的综合特征值,然后根据各个波段所占的权重,计算影像所有波段的加权值,当分割出对象的光谱和形状综合加权值小于某个指定的阈值时,进行重复迭代运算,直到所有分割对象的综合加权值大于指定阈值即完成影像的多尺度分割操作。
图3 多尺度分割界面
在多尺度分割中需要定义一些参数,包括尺度参数、层的权重、均质标准(颜色和形状)。其中尺度参数是一个抽象的词语,它确定生成的影像对象最大允许的异质性,通过修改尺度参数,可以改变结果中的影像对象尺寸,高的尺度参数产生的影像对象大,低的尺度参数产生的影像对象小。在满足必要的精细的条件下尽可能使用大尺度。
在影像分割中不同层的权重和均质标准会导致不同的分割效果,建议分割时将全色波段的权重设为2,其它波段权重设为1,形状均值标准设为0.1,颜色均值标准设为0.5。
分割结果如图:
图4 易康分割结果
Ø 特征计算
将分割结果导出,同时计算分割后每个多边形的多种属性值作为决策树分类中的预测变量。
图5 分割结果输出窗口
图6 特征选择窗口
在面向对象分类中常用的特征有:
光谱特征
光谱特征仍然是目前计算机自动分类方法利用的主要特征,它是纹理、形状特征的基础,也是遥感影像最直接的信息源。常用的光谱特征有:亮度、均值、标准差、像素比值、与邻域反差、自定义特征,如归一化植被指数(NDVI)、归一化水体指数(NDWI)…
形状特征
形状是地物在影像上的外形与轮廓,是识别地物性质的重要而且明显的标志,对于河流、道路等线性地物和建筑物、农田等具有相对规则形状的单位的表达与描述,形状特征一般能取得较好的效果。常用的形状特征有:长度、面积、长/宽、密度、紧致度、形状指数、规则度…
纹理特征
纹理作为一种区域特征,是对影像各像元之间空间分布的一种描述,它反映了一个区域内像素灰度级的空间分布属性,能更好地兼顾影像宏观性质与细微结构两个方面。常用的纹理特征有:同质性、对比度、相异性、熵、角度…
在生产中可参考图6选择要计算的属性。
(2) 基于ENVI EX的影像分割与特征计算
ENVI EX核心功能包括面向对象特征提取工具(Feature Extraction)。面向对象的技术是集合临近像元为对象用来识别感兴趣的光谱要素,充分利用高分辨率的全色和多光谱数据,利用空间、质地、和光谱信息来分割和分类特点,以高精度的分类结果或者矢量输出。从高分辨率全色或者多光谱数据中提取信息,该模块可以提取各种特征地物如车辆、建筑、道路、桥、河流、湖泊以及田地等。该模块可以在操作过程中随时预览影像分割效果。
图7 选择参与分割的波段
图8 选择分割尺度和Merge尺度
在选择分割尺度和Merge尺度的时候可以勾选Preview选项,通过预览局部分割效果确定分割尺度和Merge尺度大小。
图9 Preview预览效
图10属性特征值计算
和易康相比,ENVI中提供的特征值比较少,建议全部选取。
图11输出分割结果
在这里要记得勾选Export Attributes。
(3) 影像融合与样本采集
将多波段和全色波段进行影像融合其目的是利于样本采集,如果多波段影像上可以识别解译标志,则不必做影像融合。
样本采集可以在GLC_Info中完成也可以在ArcGIS中完成,在ArcGIS中完成时注意在用ArcCatolog 新建样本文件时,采用与分割结果(影像数据)相同的参考系,并新建类别字段名CLASS,用1,2,3,…对不同类别的样本进行标识。
图12 ArcGIS中采样
样本可以为点、线、面,但由于GLC_Info在生成训练集时采用了与分割结果相交获得训练集的方式来提高操作效率,实验中点样本分类效果最佳,在点样本采集的过程中有以下几点需要注意:
Ø 样本总数为250-350之间效果较佳,其中每个类别样本数不少于5个;
Ø 某个类别的提取精度与采样时其样本个数成正比;
Ø 最好不要在类别不易判断的地域采集样本;
Ø 点样本最好选在确定类别地域的中间;
Ø 选取样本不要过于集中在一个区域;
Ø 可以将分割结果叠在影像上实施采样,防止多个样本点落在同一个多边形中,影像分类精度。
Ø 如果影像效果不佳,不易采样,可以在Google earth 上直接采样,保存为kml文件,通过ArcGIS转为shp,并进行一定的纠偏。
(4) GLC分类
通过GLC分类器完成对分割结果的自动分类需要经过生成训练集、生成规则集、执行分类三个步骤。
图13 GLC分类器自动分类流程
Ø 生成训练集
图14 生成训练集
Ø 生成规则集
如图15,将训练集输入得到用于分类的规则集。
图15 生成规则集
迭代次数:一般设迭代次数10用于提高分类精度;
样本比例:用于进行训练生成规则集的样本比例,剩余样本将用于检验获得的规则集的分类精度。
交叉验证:一般在样本采集人员不熟练时使用,用于检验样本是否合格。
全局剪枝:用于防止训练中拟合度过高。
决策树高度:用于控制生成决策树的复杂度。
阈值设定:给一个期望的测试精度,在最大的运行次数内获得期望精度内的规则集。
在实际生产应用中,一般只需设置前两个参数。
图16 精度评价
当程序运行结束,会跳出精度评价窗口(图16)。该窗口提供了生成规则集迭代过程中各决策树的拟合情况和拟合Kappa精度以及对测试样本的预测Kappa精度,其中预测Kappa精度为评定生成规则集的指标,一般情况下TestKappa可以达到0.85以上,如TestKappa过低需要修改样本或者调整解译标志。
图17 规则集
生成的规则集如图17,该规则集不仅可以用于相应分割结果的分类,还可以用于其它具有相同时相和解译标志的类似影像分割结果的分类,即规则在一定范围内具有共享性。
Ø 执行分类
图18 执行分类
将生成的规则集和分割结果输入,执行分类。该过程为对分割结果的类别标识。分割结果的属性表里将会多出CLASS字段,按类别设以不同颜色后如图20。
图19 多波段影像
图20 分类结果与图例
(5) 人工解译与编辑
在GLC_Info或者ArcGIS中完成对分类结果的修正。