《遥感原理与应用》总结——遥感图像自动识别分类

目录

遥感图像自动识别分类

1.基础知识

2.特征变换及特征选择

3.监督分类

4.非监督分类

5.非监督分类与监督分类的结合

6.分类后处理和误差分析

7.提高分类精度的方法

8.基于目标的信息提取


遥感图像自动识别分类

遥感图像自动分类的重要性,遥感图像分类的基本原理,遥感图像分类的具体方法,遥感图像分类的发展趋势。

1.基础知识

遥感图像的计算机分类: 就是利用计算机对地球表面及其环境在遥感图像上的信息进行属性识别和分类, 以达到识别图像信息所对应的实际地物,提取所需地物信息的目的。

模式与模式识别:一个模式识别系统对识别的模式作一系列的测量,然后对测量结果与模式字典中一组典型的测量值比较。若和字典中某一词目的比较结果吻合或比较吻合,则我们就可以得出分类结果这一过程。

光谱特征空间及地物在特征空间中聚类的统计特性

《遥感原理与应用》总结——遥感图像自动识别分类_第1张图片

特征空间中的距离:绝对值距离、欧氏距离、马氏距离、均值向量混合距离、相关系数。

计算机自动分类步骤:

        明确遥感图像分类目的及需要解决的问题(选择特定区域的遥感数字图像)

        跟据研究区域,收集与分析地面参考信息与有关数据(辐射校正,几何纠正)

        选择合适的图像分类方法和算法,确定分类类别

        找出代表这些类别的统计特征

        监督分类:选择具有代表性的训练场地进行采样测定特征

        非监督分类:聚类等方法对特征相似的像素进行归类,测定其特征

        对遥感图像中各像素进行分类

        分类精度检查

        对判别分析的结果统计检验

2.特征变换及特征选择

特征变换

        主成分(主分量)变换(K-L变换)

        (1)基本思想:一种线性变换,均方误差最小的最佳正交变换:是在统计特征基础上的线性变换。
        (2)目的:数据压缩;新的特征图像之间互不相关;增加类别的可分性。

        (3)几何意义:把原始特征空间的特征轴旋转到平行于混合集群结构轴的方向上。

        (4)K-L变换的性质:
                变换后的矢量的协方差矩阵是对角的。所有正交变换中均方误差最小。
                主分量变换后,有的特征影像反差拉大,信息集中,整个影像上离散度变大;而另一些特征影像上离散度变小,出现更多的噪声。
                根据统计,对于Landsat MSS四个波段的影像,经主分量变换后,在第一主分量PC1图像中占有90%左右的总信息量,第二主分量PC2图像的占7%, PC3和PC4共占3%左右。

        (5)主分量变换计算步骤
                (1)计算均值向量M和协方差矩阵C;]

                (2)计算矩阵C的特征值和特征向量;

                (3)将特征值按由大到小的次序

                (4)选择前几个特征值对应的几个特征向量构造变换矩阵n。

                (5)根据Y=中nX进行变换,得到的新特征影像就是变换的结果,X为多光谱图像的一个光谱特征矢量。

        哈达玛变换:利用哈达玛矩阵作为变换矩阵实施的遥感多光谱域变换。    

        穗帽变换(缨帽变换,K-T变换):MSS图像信息随时间变化的空间分布形态是呈规律性形状的,像一个顶部有缨子的毡帽。(线性变换)

        比值变换:比值变换图像用作分类有许多优点,它可以增强土壤,植被,水之间的辐射差别,压抑地形坡度和方向引起的辐射量变化。痛过比值降低光照影响。

                差分比值:设计某种比值形式,如差分比值还能近似地改正大气影响,同时消去地形影响。

        生物量指标变换(特殊的比值变换)

特征选择:在遥感图像自动分类过程中,不仅使用原始遥感图像进行分类,还使多种特征变换之后的影像。我们总希望能用最少的影像数据最好地进行分类。这样就需在这些特征影像中,选择一组最佳的特征影像进行分类,这就称为特征选择。

        定性的方法        定量的方法        相关系数法        标准化距离法

        距离测度:类内距离越小,类间距离越大。

        散布矩阵测度:类内散布矩阵和类间散布矩阵。

3.监督分类

监督分类:基于我们对遥感图像上样本区内地物的已知类别, 利用这些样本类别的特征作为依据来识别非样本数据的类别。

基本思想:从研究区选取有代表性的训练场地作为样本;根据已知训练区提供的样本,通过选择特征参数,建立判别函数,据此对样本像元进行分类;依据样本类别的特征来识别非样本像元的归属类别。

判别函数和判别规则(分类方法)

判别函数:当各个类别的判别区域确定后,用来表示和鉴别某个特征矢量属于哪个类别的函数。

判别规则:判断特征矢量属于某类的依据。
常用的两种判别函数和判别规则:

        概率判别函数和贝叶斯判别规则(最大似然法

        由特征空间概念可知:地物点可以在特征空间找到相应的特征点;同类地物在特征空间中形成一个从属于某种概率分布的集群。
        概率判别函数:贝叶斯判别规则:贝叶斯判别规则以错分概率或风险最小为准则的判别规则。

        距离判别函数和判别规则(最小距离法

马氏距离、欧氏距离、计程距离

具体过程

        原始影像数据准备

        明确感兴趣的类别

        特征变换和特征选择

        选择训练样区(准确性、代表性和统计性)

        确定判决函数和判决规则

        根据判决函数和判决规则对非训练样区的图像区域进行分类

        分类后处理

        精度评价

        分类结果输出

监督法分类的优缺点
优点:根据应用目的和区域,有选择的决定分类类别,避免出现一些不必要的类别;可以控制训练样本的选择;可以通过检查训练样本来决定训练样本是否被精确分类,从而避免分类中的严重错误;避免了非监督分类中对光谱集群的重新归类。

缺点:主观性;由于图像中间类别的光谱差异,使得训练样本没有很好的代表性;训练样本的获取和评估花费较多人力时间;只能识别训练中定义的类别。

4.非监督分类

非监督分类(聚类分析):事先对分类过程不施加任何的先验知识,仅凭遥感影像的光谱特征的分布规律进行“盲目”的分类。其分类的结果只是对不同类别达到了区分,但并不能确定类别的属性;其类别的属性是通过分类结束后目视判读或实地调查确定的。

基本思想:在没有先验类别(训练场地)作为样本的条件下,即事先不知道类别特征,主要要根据像元间的相似度的大小进行归类合并(相似度大的归为一类)。

分类方法

K-均值聚类法:K-均值聚类法的聚类准则是使每一聚类中,多模式点到该类别的中心的距离的平方和最小。其基本思想是,通过迭代,主次移动各类的中心,直至得到最好的聚类结果为止。

 ISODATA算法(聚类分析):(1)初始化(2)选择初始中心(3)按一定规则(如距离最小)对所有像元划分(4)重新计算每个集群的均值和方差,按初始化的参数进行分裂和合并(5)结束,迭代次数或者两次迭代之间类别均值变化小于阈值(6)否则,重复3-5(7)确认类别,精度评定。

平行管道法聚类分析、系统聚类法、等混合距离法

非监督法分类的优缺点

优点:不需要预先对所分类别的区域有广泛的了解,需要用一定的知识来解释得到的集群组:人为误差的机会减少;量小的类别能被区分。

缺点:得到的集群组类别不一定对应分析者想要的类别:难对产生的类别进行控制;不同图像之间的对比困难。

5.非监督分类与监督分类的结合

监督法分类主要缺陷是必须在分类前圈定样本性质单一的训练样区,而这可以通过非监督法来进行。即通过非监督法将一定区域聚类成不同的单一类别,监督法再利用这些单一类别区域“训练”计算机。通过“训练"后的计算机将其它区域分类完成,这样避免了使用速度比较慢的非监督法对整个影像区域进行分类,使分类精度得到保证的前提下,分类速度得到了提高。具体可按以下步骤进行。

6.分类后处理和误差分析

分类后处理(分类后专题图格式,分类后处理);

分类后的精度评定
混淆矩阵

        是一个用于表示分为某一类别的像元个数与地面检验为该类别数的比较阵列。通常,阵列中的列代表参考数据,行代表由遥感数据分类得到的类别数据。有像元数和百分比表示两种。 
总体分类精度:

        等于被正确分类的像元总和除以总像元数。被正确分类的像元数目沿着混淆矩阵的对角线分布,总像元数等于所有真实参考源的像元总数 。

Kappa系数

        把所有真实参考的像元总数乘以混淆矩阵对角线的和,再减去一类中真实参考像元数与该类中被分类像元总数的积,再除以总的像元数的平方减去这一类中地表真实像元与这一类被分类的像元总数的积得到的。

错分误差

        指被分为用户感兴趣的类,而实际属于另一类的像元,它显示在混淆矩阵里面。

漏分误差

        指本身属于地表真实分类,当没有被分类器分到相应类别中的像元数。
制图精度

        是指分类器将整个影像的像元正确分为A类的像元数(对角线值)与A类真实参考总数(混淆矩阵中A类列的总和)的比率。

用户精度

        是指正确分到A类的像元总数(对角线值)与分类器将整个影像的像元分为A类的像元总数(混淆矩阵中A类行的总和)比率。

7.提高分类精度的方法

制约分类精度的原因

(1)遥感数据本身制约:光谱:相似性,时相与环境;空间分辨率。

(2)分类方法:单点分类;空间结构信息没有利用。

方法

(1)分类前预处理:校正(辐射和几何);变换;空间信息提取(纹理)。

(2)分类树与分层分类:一次分类不能满足精度要求时,进行多次分类。

(3)混合分类(多分类器结合):监督分类法与非监督分类法。

(4)多种信息复合:遥感信息非遥感信息;高程信息在遥感图像分类中的应用;纹理信息在遥感图像分类中的应用。

(5)与GIS集成:GIS与遥感数据复合分类;间接支持分类;用于选样区,检验样区,纠正等。

(6)基于目标的遥感图像分类.

8.基于目标的信息提取

基本思想:土地覆盖反映土地的自然属性,而土地利用则侧重于土地的社会属性;影像的光谱特征直接反映的主要是土地覆盖状况,而土地利用信息的提取除了光谱特征还需要其他的信息支撑;传感器成像往往割裂了地物之间的相关性。

目标的含义:目标(图斑、区域、对象、同质像元组等),含义为同质性原则将光谱特性相近的像元合并而成的有代表意义的多边形图像对象,可理解为图像上光谱信息类似的影像像元的集合体。

目标与像元的区别:

        基于像元的显示,某尺度下同质的显示

        目标所具有的特征:

                对象特征:颜色,形状,纹理,层次结构。

                类间特征:与邻对象之间,与子对象之间,与父对象之间。

与统计方法的区别:处理的对象,多层次,使用的特征,分类采用模糊理论,分类的结果。

基本步骤:多尺度分割;确定分类体系和分类器;利用成员函数对目标特征模糊化;分类;精度评定。

遥感图像分割:全部区域的并集包括图像中所有的像元;各个区域是互相不重叠的;区域中的像元具有相同或相近的属性;属于不同区域的像元具有不同的特性;同一区域内任意两像元在该区域互相连通。

遥感图像分割算法的要求:同质性、合适的尺度、数量级、通用性、可重复性、高效。

遥感图像常用的分割方法:阙值分割方法、聚类分割方法、区域生长法、数学形态学方法。

精度评定:最佳结果分析,稳定性分析,基于真实数据的误差矩阵。


目视判读与计算机分类的区别
        目视判读是直接利用人类的自然识别智能,而计算机分类是利用计算机技术来人工模拟人类的识别功能。
        遥感图像的计算机分类是模式识别中的一个方面,它的主要识别对象是遥感图像及各种变换之后的特征图像,识别目的是国土资源与环境的调查。

监督分类和非监督分类方法比较
        监督分类和非监督分类的根本区别点在于是否利用训练场来获取先验的类别知识,监督分类根据训练场提供的样本选择特征参数,建立判别函数,对待分类点进行分类。因此,训练场地选择是监督分类的关键。对于不熟悉区域情况的人来说选择足够数量的训练场地带来很大的工作量,操作者需要将相同比例尺的数字地形图叠在遥感图像上,根据地形图上的已知地物类型圈定分类用的训练场地。由于训练场地要求有代表性,训练样本的选择要考虑到地物光谱特征,样本数目要能满足分类的要求,有时这些还不易做到,这是监督分类不足之处。
        相比之下,非监督分类不需要更多的先验知识,它根据地物的光谱统计特性进行分类。因此,非监督分类方法简单,且分类具有一定的精度。 严格说来,分类效果的好坏需要经过实际调查来检验。当光谱特征类能够和唯一的地物类型(通常指水体、不同植被类型、土地利用类型、土壤类型等)相对应时,非监督分类可取得较好分类效果。当两个地物类型对应的光谱特征类差异很小时,非监督分类效果不如监督分类效果好

你可能感兴趣的:(遥感原理与应用,机器学习,深度学习,python)