光谱特征选择与特征提取
光谱数据库与光谱分析
光谱数据库的意义
作为标准参考光谱或训练样本,为定量、定性识别分类模型及软件提供基本数据源
例子:
美国地质调查局的USGS光谱库
喷气推进实验室的JPL标准物质成份波谱库
1987年中国科学院空间科学技术中心出版了“中国地球资源光谱信息资料汇编”,含岩石、土壤、水体、植被、农作物等地物的波谱曲线共1000条,并有相应的实验分析报告。波长范围主要为0.4~1.0μm,部分在0.4~2.4μm之间。
1998年中科院遥感所建立了面向对象的光谱数据库,共收集地物光谱数据5000条[1],这是我国第一部系统的光谱库。
波谱数据库标准和规范
典型农作物的分类与目标特性描述规范;
典型农作物波谱特性测量规范。
典型农作物波谱入库数据
新测农作物波谱数据及目标环境配套参数不少于6000条;
收集已有农作物波谱数据不少于2000条;
提取航空航天像元级波谱数据不少于400条;
收集图像样本数据大于100幅。
观测试验规范的制定
典型农作物分类与目标参数描述规范
农作物波谱测量技术规范
农作物波谱数据收集与质量评价标准
模型收集与开发
1.模型库总体建设
2.农学模型的收集与整编
地面光谱数据
遥感图像数据
先验知识数据
3.农学模型组件开发
新数据采集?
光谱分析方法
基于光谱波形参数
光谱精确识别,除了利用最主要的特征外,还必须结合其次要特征,以及利用整个谱带与识别像元的谱带进行相关匹配来识别。
光谱特征体系包括:
光谱曲线特征:全部波段的像元光谱曲线分析
光谱变换特征:部分波段的数据变换和组合
光谱相似性度量特征:光谱向量相似性度量
波谱相似性测度
各样本之间的平均距离或相对距离
离散度(基于条件概率之差)
J-M距离(概率密度函数之差)
相关性
光谱匹配需要一个指标来衡量在整个测量的波长范围内光谱的相似程度。可用相关系数来测度光谱响应的匹配程度。
也可用两光谱曲线的均方差D来定义这一个指标
如果考虑到每类的光谱响应值的分布存在一个范围,我们可以采用归一化的方法来给出这一指标,即夹角余弦:
基于高光谱数据库的光谱角度匹配
当模式类的分布呈扇状分布时,定义两矢量之间的广义夹角余弦为相似函数,这即为较为广泛应用的广义夹角匹配模型。将象元N个波段的光谱响应作为N维空间的矢量,则可通过计算它与端元的光谱之间广义夹角来表征其匹配程度:夹角越小,说明越相似(F. A. Kruse et al, 1993)。两矢量广义夹角余弦为:
端元光谱可从光谱库来,也可直接从图像抽取出来。
混合光谱理论与光谱分解
混合光谱机理如上图所示,其形成原因主要包括两个方面:
(1) 在一个瞬时视场内(IFOV),有多种物质成分存在的空间混合(Spatial mixing);
(2) 在一个瞬时视场内, 由于地形和物体阴影引起的照度差异( Variable illumination)。
基于以上两个原因,在一个象元内部,就形成了具有各向异性的瞬时视场,这样的一个象元就被称为混合象元。
如果在地面像元的IFOV视面积A上有m种物质,即像元组份(endmember),其总入射能量为L(λ),总反射率为ρ(λ),则总反射辐射亮度为L(λ)ρ(λ),各个组分的反射辐射亮度为:
L1(λ) ρ1(λ), L2 (λ) ρ2 (λ) ,…Lm(λ)ρm(λ) ,
如果各个组分的IFOV视面积分别为A1 ,A 2 ,…Am,
则A 1 + A 2 + A…+ A m = A 。
设各像元组份在像元中所占的视面积比为:
F 1=A1/A, F2=A2/A,…Fm=Am/A
无论遥感器的瞬时视场IFOV所限定的地面像元内有多少种辐亮度不同的目标物(endmember),根据非相干光的光辐射能量(功率)相加定律,探测器阵元接收的是这些目标物即像元组份辐射强度相加的总的表观辐射强度。
Pixel Purity Index
从多光谱和高光谱图像找到光谱学”最纯”的像元. 方法:反复将图像n为空间的散点图投影到一个随机的单位矢量,每次投影中两端的点认为是有可能是endmember,记录下来,最终,像元纯度图是一个每个像元被记录为endmember次数的指数图。
盲分解方法
调整矩阵W的值,使Z的某个矢量为单位矢量,表明此时Y就是S空间的某一基矢量.一般情况下Y为S空间基矢量的线性组合,只要组分信息的概率密度满足非高斯分布的要求,就可以根据大数定律推断四阶矩的取值在S空间是不均一的,当Y与S空间的某个基矢量相一致时,该方向的四阶矩取非零值,其他方向的四阶矩近似为零. 所以当矩阵WX的四阶矩取值为极大或者极小时,就是Y与S空间的某一基矢量相一致。
实施盲分解的前提条件:
权重系数矩阵A必须为常系数矩阵,即物理过程可以用线性方程组来表达;
各组分信息必须完全满足统计独立的条件;
各组分信息的概率密度函数应是非高斯分布,最多只允许有一个独立成分拥有高斯型概率密度函数。