波长范围0.38 μm~0.76 μm,由红、橙、黄、绿、青、蓝、紫色光组成,是摄影方式常用的遥感波段
波长1mm~1m的无线电波
微波和红外两者的特征相似,都属于热辐射性质。微波能穿透云雾、小雨,是全天候遥感,昼夜均可进行。微波对植被、冰雪、干沙、干土均有较强的穿透力,常被用来探测被冰雪、植被、沙土所遮掩的地物
大气传输特性:大气对电磁波的吸收、散射和透射特性,与波长和大气的成分有关
大气散射:太阳辐射在传播过程中遇到小微粒而改变传播方向,向各方向散开
瑞利散射:微粒的直径比辐射波长小得多时产生的散射,散射率与波长的四次方成反比(蓝紫光散射大,应用少)
大气窗口:电磁波通过大气层未被反射、吸收和散射的那些透射率高的波段范围
电磁波进入地球须通过大气层,约30%被大气反射,17%被吸收,22%被散射,**31%**到达地面
空间分辨率:
当分辨率为1km时,一个像元代表地面1kmX1km的面积,即1km2;
当分辨率为30m时,一个像元代表地面30m×30m的面积,即30m2;
载荷:可见光、多光谱、高光谱、SAR等
随着光谱分辨率的不断提高,光学遥感的发展过程可分为:全色(Panchromatic)→彩色(Color Photography)→多光谱(Multispectral)→高光谱(hyspectral)
多光谱和高光谱比较:光谱分辨率在λ/10数量级范围的称为多光谱,光谱分辨率在λ/100的遥感信息称之为高光谱遥感。
高光谱和多光谱实质差别:高光谱的波段较多,谱带较窄;多光谱相对波段较少。高光谱遥感比多光谱遥感的光谱分辨率更高,但光谱分辨率高的同时空间分辨率会降低。
高光谱能够更好地分辨出肉眼甚至普通的光学遥感不能识别的地物,包括内在的物理、化学特性,甚至是物质的分子和原子结构。
在数百公里高度运行的高光谱卫星不仅能观测到地面覆盖的是不是植被,还能探知这些植被的具体种类和长势如何
正向变换:将多光谱图像像素值转换至另一个特征空间
逆向变换:利用全色图像替换第一特征分量,并由特征空间反向变换至像素值空间,得到融合图像
IHS彩色坐标系统是根据视觉原理定义了3个互不相关的颜色属性:亮度(I)、色调(H)和饱和度(S)
I、H、S3个分量具有相对独立性,可分别进行处理,能够定量地描述颜色特征。因此,IHS系统在定量计算方面具有优势。
将低分辨率图像(多光谱)经IHS变换后的强度分量I,用高分辨率图像(全色)来替代
融合后影像颜色值取决于全色影像与IHS变换后的I影像之差
特征空间距离的本质:特征之间的相似性度量,是图像分类的定量依据。
距离有不同的度量方式:
运动估计:
通过图像匹配的方法获取视频相邻帧间的运动参数,然后以固定帧为基准,将多帧运动参数进行关联进而获取全局运动轨迹。
全局运动轨迹代表摄像机的真实运动轨迹,既包含由人为意识控制产生低频、平滑的主动运动,又包括由非人为意识的外部干扰产生的高频抖动。
运动校正:
通过低通滤波或者路径优化的方法从全局运动中去除抖动分量,获得一条平滑的主动运动轨迹,其中每帧图像在主动运动轨迹中的位置称作平衡位置。
图像拼接技术主要包括:特征提取、图像配准和图像融合
其中图像配准是整个图像拼接技术的核心部分,直接决定了图像拼接结果的质量。图像配准算法主要分为3类:
图像配准:精度、速度
噪声是随机量,可以从统计数学的观点来定义噪声。凡是统计特性不随时间变化的噪声称为平稳噪声,而统计特性随时间变化的噪声称作非平稳噪声。
以上各种类型的噪声反映在图像画面上,大致可以分为两种典型的图像噪声:
随机噪声根据其幅值的概率密度函数,还可分成:高斯噪声、瑞利噪声
最常见的9种滤波方式:
卫星成像系统中的噪声成分主要有以下几种:
通过对实际卫星影像的统计发现,随机条带噪声主要有四个特点:
与传统拍摄技术设备相比的优势:
特别适合获取带状地区航拍影像(公路、铁路、河流、水库、海岸线等)
直方图均衡是根据图像亮度值的出现频率来分配它们的亮度显示范围,使一定灰度范围内的像元的数量大致相等,得到一幅灰度直方图为均匀分布的新图像
其实质是对图像进行非线性变换,重新分配图像像元值,使一定灰度范围内的像元的数量大致相等
设一幅图像总像元数为n,亮度级为L,nk表示第k亮度级rk出现的频数,则第k亮度级出现的概率为:
p r ( r k ) = n k n ( k = 0 , 1 , … , L − 1 ) p_{r}\left(r_{k}\right)=\frac{n_{k}}{n}(k=0,1, \ldots, L-1) pr(rk)=nnk(k=0,1,…,L−1)
则变换函数可表示为:
S k = ( L − 1 ) ∑ j = 0 k p r ( r j ) = ( L − 1 ) ∑ j = 0 k n j n ( k = 0 , 1 , … , L − 1 ) S_{k}=(L-1) \sum_{j=0}^{k} p_{r}\left(r_{j}\right)=(L-1) \sum_{j=0}^{k} \frac{n_{j}}{n}(k=0,1, \ldots, L-1) Sk=(L−1)j=0∑kpr(rj)=(L−1)j=0∑knnj(k=0,1,…,L−1)
直方图均衡化使得原图像直方图上亮度值分布密集的部分被拉伸,较稀疏的部分被压缩,从而使图像的对比度得到增强
累积直方图:纵坐标是小于或等于特定灰度级像元在图像中的百分数
其中L是亮度级,P是上一步计算的累计频率
3. 变换函数四舍五入得到新亮度值
图像压缩:
在不丢失或较少丢失(有用)信息的前提下,以较少的比特(有损或无损地)表示或重新组织原始图像信息,实现缩减图像数据量,以减少存储空间,提高其传输、存储和处理效率
主要的数据冗余:
如果一个图像的灰度级编码,使用了多于实际需要的编码符号,就称该图像包含了编码冗余
对于一个图像,很多单个像素对视觉的贡献是冗余的,这是建立在对邻居值预测的基础上
图像中存在许多灰度级均匀一致的连续区域,通过行程长度编码和预测编码
视觉感知时对信息的接受是有选择的
有些信息相对不重要——视觉冗余信息
亮度 vs.色度
人类视觉系统对色度信号的敏感程度低于亮度信号
高频 vs.低频
人类视觉系统对高频信号的敏感程度低于低频信号
去除这些信息不会明显降低对图像质量的感受
压缩前后所需的信息存储量之比,越大越好
图像压缩前后存在的误差(失真)大小度量
L a v g = ∑ β k P k ( b i t ) {{L}_{avg}}=\sum{{{\beta }_{k}}{{P}_{k}}(bit)} Lavg=∑βkPk(bit)
β是编码长度,p是出现概率
信息量:
I(x)=-lo g 2 p(x) \text{I(x)=-lo}{{\text{g}}_{2}}\text{p(x) } I(x)=-log2p(x)
信息熵:
H ( x ) = ∑ p ( x ) I ( x ) H(x)=\sum{p(x)I(x)} H(x)=∑p(x)I(x)
熵是无失真编码下界
最大离散熵定理:
如果信源中各符号的出现概率相等,信源熵值达到最大
对非等概率分布的信源,采用不等长编码其平均码长小于等长编码的平均码长
香农信息论已证明,信源熵是进行无失真编码的理论极限。
可以证明,考虑像素间的相关性,使用高阶熵一定可以获得更高的压缩比
客观、便于计算或测量
信息丢失的级别,可以表示为原始(或输入)图像与压缩后又解压缩输出的图像的函数
P S N R = 10 log 10 ( Peak Signal Value ) 2 M S E ( d B ) P S N R=10 \log _{10} \frac{(\text {Peak Signal Value})^{2}}{M S E}(\mathrm{dB}) PSNR=10log10MSE(Peak Signal Value)2(dB)
通过视觉比较两个图像,给出一个定性的评价,如失真严重、失真较大,稍有失真无可察觉失真、完全无失真,这种评价被称为主观保真度标准。
因人而异,受主观影响较大、应用不方便
优势
劣势
基本思想:
编码原理:
特点:
应用:
统计编码:
变长最佳编码定理:
基本思想:
静态编码:
动态编码:
优点:
缺点:
算术编码:
像素冗余:
编码思想:
视频中存在大量信息冗余:
例如:
字母“e”在英语中比字母“z”更加常用
字母“q”后面是“z”的可能性非常小
根据信息理论:“the lower the probability, the higher the entropy.”
因此,可采用“the higher the entropy, the less bits to express” 来消除这种冗余
色度采样: 去除视觉冗余
帧内预测: 去除空域冗余
帧间预测: 去除时域冗余
变换编码: 去除空域冗余
量化: 去除视觉冗余
熵编码: 去除统计冗余
通过相邻帧内的信号预测当前帧信号,只需保存或传输残差值即可
引入B帧图像:
运动估计:
运动补偿:
根据运动矢量和帧间预测方法,求得当前帧的预测值的过程
运动搜索的块大小:
HEVC:基于递归四叉树的CTU/CU/PU/TU划分
多层四叉树递归,复杂度大幅提升
运动搜索范围:
块匹配标准:
差值平方和(Sum of Squared Difference, SSD/SSE)
均方误差(Mean Square Difference, MSD/MSE)
高精度、高复杂度
绝对误差和(Sum of Absolute Difference, SAD/SAE)
平均绝对差(Mean absolute difference, MAD)
SATD(Sum of Absolute Transformed Difference)
SAD最简单(只需加减法+绝对值),最常用
典型搜索算法:
VBR:可变比特率
CBR:恒定比特率
码率控制: 码率平稳 & 质量平稳
针对数据信息量而言,熵为下限
例:哈夫曼编码(Huffman Coding):对出现概率高的符号分配短的码字,得到符号平均码长最短的码
色彩空间转换->帧内/帧间预测->变换编码与量化->熵编码
H.264/AVC