10.彩色图像
常见的颜色空间和应用场合
伪彩色处理有什么用?
灰度\彩色图像不同模型之间的转换
伪彩色处理的方法(从灰色图像到彩色图像变换的方法)——该处有实验
11.图像压缩
变换编码、预测编码、统计编码、哈夫曼编码以及其他的基本编码方式
冗余都有哪些?怎么去除冗余?DCT变换本身并不会去除冗余,量化才是
12.形态学
形态学的基本操作要知道是怎么做的:腐蚀、膨胀、开、闭
13.图像分割
基于颜色的图像分割
边缘检测算法(canny)
阈值化方法:最基本的OTSU、全局阈值、自适应的阈值——该处有实验
阈值化方法的影响因素和改善
时间紧任务重,加油加油!
--首先是一些杂七杂八的概念,可以跳过
-彩色图像处理分为:全彩色处理和伪彩色处理
-描述颜色三个基本属性:亮度、色调和饱和度(色调和饱和度合在一起称为色度)
-全彩色处理:三个通道分别处理或者是直接基于一个颜色向量
色彩切片(强调一些感兴趣的色彩部分)
色调和色彩校正:相片增强和色彩复制
色调矫正:没有修改颜色,只是改了对比度和亮度,用相同的变换函数映射所有三种(或四种)颜色分量如果是HSI就直接调整亮度
颜色修正:任何颜色的比例都可以通过减少相反颜色的数量来增加
直方图处理:HSI很适合,均匀的拓展颜色强度,颜色本身不变
彩色图像的平滑和锐化:和灰色图像的一样,但是要分三个维度
-常见的颜色模型和应用场合
颜色模型
硬件导向的:RGB / CMY and CMYK
面向应用程序的:HSI(根人认识颜色的方式最相同)
RGB
适合显示的时候用,但是中间的颜色处理过程却不一定是RGB
所有的颜色都归一化到1,1,1的小立方体里面,对角线是各种灰色
像素深度:RGB空间中表示每个像素的位数 现在是8位(0~255)
•24位RGB颜色立方体(即红绿蓝各8位)
CMY和CMYK
主要应用在打印机这一类需要颜色堆叠的机器上
K是指在CMY(青色、洋红、黄色)的基础上加上黑色
RGB和CMYK 的区别和联系
RGB是发光色彩模式,就是用在屏幕上的,CMY是依靠反光的色彩模式,用在印刷品
CMY是RGB三原色的三个混色
HSI(色相,饱和度,强度)
和人对颜色的描述很像,是开发基于颜色描述的图像处理算法的理想工具
三维的空间,不同的角度代表不同的色相,y轴是明度,从内到外是饱和度
-灰度\彩色图像不同模型之间的转换
-RGB到HSI——该处有实验
完成上述公式大致有两种思路:
-HSI到RGB
没讲
-伪彩色处理有什么用?
定义:根据指定的标准为灰色值分配颜色
用处:人类可视化;对图像或图像序列中灰度事件的解释,因为人可以识别好多颜色,但只能识别一些些的灰度
用途:多光谱图像处理
-伪彩色处理的方法(从灰色图像到彩色图像变换的方法)——该处有实验
强度切片(灰度切片)
这个应该很好理解,就是①先把 灰度分级②给每一级分配一个颜色
灰度到颜色转换(通过一定规则的变换)
对任何输入像素的灰度级进行三个独立的变换。然后将这三个结果分别送入彩色电视显示器的红色、绿色和蓝色通道
这个方法主要的问题就是确定”transformation“
正弦波,改变相位和频率(一毛一样的话就还是灰色的)
不过还有比较简单的方法,就是直接自己定一个规则,比如R分量在128-240之间的赋值为128否则为0之类的
-压缩比&相对数据冗余 (n1是压缩前占用的存储,n2是压缩后)
-冗余都有哪些?
-空间和时间冗余:相邻位置和相邻帧的相同位置灰度都差不多
-编码冗余:表示某个量的信息不需要那么多编码空间
-感知冗余:人们对色度不敏感但是对亮度敏感
-图像压缩模型:怎么去除冗余?编码不会去除冗余,量化才会
①Mapper转换:去除时空冗余为了减少图像中像素间的冗余,通常用于人类观看和解释的二维像素阵列必须转换成一种更有效(但通常是“非视觉”)的格式
②Quantizer量化:减少心理视觉上的冗余(无损压缩不做量化哦
③coder编码:解决了编码冗余
-平均编码长度(变长、词典、位平面)
-常见压缩编码方式
----无损压缩编码
变长编码:不用固定的长度表示像素,尽可能短的码字分配给最可能的灰度级,当原图像灰度特别平均的 时候,这个编码的区别就不是很大了
①哈夫曼编码:其实就是构建哈夫曼树呀,需要会计算平均编码长度!!
②其他改进版霍夫曼:截断霍夫曼编码
③ 算数编码:掌握如何编码,如何解码
思想就是用较短的代码来表示较长的字符串来实现压缩,具体怎么做的可以看看例子
位平面编码
思想将多层(单色或彩色)图像分解为一系列二值图像,然后用二值图的压缩编码处理(块编码和游程编码和预测编码),比如一个0-255的图像可以表示为,这样每一位上分开,比如127表示为01111111
但是这样还不能直接用,要变成灰码才可以,127变成10000000, 高阶位平面远比低阶位平面复杂
①块编码
②游程编码
③预测编码(这个有讲的比较细节)
----有损压缩编码
有损的预测编码:对误差en进行了量化
DPCM差分脉冲编码
变换编码(DCT)
变换可以去除冗余和相关性,可以使得图像的能量更集中
-JPEG的编码方式
-保真度准则
——客观逼真度标准(算出来的)——实验涉及
——主观逼真度标准:就是凭感觉,你觉得好就是好
腐蚀:结构元可以被完全包含
膨胀:结构元和主体有交集即可
开(先腐蚀后膨胀):去掉结构元在主体中怎么移动都覆盖不到的部分
闭(先膨胀后腐蚀)
-基于颜色的图像分割
基于HSI:一般是分H(色相)
基于RGB:首先先算出来感兴趣颜色的Average颜色,记作向量a,然后对相似性进行衡量,衡量的方法有
欧氏距离
或者椭圆形的(C是样本的协方差矩阵)
或者正方形的
-边缘检测
-霍夫变换
极坐标里的一个点ρ=xCosθ+ySinθ,是霍夫空间的一个正弦曲线
-DOG算法:先对滤波器求导再检测边缘
-边缘检测器(canny)
②使用Sobel算子计算像素梯度
③非极大值像素梯度抑制(这是理解难点)
沿着边缘方向,检测前后是否有比该点梯度的更大的点(用线性插值),如果该点最大,那就视他为边缘点,否则舍弃
④阈值滞后处理&孤立弱边缘抑制
设置一个最大阈值一个最小阈值,小于最小阈值的,直接舍弃,大于最大阈值的保留,中间的属于不知道是噪声还是边缘的,这时候就用大于最大阈值的部分做联通扩张,联通的部分视为边缘部分
篇幅限制不能赘述,可以看这个博主的
-阈值化方法:
全局阈值——该处有实验
最基本的OTSU
-阈值化方法的影响因素和改善
-影响因素:噪声,光照不均匀
-平滑滤波,降噪之后再阈值化
-使用边缘来改善全局阈值
只考虑那些位于或靠近物体和背景之间的边缘的像素
-局部自适应的阈值
这个就是解决光照不均的问题,把图像分块,然后每一块都单独的阈值化