1.颜色空间
答:
RGB:red,green,blue(红,绿,蓝)
HSV:hue, saturation, value(色调:颜色种类;饱和度:颜色纯度;明度:颜色明亮度)
CMY(K):cyan,magenta,yellow,key(蓝绿,品红,黄,黑)
CIE-XYZ:人眼颜色视觉
Lab:
2.像素值范围
答:[0,255]或者[0,1]
3.图片存储
答:
彩色图:RGB三通道存储(三维矩阵:三个矩阵表示),如Red通道,像素值在255之间,0表示黑,255表示最红。
当某个像素点的三个通道值均为255,那么这个像素点的值就是255,呈白色。
灰度图:黑(0),白(255),中间值为不同程度的灰色
彩色图转化为灰度图:Gray=R0.3+G0.59+B*0.11
4.图像增强的目标
答:
抑制无用信息,突出有用信息
图像处理分为空间域处理和频率域处理。
答:
直方图是图像灰度值的统计,横坐标为灰度值(0~255),纵坐标为像素点个数
答:
对密集的直方图进行非线性拉伸,密集的直方图变得离散一点,使得图片成块灰度值的地方,对比度变得更好。
答:
通过滑窗,每个窗口做直方图均衡,对于图片同时含有暗和亮,处理效果更好。
答:
在自适应直方图均衡的基础上进行优化,使得图片中的各位置灰度值具有连续性,看上去更自然一点。
答:
腐蚀:用一个小矩阵模板,沿着图像的高亮部分的内边缘过一遍,其小模板中心点的轨迹形成了新的图像,这就是图片的腐蚀。
膨胀:用一个小矩阵模板,沿着图像的高亮部分的外边缘过一遍,其小模板中心点的轨迹形成了新的图像,这就是图片的膨胀。
答:
开运算:先腐蚀再膨胀,消除目标外的孤立点
闭运算:先膨胀再腐蚀,消除目标内的孔洞
答:
对图片中某个像素点,用滤波函数(卷积核)乘以该像素点的领域,得到该像素的滤波结果。
(用卷积核对图片进行滑窗,两个矩阵中的数字对应相乘再相加)
定义不同的滤波函数(卷积核3x3、5x5、7x7等),会对图像产生不同的效果,如平滑处理(也叫去燥)、求梯度(也叫锐化)、边缘检测、特征点检测,深度学习中的特征提取也是类似的道理。
答:
补零,边界复制,镜像复制,块复制
答:
方法:使用值全为1卷积核,步长为1,边界填充0
作用:使得图片变模糊了,噪声点没有去除,图像细节也丢失了,没啥用。
答:
方法:卷积核滑窗时,将图像中对应矩形区域内的像素,从小到大排序,并选择中间值作为该位置像素的输出
作用:可以去除椒盐噪声,即去除图片中的麻点
作用:模拟人眼,突出中心区域,类似于背景虚化
注:将2D卷积拆分成2个1D卷积,可以有效降低计算量。
方法:卷积核的一个方向有梯度,一个方向均值平滑
作用:检测图像中某个方向上(水平或垂直)具有梯度变化的像素领域,即检测边缘,另一个方向变模糊。
方法:卷积核的一个方向有梯度,一个方向高斯平滑
作用:检测图像中某个方向上(水平或垂直)具有梯度变化的像素领域,即检测边缘,另一个方向突出中心区域。。
方法:卷积核的值加起来为0,中心点的值等于周围总和值(绝对值相等)
作用:原图减去拉普拉斯滤波后的图像,得到的图像可以突出图像的细节。拉普拉斯滤波本身可以检测边缘、团块
作用:用于图像缩放,获取同一物体的不同尺寸。
方法:先进行高斯滤波,再进行降采样
方法:第i+1层高斯金字塔图像经过上采样,并进行高斯模糊后,再与第i层高斯金字塔图像相减,可以得到拉普拉斯金字塔的第i层图像。
作用:用于图像恢复,由小尺度图像得到大尺度图像。
图像的高频细节在卷积和下采样中会丢失,而拉普拉斯金字塔可以保留不同尺度的高频信息,并用于图像恢复。
图像的空间域处理,就是用卷积核进行运算,但是速度太慢。考虑将空间域变换到频率域。
思路:将空间域信号变成频域
作用:频谱滤波,处理空间域无法处理的情况。
1.量化颜色直方图:对颜色空间进行单元格划分,统计落在单元格的像素点数量。用于RGB,HSV颜色空间。
2.聚类颜色直方图:对出现的像素点颜色进行直方图统计。用于Lab颜色空间。
答:
图片中像素值快速变化的区域,具有丰富的语义信息(像素值的一阶导数,取极值)
答:
由于图片中存在噪声,导数对噪声敏感,如果直接提取边缘,会有许多噪声的地方也会出现极值,所以先用高斯平滑滤波,可以突出图片中边缘,去除噪声;最后求导进行边缘提取
(总结:先高斯滤波,再对像素值使用一阶导数,一阶导数极值的地方就是边缘了)
答:
由于图片中的边缘是分布在不同方向上的,比如横着方向提取的边缘,表示图片在这一区域的像素值,横着方向变化剧烈。
那么如果像素值在任一方向变化剧烈,该怎么提取边缘呢?即将横着方向,扩展为梯度方向,可找到当前像素点沿着哪个方向变化最激烈。
那么变化的剧烈值是多少呢?即对x,y方向变化的值,两个一阶导数取平方,再求和,就是梯度。
注:由于提取边缘用的高斯滤波,高斯平滑函数的σ决定高斯函数的胖瘦和高低,即决定边缘提取的精度,σ越小,边缘提取越精确。
答:
我们人类在从不同距离,不同方向,不同光照条件下观察一个物体时,虽然这个物体的大小,形状,明暗都会有不同,但是我们仍然可以判断出,它们是同一个物体。所以,我们认为物体中有些点**(特征点或者关键点),在物体处于不同条件下时,彼此能够匹配**。
那我们在什么条件下仍为两个点就是匹配的特征点呢,这需要描述子来进行判断。
答:
用一个小窗口,在任一方向上移动,如果每个方向上都有较大的像素值变动,当前位置就是一个角点。如果只有一个方向有像素值变动大,当前位置为边缘直线。无变动则为平区域。
答:
找特殊点,以某个像素点为中心,观察一个离散圆,如果圆上有n个连续点的像素值,超过或低于某个像素阈值,就认为这个中心像素点是一个角点。
答:
斑点:SIFT、SURF、ORB
像素值函数的一阶导数值最大值(像素值函数的二阶导数值为0),表示的是边缘。
像素值函数的二阶导数值,取最大值,此时像素点的位置就是斑点。
需要理解每一步的具体操作:检测关键点、选关键点方向、生成关键点描述子
检测关键点:
用DOG高斯差分空间代替LOG拉普拉斯空间,减小计算量
选关键点方向:
生成关键点描述子:
答:
需要理解每一步的具体操作:改进的fast角点,改进的brief描述子
答:
也是一种特征提取方法。
答:
Haar-like特征 + 级联分类器
答:
方法1: HOG + SVM
方法2:DPM