2019.10.09更新……
图像:可以用矩阵表示,行列表示图像的长高,矩阵的元素值可以表示灰度值的大小。
图像深度:指存储每个像素所用的位数,例如:位深度为1的图像的像素有两个可能的值:白色或者黑色;如果为位深度为8,则有2^8=256种颜色或者灰度等级(一般情况下位深度取8够用了)。
区域:表示一幅图像中一个任意的像素子集,不就是ROI嘛???
一般图像处理过程:读图、灰度化、缩放、阈值找到ROI区域、构建滤波函数、在频域进行滤波然后转到时域、通过灰度变换(增强对比度)、通过阈值各种特征选择即可找出目标。
一般的预处理流程为:1灰度化->2几何变换->3图像增强。
灰度化,在RGB模型中,如果R=G=B时,则彩色表示一种灰度颜色,其中R=G=B的值叫灰度值,因此,灰度图像每个像素只需一个字节存放灰度值(又称强度值、亮度值),灰度范围为0-255(位深度为8时)。
图像几何变换又称为图像空间变换,通过平移、转置、镜像、旋转、缩放等几何变换对采集的图像进行处理,用于改正图像采集系统的系统误差和仪器位置(成像角度、透视关系乃至镜头自身原因)的随机误差。此外,还需要使用灰度插值算法,因为按照这种变换关系进行计算,输出图像的像素可能被映射到输入图像的非整数坐标上。通常采用的方法有最近邻插值、双线性插值和双三次插值。
增强图像中的有用信息,它可以是一个失真的过程,其目的是要改善图像的视觉效果,针对给定图像的应用场合,有目的地强调图像的整体或局部特性,将原来不清晰的图像变得清晰或强调某些感兴趣的特征,扩大图像中不同物体特征之间的差别,抑制不感兴趣的特征,使之改善图像质量、丰富信息量,加强图像判读和识别效果,满足某些特殊分析的需要。(其实就是为了突出自己感兴趣的部分)图像增强算法可分成两大类:空间域法和频率域法。
空间滤波和频域滤波的对比:
前者空间域法中具有代表性的算法有局部求平均值法和中值滤波(取局部邻域中的中间像素值)法等,它们可用于去除或减弱噪声。
后者把图像看成一种二维信号,对其进行基于二维傅里叶变换的信号增强。采用低通滤波(即只让低频信号通过)法,可去掉图中的噪声;采用高通滤波法,则可增强边缘等高频信号,使模糊的图片变得清晰。
模式识别中进行匹配识别或者分类器分类识别时,判断的依据就是图像特征。用提取的特征表示整幅图像内容,根据特征匹配或者分类图像目标。常见的特征提取算法主要分为以下3类:
原理:LBP的基本思想是定义于像素的8邻域中, 以中心像素的灰度值为阈值, 将周围8 个像素的值与其比较, 如果周围的像素值小于中心像素的灰度值, 该像素位置就被标记为0, 否则标记为1. 图像中的每一个像素都得到一个二进制组合, 这些组合作为特征就可以用来表示原始图像。
LBP(Local Binary Patterns,局部二值模式)是提取局部特征作为判别依据的,为一种有效的纹理描述算子,度量和提取图像局部的纹理信息,对光照具有不变性。有多种改进型,LBP结合BP神经网络已经用于人脸识别等领域。
改进:
应用:LBP主要应用在纹理分类、人脸分析等。LBP特征提取结果还是大小相同的一幅图像,但一般都不直接将LBP图谱作为特征向量用于分类识别,而是采用LBP特征谱的统计直方图作为特征向量用于分类识别。
原理:所检测的局部物体外形能够被光强梯度或边缘方向的分布所描述(本质:梯度的统计信息,而梯度主要存在于边缘的地方),HoG算法提取的是图像各个像素梯度的统计直方图,一般会将这些梯度直方图转化成一个向量,用于分类器的训练输入。
方向梯度直方图(Histogram of Oriented Gradient, HOG)特征是一种在计算机视觉和图像处理中用来进行物体检测的特征描述子。它通过计算和统计图像局部区域的梯度方向直方图来构成特征。
应用:Hog特征结合SVM分类器已经被广泛应用于图像识别中,尤其在行人检测中获得了极大的成功。需要提醒的是,HOG+SVM进行行人检测的方法是法国研究人员Dalal在2005的CVPR上提出的,而如今虽然有很行人检测算法不断提出,但基本都是以HOG+SVM的思路为主。
不变性:具有光照不变性,不具有尺寸和旋转不变性。
原理:haar特征分成了四类:边缘特征、线性特征、中心特征和对角线特征,这些特征组成了特征模板。这些模板的特征值的组合就是白色矩形区域像素值之和减去黑色矩形像素和。haar特征值反映了图像的灰度变化情况。
应用:人脸检测
在现实世界中,角点对应于物体的拐角,道路的十字路口、丁字路口等。从图像分析的角度来定义角点可以有以下两种定义:
原理:使用一个固定窗口在图像上进行任意方向上的滑动,比较滑动前与滑动后两种情况,窗口中的像素灰度变化程度,如果存在任意方向上的滑动,都有着较大灰度变化,那么我们可以认为该窗口中存在角点。如果只在一个方向上有着较大的变化,则可能是一条直线。
原理: DOG(Difference of Guassian):简称 高斯函数的差分,将两幅图像在不同参数下的高斯滤波结果相减,得到DoG图。是一阶边缘提取。
通过将图像与高斯函数进行卷积得到一幅图像的低通滤波结果,即去噪过程,这里的Gaussian和高斯低通滤波器的高斯一样,是一个函数,即为正态分布函数。
原理:LoG(Laplacian of Gaussian):简称 高斯-拉普拉斯,Laplace算子对通过图像进行操作实现边缘检测的时,对离散点和噪声比较敏感。于是,首先对图像进行高斯卷积滤波进行降噪处理,再采用Laplace算子进行边缘检测,就可以提高算子对噪声抗干扰能力, 是二阶边缘提取。
原理:是一种检测局部特征的算法,该算法通过求一幅图中的特征点及其有关尺寸和方向的描述子得到特征并进行图像特征点匹配,获得了良好效果。每个特征点的SIFT特征是128维向量,因此计算量巨大。不变性:具有尺寸和旋转不变性。
改进:PCA-SIFT,如名称所说“主成分SIFT特征”,主要提取了128维特征向量中的20个特征,大大减少了计算。
SURF是SIFT角点检测算法的改进版,主要体现在速度上,SURF是SIFT速度的3倍。SIFT在尺度和旋转变换的情况下匹配效果比SURF好,而SURF在亮度变化下匹配效果比较好。
Sift采用的是DOG图像,而surf采用的是Hessian矩阵行列式近似值图像。