计算机视觉三个层次
1. 图像分类概述
1.1
图像分类是指根据一定的分类规则将图像自动分到一组预定义类别中的过程。
1.2
图像分类方法的划分十分多样。根据图像语义内容的不同层次可以将图像分类划分为:
(1)对象分类 object categorization
(2)场景分类 scene classification
(3)事件分类 event classification
(4)情感分类 emotion classification
1.3
视觉一致的图像分类:主要依据是图像内容的视觉感知一致性(看起来一样,差不多)而不是功能一致性(用途差不多,一样)。
基于场景的图像分类:根据图像拍摄时所处的物理环境类别来对图像进行分类
对象分类和目标识别:对象分类是指判定一个图像中是否出现了某个对象类别的方法但他并不需要定为或者分割出图像中的对象;
对象识别或目标识别:通常指从新的图像中找出以前证件出现过的同一对象。
1.4
图像分类的应用
网络图像检索
视频分析与检索
医学图像分类
医学图像数据挖掘
图像检测
遥感图像分类
1.5 图像分类的基本过程
基本操作是建立 图像内容的描述,然后利用机器学习方法学习图像类别,最后利用学习得到的模型对未知图像进行分类。
一般来说,图像分类性能主要与图像特征提取和分类方法密切相关。图像特征提取是图像分类的基础,提取的图像特征应能代表各种不同的图像属性;
分类方法是图像分类的核心,最终的分类准确性与分类方法密切相关。
2. 图像的特征处理
2.1
图像特征是对凸显特性或属性的描述。每一幅图像都有其自身的特征,如:亮度、边缘的轮廓、纹理或色彩。
图像特征的提取和表示是凸显分类的基础,所选取的特征应该能充分表示图像语义内容,对环境的改变也应具有一定的鲁棒性和稳定性;
2.2
图像分类中提取的特征主要有两类:
(1)底层视觉特征
(2)局部不变特征
A。底层视觉特征
包括颜色、形状和纹理三大类。
颜色:
常用的颜色空间包括:RGB。HSV空间、以及反颜色空间(opponent color space)等等
目前,颜色特征的提取主要集中在全局颜色特征和空间颜色特征两个方面:
全局颜色特征的提取方法:颜色直方图、颜色矩和颜色熵等。不包括图像颜色的空间分布特征;
图像颜色空间分布特征的方法:改进的颜色直方图法、颜色聚合向量、颜色集、颜色相关图等。
形状:
描述形状的方法通常分为基于区域的形状描述方法和基于轮廓的形状描述方法两种。
基于区域的形状描述方法:注重集合形状的全局特征,描述形状局部特征的能力有限,常用特征有:几何不变矩、Legendre矩、Zenike矩、复数矩等;
基于轮廓的形状描述方法又可以分为基于空间域的方法和基于变换域的方法:
基于空间域:即集合特征描述方法。主要通过抽取边界的曲率、关键点、表姐长度等形状特征来描述物体的轮廓,节省存储空间,特征提取速度慢,对轮廓特性的描述相对抽象;
基于变换域的轮廓描述方法 主要将目标轮廓的边缘点数据变换到频率域中,从信号频率的角度来解释轮廓信息,特征提取速度快、对存储空间的需求适中、在表现人的主观视觉方面有局限性。
纹理
纹理特征是不依赖于颜色和亮度的反映图像中同质现象的视觉特征,其本质是刻画像素的邻域灰度空间分布规律。是所有物体表面共有的内在特性;
提取方法目前主要有四类:
基于统计的:主要通过统计图像中像素的灰度分布规律来描述纹理特征,如共生矩阵、Tamura纹理特征等;
基于几何的:将纹理看做是纹理基元按照一定的集合规则排列的组合,如利用结构法提取纹理基元等;
基于模型的:以图形的构造模型为基础,采用模型的参数为纹理特征,典型的方法如:马尔可夫随机场、同步自回归模型法和Wold模型法等;
基于信号处理的:利用信号处理的频率分析理论图区纹理特征,如小波变换、Gabor滤波法等
B。局部不变特征
也称为局部特征
首要任务是要提取出更加稳定的图像特征来描述图像。
稳定:希望该特征能对旋转、尺度缩放、仿射变换、视角变化、光照变化等图像变化因素保持一定的不变形,对运动、遮挡、噪声等因素也保持较好的可匹配性;
提取分为两个部分:特征点(或区域)探测和特征描述
特征点探测:采用一定的规则或者策略从图像中选取一些有代表性的特征点或特征区域;
特征描述:根据特征点探测所得特征点或特征区域,提取出满足一定不变性要求的特征向量;
3. 图像分类的流程
(1)数据集的选择:Oliva and Torralba(OT)、Fei-fei Li and Perona(FP),Lazebnik,Schmid and Ponce(LPS)
(2)特征的提取和表达
(3)数据字典的建立
(4)词典模型的表示
(5)分类器的学习:SVM;贝叶斯
(6)训练集的表达
(7)分类性能评估方法:eg,分类准确率 Classification Accuracy