图像特征与描述

直方图:

    用于计算图片特征,表达

    对图片数据/特征分布的一种统计

        灰度,颜色    /    梯度/边缘,形状,纹理    /    局部特征点,视觉词汇

    区间:

        具有一定的统计或物理意义

        一种数据或特征的代表

        需要预定义或基于数据进行学习

        数值是一种统计量:概率,频数,特定积累

    维度小于原始数据


聚类:

    目标:找出混合样本集中内在的组群关系

    把一个对象集合分组或分割为子集或类,使得,类内对象之间的相关性高,类间对象之间的相关性差。

    常用方法:Kmeans(数据分类大多首用kmeans),EM算法,谱聚类,层次聚类......


    Kmeans:数据集(),是d维特征向量,目标:把n个数据分成k组s={}这种分类具有最小类内平方和

                                                                            

    算法流程:1,首选K个类中心,首次随机选取,2,计算每个点跟K个类中心的距离,3,把数据点分配给距离最近的一个类中心,4,计算新的类中心(重复迭代2,3,4),5,满足终止条件后,终止迭代。

    kmeans类数K的选取:

        最简单:多值尝试取聚类指标最优或提升转折点

    kmenas初始中心选择:

        多次全随机取最优。

        最远选取:第一类中心->随机选择,第二类中心->距离第一个中心最远的点,第三类中心->距离前2个中心最远的点,以此类推,到第K个

        Kmeans++半随机:第一个类中心->随机选择,记D(x)为数据点x距最近的聚类中心的距离,选取下一个聚类中心,选取的概率正比于        ,以此类推,到第K个

        其他。


颜色特征:

    量化颜色直方图:

        适用颜色空间:RGB,HSV等均匀空间

        操作:颜色空间量化,单元由单元中心代表,统计落在量化单元上的像素数量。


    聚类颜色直方图:

        适用颜色空间:Lab等非均匀空间

        操作:使用聚类算法对所有像素点颜色向量进行聚类,kmeans

        单元(bin)由聚类中心代表。


几何特征:

边缘:像素明显变化的区域,具有丰富的语义信息,用于:物体识别,几何,时间变换

边缘定于:像素值函数快速变化的区域->一阶导数的极值区域


边缘提取:先高斯去噪(高斯滤波),再使用一阶导数获取极值,导数对噪声敏感,高斯核的标准差越大,核越大,面积约广。

图像特征与描述_第1张图片


图像特征与描述_第2张图片

        边缘提取尺度问题:不同标准差的滤波(x方向)捕捉到的不同尺度的边缘,尺度越小细节越明显。


图像特征与描述_第3张图片
不同尺度对应不同的细节区分


兴趣点/关键点:不同视角图片之间的映射,稳定局部特征点(可重复性,显著性,抗图片变换(外貌变换(平亮,光照),几何变换(平移,选择,尺度))) 

兴趣点/关键点:图片匹配/拼接,运动跟踪,物体识别,机器人导航,3D重建


Harris角点(捕捉稳定的边缘组合点/关键点,不受光照/平移等影响):一种显著点,在任何方向上移动小观察窗,导致大的像素变动,说明信息点集中。

图像特征与描述_第4张图片
角点示意


斑点:拉普拉斯限度,一阶导极值点->二阶导数零点,梯度/边缘可以通过寻找,二阶导数接近零,一阶导数足够大,对噪声很敏感,需要先做高斯平滑

图像特征与描述_第5张图片
一阶导数/二阶导数

            二阶导数高斯滤波(LOG)于标准差相关,若标准差越大,图像越粗糙,标准差越小,图像越繁杂。

捕捉斑点寻找拉普拉斯限度的极值,捕捉边缘寻找拉普拉斯的绝对值


SIFT关键点

    基于尺度空间不变的特征,特点:具有良好的不变性,旋转,尺度缩放,平移,亮度变化,遮挡和噪声。独特性好,信息量丰富,适用于在海量特征数据库中进行快速,准确的匹配。多量性,即使少数物体也可以产生大量的SIFT特征。

尺度空间,使用不同标准差的LoG对图片进行滤波

滤波

Dog,LoG近似等于2个不同尺度的高斯差分


图像特征与描述_第6张图片
DoG

SIFT特征计算:计算高斯差分,尺度空间,获取极值点,特征点处理(位置插值,去除低对对比度,去除边缘点),方向估计,描述子提取。

SIFT特征点方向估计:在尺度上计算梯度直方图,2*2网格,8个方向,获取最高值为关键点主方向。

SIFT特征点方向归一化:将坐标轴方向旋转为关键点方向(旋转不变性)

图像特征与描述_第7张图片
将坐标轴方向旋转为关键点方向

SIFT计算特征点描述子:在旋转后的坐标上采样16*16的像素窗,4*4网格,8方向直方图,共计128维。

SURF:近似SIFT算法,实现快速版,均值滤波,积分滤波,精度略有牺牲。


纹理特征

HOG(方向梯度直方图)

LBP(局部二值模式);将每个像素点于周围点大小比较,半径为R的圆上,均匀采样P个点,大小量化为0或1,多个bit组成一个数,统计每个数的直方图。

图像特征与描述_第8张图片
LBP

Garbor滤波器组:具有高斯和的特性,模拟人类的视觉系统。

你可能感兴趣的:(图像特征与描述)