我自己的计算机视觉知识结构

实践环境

OpenCV 3.2和Python 2.7

TensorFlow1.1和Python 3.5

-------------------------------------------------------------------------------

计算机视觉框架

语义感知

分类

物体,属性,场景等

检测

物体,行人,人脸等

识别

物体:车牌文本;人:人脸,指纹,虹膜,步态,行为

分割

场景的分割:自动驾驶;检测:光学图像的特征识别

检索

以文搜图,以图搜图,图文连搜

语言

图片描述,图片问答

几何属性

3D建模

双目视觉

增强现实

------------------------------------------------------------------------------

传统图像处理

空域分析和变换(sobel, laplace, 高斯,中值 )

频域分析和变换(傅里叶变换,小波变换)

模板匹配,图像金字塔, 滤波器组

特征数据操作(主成分分析,奇异值分解,聚类)


图像特征

颜色特征:RGB,HSV,Lab等 直方图

几何特征:Edge,Corner,Blob等

局部特征:SIFT,SURF,FAST等

梯度Prewitt滤波/卷积

水平梯度/垂直边缘

垂直梯度/水平边缘

梯度sobel滤波、卷积

梯度laplace滤波、卷积

二阶微分算子

团块检测:周边高于(低于)中心点

边缘检测:像素快速变化的区域

高斯金字塔

多次高斯卷积以后,一些像素多余

n次(高斯卷积->2x采样)->n层金字塔

目的:捕捉不同尺寸的物体(合适尺寸永远未知)

拉普拉斯金字塔

高频细节信息在卷积核下采样中丢失。

保留所有层所丢失的高频信息,用于图像恢复。


模板匹配

兴趣点匹配

Harris角点(corner),任何方向移动小的观察窗,导致像素大的变化。

Blob斑点,一阶导极值点->二阶导零点/对噪声很敏感,需要先做高斯平滑

SIFT,良好不变性,独特性好,信息量丰富,少量图片能产生大量SIFT特征

HOG,纹理特征,分别计算水平,垂直梯度,彩色图选取梯度幅值最大

Gabor:类似人的视觉系统,多频率,多尺度,多方向

频域:属于加窗的傅里叶变换

空域:一个高斯核函数和正弦平面波乘积

你可能感兴趣的:(我自己的计算机视觉知识结构)