CV 百度飞桨7日打卡营

1. 前言

     对于我而言,对我最有用的只是在第一天的理论课程中,这么说不意味着说后几天的知识不重要,第一天介绍的是计算机视觉的发展历程么,是怎么一步步的发展到用深度学习的知识进行cv工作的,虽然说这些知识相对来说已经不在是时代的宠儿,不掌握这些内容,完全用深度学习去进行cv的学习,也没太大的差别,但对于我而言,缺少那方面的了解,就总感觉缺了些什么。虽然自己通过一些文章对那些东西也有一定的了解,但是,缺少和其他人的交流,知识总会有所缺漏。话不多说,开始进入重点。

2. 语义鸿沟

    图像的底层视觉特性和高层语义概念之间的鸿沟

例如:相似的视觉特性,不同的语义概念

CV 百度飞桨7日打卡营_第1张图片

例如:不相似的视觉特性,相同的语义概念

3. 传统图像识别技术

    早期图像识别流程

特征提取------------> 索引技术----------------->相关反馈----------------->重排序

CV 百度飞桨7日打卡营_第2张图片

特征提取:用全局的视觉底层特性统计量表示图像(包括,颜色,形状,纹理等),将这些特征转换为向量表示,向量降维。

中期图像识别流程

CV 百度飞桨7日打卡营_第3张图片

特征提取:改为提取图像的局部特征。有两种技术手段。

特征检测子:检测图像区块中心位置 Harris, DoG, SURF, Hattis-Affine

特征描述子:描述区块的视觉内容 SIFT, GLOH, Shape Contest, ORB

人工智能图像识别流程

这个流程以我个人的理解就是,通过卷积神经网络进行特征的提取,3*3或者5*5(7*7)的卷积核,对图片的特征进行提取,网络的浅层关注图片的基础特征(包括,颜色,形状,纹理等),网络的深层关注图片的语义特征。之后添加一些特定功能的模块进行分类任务或者检测任务。最后奉上一个经典的VGG网络模型。

CV 百度飞桨7日打卡营_第4张图片

 

你可能感兴趣的:(CV 百度飞桨7日打卡营)