计算机视觉——三维视觉 I

【本学期选修国科大计算机视觉课程,本人方向也是cv,因此想通过博客方式记录课程中比较重要的点,巩固并且进行一些扩展学习】

【从本章节开始由申抒含老师为我们讲述相关知识】

【本章节内容针对相机模型和多视几何进行讲解】

接下来我们将主要针对以下内容进行介绍:

射影空间

小孔相机成像模型

基本矩阵F,如8点法等

一. 计算机视觉发展历史

从Marr最开始的图像处理到Hinton提出深度学习,甚至延续到现在,也就40年的时间,也就意味着计算机视觉此时只是处于一种前期发展,更需要人们去投入心思发现其奇妙之处。

特征提取是针对点线面进行分析,提取所需特征值。

2.5维深度图是指可见区域,如一堆方块放置在一边,你只能看到正面对着的那一块。

子空间学习大意是指通过投影,实现高维特征向低维空间的映射,是一种经典的降维思想。绝大多数的维数约简(降维,投影)算法都算是子空间学习,如PCA、LDA、LPP、LLE等;

在Poggio时期,流行寻找更加好的空间分类器

深度学习这边就不多加介绍,包括VGG,Imception等,后期有机会会对其模块进行介绍。

计算机视觉——三维视觉 I_第1张图片现计算机视觉使用范围很广,同样也意味着我们方向的多样性,但是主要还是针对三维图像的复原,包括三维城市,三维动作捕捉等

计算机视觉——三维视觉 I_第2张图片

 二. 射影空间

我们这边通过一个图进行学习。

x为投影呈现的二维,X为射影投影之后的,真实呈现的三维模型。

计算机视觉——三维视觉 I_第3张图片

 计算机视觉——三维视觉 I_第4张图片

 最后我们用计算机视觉——三维视觉 I_第5张图片来表示3D空间点和2D图像点

但是问题来了,如果存在一个无限远的点,我们应该如何表示?

• 在一条直线上只有唯一一个无穷远点

• 在一个平面上,所有的无穷远点组成一条直线,称为该平面的无穷远直线

三维空间中的所有无穷远点组成的一个平面,称为这个空间的无穷远平面
n维欧式空间加入无穷远元素,并对有限元素和无穷远元素不加区分,则他们共同构成n维射影空间,记作Ρn
齐次坐标 是射影空间的坐标表达方式
计算机视觉——三维视觉 I_第6张图片

                                                         【非齐次到齐次】

计算机视觉——三维视觉 I_第7张图片

                                                        【齐次到非齐次】

其中:

1.齐次坐标在相差一个尺度时等价,即w=1
2.无穷远点的齐次坐标w=0

三.相机模型

计算机视觉——三维视觉 I_第8张图片                                                                     计算机视觉——三维视觉 I_第9张图片

 三维计算机视觉坐标系: 1. 世界坐标系2. 相机坐标系

计算机视觉——三维视觉 I_第10张图片计算机视觉——三维视觉 I_第11张图片

计算机视觉——三维视觉 I_第12张图片 相机模型——内参数矩阵

 计算机视觉——三维视觉 I_第13张图片

 p是指光轴穿过图像的中心位置!

计算机视觉——三维视觉 I_第14张图片

 四. 多视几何

单幅图像的投影方程:

多幅图像的投影方程: 

计算机视觉——三维视觉 I_第15张图片

计算机视觉——三维视觉 I_第16张图片

 Fundamental matrix(基础矩阵)

计算机视觉——三维视觉 I_第17张图片

两视图的极几何约束 (epipolar geometry) 可以用一个 3x3 矩阵描述,称为基本矩阵(fundamental matrix)F
表达了 image 1 中的齐次坐标点 p image 2 p 的极线之间的映射关系
image 2 中点 p 的极线:Fp

 图像对应点间的极几何约束关系可以表达为:

 计算机视觉——三维视觉 I_第18张图片

 八点法,顾名思义就是寻找八个点进行观测。

计算机视觉——三维视觉 I_第19张图片

 计算机视觉——三维视觉 I_第20张图片

 注意:当空间点位于空间同一平面时,产生退化情况,无法求解

Essential matrix(本质矩阵)

计算机视觉——三维视觉 I_第21张图片

 寻找最小配置解的意义:

图像匹配点中不可避免的存在外点,因此使用 RANSAC 进行鲁棒估计。
RANSAC计算流程:
1. 随机选 r 对匹配点计算模型;
2. 计算模型的一致集(所有符合模型的匹配点构成的集合);
3. 步骤 1-2 循环 n 次;
4. 使用最大一致集中的所有匹配点重新计算模型。
假定两幅图像中正确匹配点所占比例为 p =0.5 ,则经过 n 次RANSAC后找到正确模型的概率为( r 为最小数据点个数):
                                            
p =0.5, r =4, n =500 时,正确的模型未被找到的概率为 1 × 10 -14
p =0.5, r =5, n =500 时,正确的模型未被找到的概率为 1 × 10 -7
p =0.5, r =6, n =500 时,正确的模型未被找到的概率为 1 × 10 -4

计算机视觉——三维视觉 I_第22张图片

                                                                【推荐书籍】 

【本章节没有讲其他特别高深的问题,因为省略了一些数学推导原理,仅作为大致了解内容,不足之处,敬请谅解】

你可能感兴趣的:(计算机视觉,计算机视觉)