OpenMVG、OpenMVS配置及学习记录(Win10+VS2015)

更新于2018年7月24日
经过了近一年的学习,总结各方面经验,还是极其强烈的建议初入三维重建的朋友几点:
1.不要在Windows系统下装openmvg和openmvs了,直接用上Linux系统吧,Ubuntu14.04或者16都可以,openmvg和openmvs在Linux上的安装简直不要太简单,百度去两个库的主页,通过命令行就全部安装好了,真的很方便,而且既然接触编程,使用Linux也是很好的选择。不要再在Windows下挣扎了!
2.目前视觉SLAM很火,而且和三维重建有很多交叉,只是侧重不同,目前没有好的入门三维重建的书,但是入门SLAM的书有一本很好的,视觉SLAM十四讲,通过这本书的学习,你也将会对三维重建有更好的了解及基础。

更新于2017年5月12日。


最近开始在做基于二维图像的三维重建项目,OpenMVG和OpenMVS可谓是必不可少的两个库,但网上配置及学习资料太少,花了整整一个月的时间才将库配置好,过程可谓艰难。本人也是入门级,此贴的目的在于将自己的经验分享给大家,给后来者提供一些方向和提示,望多交流,批评指正,建群一起学习。
OpenMVS是在OpenMVG的基础上的进一步操作,因此我们先来配置OpenMVG。

1、OpenMVG配置

首先需要一台比较“干净”的电脑,因为配置过程会用到许多的第三方库,以及对系统环境的配置,若电脑内已经装了类似opencv、boost等的,容易出现版本不匹配等各种意想不到的错误,因此建议还是删干净,或者是在虚拟机里搭(前提是电脑配置够好,不然跑不动程序),或者是用一台新的电脑,由于我笔记本之前就做图像处理,因此乱七八糟的东西很多,配了半个多月都没配好,最后还是在一台新的台式机上配置好的。另外,我的基本环境是Win10+VS2015,其他的环境没试过,不能保证可行。
第二点是,本文在配置阶段主要参考了http://blog.csdn.net/mitsubishisony/article/details/52332470,然后根据自己的实际操作过程进行了一些补充,具体内容大家可以在http://download.csdn.net/detail/weixin_36408769/9838169下载。前面也说到,整个配置过程会使用到不少的第三方库,为了大家方便,特将相关的安装包提供给大家,共有三个压缩包1:http://download.csdn.net/detail/weixin_36408769/9838075  2:http://download.csdn.net/detail/weixin_36408769/9838077  3:http://download.csdn.net/detail/weixin_36408769/9838150。大家下载好后先把第三个安装包的cmake及git安装好。由于上传文件大小的限制,还有几个太大的文件放网盘了:链接:http://pan.baidu.com/s/1dF5oYtV 密码:2hdl。最后VS2015社区版的安装镜像文件也放在了网盘链接:http://pan.baidu.com/s/1pKCLPEF 密码:s9df,大家下一个虚拟光驱的软件就能运行了。

2、OpenMVG学习

openMVG提供了一个可以解决计算机视觉问题并构建完整SFM流程的小型库集合。下面对库的内容依次介绍。
**图像库**
图像容器:
    OpenMVG Image 类可以存储灰度,RGB,RGBA或自定义的图像数据,提供基于像素的图像读写操作。基本方法如下:
// A 8-bit gray image:
Image<unsigned char> grayscale_image_8bit;

// A 32-bit gray image:
Image<double> grayscale_image_32bit;

// Multichannel image: (use pre-defined pixel type)

// A 8-bit RGB image:
Image rgb_image_8bit;
Imageunsigned char> > rgb_image2_8bit;

// 8-bit RGBA image
Image rgba_image_8bit;
Imageunsigned char> > rgba_image2_8bit;

// 32 bit RGB image:
Imagedouble> > rgb_image_32bit;
图像I/O操作:
// Read a grayscale image (if conversion need, it is done on the fly)
Image<unsigned char> gray_image;
bool bRet = ReadImage("Foo.imgExtension", &gray_image);

// Read a color image
Image rgb_image_gray;
bool bRet = ReadImage("Foo.imgExtension", &rgb_image);
图像绘制操作:
Image<unsigned char> image(10,10);
image.fill(0);

// Pixel access is done as matrix (row, line)
int row = 2;
int column = 4;
image(row, column) = 127;

// Horizontal scanline
DrawLine( 0, 5, w-1, 5, 255, &image);

// Circle of radius 3 and center (5,5)
const int radius = 3;
const int x = 5, y = 5;
DrawCircle(x, y, radius, (unsigned char)255, &image);

// Ellipse of center (5,5) and (3,0
const int radius1 = 3, radius2 = 1, angle = 0;
const int x = 5, y = 5;

DrawEllipse(x, y, radius1, radius2, (unsigned char)255, &image, (double)angle);

// Example with a RGB image
Image imageRGB(10,10);
DrawCircle(x, y, radius, RGBColor(255,0,0), &imageRGB);

数学和线性代数库

该模块提供依赖于[Eigen]库的数学和线性代数工具。 Eigen是线性代数的C ++模板库。基本思想是提供给openMVG:

•用于矩阵和向量的高级别内存容器,
•容易的矩阵和向量操纵,
•数字求解器和相关算法的集合。
矢量,矩阵容器:
OpenMVG重新定义了代码一致性和清晰度的一些特征基类型(点,向量,矩阵):
•Vec2将单个2d点存储为列矩阵(x,y)
•Vec3将单个3d点存储为列矩阵(x,y,z)
•Vec2f,Vec3f浮点版本。
•Vec是一个值的向量(双精度)
•Vecf一个浮点值的向量
•Mat对于通用矩阵容器,
•Mat2X收集由2d列存储的列,
•Mat3X将3d点的集合存储为列。
// Create a set of 2D points store as column
//创建一组2D点存储为列
Mat2X A(2, 5);//2行5列
A << 1, 2, 3, 4, 5,
6, 7, 8, 9, 10;
A.col(); // return a column vector : (1,6)^T
A.row(); // return a row vector : (1,2,3,4,5)
线性代数
SVD/QR/LU 分解

特征库

该模块为特征和相关描述符提供通用容器。
特征:提供基本结构和IO来存储基于Point的特征。
存储点特征的类:PointFeature存储特征的位置(x,y)。SIOPointFeature存储特征(x,y,s,o)的位置,方向和尺度。

特征描述符:提供描述符数据的基本结构和IO。
模板

// SIFT like descriptor
using siftDescriptorData Descriptor<float, 128>;

// SURF like descriptor
using surfDescriptorData = Descriptor<float, 64>;

// Binary descriptor (128 bits)
using binaryDescriptor_bitset = Descriptor<std::bitset<128>,1> binaryDescriptor_bitset;
// or using unsigned chars
using binaryDescriptor_uchar = Descriptor<unsigned char, 128/sizeof(unsigned char)>;

特征点集:
存储特征点及其相关描述符:

template<typename FeaturesT, typename DescriptorsT> class KeypointSet
// Define SIFT Keypoints:

// Define the SIFT descriptor [128 floating point value]
using Descriptor<float, 128> DescriptorT;

// Use SIFT compatible features (scale, orientation and position)
using FeatureT = SIOPointFeature;

// Describe what a collection of local feature is for a given image:
using FeatsT = std::vector;
using DescsT = std::vector;

// Link features and their descriptors as a collection:
using KeypointSetT = KeypointSet;

相机库

该模块提供不同的相机模型。
针孔相机模型:
相机可以由投影模型近似,通常称为针孔投影。 相机的最简单的表示是光敏表面(传感器):图像平面,在给定位置处的透镜(投影投影)和空间中的取向。

OpenMVG、OpenMVS配置及学习记录(Win10+VS2015)_第1张图片

针孔摄像机几何模型的投影相机具有两个子参数,内在和外在参数。 内在参数对光学元件(无变形)进行建模,外在模型将相机的位置和方向置于空间中。 相机的投影描述如下:

OpenMVG、OpenMVS配置及学习记录(Win10+VS2015)_第2张图片

内部参数:ku和kv通常为1,f表示焦距,cu和cv为主点,表示图像的理想中心。外部参数:R,t分别表示旋转矩阵和平移矩阵。

OpenMVG针孔相机模型

Pinhole_Intrinsic : public IntrinsicBase

classic pinhole camera (Focal + principal point and image size).焦距、主点与图像大小

Pinhole_Intrinsic_Radial_K1 : public Pinhole_Intrinsic

classic pinhole camera (Focal + principal point and image size) + radial distortion defined by one factor.使用一个因素设置径向畸变。

Pinhole_Intrinsic_Radial_K3 : public Pinhole_Intrinsic

classic pinhole camera (Focal + principal point and image size) + radial distortion by three factors.使用三个因素设置径向畸变。

Pinhole_Intrinsic_Brown_T2 : public Pinhole_Intrinsic

classic pinhole camera (Focal + principal point and image size) + radial distortion by three factors + tangential distortion by two factors.使用三个因素设置径向畸变,使用两个因素设置切向畸变。

Pinhole_Intrinsic_Fisheye : public Pinhole_Intrinsic

classic pinhole camera (Focal + principal point and image size) + fish-eye distortion by four factors.使用四个因素设置鱼眼畸变。

// Setup a simple pinhole camera at origin
// Pinhole camera P = K[R|t], t = -RC
Mat3 K;
K << 1000, 0, 500,
     0, 1000, 500,
     0, 0, 1;
PinholeCamera cam(K, Mat3::Identity(), Vec3::Zero());

多视角库

多视角模板主要包括:
用于在多视图几何中出现的2到n维视图几何约束的求解器的集合。
一个通用框架“内核”可以嵌入这些求解器进行鲁棒估计。
列出并解释了第一个可访问的解算程序,并记录了“内核”概念。

2维求解(2D到2D对应)

openMVG为以下几何估计提供求解器:
仿射,同形异义,基本矩阵,7到n pt,8到n pt(直线变换)[HZ]。必要矩阵,8到n pt(直线变换)[HZ],5pt +内在参数[Stewenius],[Nister]。

N-View几何估计

三角测量,旋转,平移

单应性矩阵:

单应性矩阵绘制了一个平面的两个投影之间的关系。H是一个(3×3)矩阵,它将左右图像中的坐标与以下关系联系起来。

OpenMVG、OpenMVS配置及学习记录(Win10+VS2015)_第3张图片
H可由四对以上的对应点估计出来。

基本矩阵:

基本矩阵是观察相同场景的两个图像之间的关系,其中这些点的投影在两个图像中是可见的。 给定两个视图之间的点对应:

OpenMVG、OpenMVS配置及学习记录(Win10+VS2015)_第4张图片

F是(3×3)基本矩阵,它将点x与属于3D X点的投影的线相关联。F有七个自由度,需要至少七个以上的已知对应点关系才能进行计算。

相对姿态估计(本质矩阵)

向基本矩阵添加内在参数,得到本质矩阵,该本质矩阵将相机的相对位置与基本矩阵关系相连。

OpenMVG、OpenMVS配置及学习记录(Win10+VS2015)_第5张图片

绝对姿态估计/相机切除(位姿矩阵)

给定3D-2D点对应的列表,可以计算相机姿态估计。 它包括估计右侧相机的相机参数,使3D点重新投影的残差可以最小化,这是一个优化问题,试图解决P参数,以便最小化:

OpenMVG、OpenMVS配置及学习记录(Win10+VS2015)_第6张图片

openMVG 提供了三种不同的方法来解决这个问题:
6pt直接线性变换[HZ],
具有内在EPnP [EPnP]的4pt,
3pt内在P3P [Kneip]。

内核概念

为了在通用的鲁棒估计框架中使用求解器,我们将它们与允许链接的Kernel类结合使用:

OpenMVG、OpenMVS配置及学习记录(Win10+VS2015)_第7张图片

线型规划

其他内容参见http://openmvg.readthedocs.io/en/latest/

你可能感兴趣的:(OpenMVG、OpenMVS配置及学习记录(Win10+VS2015))