SLAM第12讲 建图实践部分

1 实践:单目稠密重建

1.1 我们需要下载示例程序所需要的数据集。它提供了一架无人机采集到的单目俯视图像,共200张,同时提供了每张图像对应的位姿。下面我们通过这些数据估算第一帧图像每个像素对应的深度值,即进行单目稠密重建。


  • 假设所有像素的深度满足某个初始的高斯分布;
  • 当新数据产生时,通过极线搜索和块匹配确定投影点位置;
  • 根据几何关系计算三角化后的深度及不确定性;
  • 将当前观测融合进上一次的估计中。若收敛则停止计算,否则返回第二步;


1> 定义了readDatesetFiles()函数利用创建的fin文件流对象从对应的数据集路径下去获取200帧图像的名称以及所对应的相机的位姿,无需重新去打开文件读取图片名称,位姿文件每行的开头就是对应的200张图片的名称,然后去获取第一幅图像的所有像素点的深度信息。

2> 获取完数据集中的内容后,紧接着对第一幅图初始化深度图和深度图方差

double init_depth = 3.0;    // 深度初始值
 double init_cov2 = 3.0;     // 方差初始值
 Mat depth(height, width, CV_64F, init_depth);             // 深度图
 Mat depth_cov2(height, width, CV_64F, init_cov2);         // 深度图方差

3> 第一帧图像与剩下的其他图像的相机位姿的变换关系:

SE3d pose_curr_TWC = poses_TWC[index];
 SE3d pose_T_C_R = pose_curr_TWC.inverse() * pose_ref_TWC;   // 坐标转换关系: T_C_W * T_W_R = T_C_R

4> 对深度图和深度方差进行更新update(ref, curr, pose_T_C_R, depth, depth_cov2);

// 对整个深度图进行更新
设定深度图方差的阈值,小与min_cov我们认为对应像素的深度已收敛,若大与max_cov则发散,然后在极线段上去匹配对应的像素点,通过三角化来取定确定深度进而优化像素的深度。使用epipolarSearch() 进行极线搜索。根据获取到的第一幅图像的深度信息把像素点从像素坐标转到相机坐标下Vector3d f_ref = px2cam(pt_ref);,然后对其极每个点的坐标进行归一化,使其都在相机的归一化平面坐标系下,f_ref.normalize(); 该像素点对应的空间点的初始化坐标为Vector3d P_ref = f_ref * depth_mu; // 参考帧的 P 向量 ,然后将像素空间点通过前面算出的T_C_R将其转换到第二帧图像所对应的相机的坐标系下通过Vector2d px_mean_curr = cam2px(T_C_R * P_ref); // 按深度均值投影的像素将其转为当前图像下的像素坐标。“空间点到光心的直线上所有点都在同一极线上”,因此我们取两个不同深度值(以均值为中心左右各取3倍标准差为半径,取最大值和最小值)做重投影,两点确定一条直线,也就得到了极线段

double d_min = depth_mu - 3 * depth_cov, d_max = depth_mu + 3 * depth_cov;
if (d_min < 0.1) d_min = 0.1;
Vector2d px_min_curr = cam2px(T_C_R * (f_ref * d_min));    // 按最小深度投影的像素
Vector2d px_max_curr = cam2px(T_C_R * (f_ref * d_max));    // 按最大深度投影的像素
 Vector2d epipolar_line = px_max_curr - px_min_curr;    // 极线(线段形式)
 epipolar_direction = epipolar_line;        // 极线方向

然后将极线的归一化,以深度均值为中心,左右取半长度,步长为sqrt(2 * best_ncc)来找匹配点,px_mean_curr是带有深度方差的投影点,在极线上得到一个沿着NCC分布的确定匹配点px_curr,匹配好后

最后更新先验信息:evaludateDepth(ref_depth, depth);



// 对整个深度图进行更新
// 极线搜索
// 方法见书 12.2 12.3 两节
// 后面这些太简单我就不注释了(其实是因为懒)
void plotDepth(const Mat &depth_truth, const Mat &depth_estimate) {
    imshow("depth_truth", depth_truth * 0.4);
    imshow("depth_estimate", depth_estimate * 0.4);
    imshow("depth_error", depth_truth - depth_estimate);

void evaludateDepth(const Mat &depth_truth, const Mat &depth_estimate) {
    double ave_depth_error = 0;     // 平均误差
    double ave_depth_error_sq = 0;      // 平方误差
    int cnt_depth_data = 0;
    for (int y = boarder; y < depth_truth.rows - boarder; y++)
        for (int x = boarder; x < depth_truth.cols - boarder; x++) {
            double error = depth_truth.ptr<double>(y)[x] - depth_estimate.ptr<double>(y)[x];
            ave_depth_error += error;
            ave_depth_error_sq += error * error;
    ave_depth_error /= cnt_depth_data;
    ave_depth_error_sq /= cnt_depth_data;

    cout << "Average squared error = " << ave_depth_error_sq << ", average error: " << ave_depth_error << endl;

void showEpipolarMatch(const Mat &ref, const Mat &curr, const Vector2d &px_ref, const Vector2d &px_curr) {
    Mat ref_show, curr_show;
    cv::cvtColor(ref, ref_show, CV_GRAY2BGR);
    cv::cvtColor(curr, curr_show, CV_GRAY2BGR);

    cv::circle(ref_show, cv::Point2f(px_ref(0, 0), px_ref(1, 0)), 5, cv::Scalar(0, 0, 250), 2);
    cv::circle(curr_show, cv::Point2f(px_curr(0, 0), px_curr(1, 0)), 5, cv::Scalar(0, 0, 250), 2);

    imshow("ref", ref_show);
    imshow("curr", curr_show);

void showEpipolarLine(const Mat &ref, const Mat &curr, const Vector2d &px_ref, const Vector2d &px_min_curr,
                      const Vector2d &px_max_curr) {

    Mat ref_show, curr_show;
    cv::cvtColor(ref, ref_show, CV_GRAY2BGR);
    cv::cvtColor(curr, curr_show, CV_GRAY2BGR);

    cv::circle(ref_show, cv::Point2f(px_ref(0, 0), px_ref(1, 0)), 5, cv::Scalar(0, 255, 0), 2);
    cv::circle(curr_show, cv::Point2f(px_min_curr(0, 0), px_min_curr(1, 0)), 5, cv::Scalar(0, 255, 0), 2);
    cv::circle(curr_show, cv::Point2f(px_max_curr(0, 0), px_max_curr(1, 0)), 5, cv::Scalar(0, 255, 0), 2);
    cv::line(curr_show, Point2f(px_min_curr(0, 0), px_min_curr(1, 0)), Point2f(px_max_curr(0, 0), px_max_curr(1, 0)),
             Scalar(0, 255, 0), 1);

    imshow("ref", ref_show);
    imshow("curr", curr_show);

运行结果:由于运行时间比较久,耐心等待。 高博代码中的错误之处:导致无限段错误,原因:

Mat depth(width, height, CV_64F, init_depth);             // 深度图
Mat depth_cov2(width, height, CV_64F, init_cov2);         // 深度图方差

整体分析:从数据集中读取了图像,然后交给update函数,对深度进行更新。在update中,我们遍历了参考帧的每个像素,先在当前帧中寻找极线匹配,若匹配上,则利用极线匹配的结果更新深度图的估计。在极线搜索中假设深度服从高斯分布,所以我们以均值为中心,左右各取正负3 σ \sigma σ为半径,在当前帧中寻找极线的投影。然后,遍历此极线上的像素(步长为二分之根号二近似0.7,寻找NCC最高的点作为匹配点,如果最高的NCC也低于阈值0.85,则认为匹配失败。NCC的计算采用了去均值化后的做法,最后进行三角化,不确定性的计算(高斯融合).

1.2 对上述实验的分析和讨论
1) 像素梯度的问题
对深度图进行观察中发现,块匹配的正确性与是否依赖于图像块是否就有区分度.所以进行块匹配的时候,必须假设小块不变,然后将该小块与其他小块进行对比。这时有明显梯度的小块具有良好的区分度,不易引起五匹配.对与梯度不明显的像素,由于在块匹配时没有区分性,将难以有效的估计深度。也就是说立体视觉对物体纹理的依赖性强。进一步讨论像素梯度问题,还会发现像素梯度和极线的关系:当像素梯度平行于极线方向,我们能够精确的确定匹配度最高点出现在何处,当像素梯度垂直于极线方向,即使小块有明显的梯度,当我们沿着极线做匹配时,会发现匹配程度都是一样的,得不到有效的匹配。而实际上,梯度与极线的情况有可能介于二者之间:即不完全平行又不完全垂直。也就是说 当像素梯度与极线夹角较大时,极线匹配的不确定性大;当夹角较小时,匹配的不确定性小。

SLAM第12讲 建图实践部分_第1张图片
2) 逆深度
逆深度也是一种广泛使用的参数化技巧,在演示程序中,我们假设深度值满足高斯分布d~ N ( μ , σ 2 ) ∣ N(\mu, \sigma^2)| N(μ,σ2),但是真的满足吗,其时不然,最近的点不会小与相机的焦距(或认为深度不小于0),这个分布并不像高斯分布, 形成一个对称的形状。它的尾部可能稍微长,负数区域则为0;而且在一些室外场景,可能存在无穷远的点,初始化中难以涵盖这些点,并且高斯分布描述他们会有一些数值上的困难,于时采用逆深度,深度的倒数,为高斯分布比较有效,也具有更好的数值稳定性,从而成为一种通用的技巧。
在块匹配之前,做一次图像到图像的变换是一种常见的预处理方式。这是因为:我们假设在相机运动时图像小块保持不变,而这个假设在相机平移时能够保持成立,但相机发生旋转后就很难保持成立了。 为了防止这种现象,我们通常在块匹配前,把参考帧和当前帧的运动都参考近来。
参考帧上的一个像素 P R P_R PR与真实三维空间点世界坐标系 P w P_w Pw关系: d R P R = K ( R R W P W + t R W ) d_R P_R = K(R_{RW} P_W + t_{RW}) dRPR=K(RRWPW+tRW),类似的当前 P C P_C PC: d c P C = K ( R C W P W + t C W ) d_c P_C = K(R_{CW} P_W +t_{CW}) dcPC=K(RCWPW+tCW), 待入消去 P W P_W PW,即两幅图像间的像素关系为:
当知道 d R , P R d_R, P_R dR,PR时,可以计算出 P C P_C PC的投影位置。此时,再给 P R P_R PR两个分量各一个增量 d u , d v d_u ,d_v du,dv,可以求得 P C P_C PC的增量,算出局部范围内参考帧和当前帧图像坐标变换的一个线性关系构成的仿射变换:

SLAM第12讲 建图实践部分_第2张图片根据仿设变换,可以将当前帧的图像进行变换,再进行匹配,以获得对旋转更好的效果。
5) 其他改进

2 RGB-D稠密建图

点云地图中的每个点包含x,y,z,r,g, b信息。RGB-D提供了彩色图和深度图,因此很容易用相机内参计算RGB-D点云。通过某种手段得到相机的位姿,那么只要直接把点云进行加权,就可以获得全局的点云。而在实际的建图中,我们还会对点云加一些滤波处理,以获得更好的视觉效果。主要使用的两种滤波器:外点去除滤波器,体素网格的降采样滤波器


int main(int argc, char **argv) {
    vector<cv::Mat> colorImgs, depthImgs;    // 彩色图和深度图
    vector<Eigen::Isometry3d> poses;         // 相机位姿

    ifstream fin("./data/pose.txt");
    if (!fin) {
        cerr << "cannot find pose file" << endl;
        return 1;

    for (int i = 0; i < 5; i++) {
        boost::format fmt("./data/%s/%d.%s"); //图像文件格式
        colorImgs.push_back(cv::imread((fmt % "color" % (i + 1) % "png").str()));
        depthImgs.push_back(cv::imread((fmt % "depth" % (i + 1) % "png").str(), -1)); // 使用-1读取原始图像

        double data[7] = {0};
        for (int i = 0; i < 7; i++) {
            fin >> data[i];
        Eigen::Quaterniond q(data[6], data[3], data[4], data[5]);
        Eigen::Isometry3d T(q);
        T.pretranslate(Eigen::Vector3d(data[0], data[1], data[2]));

    // 计算点云并拼接
    // 相机内参 
    double cx = 319.5;
    double cy = 239.5;
    double fx = 481.2;
    double fy = -480.0;
    double depthScale = 5000.0;

    cout << "正在将图像转换为点云..." << endl;

    // 定义点云使用的格式:这里用的是XYZRGB
    typedef pcl::PointXYZRGB PointT;
    typedef pcl::PointCloud<PointT> PointCloud;

    // 新建一个点云
    PointCloud::Ptr pointCloud(new PointCloud);
    for (int i = 0; i < 5; i++) {
        PointCloud::Ptr current(new PointCloud);
        cout << "转换图像中: " << i + 1 << endl;
        cv::Mat color = colorImgs[i];
        cv::Mat depth = depthImgs[i];
        Eigen::Isometry3d T = poses[i];
        for (int v = 0; v < color.rows; v++)
            for (int u = 0; u < color.cols; u++) {
                unsigned int d = depth.ptr<unsigned short>(v)[u]; // 深度值
                if (d == 0) continue; // 为0表示没有测量到
                Eigen::Vector3d point;
                point[2] = double(d) / depthScale;
                point[0] = (u - cx) * point[2] / fx;
                point[1] = (v - cy) * point[2] / fy;
                Eigen::Vector3d pointWorld = T * point;

                PointT p;
                p.x = pointWorld[0];
                p.y = pointWorld[1];
                p.z = pointWorld[2];
                p.b =[v * color.step + u * color.channels()];
                p.g =[v * color.step + u * color.channels() + 1];
                p.r =[v * color.step + u * color.channels() + 2];
        // depth filter and statistical removal 
        PointCloud::Ptr tmp(new PointCloud);
        pcl::StatisticalOutlierRemoval<PointT> statistical_filter;//去掉深度值无效的点
        statistical_filter.setMeanK(50); //过滤掉孤立的点
        (*pointCloud) += *tmp;

    pointCloud->is_dense = false;
    cout << "点云共有" << pointCloud->size() << "个点." << endl;

    // voxel filter 体素网格滤波器
    pcl::VoxelGrid<PointT> voxel_filter;
    double resolution = 0.03;  //体素网格滤波器的分辨率0.003 x 0.003 x 0.003
    voxel_filter.setLeafSize(resolution, resolution, resolution);       // resolution
    PointCloud::Ptr tmp(new PointCloud);

    cout << "滤波之后,点云共有" << pointCloud->size() << "个点." << endl;

    pcl::io::savePCDFileBinary("map.pcd", *pointCloud);
    return 0;

需要使用pcl工具:sudo apt-get install libpcl-dev plc-tools进行点云库的安装。

cmake_minimum_required(VERSION 3.4)

set(CMAKE_CXX_FLAGS "-std=c++14 -O2")

# opencv 
find_package(OpenCV 3.4 REQUIRED)

# eigen 

# pcl 
find_package(PCL REQUIRED)

add_executable(pointcloud_mapping pointcloud_mapping.cpp)
target_link_libraries(pointcloud_mapping ${OpenCV_LIBS} ${PCL_LIBRARIES})

SLAM第12讲 建图实践部分_第3张图片
SLAM第12讲 建图实践部分_第4张图片

class pcl: : MovingLeastSquares< PointlnT, PointOutT>
类 MovingLeastSquares 实现了基于移动最小二乘算法的点云平滑处理、数据重采样,并且可以计算优化的估计法线,其输入是点云数据,输出为经过用户设定参数对应的处理之后得到的平滑重采样点云

// typedefs
typedef pcl::PointXYZRGB PointT;
typedef pcl::PointCloud<PointT> PointCloud;
typedef pcl::PointCloud<PointT>::Ptr PointCloudPtr;
typedef pcl::PointXYZRGBNormal SurfelT;
typedef pcl::PointCloud<SurfelT> SurfelCloud;
typedef pcl::PointCloud<SurfelT>::Ptr SurfelCloudPtr;

SurfelCloudPtr reconstructSurface(
        const PointCloudPtr &input, float radius, int polynomial_order) {
    pcl::MovingLeastSquares<PointT, SurfelT> mls; //PointT决定了输入点云类型,SurfelT决定了输出点云类型(当法线标志位设置为true时,输出向量必须加上normals)  点云重建算法Moving Least Square
    pcl::search::KdTree<PointT>::Ptr tree(new pcl::search::KdTree<PointT>);
    mls.setSearchMethod(tree); //使用kdTree加速搜索
    mls.setSearchRadius(radius);  //设置搜索半径 radius ,确定多项式拟合时所用的邻域点进行 k 近邻搜索时所用的半径。
    mls.setComputeNormals(true);  //设置是否计算并存储点云对应的法线,参数为 true 则设置为是。
    mls.setSqrGaussParam(radius * radius);//设置近邻高斯权重系数 sqr_ gauss_ param , 一般设置成搜索半径的平方时效果最好
    mls.setPolynomialFit(polynomial_order > 1);//设置在进行估计法线时是否使用多项式拟合进行逼近,还是仅通过切线估计得到, polynomial_ fit 参数为 true 则设置为是 。
    mls.setPolynomialOrder(polynomial_order);//设置使用多项式拟合进行运算时所用的阶数 order .
    mls.setInputCloud(input);  //输入需要进行平滑滤波处理的点云
    SurfelCloudPtr output(new SurfelCloud);
    mls.process(*output);  //输出处理后的点云
    return (output);

pcl::PolygonMeshPtr triangulateMesh(const SurfelCloudPtr &surfels) {
    // Create search tree*
    pcl::search::KdTree<SurfelT>::Ptr tree(new pcl::search::KdTree<SurfelT>);

    // Initialize objects
    pcl::GreedyProjectionTriangulation<SurfelT> gp3;
    pcl::PolygonMeshPtr triangles(new pcl::PolygonMesh);

    // Set the maximum distance between connected points (maximum edge length)

    // Set typical values for the parameters
    gp3.setMaximumSurfaceAngle(M_PI / 4); // 45 degrees
    gp3.setMinimumAngle(M_PI / 18); // 10 degrees
    gp3.setMaximumAngle(2 * M_PI / 3); // 120 degrees

    // Get result

    return triangles;

int main(int argc, char **argv) {

    // Load the points
    PointCloudPtr cloud(new PointCloud);  //创建点云指针
    if (argc == 0 || pcl::io::loadPCDFile(argv[1], *cloud)) {  //读入PCD格式的文件
        cout << "failed to load point cloud!";
        return 1;
    cout << "point cloud loaded, points: " << cloud->points.size() << endl;

    // Compute surface elements
    cout << "computing normals ... " << endl;
    double mls_radius = 0.05, polynomial_order = 2;
    auto surfels = reconstructSurface(cloud, mls_radius, polynomial_order);

    // Compute a greedy surface triangulation
    cout << "computing mesh ... " << endl;
    pcl::PolygonMeshPtr mesh = triangulateMesh(surfels); //两个相机位姿和特征点在两个相机坐标系下的坐标,输出三角化后的特征点的3D坐标。

    cout << "display mesh ... " << endl;
    pcl::visualization::PCLVisualizer vis;
    vis.addPolylineFromPolygonMesh(*mesh, "mesh frame");
    vis.addPolygonMesh(*mesh, "mesh");

执行:./sufel_mapping map.pcd
SLAM第12讲 建图实践部分_第5张图片

  • 点云规模大,所以pcd文件也很大,640x480图像上有30万个点空间,需要大量存储空间。进过体素滤波后,还是很大,点云地图提供了一些细节(阴影)等,但是放在有限的空间中浪费,我们只要降低分辨率,才能在有限的空间中存储大规模环境,但是降低分辨率会导致图像质量下降。需要一种对图像进行压缩,可以舍弃重复信息的地图形式

  • 点云地图无法处理运动物体。我们只能添加点,而没有“当点消失时把它移除”的做法。在实际的环境中,运动物体的普遍存在,使得点云地图变得不够实用。

    三维空间建模为许多个小方块(体素)是一种常见方法。如果我们把一个小方块的每个面平均切成两片,那末每个小方块就变成同样大小的八个小方块。这个步骤可以不断重复,知道最后的方块大小达到建模的最高精度,。在这个过程中,把一个方块分成8个大小一样的小方块看成“一个节点展开成8个子节点”, 那么整个最大空间细到最小空间的过程,就是一个八叉树
    如叶子节点立方体大小为1, 10层树,建模体积大约是8的10次方 ——1073
    SLAM第12讲 建图实践部分_第6张图片
    假设用一个浮点数x [0, 1]来表达,一开始取0.5 , 如果不断的观测到它被占据,就让这个值不断增加,反之,如果不断观测到空白,就让他不断减小。通过这种方式,可以动态的建模地图中的障碍信息。不过,由于x的增加或减少会超出范围(其中0 或1 是占据或不被占据的含义,中间值是由于噪声影响会出现未知的情况),所以不直接用概率描述节点是否被占据,而用概率对数值来描述。
    SLAM第12讲 建图实践部分_第7张图片
    安装octmap库,八叉树地图和对应的可视化工具octovis在该库中:sudo apt-get install liboctomap-dev octovis


int main(int argc, char **argv) {
    vector<cv::Mat> colorImgs, depthImgs;    // 彩色图和深度图
    vector<Eigen::Isometry3d> poses;         // 相机位姿

    ifstream fin("../data/pose.txt");
    if (!fin) {
        cerr << "cannot find pose file" << endl;
        return 1;

    for (int i = 0; i < 5; i++) {
        boost::format fmt("../data/%s/%d.%s"); //图像文件格式
        colorImgs.push_back(cv::imread((fmt % "color" % (i + 1) % "png").str()));
        depthImgs.push_back(cv::imread((fmt % "depth" % (i + 1) % "png").str(), -1)); // 使用-1读取原始图像

        double data[7] = {0};
        for (int i = 0; i < 7; i++) {
            fin >> data[i];
        Eigen::Quaterniond q(data[6], data[3], data[4], data[5]);
        Eigen::Isometry3d T(q);
        T.pretranslate(Eigen::Vector3d(data[0], data[1], data[2]));

    // 计算点云并拼接
    // 相机内参 
    double cx = 319.5;
    double cy = 239.5;
    double fx = 481.2;
    double fy = -480.0;
    double depthScale = 5000.0;

    cout << "正在将图像转换为 Octomap ..." << endl;

    // octomap tree 
    octomap::OcTree tree(0.01); // 参数为分辨率

    for (int i = 0; i < 5; i++) {
        cout << "转换图像中: " << i + 1 << endl;
        cv::Mat color = colorImgs[i];
        cv::Mat depth = depthImgs[i];
        Eigen::Isometry3d T = poses[i];

        octomap::Pointcloud cloud;  // the point cloud in octomap 

        for (int v = 0; v < color.rows; v++)
            for (int u = 0; u < color.cols; u++) {
                unsigned int d = depth.ptr<unsigned short>(v)[u]; // 深度值
                if (d == 0) continue; // 为0表示没有测量到
                Eigen::Vector3d point;
                point[2] = double(d) / depthScale;
                point[0] = (u - cx) * point[2] / fx;
                point[1] = (v - cy) * point[2] / fy;
                Eigen::Vector3d pointWorld = T * point;
                // 将世界坐标系的点放入点云
                cloud.push_back(pointWorld[0], pointWorld[1], pointWorld[2]);

        // 将点云存入八叉树地图,给定原点,这样可以计算投射线
        tree.insertPointCloud(cloud, octomap::point3d(T(0, 3), T(1, 3), T(2, 3)));

    // 更新中间节点的占据信息并写入磁盘
    cout << "saving octomap ... " << endl;
    return 0;

SLAM第12讲 建图实践部分_第8张图片
octovis octomap.bt命令进行 可视化查看:按“1”键可以根据高度信息进行染色。
SLAM第12讲 建图实践部分_第9张图片
