3d2d代码中的一些解读

cmakelists:

cmake_minimum_required(VERSION 3.7)
project(pose_estimation_3d2d)

set(CMAKE_CXX_STANDARD 11)

list(APPEND CMAKE_MODULE_PATH /home/roibn/install/g2o-master/cmake_modules)

find_package( OpenCV 3.1 REQUIRED )
find_package( G2O REQUIRED )
find_package( CSparse REQUIRED )

include_directories(
        ${OpenCV_INCLUDE_DIRS}
        ${G2O_INCLUDE_DIRS}
        ${CSPARSE_INCLUDE_DIR}
        "/usr/include/eigen3/"
)

set(SOURCE_FILES main.cpp)
add_executable(pose_estimation_3d2d ${SOURCE_FILES})
target_link_libraries( pose_estimation_3d2d
        ${OpenCV_LIBS}
        ${CSPARSE_LIBRARY}
        g2o_core g2o_stuff g2o_types_sba g2o_csparse_extension
        )

代码:

#include 
#include 
#include 
#include 
#include 
#include 
#include 
#include 
#include 
#include 
#include 
#include 
#include 

using namespace std;
using namespace cv;

//特征点匹配,传入两张图像,两张图像对应的特征点,最后生成的匹配存入matches数组
void find_feature_matches (
        const Mat& img_1, const Mat& img_2,
        std::vector& keypoints_1,
        std::vector& keypoints_2,
        std::vector< DMatch >& matches );

//像素坐标到归一化平面坐标
Point2d pixel2cam ( const Point2d& p, const Mat& K );

//BA优化
void bundleAdjustment (
        const vector points_3d,
        const vector points_2d,
        const Mat& K,
        Mat& R,
        Mat& t
);


int main(int argc, char** argv)
{
    if ( argc != 5 )
    {
        cout<<"usage: pose_estimation_3d2d img1 img2 depth1 depth2"<return 1;
    }

    //-- 读取图像
    Mat img_1 = imread ( argv[1], CV_LOAD_IMAGE_COLOR );
    Mat img_2 = imread ( argv[2], CV_LOAD_IMAGE_COLOR );

    vector keypoints_1, keypoints_2;
    vector matches;
    find_feature_matches ( img_1, img_2, keypoints_1, keypoints_2, matches );
    cout<<"图一找到"<"个关键点"<cout<<"图二找到"<"个关键点"<cout<<"筛选后一共"<"组匹配点"<// 建立3D点
    Mat d1 = imread ( argv[3], CV_LOAD_IMAGE_UNCHANGED );       // 深度图为16位无符号数,单通道图像
    Mat K = (Mat_<double>(3, 3) << 520.9, 0, 325.1, 0, 521.0, 249.7, 0, 0, 1);
    vector pts_3d;
    vector pts_2d;
    for ( DMatch m:matches )
    {
        //这一步应该是取得匹配点的深度,queryIdx查询描述子索引,pt关键点的坐标
        cout<<"输出索引为:"<unsigned short> (int ( keypoints_1[m.queryIdx].pt.y )) [ int ( keypoints_1[m.queryIdx].pt.x ) ];
        if ( d == 0 )   // bad depth
            continue;
        float dd = float(d/1000.0);
        Point2d p1 = pixel2cam ( keypoints_1[m.queryIdx].pt, K );
        pts_3d.push_back ( Point3f ( float(p1.x*dd), float(p1.y*dd), dd ) );
        pts_2d.push_back ( keypoints_2[m.trainIdx].pt );
    }

    cout<<"3d-2d pairs: "<false ); // 调用OpenCV 的 PnP 求解,可选择EPNP,DLS等方法
    Mat R;
    cv::Rodrigues ( r, R ); // r为旋转向量形式,用Rodrigues公式转换为矩阵

    cout<<"R="<cout<<"t="<cout<<"calling bundle adjustment"<return 0;
}

void find_feature_matches ( const Mat& img_1, const Mat& img_2,
                            std::vector& keypoints_1,
                            std::vector& keypoints_2,
                            std::vector< DMatch >& matches )
{
    //-- 初始化
    //Mat类型描述子,表征描述子也是图像矩阵的形式
    Mat descriptors_1, descriptors_2;
    // used in OpenCV3
    Ptr detector = ORB::create();
    Ptr descriptor = ORB::create();
    // use this if you are in OpenCV2
    // Ptr detector = FeatureDetector::create ( "ORB" );
    // Ptr descriptor = DescriptorExtractor::create ( "ORB" );
    Ptr matcher  = DescriptorMatcher::create ( "BruteForce-Hamming" );
    //-- 第一步:检测 Oriented FAST 角点位置
    detector->detect ( img_1,keypoints_1 );
    detector->detect ( img_2,keypoints_2 );

    //-- 第二步:根据角点位置计算 BRIEF 描述子
    descriptor->compute ( img_1, keypoints_1, descriptors_1 );
    descriptor->compute ( img_2, keypoints_2, descriptors_2 );

    //-- 第三步:对两幅图像中的BRIEF描述子进行匹配,使用 Hamming 距离
    vector match_array;
    // BFMatcher matcher ( NORM_HAMMING );
    matcher->match ( descriptors_1, descriptors_2, match_array );
    cout<<"未筛选一共有"<"组匹配点"<//-- 第四步:匹配点对筛选
    double min_dist=10000, max_dist=0;

    //找出所有匹配之间的最小距离和最大距离, 即是最相似的和最不相似的两组点之间的距离
    for ( int i = 0; i < descriptors_1.rows; i++ )
    {
        double dist = match_array[i].distance;
        if ( dist < min_dist ) min_dist = dist;
        if ( dist > max_dist ) max_dist = dist;
    }

    printf ( "-- Max dist : %f \n", max_dist );
    printf ( "-- Min dist : %f \n", min_dist );

    //当描述子之间的距离大于两倍的最小距离时,即认为匹配有误.但有时候最小距离会非常小,设置一个经验值30作为下限.
    for ( int i = 0; i < descriptors_1.rows; i++ )
    {
        if ( match_array[i].distance <= max ( 2*min_dist, 30.0 ) )
        {
            matches.push_back ( match_array[i] );
        }
    }
}

Point2d pixel2cam ( const Point2d& p, const Mat& K )
{
    return Point2d
            (
                    ( p.x - K.at<double> ( 0,2 ) ) / K.at<double> ( 0,0 ),
                    ( p.y - K.at<double> ( 1,2 ) ) / K.at<double> ( 1,1 )
            );
}

void bundleAdjustment (
        const vector< Point3f > points_3d,
        const vector< Point2f > points_2d,
        const Mat& K,
        Mat& R,
        Mat& t)
{
    // 初始化g2o
    typedef g2o::BlockSolver< g2o::BlockSolverTraits<6,3> > Block;  // pose 维度为 6, landmark 维度为 3
    Block::LinearSolverType* linearSolver = new g2o::LinearSolverCSparse(); // 线性方程求解器
    Block* solver_ptr = new Block ( linearSolver );     // 矩阵块求解器
    g2o::OptimizationAlgorithmLevenberg* solver = new g2o::OptimizationAlgorithmLevenberg ( solver_ptr );
    g2o::SparseOptimizer optimizer;
    optimizer.setAlgorithm ( solver );

    // 定义并添加各种顶点vertex,这里的顶点有一个相机位姿和许多路标
    //添加一个相机位姿camera pose。给这个pose设置Id为0:pose->setId(0);
    //optimizer.addVertex()
    g2o::VertexSE3Expmap* pose = new g2o::VertexSE3Expmap();//貌似这句有问题,但是并没有看出来啥问题,会报错Process finished with exit code 139 (interrupted by signal 11: SIGSEGV)
    Eigen::Matrix3d R_mat;
    R_mat <<
          R.at<double> ( 0,0 ), R.at<double> ( 0,1 ), R.at<double> ( 0,2 ),
            R.at<double> ( 1,0 ), R.at<double> ( 1,1 ), R.at<double> ( 1,2 ),
            R.at<double> ( 2,0 ), R.at<double> ( 2,1 ), R.at<double> ( 2,2 );
    pose->setId ( 0 );
    pose->setEstimate(g2o::SE3Quat(R_mat, Eigen::Vector3d(t.at<double>(0, 0), t.at<double>(1, 0), t.at<double>(2, 0))));
    optimizer.addVertex ( pose );

    //添加许多路标点landmarks,每个路标点设置一个ID。
    //optimizer.addVertex()
    int index = 1;
    for ( const Point3f p:points_3d )
    {
        g2o::VertexSBAPointXYZ* point = new g2o::VertexSBAPointXYZ();
        point->setId ( index++ );
        point->setEstimate ( Eigen::Vector3d ( p.x, p.y, p.z ) );
        point->setMarginalized ( true ); // g2o 中必须设置 marg 参见第十讲内容
        optimizer.addVertex ( point );
    }


    //添加相机参数.optimizer.addParameter(). parameter: camera intrinsics
    g2o::CameraParameters* camera = new g2o::CameraParameters (K.at<double>(0, 0), Eigen::Vector2d(K.at<double>(0, 2), K.at<double>(1, 2)), 0);
    camera->setId ( 0 );
    optimizer.addParameter ( camera );

    // 添加许多边edges: optimizer.addEdge()
    index = 1;
    for ( const Point2f p:points_2d )
    {
        g2o::EdgeProjectXYZ2UV* edge = new g2o::EdgeProjectXYZ2UV();
        edge->setId ( index );
        edge->setVertex ( 0, dynamic_cast ( optimizer.vertex ( index ) ) );
        edge->setVertex ( 1, pose );
        edge->setMeasurement ( Eigen::Vector2d ( p.x, p.y ) );
        edge->setParameterId ( 0,0 );
        edge->setInformation ( Eigen::Matrix2d::Identity() );
        optimizer.addEdge ( edge );
        index++;
    }

    optimizer.setVerbose ( true );
    optimizer.initializeOptimization();
    optimizer.optimize ( 100 );

    cout<"after optimization:"<cout<<"T="<estimate()).matrix()<

这里说一下,程序最后没有跑通,报错:Process finished with exit code 139 (interrupted by signal 11: SIGSEGV)。瞅着是段错误,逐条添加编译运行,发现到BA函数定义里的:
g2o::VertexSE3Expmap* pose = new g2o::VertexSE3Expmap();
这一句时就会报错,没有的话上方的pnp是能跑出来结果的。
实验了一下,用别的电脑跑没问题,应该是环境配置问题。注释掉BA函数定义和主函数中最后调用BA函数那句,可以运行。

main函数中,主要卡在了这一句:

ushort d = d1.ptr (int ( keypoints_1[m.queryIdx].pt.y )) [ int ( keypoints_1[m.queryIdx].pt.x ) ];

先看一下这个m的类型:DMatch,是个什么来头:

/*
 * Struct for matching: query descriptor index, train descriptor index, train image index and distance between descriptors.
 */ 
 /*
  * DMatch主要用来储存匹配信息的结构体,query是要匹配的描述子,train是被匹配的描述子,在Opencv中进行匹配时
  * void DescriptorMatcher::match( const Mat& queryDescriptors, const Mat& trainDescriptors, vector& matches, const Mat& mask ) const
  * match函数的参数中位置在前面的为query descriptor,后面的是 train descriptor
  * 例如:query descriptor的数目为20,train descriptor数目为30,则DescriptorMatcher::match后的vector的size为20
  * 若反过来,则vector的size为30
  * 
 */ 
struct CV_EXPORTS_W_SIMPLE DMatch 
{ 
    //默认构造函数,FLT_MAX是无穷大 
    //#define FLT_MAX         3.402823466e+38F        /* max value */ 
    CV_WRAP DMatch() : queryIdx(-1), trainIdx(-1), imgIdx(-1), distance(FLT_MAX) {} 
    //DMatch构造函数 
    CV_WRAP DMatch( int _queryIdx, int _trainIdx, float _distance ) : 
            queryIdx(_queryIdx), trainIdx(_trainIdx), imgIdx(-1), distance(_distance) {} 
    //DMatch构造函数 
    CV_WRAP DMatch( int _queryIdx, int _trainIdx, int _imgIdx, float _distance ) : 
            queryIdx(_queryIdx), trainIdx(_trainIdx), imgIdx(_imgIdx), distance(_distance) {} 

    //queryIdx为query描述子的索引,match函数中前面的那个描述子 
    CV_PROP_RW int queryIdx; // query descriptor index 
    //trainIdx为train描述子的索引,match函数中后面的那个描述子 
    CV_PROP_RW int trainIdx; // train descriptor index 
    //imgIdx为进行匹配图像的索引 
    //例如已知一幅图像的sift描述子,与其他十幅图像的描述子进行匹配,找最相似的图像,则imgIdx此时就有用了。 
    CV_PROP_RW int imgIdx;   // train image index 
    //distance为两个描述子之间的距离 
    CV_PROP_RW float distance; 
    //DMatch比较运算符重载,比较的是DMatch中的distance,小于为true,否则为false 
    // less is better 
    bool operator<( const DMatch &m ) const 
    { 
        return distance < m.distance; 
    } 
};  

上面这段是摘抄的。

也就是说,在find_feature_matches函数中有一句:

matcher->match ( descriptors_1, descriptors_2, match_array );


利用Mat类型的descriptors_1和Mat类型的descriptors_2,计算出一个匹配点数组,这个数组的元素类型是DMatch类型的(也就是main函数中卡的那句里面的m,就是一个DMatch类型的)。这步计算中,数组中的DMatch类型元素,下面有几个信息被记住了。其中就有这个queryIdx,描述子在match_array中的索引,这是一个属性值,在计算时就计算完被存储起来了。

2017/10/14回看,这里做一些新的理解:上面括起来一段写的比较乱,当时还不是特别明白。其实很简单的道理:match匹配是两个Descriptors的匹配,匹配完信息中,有queryIdx和trainIdx,queryIdx为这个匹配在前描述子中的索引,trainIdx就为后描述子的索引了。为什么要有索引,因为两个描述子的量可能不一样,所以要对应一下。举个例子就有可能:某个Dmatch是前1配后2配出来的,或者是前100配后105配出来的,所以要用索引定位。
那至于match匹配得到的结果数组中Dmatch的个数,也就是进行match到底我要得到多少个Dmatch呢?这是另外一个问题了跟上面的索引不搭边的。从上面摘抄可看出,那就简单的跟第一张图的描述子个数一样吧,所以这里也看出来,匹配结果中Dmatch个数是跟第二张图中的描述子个数(const Mat& trainDescriptors)没关系的。

继续看,
image1通过detect()得到vector类型的keypoints,再通过compute()得到Mat类型的descriptors,然后,match()得到DMatch类型的数组。
这整个过程中,假设第一步找出了500个keypoints,那么后面,必定会有对应的500个descriptor(只是这些descriptor都是在图上的,所以整一个为Mat类型),到这里,这500个descriptor最后有多少个DMatch我不知道, 但是我知道的是,每个Dmatch记录下来的queryIdx信息中有它在原来descriptor中的索引,所以取得这个索引就取得了keypoint的索引,然后再用.pt取得坐标值就好了。

matcher->match ( descriptors_1, descriptors_2, match_array );

时,就记下来了。

再回头看这一句:

ushort d = d1.ptr (int ( keypoints_1[m.queryIdx].pt.y )) [ int ( keypoints_1[m.queryIdx].pt.x ) ];

m.queryIdx得到这个Dmatch是用第几个descriptor算出来的,也就是descriptors索引,由于descriptors索引一一对应keypoints(因为每个keypoint都会计算出一个descriptor),所以可以用来寻找对应的keypoint,再利用.pt,求得keypoint的坐标,进而(.y)[.x]定位像素位置,取得像素值,也就是单通道深度图里的深度值。
这其中m.queryIdx索引,跟for ( DMatch m:matches )这句中的m在matches中的索引没点关系,而且是不是基于范围的for循环就没有索引这么一说吧。
也就是说如何获取m在matches数组中的位置?
最后从添加的输出可以看出来,500个keypoint,500个match,m.queryIdx也是分布在0-500中间,而筛选后的matches数组只有79个元素,也就是79对匹配点。

你可能感兴趣的:(14讲程序注释,SLAM)