SLAM||DUNK

ORB-SLAM2 关键问题之特征提取

ORBSLAM2-特征提取

- 1、流程
- 2、特征点
- 3、构造函数
- 4、operator()
- - 4.1 computeDescriptors()
  - 4.1、ComputePyramid() 计算图像金子塔
  - 4.2、ComputeKeyPointsOctTree()
  - - 4.2.1、DistributeOctTree()
    - - 4.2.1.1、DivideNode()

1、流程

1、Tracking对象被构造时，创建了特征提取器对象。
在创建System对象的构造函数内，创建了Tracking对象，而在Tracking对象的构造函数中，创建了特征提取器对象。 Tracking类中声明了几个特征提取器对象：

///作者自己编写和改良的ORB特征点提取器
ORBextractor* mpORBextractorLeft, *mpORBextractorRight;
///在初始化的时候使用的特征点提取器,其提取到的特征点个数会更多
ORBextractor* mpIniORBextractor;

这几个特征提取器对象在Tracking的构造函数中完成初始化：

// tracking过程都会用到mpORBextractorLeft作为特征点提取器
mpORBextractorLeft = new ORBextractor(
    nFeatures,      
    fScaleFactor,
    nLevels,
    fIniThFAST,
    fMinThFAST);

// 如果是双目，tracking过程中还会用用到mpORBextractorRight作为右目特征点提取器
if(sensor==System::STEREO)
    mpORBextractorRight = new ORBextractor(nFeatures,fScaleFactor,nLevels,fIniThFAST,fMinThFAST);

// 在单目初始化的时候，会用mpIniORBextractor来作为特征点提取器      可以看到  提取的特征点数量是原来的2倍  
if(sensor==System::MONOCULAR)
    mpIniORBextractor = new ORBextractor(2*nFeatures,fScaleFactor,nLevels,fIniThFAST,fMinThFAST);

可以看到在单目中，mpIniORBextractor提取器比mpORBextractorLeft提取器多提取一倍的特征点。

2、在创建Frame时，利用特征提取器对象进行特征提取
Frame构造函数中，传入了在构造Tracking时创建的特征提取器对象mpIniORBextractor和mpORBextractorLeft。在Frame构造函数中，又是通过ExtractORB()函数提取特征点的,
ExtractORB()函数中通过调用ORBextractor::operator()来提取特征点和描述子，
对于单目和RGBD相机，提取的特征点放在mvKeys中，描述子放在mDescriptors。

2、特征点

说了这么久的特征点，那么这个特征点到底是什么呢？特征点的定义如下。
ORBSLAM2中提取的特征点都是cv::KeyPoint类型的，这个类型里面有什么呢,查看声明可以看到

CV_PROP_RW Point2f pt; // 提取特征点的坐标
CV_PROP_RW float size; // 大小，或者特征点的范围
CV_PROP_RW float angle; // 特征点的方向
                        //!< it's in [0,360) degrees and measured relative to
                        //!< image coordinate system, ie in clockwise.
CV_PROP_RW float response; // 特征点的响应强度 响应越大特征点越好
CV_PROP_RW int octave; // 提取出来所在金子塔的层数
CV_PROP_RW int class_id; //!< object class (if the keypoints need to be clustered by an object they belong to)

这里面 pt, size, angle, octave 是我们在后面的特征提取过程需要自己设置的，response则是在求特征点时直接计算出来的。

3、构造函数

先从构造函数开始分析：

ORBextractor::ORBextractor(int _nfeatures, float _scaleFactor, int _nlevels,
int _iniThFAST, int _minThFAST):nfeatures(_nfeatures), scaleFactor(_scaleFactor), 
nlevels(_nlevels),iniThFAST(_iniThFAST), minThFAST(_minThFAST)

参数： nfeatures：提取的特征点总数，单目初始化时是2000, 其他时候以及双目\RGBD都是1000。
scaleFactor：层与层间的缩放系数，默认是1.2
nlevels：金字塔层数，8
iniThFAST：FAST阈值 10 minThFAST：FAST阈值 5

流程：先明确几个Vector和变量的作用。
mvScaleFactor：存放各层相对与原始图片的缩放倍数的容器。
mvLevelSigma2：为 mvScaleFactor 的平方。
mvInvScaleFactor：缩放倍数的倒数，相当于当前层与原始层的百分比。
mvInvLevelSigma2： mvInvScaleFactor的平方。
mvImagePyramid：储存各层图片的金字塔。
mnFeaturesPerLevel：金字塔中每层图像特征点的数量。
函数实现：

// ORB特征提取的构造函数                                        
ORBextractor::ORBextractor(int _nfeatures, float _scaleFactor, int _nlevels,
         int _iniThFAST, int _minThFAST):
    nfeatures(_nfeatures), scaleFactor(_scaleFactor), nlevels(_nlevels),
    iniThFAST(_iniThFAST), minThFAST(_minThFAST)
{
  //*********************** 计算每层缩放倍数的值 mvScaleFactor保存每层图像相对与原始图像的放大倍数 ****************
  // mvLevelSigma2为mvScaleFactor的平方
    mvScaleFactor.resize(nlevels);
    mvLevelSigma2.resize(nlevels);
    mvScaleFactor[0]=1.0f;
    mvLevelSigma2[0]=1.0f;
    for(int i=1; i<nlevels; i++)
    {   // scaleFactor: 1.2    后一层是前一层的1.2倍
        mvScaleFactor[i]=mvScaleFactor[i-1]*scaleFactor;       // 计算第i层的缩放倍数  越高层倍数越大，也就是实际图片越小
        mvLevelSigma2[i]=mvScaleFactor[i]*mvScaleFactor[i];    // 取平方    有什么用？？？？？？？
    }
    // 计算倍数的倒数
    mvInvScaleFactor.resize(nlevels);
    mvInvLevelSigma2.resize(nlevels);
    for(int i=0; i<nlevels; i++)
    {
        mvInvScaleFactor[i]=1.0f/mvScaleFactor[i];
        mvInvLevelSigma2[i]=1.0f/mvLevelSigma2[i];
    }

    mvImagePyramid.resize(nlevels);      // 容器resize为金字塔的层数   
     /***********************************计算每层的特征点数量  mnFeaturesPerLevel**************************************/
    mnFeaturesPerLevel.resize(nlevels);  // mnFeaturesPerLevel保存每层特征点的数量 容量为金字塔层数 
    float factor = 1.0f / scaleFactor;   // 放大率的倒数
    /* 求第一层图像的特征点的数量   因为特征点应该在金字塔所有层均匀分布，所以每层的特征点数量与图像大小成正比，而知道所有层特征点的总数为nfeatures，所以可以求出每一层的特征点数量
     每层特征点的数量成等比数列 比值为factor  根据等比求和公式 Sn = a1*(1-q^n)/(1-q) => a1 = Sn*(1-q)/(1-q^n)  */
    float nDesiredFeaturesPerScale = nfeatures*(1 - factor)/(1 - (float)pow((double)factor, (double)nlevels));
    
    int sumFeatures = 0;
    // 求取每层的特征点的数量
    for( int level = 0; level < nlevels-1; level++ )   // 0-6
    {
        mnFeaturesPerLevel[level] = cvRound(nDesiredFeaturesPerScale); // cvRound()求取最接近的整数
        sumFeatures += mnFeaturesPerLevel[level];     // 特征点求和
        nDesiredFeaturesPerScale *= factor;           // 乘以缩放系数
    }
    // 最后一层的特征点数量单独赋值  这样能保证总数为nfeatures
    mnFeaturesPerLevel[nlevels-1] = std::max(nfeatures - sumFeatures, 0);
    /*******************************为计算breif描述子准备采样点的pattern**********************/
    const int npoints = 512;                                // 256对点   
    const Point* pattern0 = (const Point*)bit_pattern_31_;  // 数组名强制转换为指向Point的常量指针 Point = Point_模板类
    // 将512个点复制到pattern容器中  
    std::copy(pattern0, pattern0 + npoints, std::back_inserter(pattern));    
    
    /************************计算patch圆不同高度v时的横截线的长度  用于计算特征点方向时使用***************************/
    //This is for orientation
    // pre-compute the end of a row in a circular patch
    umax.resize(HALF_PATCH_SIZE + 1);         // HALF_PATCH_SIZE = 15
    
    // vmax当角度为45度时，最大的横截线长度
    int v, v0, vmax = cvFloor(HALF_PATCH_SIZE * sqrt(2.f) / 2 + 1);  // cvFloor()返回不大于参数的最大整数值   11
    //  int vmin = cvCeil(HALF_PATCH_SIZE * sqrt(2.f) / 2);              // cvCeil(）返回不小于参数的最小整数值
    int vmin = vmax+1;                                                 // 12
    const double hp2 = HALF_PATCH_SIZE*HALF_PATCH_SIZE;              // 半径的平方
    // 先计算高度从v到vmax处各处的横截长度   即高度为0-11的长度
    for (v = 0; v <= vmax; ++v)                  // v = 0,1,2,3,4,5....11
        umax[v] = cvRound(sqrt(hp2 - v * v));    // 通过勾股定理计算 这里取最小整数  

    // 计算高度从15-12 横截长度  
    // 根据对称性  
    for (v = HALF_PATCH_SIZE, v0 = 0; v >= vmin; --v)   
    {
        // 求出umax
        while (umax[v0] == umax[v0 + 1])    
            ++v0;
        umax[v] = v0;
        ++v0;
    }
}

构造函数最后面实现的是用于计算特征点方向的PATCH圆(代码有改动)，这个圆的半径为15，直径31，通过上面的计算构造的PATCH圆的结构如下图

应该很明显能看出对称性。

4、operator()

输入图像_image的特征点与描述子的计算就是通过这个函数完成的。

// 计算ORB特征的括号重载   
// InputArray:这个类只能作为函数的形参参数使用，不要试图声明一个InputArray类型的变量, InputArray这个接口类可以是Mat、Mat_、Mat_、vector、vector>、vector
// OutputArray是InputArray的派生类。使用时需要注意的问题和InputArray一样。和InputArray不同的是，需要注意在使用OutputArray：：getMat（）之前一定要调用OutputArray：：create（）为矩阵分配空间。
void ORBextractor::operator()( InputArray _image, InputArray _mask, vector<KeyPoint>& _keypoints,
OutputArray _descriptors)

参数： _image：输入图片 _keypoints：储存最终检测出来的特征点的容器 _descriptors ：输出的描述子

这里注意一下InputArray和OutputArray 的使用， InputArray和OutputArray是接口类，且OutputArray是InputArray的派生类，他们能接收Mat、Mat_、Mat_、vector、vector、vector类型的参数，对于InputArray类型的变量，可以通过getMat()获取Mat值，不过OutputArray的变量，还需要先用create()创建空间，然后再getMat()获取其Mat值。另外，
InputArray和OutputArray只能用于作为函数的行参，不能用它来定义实际的变量。参考链接。

该函数的具体实现如下：

void ORBextractor::operator()( InputArray _image, InputArray _mask, vector<KeyPoint>& _keypoints,
                      OutputArray _descriptors)
{ 
    if(_image.empty())
        return;
    //  InputArray输出Mat
    Mat image = _image.getMat();
    // 检测像素是否为CV_8UC1类型    即必须要是灰度图
    assert(image.type() == CV_8UC1 );
    // Pre-compute the scale pyramid  构建高斯金字塔   
    ComputePyramid(image);
    vector < vector<KeyPoint> > allKeypoints;    // 建立储存高斯金字塔中全部特征点的vector
    ComputeKeyPointsOctTree(allKeypoints);       // 计算Keypoints  并生成四叉树
    Mat descriptors;                             // 描述子
    int nkeypoints = 0;
    // 求取所有层的总特征点数
    for (int level = 0; level < nlevels; ++level)
        nkeypoints += (int)allKeypoints[level].size();      // 求和
    if( nkeypoints == 0 )
        _descriptors.release();
    else
    {   
        _descriptors.create(nkeypoints, 32, CV_8U);   // 创建一个行为nkeypoints 列为32的CV_8U矩阵
        descriptors = _descriptors.getMat();          // 将这个矩阵转为Mat
    }

    _keypoints.clear();
    _keypoints.reserve(nkeypoints);       // 创建能保存所有特征点的Vector   reserve()用于创建一个储存区 

    int offset = 0;
    // 遍历高斯金子塔所有层
    // 这个for循环主要完成： 1、求取所有特征点的描述子  2、将所有特征点的坐标转换到原始图片中
    for (int level = 0; level < nlevels; ++level)   
    {
        //××××××××××××××××× 取本层特征点 ×××××××××××××××××××××××        
        vector<KeyPoint>& keypoints = allKeypoints[level];   // 取出第level层的特征点   KeyPoint的Vector
        int nkeypointsLevel = (int)keypoints.size();         // 获取该层特征点数

        if(nkeypointsLevel==0)                               // 本层没有特征点
            continue;
        //*****************计算本层特征点的描述子*****************
        // preprocess the resized image
        Mat workingMat = mvImagePyramid[level].clone();  // 取出该层图片
	// 高斯模糊   高斯核7×7  方差2
        GaussianBlur(workingMat, workingMat, Size(7, 7), 2, 2, BORDER_REFLECT_101);

        // 计算描述子 Compute the descriptors
        Mat desc = descriptors.rowRange(offset, offset + nkeypointsLevel);    // 取出offset--(offset + nkeypointsLevel-1)行组成Mat    
        computeDescriptors(workingMat, keypoints, desc, pattern);             // 计算描述子

        offset += nkeypointsLevel;                                            // 移动到下一层
        /******************将本层的特征点坐标转换到原始图片中  这里即尺度不变性的核心********************************
	 ******************从这也能看出，一幅图片的特征点，其实是整个不同尺度的图片的特征点的集合**********************/
	
        // Scale keypoint coordinates    根据尺度关系转换特征点的坐标
        if (level != 0)    // 原始层就不用转了
        {
            float scale = mvScaleFactor[level]; //getScale(level, firstLevel, scaleFactor);   获取该层相比与原始层的缩小倍数
            // 遍历本层所有特征点
            for (vector<KeyPoint>::iterator keypoint = keypoints.begin(),
                 keypointEnd = keypoints.end(); keypoint != keypointEnd; ++keypoint)
	        // 坐标乘以缩小倍数 将坐标转换到原始图片
                keypoint->pt *= scale;     // 坐标放大到原始坐标系中
        }
        
        // And add the keypoints to the output   将本层金字塔转换坐标后的特征点插入到_keypoints容器中
        _keypoints.insert(_keypoints.end(), keypoints.begin(), keypoints.end());   // insert()这里的用法是  将迭代器[keypoints.begin(),keypoints.end())之间的元素插入到_keypoints.end()的位置
    }
}

上面总结下来可以分成3步：
1、输入图像构建图像金子塔 ComputePyramid(image)
构造的金字塔保存在 mvImagePyramid 容器中。
2、计算特征点，同时通过四叉树进行处理 ComputeKeyPointsOctTree(allKeypoints)
处理的结果放置在 allKeypoints 容器。
遍历图像金字塔的每一层：
3、计算该层特征点的描述子（特征点的描述子是一个256位的二进制数）
计算描述子流程：
1、遍历每一层图片,并获取该层图片的特征点容器.
2 对图片进行高斯滤波, 接着调用computeDescriptors()计算描述子.
4 将该层图片的特征点乘以尺度转换到原始图片上,

可以看到这个函数内部用到了很多其他的内部功能函数，下面一步一步分析。

4.1 computeDescriptors()

// 对图像金子塔的一层图片求描述子
static void computeDescriptors(const Mat& image, vector<KeyPoint>& keypoints, Mat& descriptors,
                               const vector<Point>& pattern)
{  // 储存描述子的mat   每一个描述子为一行   每一行 32*8 = 256位
    descriptors = Mat::zeros((int)keypoints.size(), 32, CV_8UC1);
    // 遍历全部特征点  
    for (size_t i = 0; i < keypoints.size(); i++)     
        // 为该特征点计算描述子     结果放在 descriptors的第i行
        computeOrbDescriptor(keypoints[i], image, &pattern[0], descriptors.ptr((int)i));
}

提取描述子的 pattern 由 bit_pattern_31_[]数组构造, 一共有256对点,点的坐标是通过学习的方法在一个直径为31的Patch中提取出的.
computeOrbDescriptor()的流程:
1 首先根据特征点的方向对采样的Patch进行旋转,这是实现方向不变性的关键.

 // 获取该特征点的方向      在之前的ComputeKeyPointsOctTree()函数中就计算出来了 
 float angle = (float)kpt.angle*factorPI;
 float a = (float)cos(angle), b = (float)sin(angle);
 // 该特征点中心像素的指针  
 const uchar* center = &img.at<uchar>(cvRound(kpt.pt.y), cvRound(kpt.pt.x));
 const int step = (int)img.step;
 // 对pattern中第idx个点的坐标按照特征点方向进行旋转, 获取旋转后的像素值   
 #define GET_VALUE(idx) \
     center[cvRound(pattern[idx].x*b + pattern[idx].y*a)*step + \
            cvRound(pattern[idx].x*a - pattern[idx].y*b)]

2 旋转后进行采样, 一共 8*32 = 256对点.

// 8×32位    
for (int i = 0; i < 32; ++i, pattern += 16)
{  
    int t0, t1, val;
    t0 = GET_VALUE(0); t1 = GET_VALUE(1);      
    val = t0 < t1;
    t0 = GET_VALUE(2); t1 = GET_VALUE(3);
    val |= (t0 < t1) << 1;
    t0 = GET_VALUE(4); t1 = GET_VALUE(5);
    val |= (t0 < t1) << 2;
    t0 = GET_VALUE(6); t1 = GET_VALUE(7);
    val |= (t0 < t1) << 3;
    t0 = GET_VALUE(8); t1 = GET_VALUE(9);
    val |= (t0 < t1) << 4;
    t0 = GET_VALUE(10); t1 = GET_VALUE(11);
    val |= (t0 < t1) << 5;
    t0 = GET_VALUE(12); t1 = GET_VALUE(13);
    val |= (t0 < t1) << 6;
    t0 = GET_VALUE(14); t1 = GET_VALUE(15);
    val |= (t0 < t1) << 7;

    desc[i] = (uchar)val;
}

4.1、ComputePyramid() 计算图像金子塔

这个函数感觉原代码写的太冗余了，我简化了一下，不影响实际效果，现在这个实现就精简多了。

void ORBextractor::ComputePyramid(cv::Mat image)
{
  for(int level = 0; level < nlevels; ++level)
  {
     float scale = mvInvScaleFactor[level];         // 获取尺寸的缩放系数    <1        
     Size sz(cvRound((float)image.cols*scale), cvRound((float)image.rows*scale));   // 该层金字塔图片的尺寸 
     // 如果不是第一层
     if(level != 0)
     {
       resize(mvImagePyramid[level-1], mvImagePyramid[level], sz, 0, 0, INTER_LINEAR);
     }
     else{   // 第一层
       mvImagePyramid[level] = image;
    }
  }
}

4.2、ComputeKeyPointsOctTree()

1、首先遍历图像金字塔每一层的图片,为图像金子塔中的每层图片提取特征点。

2、计算参与提取特征点的区域的范围 -minBorderX minBorderY maxBorderX maxBorderY

// 靠近边缘的部分不计算特征点  距离边缘EDGE_THRESHOLD以内的点不计算FAST
const int minBorderX = EDGE_THRESHOLD-3;     // EDGE_THRESHOLD设定为19  16
const int minBorderY = minBorderX;       
const int maxBorderX = mvImagePyramid[level].cols-EDGE_THRESHOLD+3;
const int maxBorderY = mvImagePyramid[level].rows-EDGE_THRESHOLD+3;

注意 EDGE_THRESHOLD表示的是特征点出现的范围即特征点中心的范围，-3是因为计算fast特征点的圆的半径为3，如下图

3、提取特征点时要将图片分割成大小大约为30的cell，然后分别对这些cell提取特征点，这样来确保每个区域都能尽可能提到特征点，这是保证特征点分布均匀的关键。
cell切分的数量以及size计算如下：

// 计算范围
const float width = (maxBorderX-minBorderX);
const float height = (maxBorderY-minBorderY);
// cell的数量     默认 cell的size是30  
const int nCols = width/W;
const int nRows = height/W;
// 计算每个cell的size    
const int wCell = ceil(width/nCols);
const int hCell = ceil(height/nRows);

这样设置cell的尺寸的目的是让cell覆盖全部图片提取区域。因为 hCell×nRows>height ，wCell×nCols>width 。

4、按行遍历每一个cell，从左到右，从上到下遍历，然后获取cell提取特征点的区域范围
[(iniY,maxY),(iniX,maxX)]，下面有一点小小的修改，即if(iniY>=maxBorderY-6)，源码里是减3，但是感觉因为FAST特征点的提取圆直径是7，所以最小的提取特征点区域应该是7*7的，所以应该减6才对吧？也不知道理解对不对，写出来请大家指正。

// 按行遍历每一个cell
for(int i=0; i<nRows; i++)
{   // 提取特征点的区域是[(iniY,maxY),(iniX,maxX)]
const float iniY =minBorderY+i*hCell;    // cell左上角的起始坐标
// 加6是为了增大提取面积
float maxY = iniY+hCell+6;               
// 左上角位置太靠近下边界则跳出 这个3是参数 我咋感觉是6？？？？改成6试试   因为FAST特征点提取的圆直径是7     否则就作为提取特征点的区域   因为这样的话  这一块区域就太小了
if(iniY>=maxBorderY-6)      
   continue;            
// 对maxY进行限制   所以最小的提取区域高度至少为7
if(maxY>maxBorderY)
   maxY = maxBorderY;
// 遍历一行的所有cell
for(int j=0; j<nCols; j++)
{
   const float iniX =minBorderX+j*wCell;      // cell左上角X坐标
   float maxX = iniX+wCell+6;                 // 同样加6扩大提取面积
   if(iniX>=maxBorderX-6)                     // 左上距离边界至少7
       continue;
   if(maxX>maxBorderX)
       maxX = maxBorderX;
       ..........
       ..........
 }
}

关于为什么 float maxY = iniY+hCell+6 要+6我的理解是：

iniY+hCell 也就是cell的区域只能提取 / 部分的特征，而 \ 的部分则变成死区了，+6可以提取出死区部分的特征。

2、对cell区域提取特征点,提取的特征点保存在vKeysCell中，代码这里只为正常情况和提不到特征点时两种情况分配了两个阈值，如果能考虑更多实际情况自动的调整阈值是不是效果会更好呢?

 vector<cv::KeyPoint> vKeysCell;     // 存取每个小cell的FAST特征点的Vector
 // 提取FAST特征点   对mvImagePyramid[level]图像的[(iniY,maxY),(iniX,maxX)]范围提取FAST
 cv::FAST(mvImagePyramid[level].rowRange(iniY,maxY).colRange(iniX,maxX),
      vKeysCell,iniThFAST,true);     // 采用阈值iniThFAST  true: 开启极大值抑制算法
 // 如果提取的特征点数为0   则阈值换成minThFAST
 if(vKeysCell.empty())
 {
     cv::FAST(mvImagePyramid[level].rowRange(iniY,maxY).colRange(iniX,maxX),
          vKeysCell,minThFAST,true);    
 }

3、遍历vKeysCell中的全部特征点，将特征点的坐标转换到原图像中，这里图像依然是去掉边缘大小
EDGE_THRESHOLD-3后的图像。

// 提取到了特征点了  将这个cell的特征点坐标转换后全部存放到vToDistributeKeys之中
if(!vKeysCell.empty())
{   // 遍历全部提取提取出来的特征点  将特征点的坐标从cell转换到全部cell的坐标再保存到vToDistributeKeys
    for(vector<cv::KeyPoint>::iterator vit=vKeysCell.begin(); vit!=vKeysCell.end();vit++)
    {
        (*vit).pt.x+=j*wCell;                             // 原始坐标加上cell的偏移
        (*vit).pt.y+=i*hCell;
        vToDistributeKeys.push_back(*vit);
    }
}

4、当前层的特征点提取完后，通过DistributeOctTree()函数通过四叉树将提取的特征点进行处理，

// 创建第level层allKeypoints的引用   keypoints
vector<KeyPoint> & keypoints = allKeypoints[level]; 
keypoints.reserve(nfeatures);
// 利用四叉树处理特征点  使特征点的数量满足条件 且分布均匀
keypoints = DistributeOctTree(vToDistributeKeys, minBorderX, maxBorderX,
                              minBorderY, maxBorderY,mnFeaturesPerLevel[level], level);

5、为keypoints中每个特征点的pt,size,octave信息赋值：

// 特征点size的计算
const int scaledPatchSize = PATCH_SIZE*mvScaleFactor[level];
// Add border to coordinates and scale information
const int nkps = keypoints.size();       
for(int i=0; i<nkps ; i++)
{
    keypoints[i].pt.x+=minBorderX;      // 转换到图像x坐标
    keypoints[i].pt.y+=minBorderY;      // 转换到图像y坐标
    keypoints[i].octave=level;          // octave储存图像金字塔的层数          
    keypoints[i].size = scaledPatchSize;// 特征点的size
}

size的作用是什么？？？？？？？？？？？？？？？？？？？？？？？？？

6、遍历每层的特征点，通过灰度质心法计算每个特征点的方向信息：

// compute orientations     计算每层图像所有特征点的方向   为计算描述子提供信息
for (int level = 0; level < nlevels; ++level)
    computeOrientation(mvImagePyramid[level], allKeypoints[level], umax);

下面看其中的关键的函数——四叉树特征点处理DistributeOctTree()。

4.2.1、DistributeOctTree()

/**
 * @brief vToDistributeKeys: 从金字塔某一层中提取出来的特征点
 * @param minX，maxX，minY，maxY :特征点区域    minBorderX, maxBorderX,minBorderY, maxBorderY
 * @param N 该层图像上应该提取的特征点个数
 * @param level 图像的层数
 */ 
vector<cv::KeyPoint> ORBextractor::DistributeOctTree(const vector<cv::KeyPoint>& vToDistributeKeys, const int &minX,
const int &maxX, const int &minY, const int &maxY, const int &N, const int &level)

算法流程：
1、找出根节点。
2、循环执行对当前所有节点(即lNodes中的节点)进行分割，这里的过程比较有意思，比如说根节点只有一个的时候，然后接下来分割出来4个节点，它们存放在lNodes中的先后顺序是右下节点，左下节点，右上节点，左上节点，然后循环执行第二次分割，这时首先是右下节点进行分割，右下节点分割完后，由于分割后的节点只是被插入到lNodes最前面，所以下一次的分割的节点仍然是之前分割节点的下一节点，直到之前lNodes中所有节点分割完了，才会重新返回到lNodes最前面的节点进行分割，这样能使分割更大程度的均匀，而不会出现只对某一个节点不停地分割的情况。
3、一次分割循环结束后，检查分割是否完毕，分割完毕的判断标准是：（1)、节点数是否已经达到需要提取的特征点数。 (2)、节点的数目已经稳定。
另外，如果当前节点继续分割一次后节点的总数可能大于所要提取的特征数时，则将要分割的节点按内部特征点的数量从大到小排序，先分割特征点数量多的节点，因为特征点多的节点更有可能分割出4个子节点出来，这样能使分割尽快达到目标。
4、分割完毕后，遍历每个节点，将响应最大的特征点找出来并保存在vResultKeys中。

详细分析：
1、计算需要多少根节点，以及创建根节点并存放到 lNodes容器，节点地址保存在 vpIniNodes 容器。
根节点放置如下

代码部分

// Compute how many initial nodes   根据图像的长宽选择初始的根节点数     宽 / 高   ( 一般宽>高 )
// 由于要求根节点的范围尽量为正方形，所以若区域长与宽的比值接近1那么只需要一个根节点 而长于宽的比值越大则需要的根节点就越多
const int nIni = round(static_cast<float>(maxX-minX)/(maxY-minY));
// 一个根节点所占的宽度
const float hX = static_cast<float>(maxX-minX)/nIni;

list<ExtractorNode> lNodes;                             // 四叉树节点   保存四叉树所有的节点
vector<ExtractorNode*> vpIniNodes;                      // 保存四叉树的节点的地址
vpIniNodes.resize(nIni);                                // 首先申请大小为根节点的大小
// 构造根节点
for(int i=0; i<nIni; i++)
{
    ExtractorNode ni;
// 根节点的范围    这里
    ni.UL = cv::Point2i(hX*static_cast<float>(i),0);    // 左上
    ni.UR = cv::Point2i(hX*static_cast<float>(i+1),0);  // 右上
    ni.BL = cv::Point2i(ni.UL.x,maxY-minY);             // 左下
    ni.BR = cv::Point2i(ni.UR.x,maxY-minY);             // 右下
    ni.vKeys.reserve(vToDistributeKeys.size());         // 分配存储特征点的空间
    
    lNodes.push_back(ni);                               // 将根节点放入lNodes        

    vpIniNodes[i] = &lNodes.back();                     // 地址保存至vpIniNodes  
}

2、遍历所有特征点，将特征点分配给位置靠近的根节点中(放置到根节点vKeys容器中)

// 遍历所有特征点   将特征点分配到根节点中     
for(size_t i=0;i<vToDistributeKeys.size();i++)
{
   const cv::KeyPoint &kp = vToDistributeKeys[i];      // 第i个特征点的坐标  
   vpIniNodes[kp.pt.x/hX]->vKeys.push_back(kp);        // 基于该特征点坐标将其分配到根节点中
}

3、遍历根节点，如果其子节点为空则从lNodes中删除…

// 获得节点的迭代器    此时保存的只有根节点
list<ExtractorNode>::iterator lit = lNodes.begin();
// 遍历每个根节点   将不需要分割的标记或者无效根节删除
while(lit!=lNodes.end())
{   // 如果该节点范围内  特征点的数量为1   则bNoMore=true表示不继续分割
   if(lit->vKeys.size()==1)
   {
       lit->bNoMore=true;
       lit++;
   }                               // 如果节点为空  则直接删除
   else if(lit->vKeys.empty())
       lit = lNodes.erase(lit);    // list  删除了节点lit后会返回下一个lit      
   else
       lit++;
}

4、循环一直到分割完成，循环内部对lNodes进行遍历，对于每个节点，若特征点数>1，则进行分裂 lit->DivideNode(n1,n2,n3,n4)，将分裂后子节点特征点数>0的插入到lNodes的首部

while(!bFinish)                      
{
  // iteration++;
  // 节点数量   
  int prevSize = lNodes.size();
  // 最开始节点的迭代器    后面分割的节点都插入到了开始的位置
  lit = lNodes.begin();
  // 分裂出来的节点中   可以再次分裂的数量   
  int nToExpand = 0;
   
  vSizeAndPointerToNode.clear();
  // 遍历其全部节点  将需要分割的进行分割   没有特征点数为0的节点
  while(lit!=lNodes.end())
  {   // 如果节点  只包含一个特征点了  那么跳到下一个
      if(lit->bNoMore)
      {
          // If node only contains one point do not subdivide and continue
          lit++;
          continue;
      }
      else                              // 可以分割   
      {   
          // If more than one point, subdivide   还有超过一个节点  则继续分割
          ExtractorNode n1,n2,n3,n4;    // 分成4个子节点
          lit->DivideNode(n1,n2,n3,n4); // 对lit节点进行分割
  
          // Add childs if they contain points
// 如果n1节点有分布特征点  
          if(n1.vKeys.size()>0)     
          {
              lNodes.push_front(n1);      // 节点存储到lNodes中  插入到最前面             
              if(n1.vKeys.size()>1)       // 可以继续分割
              { 
    // 下面几步是是用于最后如果分割的节点可能超过特征点数  则执行单独的分割步骤
                  nToExpand++;            // 可继续分割的数量++  
// 储存节点的地址与节点的特征数                                                   
                  vSizeAndPointerToNode.push_back(make_pair(n1.vKeys.size(),&lNodes.front()));
// 记录该节点的迭代器  用于后面删除根节点
                  lNodes.front().lit = lNodes.begin();
              }
          }
          // 如果n2节点有分布的特征点
          if(n2.vKeys.size()>0)
          {
              lNodes.push_front(n2);              
              if(n2.vKeys.size()>1)
              {
                  nToExpand++;     // 数量加一
                  vSizeAndPointerToNode.push_back(make_pair(n2.vKeys.size(),&lNodes.front()));
                  lNodes.front().lit = lNodes.begin();     // 记录该节点的迭代器  用于后面删除根节点
              }
          }   
          // 如果n3节点有分布的特征点
          if(n3.vKeys.size()>0)
          {
              lNodes.push_front(n3);
              if(n3.vKeys.size()>1)
              {
                  nToExpand++;
                  vSizeAndPointerToNode.push_back(make_pair(n3.vKeys.size(),&lNodes.front()));
                  lNodes.front().lit = lNodes.begin();     // 记录该节点的迭代器  用于后面删除根节点
              }
          }
          // 如果n4节点有分布的特征点
          if(n4.vKeys.size()>0)
          {
              lNodes.push_front(n4);
              if(n4.vKeys.size()>1)
              {
                  nToExpand++;
                  vSizeAndPointerToNode.push_back(make_pair(n4.vKeys.size(),&lNodes.front()));
                  lNodes.front().lit = lNodes.begin();     // 记录该节点的迭代器  用于后面删除根节点
              }
          }

          lit=lNodes.erase(lit);    // 分割完了将该节点删除
          continue;
      }
  }       
  
  // 当前所有的节点都分割完毕后   判断分割是否可以结束
  // Finish if there are more nodes than required features
  // or all nodes contain just one point
 // if((int)lNodes.size()>=N || (int)lNodes.size()==prevSize)  // 如果节点的数量超过特征点数量 或与上一次没有变化    
  if((int)lNodes.size()>=N || nToExpand == 0)
  {
      bFinish = true;    
  }   // 如果下一次分割后的节点数量大于N那么进行如下处理， 由于一个节点分割为四个节点是需要删除原节点的，所以实际上增加了3个节点   
  else if(((int)lNodes.size()+nToExpand*3)>N)
  {   //  一直循环执行直到节点的数量大于特征点数量于是分割结束
      while(!bFinish)
      {               
          prevSize = lNodes.size();
          // 上一次分割后  待分割的节点的容器 
          vector<pair<int,ExtractorNode*> > vPrevSizeAndPointerToNode = vSizeAndPointerToNode;
// 清空  接下来会保存这一轮分割后仍然需要分割的节点
          vSizeAndPointerToNode.clear();
          // 特征点数量从小到大排序   
          sort(vPrevSizeAndPointerToNode.begin(),vPrevSizeAndPointerToNode.end());
// 按特征点的数量从大到小访问节点   先分割特征点数量多的  因为特征点多的节点更有可能分割出4个子节点出来，这样能使分割尽快达到目标。    
         // for(int j=vPrevSizeAndPointerToNode.size()-1;j>=0;j--)
for(int j=0;j<vPrevSizeAndPointerToNode.size();j++)
          {
              ExtractorNode n1,n2,n3,n4;            
              vPrevSizeAndPointerToNode[j].second->DivideNode(n1,n2,n3,n4);    // 分割

              // Add childs if they contain points
              if(n1.vKeys.size()>0)
              {   // 放到最前面
                  lNodes.push_front(n1);
// 数量大于1需要继续分割
                  if(n1.vKeys.size()>1)
                  {   // 放置到容器vSizeAndPointerToNode   准备下一次的分割 
                      vSizeAndPointerToNode.push_back(make_pair(n1.vKeys.size(),&lNodes.front()));
                      lNodes.front().lit = lNodes.begin();    // 记录该节点的迭代器  用于后面删除根节点
                  }
              }
              if(n2.vKeys.size()>0)
              {
                  lNodes.push_front(n2);
                  if(n2.vKeys.size()>1)
                  {
                      vSizeAndPointerToNode.push_back(make_pair(n2.vKeys.size(),&lNodes.front()));
                      lNodes.front().lit = lNodes.begin();   // 记录该节点的迭代器  用于后面删除根节点
                  }
              }
              if(n3.vKeys.size()>0)
              {
                  lNodes.push_front(n3);
                  if(n3.vKeys.size()>1)
                  {
                      vSizeAndPointerToNode.push_back(make_pair(n3.vKeys.size(),&lNodes.front()));
                      lNodes.front().lit = lNodes.begin();   // 记录该节点的迭代器  用于后面删除根节点
                  }
              }
              if(n4.vKeys.size()>0)
              {
                  lNodes.push_front(n4);
                  if(n4.vKeys.size()>1)
                  {
                      vSizeAndPointerToNode.push_back(make_pair(n4.vKeys.size(),&lNodes.front()));
                      lNodes.front().lit = lNodes.begin();   // 记录该节点的迭代器  用于后面删除根节点
                  }
              }
              // 原节点分割后被删除   erase()函数中的参数需要是迭代器
              lNodes.erase(vPrevSizeAndPointerToNode[j].second->lit);
              // 如果这时节点数量大于N  则退出
              if((int)lNodes.size()>=N)
                  break;
          }
          // 节点数量大于N   或分割停止就结束    
          if((int)lNodes.size()>=N || (int)lNodes.size()==prevSize)
              bFinish = true;
      }
  }
}

5、分裂完毕后，每个区域选取一个响应最大的特征点，保存在 vResultKeys 。

// Retain the best point in each node
vector<cv::KeyPoint> vResultKeys;
vResultKeys.reserve(nfeatures);
// 遍历全部节点    为每个节点找到响应最大的那个特征点
for(list<ExtractorNode>::iterator lit=lNodes.begin(); lit!=lNodes.end(); lit++)
{
    vector<cv::KeyPoint> &vNodeKeys = lit->vKeys;     // 获得节点中的特征点  
    // 将第一个特征点的响应值最为max
    cv::KeyPoint* pKP = &vNodeKeys[0];                
    float maxResponse = pKP->response;                // 获取响应值   
    // 然后遍历其他的特征点 找出响应最大的特征点作为该节点的代表特征点  
    for(size_t k=1;k<vNodeKeys.size();k++)
    {
        if(vNodeKeys[k].response>maxResponse)
        {
            pKP = &vNodeKeys[k];
            maxResponse = vNodeKeys[k].response;
        }
    }
    // 每个节点响应最大的保存在这里
    vResultKeys.push_back(*pKP);
}

4.2.1.1、DivideNode()

介绍：一个节点中有多个特征点 ,那么将该节点分成4个子节点。
void ExtractorNode::DivideNode(ExtractorNode &n1, ExtractorNode &n2, ExtractorNode &n3, ExtractorNode &n4)
将一个节点分割成4个的主要思路是：
0、求出该cell的半径。
1、求出各个子节点n1,n2,n3,n4的区域范围，UL，UR，BL，BR。
2、将原节点中所有的特征点分配到子节点中 vKeys。
3、将不需要分割的节点设置bNoMore = true。

// 一个节点中有多个特征点   那么将该节点分成4个子节点  
void ExtractorNode::DivideNode(ExtractorNode &n1, ExtractorNode &n2, ExtractorNode &n3, ExtractorNode &n4)
{
    // 求该节点的区域中心位置
    const int halfX = ceil(static_cast<float>(UR.x-UL.x)/2);
    const int halfY = ceil(static_cast<float>(BR.y-UL.y)/2);

    //Define boundaries of childs   
    // 设定第一个子节点的区域    左上角的节点
    n1.UL = UL;
    n1.UR = cv::Point2i(UL.x+halfX,UL.y);
    n1.BL = cv::Point2i(UL.x,UL.y+halfY);
    n1.BR = cv::Point2i(UL.x+halfX,UL.y+halfY);
    n1.vKeys.reserve(vKeys.size());
    // 第二个节点   
    n2.UL = n1.UR;
    n2.UR = UR;
    n2.BL = n1.BR;
    n2.BR = cv::Point2i(UR.x,UL.y+halfY);
    n2.vKeys.reserve(vKeys.size());
    // 第三个节点
    n3.UL = n1.BL;
    n3.UR = n1.BR;
    n3.BL = BL;
    n3.BR = cv::Point2i(n1.BR.x,BL.y);
    n3.vKeys.reserve(vKeys.size());
    // 第4个节点
    n4.UL = n3.UR;
    n4.UR = n2.BR;
    n4.BL = n3.BR;
    n4.BR = BR;
    n4.vKeys.reserve(vKeys.size());

    //Associate points to childs   根据特征点的坐标将特征点分配到节点中
    for(size_t i=0;i<vKeys.size();i++)
    {
        const cv::KeyPoint &kp = vKeys[i];   // 获取特征点
        if(kp.pt.x<n1.UR.x)
        {
            if(kp.pt.y<n1.BR.y)
                n1.vKeys.push_back(kp);   // 左上
            else
                n3.vKeys.push_back(kp);   // 左下
        }
        else if(kp.pt.y<n1.BR.y)          
            n2.vKeys.push_back(kp);        // 右上
        else
            n4.vKeys.push_back(kp);         // 右下
    }
    // 看有没有不需要分割的节点
    if(n1.vKeys.size()==1)
        n1.bNoMore = true;
    if(n2.vKeys.size()==1)
        n2.bNoMore = true;
    if(n3.vKeys.size()==1)
        n3.bNoMore = true;
    if(n4.vKeys.size()==1)
        n4.bNoMore = true;

}

你可能感兴趣的:(vslam)

VSLAM新方案之《在复杂环境中实现高精度与超强鲁棒性》 OAK中国_官方 SLAM 人工智能 rpab-map
OAKChina&苏州泛科特机器人联合推出OAK-DSeries&因子空间感知（FactorPerceptionKit）VSLAM解决方案01FactorPerceptionKit简介FactorPerceptionKit是一种真正基于深度学习技术的VSLAM方案，不同于许多厂商仅通过添加目标检测或语义分割模型来实现额外功能，我们直接在SLAM底层使用HF-Net模型，该模型同时进行局部特征点检测
OAK相机：纯视觉SLAM在夜晚的应用 OAK中国_官方人工智能机器学习 SLAM
哈喽，OAK的朋友们，大家好啊，今天这个视频主要想分享一下袁博士团队用我们的OAK相机产出的新成果在去年过山车SLAM的演示中，袁博士团队就展示了纯视觉SLAM在完全黑暗的环境中的极高鲁棒性。现在袁博士团队进一步挖掘了纯视觉的潜力，于是又专门录了一段夜间的演示给我们展示了在完全黑暗及光线变化的环境中可靠工作的VIO、回环检测及适用于大场景的内存管理技术。他们现在已将整套VSLAM方案包含在Fact
VSLAM技术实现机器人在不同场景下的精准导航、避障向阳而生|X 自主导航 python 计算机视觉
链接：https://developer.orbbec.com.cn/forum_plate_module_details.html?id=998
ORBSLAM3 运行流程以rgbd_tum.cc函数为例进行分析水理璇浮 ORBSLAM3 数码相机
一、运行使用的是D435i相机自己录制的数据。运行命令：./Examples/RGB-D/rgbd_tum'/opt/vslam/ORB_SLAM3_detailed_comments-dense_map_new/Vocabulary/ORBvoc.txt''/opt/vslam/ORB_SLAM3_detailed_comments-dense_map_new/Examples/RGB-D/TU
OpenVSLAM在Ubuntu16.04下编译安装 hhh0209 vslam linux
最近开始学习VSLAM，理论知识大概了解了一下，想要学透还是需要下一番功夫的。为了领导的任务，先把OpenVSLAM装上，跑个demo看看。我平时用windows比较多，改成Linux还是得适应一下。参考资料主要有：1参考12参考23官方安装文档按着这些教程，基本能安装下来，中间也会有些小问题，记录如下：1，参考1里的依赖安装第10条我没有安装成功；2，我的OPENCV是3.4.0版本；3，安装y
VSLAM中的特征点三角化 nice-wyh 算法
特征点三角化（Triangulation）是VSLAM中一个非常基础的问题，它是根据特征点在多个相机下的投影恢复出特征点的3D坐标。特征点在某个相机中被观测到，根据相机位姿和观测向量可以得到3D空间中的一条从相机中心出发的观测“射线”，多个相机位姿观测会产生多条观测射线，理想情况下这些观测射线相交于空间中一点，求所有观测射线的交点就是特征点在3D空间的位置，这就是三角化最朴素的思想。实际中由于噪声
导航与定位技术已成为移动机器人的核心技术之一 Fuweizn 移动机器人自动化生产线 AGV智能搬运机器人自动化机器人工业自动化
随着移动机器人技术的不断发展和应用领域的扩大，导航与定位技术已成为移动机器人的核心技术之一。本文将介绍移动机器人导航与定位技术的发展现状、技术前沿和面临的挑战。一、导航与定位技术的发展现状移动机器人的导航与定位技术是实现自主移动的关键。目前，移动机器人的导航与定位技术主要包括基于GPS、SLAM、VSLAM等技术的方法。1、GPS导航技术：利用全球定位系统进行定位，精度高、覆盖范围广，但需要外部信
vslam论文24：ESVIO: 基于事件相机的双目VIO（RAL 2023） xsyaoxuexi 视觉SLAM论文阅读 c++人工智能学习笔记
摘要异步输出低延迟事件流的事件相机为具有挑战性的情况下的状态估计提供了很大的机会。尽管近年来基于事件的视觉里程测量技术得到了广泛的研究，但大多数都是基于单目的，而对立体事件视觉的研究很少。在本文中，我们介绍了ESVIO，这是第一个基于事件的立体视觉惯性里程计，它利用了事件流、标准图像和惯性测量的互补优势。我们建议的pipeline包括ESIO(纯基于事件的)和ESVIO(带有图像辅助的事件)，它们
vslam论文25: 结构约束的RGB-D SLAM（ICRA 2021） xsyaoxuexi 视觉SLAM论文阅读 c++平面学习计算机视觉笔记
摘要本文提出了一种专门为结构化环境设计的RGB-DSLAM系统，旨在通过从周围提取的几何特征来提高跟踪和制图精度。除了点之外，结构化环境还提供了大量的几何特征，如线和平面，我们利用这些特征来设计SLAM系统的跟踪和映射组件。对于跟踪部分，我们基于曼哈顿世界(MW)的假设探索这些特征之间的几何关系。我们提出了一种基于点、线和面的解耦优化方法，以及在附加的姿态优化模块中使用曼哈顿关系。在建图部分，以较
vslam论文10：PL-VINS:具有点和线特征的实时单目视觉惯性SLAM xsyaoxuexi 视觉SLAM论文阅读笔记 c++
摘要PL-VINS是基于最先进的基于点的VINS-mono，开发的一种基于点和线特征的实时、高效优化的单目VINS方法。我们观察到，目前的作品使用LSD算法提取线条特征;然而,LSD是为场景形状表示而设计的，而不是为姿态估计问题设计的，由于其高昂的计算成本，这成为了实时性能的瓶颈。在本文中，我们通过研究隐藏参数调整和长度抑制策略来改进LSD算法。改进后的LSD算法的运行速度至少是LSD的三倍。此外
vslam论文15：DynaVINS: 一种动态环境下的视觉惯性SLAM（ICRA 2023） xsyaoxuexi 视觉SLAM论文阅读笔记 c++学习
摘要视觉惯性里程计和SLAM算法广泛应用于服务机器人、无人机和自动驾驶汽车等领域。大多数SLAM算法都是基于假设地标是静态的。然而，在现实世界中，存在着各种各样的动态物体，它们降低了姿态估计的精度。此外，临时静态对象(在观察期间是静态的，但在视线之外时移动)会触发误报循环关闭。为了克服这些问题，我们提出了一种新的视觉惯性SLAM框架，称为DynaVINS，它对动态目标和临时静态目标都具有鲁棒性。在
vslam论文23：VIP-SLAM: 一种高效、紧耦合的RGB-D视觉惯性平面SLAM（ICRA 2022） xsyaoxuexi 视觉SLAM论文阅读平面人工智能算法笔记 c++学习
摘要本文提出了一种融合RGB、Depth、IMU和结构化平面信息的紧密耦合SLAM系统。传统的基于稀疏点的SLAM系统总是保持大量的地图点来建模环境。大量的地图点给我们带来了很高的计算复杂度，使其难以部署在移动设备上。另一方面，平面是人造环境尤其是室内环境中常见的结构形式。我们通常可以使用少量的平面来表示一个大的场景。因此，本文的主要目的是降低基于稀疏点的SLAM的高复杂性。我们构建了一个轻量级的
vslam论文8：EPLF-VINS: Real-Time Monocular Visual-InertialSLAM With Efficient Point-Line Flow Features xsyaoxuexi 视觉SLAM论文阅读人工智能学习自动驾驶 c++
（RAL2023）摘要本文介绍了一种利用点和线特征的高效视觉惯性同步定位和映射(SLAM)方法。目前，基于点的SLAM方法在弱纹理和运动模糊等场景下表现不佳。许多研究者注意到线特征在空间中的优异特性，并尝试开发基于线的SLAM系统。然而，线条提取和描述匹配过程的计算量巨大，难以保证整个SLAM系统的实时性，而错误的线条检测和匹配限制了SLAM系统性能的提高。本文通过短线融合、线特征均匀分布、自适应
vulkan shader变换--Apple的学习笔记 applecai
关于图形变换，之前就做过专题学习过了。再快速复习下正交矩阵及矩阵变换的python实现--Apple的学习笔记其实主要的变换包括缩放，平移，旋转，衍射。另外二维图形主要都是按坐标旋转，三维图形都是按轴旋转的。关键点需要知道坐标系。然后代码工程显示的照片是相机视角的，所以还需要了解世界坐标/物体坐标/相机坐标/图像坐标的概念及转换。之前学习vslam的时候都学习过了。所以有了这些基础，我就直奔主题将
手撕视觉slam14讲 ch13 代码总结全日制一起混手撕VO篇视觉slam十四讲 SLAM c++计算机视觉 ubuntu
运行效果（Kitti00）4倍速一、代码GitHub-tzy0228/Easy-VO-SLAM:VSLAM-CH13工程代码注释版本二、编译过程踩坑视觉SLAM十四讲第二版ch13编译及运行问题_全日制一起混的博客-CSDN博客三、代码解读手撕视觉slam14讲ch13代码（1）工程框架与代码结构-CSDN博客手撕视觉slam14讲ch13代码（2）基本类的抽象_全日制一起混的博客-CSDN博客手
【VSLAM】ORB-SLAM3安装部署与运行 DevFrank c++CV计算机视觉与音视频机器人 ros slam
心口如一，犹不失为光明磊落丈夫之行也。——梁启超文章目录:smirk:1.ORB-SLAM3介绍:blush:2.代码安装部署1.安装ros与opencv2.安装Pangolin作为可视化和用户界面3.安装Eigen3一个开源线性库，可进行矩阵运算4.安装ORB-SLAM3:satisfied:3.案例运行1.运行数据集2.用真实相机usb_cam运行1.ORB-SLAM3介绍ORB-SLAM3是
VSLAM（7）：后端优化---滤波器方法和BA图优化聪明的笨小子视觉SLAM14讲 python 算法
在视觉里程计完成每次的位姿估计后，可以实时地得到一个短时间内的轨迹和地图点，但是由于估计本身具有误差，这个误差会一直保持并不断累加。所以可以构建一个尺度和规模更大的优化问题，来计算一段长时间内的最有轨迹和地图。一,后端优化综述SLAM问题可以由运动方程和观测方程描述，设从t=0到t=N这个时间段内，机器人经过了到的位姿点，观测到了这么多的特征点，那么有：视觉前段往往在某一时刻会观测很多的特征点，所
vslam论文14：Monocular Visual-Inertial Odometry with Planar Regularities（ICRA 2023） xsyaoxuexi 视觉SLAM论文阅读 c++学习笔记
摘要最先进的单目视觉惯性里程计(VIO)方法依赖于稀疏点特征，部分原因是它们的效率、鲁棒性和普遍性，而忽略了高级结构规律，如平面，这些在人造环境中很常见，可以用来进一步约束运动。一般来说，由于平面的存在空间很大，可以用相机观察平面很长一段时间，因此可以进行长期导航。所以，在本文中，我们设计了一种新颖的实时单目VIO系统，该系统在轻量级多状态约束卡尔曼滤波器(MSCKF)中由平面特征完全正则化。我们
vslam论文21：基于点、面图的高效视觉惯性导航（ICRA 2023） xsyaoxuexi 视觉SLAM论文阅读笔记学习 c++平面
摘要相对于全局先验地图，精确和实时的全局姿态估计在许多应用中是必不可少的，例如微型飞行器和增强现实的物流。假设纯稀疏的三维点图可以提供环境的无结构表示，那么生成点平面先验图可以进一步建模环境拓扑并为精确定位提供全局约束。为了实现这一点，我们提出了一个基于滤波器的大规模视觉惯性里程计系统，称为PPM-VIO，它利用点平面图来纠正累积漂移。该系统利用语义信息检测稀疏点云的共面信息，通过几何约束、语义约
vslam论文1：Range-Focused Fusion of Camera-IMU-UWB for Accurate and Drift-Reduced Localization(RAL2021) xsyaoxuexi 视觉SLAM论文阅读数码相机
准确、低飘移定位的相机-IMU-UWB聚焦距离融合摘要：在这项工作中，我们提出了一种紧耦合的单目摄像机、6自由度IMU和单个未知UWB锚融合方案，以实现精确和减少漂移的定位。具体地说，该文章聚焦于将UWB传感器整合到现有的最先进的视觉惯性系统。为实现这一目标，之前的工作使用单个最近的UWB距离数据来更新滑动窗口中的机器人位置(“聚焦位置”)，并展示了令人鼓舞的结果。然而，这些方法忽略了：1)UWB
vslam论文4：Dynam-SLAM: An Accurate, Robust Stereo Visual-Inertial SLAM Method in Dynamic Environments xsyaoxuexi 视觉SLAM论文阅读论文阅读人工智能自动驾驶 c++目标检测
出版：TRO2022摘要大多数现有的基于视觉的SLAM系统及其变体仍然假设观测是绝对静态的，无法在动态环境中表现良好。在这里，我们介绍了Dynam-SLAM(Dynam)，这是一种双目视觉惯性SLAM系统，能够在高动态环境中实现稳健、准确和连续的工作。我们的方法致力于将双目场景流与惯性测量单元(IMU)松耦合，用于动态特征检测，并将动态特征和静态特征与IMU测量紧耦合以进行非线性优化。首先，对测量
vslam论文2：FEJ-VIRO: A Consistent First-Estimate Jacobian Visual-Inertial-Ranging Odometry（ IROS-2022） xsyaoxuexi 视觉SLAM论文阅读人工智能目标跟踪自动驾驶 c++
FEJ-VIRO:一种一致的第一估计雅可比视觉-惯性-测距里程计一、摘要最近几年，VIO已经实现了很多显著的进步。然而，VIO方法在长期轨迹中会遭受定位飘移。在这篇文章中，我们提出FEJ-VIRO通过一致地将UWB测量值整合到VIO框架去减少VIO的定位飘移。考虑到UWB锚的原始位置通常无法获取，我们提出一种长短窗结构去初始化UWB锚的位置，和状态增广的协方差。初始化后，FEJ-VIRO同时估计U
德鲁周记06--VSLAM从入门到入坟安德鲁JANKENPAN 德鲁周记 SLAM slam
VSLAM入门介绍基础知识三维空间的刚体运动欧式变换四元数欧拉角李群与李代数线性拟合相机单目相机双目相机深度相机基本框架视觉里程计特征匹配ORB直接法对比后端优化EKFBA(BundleAdjustment)回环检测建图因为研究生的工程实践我选择了这个方向，这两周一直在学VSLAM，看完了高翔老师的视频和《视觉SLAM十四讲》，强烈推荐！！！入门必看，神书！！当然我第一遍自我感觉是肯定没看太懂的，
【VSLAM系列】三：Vins-Mono论文笔记塞拉摩视觉SLAM 论文阅读数码相机人工智能
VINs-Mono论文1.VINS-Mono的特点：1.未知初始状态的鲁棒性初始化过程2.带imu-camera外参校准和imu校准的紧耦合，基于非线性优化的单目VIO系统3.在线重定位和四个自由度的全局姿态图优化。4.姿态图可以保存，加载，并和局部姿态图进行合并。2.传感器数据处理摄像头和imu数据融合方法：1.松耦合法，imu是独立于摄像头的模块，常使用EKF算法，imu数据此时用于状态传播，
vSLAM中IMU预积分的作用--以惯性导航的角度分析清风微升至视觉SLAM 数码相机
作为一个学过一点惯导的工程师，在初次接触视觉slam方向时，最感兴趣的就是IMU预积分了。但为什么要用这个预积分，在看了很多材料和书后，还是感觉模模糊糊，云里雾里。在接触了vSLAM的更多内容后，站在历史研究者的角度去分析，得到了一个更为清晰的作用分析。首先，需要明确IMU与相机这两种传感器的互补作用，这是为什么要用IMU的原因。直接贴出程博书中的内容，总结的比较全面了。总之，就是相机成像的缺点可
Semantic Visual Simultaneous Localization andMapping: A Survey 语义视觉同步定位与映射研究综述粗翻尤齐深度学习机器学习人工智能 python 算法
2021摘要视觉同步定位与映射（vSLAM）在计算机视觉和机器人领域取得了巨大进展，并已成功应用于自主机器人导航和AR/VR等许多领域。然而，vSLAM无法在动态和复杂的环境中实现良好的本地化。近年来，许多出版物报道，通过将语义信息与vSLAM相结合，语义vSLAM系统具有解决上述问题的能力。然而，还没有关于语义vSLAM的全面调查。为了填补这一空白，本文首先回顾了语义vSLAM的发展，明确强调了
SLAM总览【自学备忘】 Yup_Boss 矩阵
SLAM一、VSLAM1、库1.1Sophus库1.1.1Sophus库安装1.1.2Sophus库函数一、VSLAM1、库1.1Sophus库Eigen库是一个开源的C++线性代数库，它提供了快速的有关矩阵的线性代数运算，还包括解方程等功能。但是Eigen库提供了集合模块，但没有提供李代数的支持。一个较好的李群和李代数的库是Sophus库，它很好的支持了SO(3),so(3),SE(3)和se(
OpenVSLAM源码阅读释怀°Believe #视觉SLAM 人工智能
⚡⚡⚡通过src下面的CMakeLists.txt开始构建项目add_subdirectory(stella_vslam)上面这句代码向CMake告知在当前项目中引入一个子目录，并在子目录中查找另一个CmakeLists.txt文件来构建项目在stella_vslam子目录中的CMakeLists.txt文件将描述如何构建stella_vslam子项目，可能包括源文件、编译选项、链接库等。主项目的
博客学习目录 Howe_xixi 学习
填坑专区，督促自己有系统的学习归纳。先把想学的挖个坑，一边填坑一边挖坑。怕什么真理无穷，进一步有一步的欢喜。目录【基础学科学习】【线性代数笔记】《3Blue1Brown》笔记【SLAM】【VSLAM笔记】《视觉SLAM十四讲》学习笔记Smoothly-VSLAM学习笔记【嵌入式开发】【鸿蒙开发笔记】OpenHarmony北向学习笔记【Linux系统】【编程语言学习】【C++笔记】【Python笔记
【VSLAM系列】四：Vins-Mono源码学习笔记塞拉摩视觉SLAM 学习笔记 opencv
VINS-Mono源码工程化技巧：滑动窗口的优化方式–>控制计算量同时实现优于滤波方法的里程计高效的去畸变操作–>实时性优于opencv且精度不会下降的去畸变不同实时性要求的处理方法–>后端实时性要求高于回环优点：套件价格、功耗、尺寸优势明显快速鲁棒的单目IMU初始化过程紧耦合的后端优化，在优化VIO位姿的同时还兼顾外参标定，零偏估计以及传感器延时估计回环检测功能，便于构建全局一致性更好的位姿和地
java短路运算符和逻辑运算符的区别 3213213333332132 java基础
/* * 逻辑运算符——不论是什么条件都要执行左右两边代码 * 短路运算符——我认为在底层就是利用物理电路的“并联”和“串联”实现的 * 原理很简单，并联电路代表短路或（||），串联电路代表短路与（&&）。 * * 并联电路两个开关只要有一个开关闭合，电路就会通。 * 类似于短路或（||），只要有其中一个为true（开关闭合）是
Java异常那些不得不说的事白糖_ java exception
一、在finally块中做数据回收操作比如数据库连接都是很宝贵的，所以最好在finally中关闭连接。 JDBCAgent jdbc = new JDBCAgent(); try{ jdbc.excute("select * from ctp_log"); }catch(SQLException e){ ... }finally{ jdbc.close();
utf-8与utf-8(无BOM)的区别 dcj3sjt126com PHP
BOM——Byte Order Mark，就是字节序标记在UCS 编码中有一个叫做"ZERO WIDTH NO-BREAK SPACE"的字符，它的编码是FEFF。而FFFE在UCS中是不存在的字符，所以不应该出现在实际传输中。UCS规范建议我们在传输字节流前，先传输字符"ZERO WIDTH NO-BREAK SPACE"。这样如
JAVA Annotation之定义篇周凡杨 java 注解 annotation 入门注释
Annotation: 译为注释或注解 An annotation, in the Java computer programming language, is a form of syntactic metadata that can be added to Java source code. Classes, methods, variables, pa
tomcat的多域名、虚拟主机配置 g21121 tomcat
众所周知apache可以配置多域名和虚拟主机，而且配置起来比较简单，但是项目用到的是tomcat，配来配去总是不成功。查了些资料才总算可以，下面就跟大家分享下经验。很多朋友搜索的内容基本是告诉我们这么配置：在Engine标签下增面积Host标签，如下： <Host name="www.site1.com" appBase="webapps"
Linux SSH 错误解析（Capistrano 的cap 访问错误 Permission ） 510888780 linux capistrano
1.ssh -v [email protected] 出现 Permission denied (publickey,gssapi-keyex,gssapi-with-mic,password). 错误运行状况如下： OpenSSH_5.3p1, OpenSSL 1.0.1e-fips 11 Feb 2013 debug1: Reading configuratio
log4j的用法 Harry642 java log4j
一、前言： log4j 是一个开放源码项目，是广泛使用的以Java编写的日志记录包。由于log4j出色的表现，当时在log4j完成时，log4j开发组织曾建议sun在jdk1.4中用log4j取代jdk1.4 的日志工具类，但当时jdk1.4已接近完成，所以sun拒绝使用log4j，当在java开发中
mysql、sqlserver、oracle分页，java分页统一接口实现 aijuans oracle jave
定义：pageStart 起始页，pageEnd 终止页,pageSize页面容量 oracle分页：　　　　select * from ( select mytable.*,rownum num from (实际传的SQL) where rownum<=pageEnd) where num>=pageStart sqlServer分页：
Hessian 简单例子 antlove java Web service hessian
hello.hessian.MyCar.java package hessian.pojo; import java.io.Serializable; public class MyCar implements Serializable { private static final long serialVersionUID = 473690540190845543
数据库对象的同义词和序列百合不是茶 sql 序列同义词 ORACLE权限
回顾简单的数据库权限等命令; 解锁用户和锁定用户 alter user scott account lock/unlock; //system下查看系统中的用户 select * dba_users; //创建用户名和密码 create user wj identified by wj; identified by //授予连接权和建表权 grant connect to
使用Powermock和mockito测试静态方法 bijian1013 持续集成单元测试 mockito Powermock
实例： package com.bijian.study; import static org.junit.Assert.assertEquals; import java.io.IOException; import org.junit.Before; import org.junit.Test; import or
精通Oracle10编程SQL(6)访问ORACLE bijian1013 oracle 数据库 plsql
/* *访问ORACLE */ --检索单行数据 --使用标量变量接收数据 DECLARE v_ename emp.ename%TYPE; v_sal emp.sal%TYPE; BEGIN select ename,sal into v_ename,v_sal from emp where empno=&no; dbms_output.pu
【Nginx四】Nginx作为HTTP负载均衡服务器 bit1129 nginx
Nginx的另一个常用的功能是作为负载均衡服务器。一个典型的web应用系统，通过负载均衡服务器，可以使得应用有多台后端服务器来响应客户端的请求。一个应用配置多台后端服务器，可以带来很多好处：负载均衡的好处增加可用资源增加吞吐量加快响应速度，降低延时出错的重试验机制 Nginx主要支持三种均衡算法： round-robin l
jquery-validation备忘白糖_ jquery css F#Firebug
留点学习jquery validation总结的代码： function checkForm(){ validator = $("#commentForm").validate({// #formId为需要进行验证的表单ID errorElement :"span",// 使用"div"标签标记错误，默认:&
solr限制admin界面访问（端口限制和http授权限制） ronin47 限定Ip访问
solr的管理界面可以帮助我们做很多事情，但是把solr程序放到公网之后就要限制对admin的访问了。可以通过tomcat的http基本授权来做限制，也可以通过iptables防火墙来限制。我们先看如何通过tomcat配置http授权限制。第一步：在tomcat的conf/tomcat-users.xml文件中添加管理用户，比如： <userusername="ad
多线程-用JAVA写一个多线程程序，写四个线程，其中二个对一个变量加1，另外二个对一个变量减1 bylijinnan java 多线程
public class IncDecThread { private int j=10; /* * 题目:用JAVA写一个多线程程序，写四个线程，其中二个对一个变量加1，另外二个对一个变量减1 * 两个问题： * 1、线程同步--synchronized * 2、线程之间如何共享同一个j变量--内部类 */ public static
买房历程 cfyme
2015-06-21: 万科未来城，看房子 2015-06-26: 办理贷款手续，贷款73万，贷款利率5.65=5.3675 2015-06-27: 房子首付,签完合同 2015-06-28，央行宣布降息 0.25，就2天的时间差啊，没赶上。首付，老婆找他的小姐妹接了5万，另外几个朋友借了1-
[军事与科技]制造大型太空战舰的前奏 comsci 制造
天气热了........空调和电扇要准备好.......... 最近,世界形势日趋复杂化,战争的阴影开始覆盖全世界.......... 所以,我们不得不关
dateformat dai_lm DateFormat
"Symbol Meaning Presentation Ex." "------ ------- ------------ ----" "G era designator (Text) AD" "y year
Hadoop如何实现关联计算 datamachine mapreduce hadoop 关联计算
选择Hadoop，低成本和高扩展性是主要原因，但但它的开发效率实在无法让人满意。以关联计算为例。假设：HDFS上有2个文件，分别是客户信息和订单信息，customerID是它们之间的关联字段。如何进行关联计算，以便将客户名称添加到订单列表中？ &nbs
用户模型中修改用户信息时，密码是如何处理的 dcj3sjt126com yii
当我添加或修改用户记录的时候对于处理确认密码我遇到了一些麻烦，所有我想分享一下我是怎么处理的。场景是使用的基本的那些(系统自带)，你需要有一个数据表(user)并且表中有一个密码字段(password),它使用 sha1、md5或其他加密方式加密用户密码。面是它的工作流程: 当创建用户的时候密码需要加密并且保存，但当修改用户记录时如果使用同样的场景我们最终就会把用户加密过的密码再次加密，这
中文 iOS/Mac 开发博客列表 dcj3sjt126com Blog
本博客列表会不断更新维护，如果有推荐的博客，请到此处提交博客信息。本博客列表涉及的文章内容支持定制化Google搜索，特别感谢 JeOam 提供并帮助更新。本博客列表也提供同步更新的OPML文件（下载OPML文件），可供导入到例如feedly等第三方定阅工具中，特别感谢 lcepy 提供自动转换脚本。这里有导入教程。
js去除空格，去除左右两端的空格蕃薯耀去除左右两端的空格 js去掉所有空格 js去除空格
js去除空格，去除左右两端的空格 >>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>&g
SpringMVC4零配置--web.xml hanqunfeng springmvc4
servlet3.0+规范后，允许servlet，filter，listener不必声明在web.xml中，而是以硬编码的方式存在，实现容器的零配置。 ServletContainerInitializer：启动容器时负责加载相关配置 package javax.servlet; import java.util.Set; public interface ServletContainer
《开源框架那些事儿21》：巧借力与借巧力 j2eetop 框架 UI
同样做前端UI，为什么有人花了一点力气，就可以做好？而有的人费尽全力，仍然错误百出？我们可以先看看几个故事。故事1：巧借力，乌鸦也可以吃核桃有一个盛产核桃的村子，每年秋末冬初，成群的乌鸦总会来到这里，到果园里捡拾那些被果农们遗落的核桃。核桃仁虽然美味，但是外壳那么坚硬，乌鸦怎么才能吃到呢？原来乌鸦先把核桃叼起，然后飞到高高的树枝上，再将核桃摔下去，核桃落到坚硬的地面上，被撞破了，于是，
JQuery EasyUI 验证扩展可怜的猫 jquery easyui 验证
最近项目中用到了前端框架-- EasyUI，在做校验的时候会涉及到很多需要自定义的内容，现把常用的验证方式总结出来，留待后用。以下内容只需要在公用js中添加即可。使用类似于如下： <input class="easyui-textbox" name="mobile" id="mobile&
架构师之httpurlconnection----------读取和发送(流读取效率通用类) nannan408
1.前言. 如题. 2.代码. /* * Copyright (c) 2015, S.F. Express Inc. All rights reserved. */ package com.test.test.test.send; import java.io.IOException; import java.io.InputStream
Jquery性能优化 r361251 JavaScript jquery
一、注意定义jQuery变量的时候添加var关键字这个不仅仅是jQuery，所有javascript开发过程中，都需要注意，请一定不要定义成如下： $loading = $('#loading'); //这个是全局定义，不知道哪里位置倒霉引用了相同的变量名，就会郁闷至死的二、请使用一个var来定义变量如果你使用多个变量的话，请如下方式定义： . 代码如下: var page
在eclipse项目中使用maven管理依赖 tjj006 eclipse maven
概览: 如何导入maven项目至eclipse中建立自有Maven Java类库服务器建立符合maven代码库标准的自定义类库 Maven在管理Java类库方面有巨大的优势，像白衣所说就是非常“环保”。我们平时用IDE开发都是把所需要的类库一股脑的全丢到项目目录下，然后全部添加到ide的构建路径中，如果用了SVN/CVS，这样会很容易就把
中国天气网省市级联页面 x125858805 级联
1、页面及级联js <%@ page language="java" import="java.util.*" pageEncoding="UTF-8"%> <!DOCTYPE HTML PUBLIC "-//W3C//DTD HTML 4.01 Transitional//EN"> &l