lhanchao

k-d树+bbf算法的介绍与实现

最近还是一直在研究SIFT算法，而SIFT特征点匹配是一个比较经典的问题，使用暴力匹配的话确实可以得到结果，但是运行速度较慢。我的计算机处理是i5的二代系列，匹配两张各检测有2000+个SIFT特征点的图像，通过正反匹配（即取图像1与图像2的匹配结果余图像2和图像1的匹配结果的交集），再加上OpenMP多线程加速，使用暴力匹配，大概要花20多秒，还是比较慢的。所以这一周啥也没做，一直在实现kd树和对应的bbf算法。下面详细介绍下种数据结构。

一、k-d树的介绍与实现

1.1 k-d树的创建

k-d树其实就是一种树形的数据结构，但是在创建这棵树时有一些固定的规则。下面来讲一下kd树的创建过程

输入：一组数据点集，n个数据点，每个点有m维

输出：k-d树的根结点指针

过程：（1）分别计算这n个数据点在m维中各个维度的方差，取方差最大的维度dim作为分割维度；

（2）把数据点集按照该维度中值的大小进行排列，选择具有中间值的点作为该树的根结点；

（3）前半部分点进行如（1）、（2）所示的递归操作，选出的递归子树的根节点作为（2）中得到的根节点的左孩子；

同理，后半部分也这样操作。如此一直递归，直到各个递归子树的数据点集为空则算法截止。

例子：以2维平面上的点集为例，设有6个二维数据点{(2,3)，(5,4)，(9,6)，(4,7)，(8,1)，(7,2)}。

（1）首先计算这6个点的横坐标和纵坐标的方差值，横坐标的方差值为39，纵坐标上的方差值为28.63，因此第一次分割取横坐标上的值作为分割标准。把这些点按照横坐标进行排序得到{(2,3)，(4,7)，(5,4)，(7,2)，(8,1)，(9,6)}，取中间点为（7,2），因此根节点为（7,2）进行分割，如下图所示：

图1 分割示意图

（2）接下来对{(2,3)，(4,7)，(5,4)}和{(8,1)，(9,6)}分别进行分割，在{(2,3)，(4,7)，(5,4)}中纵坐标的方差较大，因此按纵坐标进行排序后分割，则（5,4）为（7,2）的左孩子，{(8,1)，(9,6)}中也是纵坐标方差较大，因此选纵坐标进行排序后分割，这里算则（9,6）作为（7,2）的右孩子。

（3）依次递归进行分割，最终形成的分割图和树状结构如下所示：

图2 上例中形成的分割图

图3 上例中形成的树状结构

1.2 k-d树的查询

k-d树建立好以后，需要查询它的最近邻，方法如下：

（1）查询点与k-d树的根节点进行比较，比较两者在根节点划分时的维度的值的大小，若查询点在该维的值小，则进入根节点的左子树，否则进入右子树。依次类推，进行查找，直到到达树的叶子节点。

（2）设当前到达的叶子节点为目前的最近邻（注意：可能并非真正的最近邻），并且记录目前的最近邻距离。沿着来时的路向前回溯，让目前的最近邻距离与查找点与当前叶子节点的父节点形成的分割超平面的距离进行比较，若当前最近邻比较小，则不用遍历当前叶子节点的父节点的另一边，否则需要遍历查找以更新最近邻距离和最近邻节点。

（3）按照（2）中所说依次遍历，直到到达根节点为止，查询结束。

上面的说法比较抽象，下面用两个博客中广为流传的例子进行解读。

假设我们需要查找点（2.1,3.1）在前面中提到的二维点集中的最近邻点。我们首先判断（7,2）的分割标准是x轴，而2.1<7，因此查找点进入（7,2）的左子树；而（5,4）的分割标准是y轴，而3.1<4，因此我们进入（5,4）的左子树，即找到叶子节点（2,3）；把（2,3）作为查找点（2.1,3.1）的临时最近邻点，最近邻距离为0.1414，向前回溯。

因为查找点到（5,4）的距离大于到（2,3）的距离，因此最近邻点和最近邻距离保持不变，因此以（2.1,3.1）为原点，以0.1414为半径画圆，该圆与（5,4）确定的分割线没有相交（即当前最近邻距离比查找点到（5,4）所确定的分割线距离要小），因此不需要进入（5,4）的右子树，继续回溯，同理，最近邻点和最近邻距离不变，以（2.1,3.1）为原点，以0.1414为半径画圆，该圆与（7,2）所确定的分割线也没有相交，因此也不需要进入（7,2）的右子树；回溯结束。因此（2,3）就是真正的最近邻节点。

如下图所示：

图4 （2.1,3.1）查询最近邻示意图

上面这个例子比较简单，下面我们看一个复杂一些的例子，假设我们要查找（2,4.5）的最近邻。

同上，首先我们判断（7,2）的分割标准是x周，而2<7，因此到（7,2）的左孩子进行查找，而(5,4)的分割标准为y轴，而4.5>4因此3.041，因此需要到（5,4）的右孩子进行查找，找到了叶子节点（4,7）。那么我们把（4,7）作为查找点的临时最近邻，最近邻距离为3.202，向前回溯，可以看到到（5,4）的距离为3.041，因此更新（5,4）为最近邻点，最近邻距离为3.041。然后以（2,4.5）为圆心，以3.041为半径画圆，可以看到该圆与（5,4）确定的分割线相交，因此需要遍历（5,4）的左子树。如下图所示：

判断（2,4.5）到（2,3）的距离为1.5，因此更新最近邻点和最近邻距离。回溯到（7，2），可以判断不需到（7,2）的右子树进行查找，如下图所示：

1.3 代码实现

k-d树的实现还算是比较简单的，在我的实现过程中遇到的问题是开始我没有理解前面提到的圆与分割线相交的意义，所以实现时遇到了一些问题，现在把我实现的kd树的核心算法一一介绍。

（1）kd树的结点数据结构

class kdNode
{
public:
	kdNode(Point &data);
	~kdNode();
	Point data;//数据点的信息
	int sort_dim;//数据点的划分维度
	kdNode *left;
	kdNode *right;
	kdNode *parent;
};

数据结构算是比较简单的，只包含了数据点的信息（Point类是我自己定义的），left和right是左右孩子的指针，parent是父节点指针，在回溯时会用到；sort_dim是记录当前结点时按照哪个维度进行划分的，在回溯时判断最近邻和查找点到当前结点确定的分割超平面的距离哪个大时会用到。

（2）创建kdTree代码

//创建kd树，keypoints为点数据，parent表示当前树的双亲，默认为NULL
kdNode* kdTree::createTree(vector &keypoints, kdNode *parent)
{
	if (keypoints.size() == 0)//若数据点集为空，则停止创建
		return NULL;
	int sort_dim = findSortDim(keypoints, parent);//确定分割的维度
	kdNode *tmp = findMidNode(keypoints);//找到分割结点
	int sort_num = keypoints.size() / 2;
	vector leftKeyPoints(keypoints.begin(), keypoints.begin() + sort_num);
	vector rightKeyPoints(keypoints.begin() + sort_num + 1, keypoints.end());
	tmp->sort_dim = sort_dim;//记录当前结点的分割维度
	tmp->left = createTree(leftKeyPoints, tmp);//递归调用，创建左子树
	tmp->right = createTree(rightKeyPoints, tmp);//递归调用，创建右子树
	tmp->parent = parent;//记录父节点
	return tmp;//返回当前树的根节点
}

这里面findMidNode函数是找到当前数据点的分割结点，在这里面对keypoints按照各点在分割维度上的大小进行了排序，因此后面直接把数据点集分成了两部分。

（3）查找最近邻结点

//通过kd树查找距离指定点node最近的点
//root是查找的kd树的根节点
//point是查找点
nearestNodeInfo& kdTree::findNearestNode(kdNode* root, const Point& point)
{
	if (root == NULL)
	{
		return nearestNodeInfo();
	}
	kdNode *p = root;
	//通过kd树的二叉搜索，顺着搜索路径很快就能找到最邻近的近似点
	while ((p->left != NULL) || (p->right != NULL))//只要p不是指向叶节点
	{
		int sort_dim = p->sort_dim;
		if (point.data[sort_dim] <= p->data.data[sort_dim])
		{
			if (p->left == NULL)
				break;
			p = p->left;
		}
		else
		{
			if (p->right == NULL)
				break;
			p = p->right;
		}
	}

	float min_dis = FLT_MAX;//距离查找点最近的距离
	float secmin_dis = FLT_MAX;//距离查找点的次近邻距离
	int min_subscript = 0;

	min_dis = calcDistance(point, p->data);//计算查找点与近似邻近叶子节点的距离
	min_subscript = p->data.subscript;//记录最近邻结点在数据点集中的下标，以便以后找到它

	kdNode* q = p;
	kdNode* tmp = q;

	//开始回溯
	while (q != root)
	{
		q = tmp->parent;
		//当前结点距离查找点的距离
		float tmp_dis = calcDistance(point, q->data);
		//当tmp_dis小于最近邻距离时，更新最近邻和次近邻
		if (tmp_dis < min_dis)
		{
			secmin_dis = min_dis;
			min_dis = tmp_dis;
			min_subscript = q->data.subscript;
		}
		//当tmp_dis大于等于最近邻且小于次近邻时，更新次近邻
		else if (tmp_dis == min_dis || tmp_dis < secmin_dis)
		{
			secmin_dis = tmp_dis;
		}
		//查找点距离当前结点构成的区域分割线的垂直距离
		float sortdim_dis = std::fabs(point.data[q->sort_dim] - q->data.data[q->sort_dim]);

		//若垂直距离小于距离当前结点的距离
		//则证明以查找点为中心，以到当前结点距离为半径画圆，会与该结点构成的区域分割线相交
		if (sortdim_dis < min_dis)
		{
			nearestNodeInfo tmpResult;
			if (tmp == q->left)
			{
				tmpResult = findNearestNode(q->right, point);
			}
			else if (tmp == q->right)
			{
				tmpResult = findNearestNode(q->left, point);
			}
			else
				cout << "q is not parent of tmp" << endl;
			//tmpDis为查找点距离当前结点的另一边的子树的最小距离
			float tmp_nearest_dis = tmpResult.nearest_dis;
			float tmp_sec_nearest_dis = tmpResult.sec_nearest_dis;
			//当子树中距离查找点的最小距离小于当前记录的最邻近距离时，更新最近邻和次近邻距离
			if (tmp_nearest_dis < min_dis)
			{
				secmin_dis = min_dis;
				min_dis = tmp_nearest_dis;
				min_subscript = tmpResult.point_subscript;
			}
			//当子树中距离查找点的最小距离在最近邻和次近邻距离之间时，更新次近邻距离
			else if (tmp_nearest_dis == min_dis || tmp_nearest_dis < secmin_dis)
				secmin_dis = tmp_nearest_dis;
			//当子树中距离查找点的次近邻距离小于更新后的次近邻距离时，再次更新
			if (tmp_sec_nearest_dis < secmin_dis)
				secmin_dis = tmp_sec_nearest_dis;
		}
		tmp = q;
	}
	nearestNodeInfo result(min_dis, secmin_dis, min_subscript);
	return result;
}

这里的nearestNodeInfo表示的是最近邻距离，次近邻距离和最近邻点在数据点集中的下标，为了后面的SIFT算法会用到。

上面的描述就是k-d树的建立和利用k-d树找最近邻的方法了。在实际应用中k-d树更加适合于低维的数据中，或者说如果数据量远大于数据的维度的时候，使用k-d树的效率与线性查找的方法相比还是有很大的提升的。但是我在实际应用时，一张图像中通常有2000+个特征点，而SIFT特征为128维的，所以加速效果也不是很好。实际上，在我的实验中，甚至不如暴力匹配的效率高（当然，这可能跟我的代码质量有关）。因此也就引出了我们接下来要介绍的bbf算法。

前面讲到了用k-d树对于高维的数据进行最邻近查询时实际上效率并不高，这里介绍一个算法用以加速k-d树对于高维数据的处理。

二、bbf（Best Bin First）算法介绍与实现

根据前面k-d树的搜索过程我们可以知道，在搜索时首先沿着kd树找到叶子节点，然后依次回溯，而回溯的路程就是前面我们查找叶子节点时逆序，因此进行回溯时并没有利用这些点的信息。我们接下来介绍的算法就是利用这些信息，回溯时给各个需要回溯的结点以优先级，这样找到最近邻会更快。接下来详细介绍bbf算法的流程。

其实bbf算法的思想比较简单，通过对回溯可能需要的路过的结点加入队列，并按照查找点到该结点确定的超平面的距离进行排序，然后每次首先遍历的是优先级最高（即距离最短的结点），直到队列为空算法结束。同时bbf算法也设立了一个时间限制，如果算法运行时间超过该限制，不管是不是为空，一律停止运行，返回当前的最近邻点作为结果。

bbf的算法流程如下：

输入：kd树，查找点x

输出：kd树种距离查找点最近的点以及最近的距离

流程：（1）若kd树为空，则设定两者距离为无穷大，返回；如果kd树非空，则将kd树的根节点加入到优先级队列中；

（2）从优先级队列中出队当前优先级最大的结点，计算当前的该点到查找点的距离是否比最近邻距离小，如果是则更新最近邻点和最近邻距离。如果查找点在切分维坐标小于当前点的切分维坐标，则把他的右孩子加入到队列中，同时检索它的左孩子，否则就把他的左孩子加入到队列中，同时检索它的右孩子。这样一直重复检索，并加入队列，直到检索到叶子节点。然后在从优先级队列中出队优先级最大的结点；

（3）重复（1）和（2）中的操作，直到优先级队列为空，或者超出规定的时间，返回当前的最近邻结点和距离。

实现代码如下：

nearestNodeInfo& kdTree::findNearestNode_bbf(kdNode* root, const Point& point)
{
	if (root == NULL)
		return nearestNodeInfo();
	kdNode *p = root;
	float min_dis = FLT_MAX;//最近邻距离
	float sec_min_dis = FLT_MAX;//次近邻距离
	int min_subscript = 0;//最近邻点在点集中的下标
	//优先级队列，查找点到当前点确定的分割超平面距离越小优先级越大
	priority_queue pri_queue;

	//priorityInfo类型包含了如下信息：
	//(1)当前的结点指针，指向kdNode类型
	//(2)当前点到查找点的欧式距离
	//(3)以及查找点到当前点确定的分割超平面的距离
	pri_queue.push(priorityInfo(p,calcDistance(point,root->data),
		                        fabs(point.data[root->sort_dim]-root->data.data[root->sort_dim])));

	int t = 0;//这里没有记录时间，使用t记录尝试更新最近邻的次数

	while (!pri_queue.empty())
	{
		t++;
		priorityInfo tmp = pri_queue.top();
		pri_queue.pop();
		int sort_dim = tmp.ptr->sort_dim;
		//如果最近邻距离小于查找点到当前点确定的分割超平面的距离则不访问该点的分支
		if (min_dis < fabs(point.data[sort_dim] - tmp.ptr->data.data[sort_dim]))
			continue;
		//记录当前点到查找点的欧式距离
		float tmp_dis = calcDistance(point, tmp.ptr->data);

		//判断是否更新最近邻、次近邻距离
		if (tmp_dis < min_dis)
		{
			sec_min_dis = min_dis;
			min_dis = tmp_dis;
			min_subscript = tmp.ptr->data.subscript;
		}
		else if (tmp_dis == min_dis || tmp_dis < sec_min_dis)
		{
			sec_min_dis = tmp_dis;
		}
		
		kdNode* q = tmp.ptr;
		//遍历以当前点为根的子树，直到叶子节点
		while (q->right != NULL || q->left != NULL)
		{
			t++;
			int s_d = q->sort_dim;
			if (point.data[s_d] <= q->data.data[s_d])//查找点在分割维的大小小于当前点分割维的大小
			{
				if (q->left != NULL)//进入左孩子之前判断左孩子是否为空
				{
					if (q->right != NULL)//把右孩子加入节点时判断右孩子是否为空
					{
						float distance = calcDistance(point, q->right->data);
						int s_t = q->right->sort_dim;
						pri_queue.push(priorityInfo(q->right, distance,
							fabs(point.data[s_t]-q->right->data.data[s_t])));
					}
					q = q->left;
				}
				else
					break;
			}
			else
			{
				if (q->right != NULL)
				{
					if (q->left != NULL)
					{
						float distance = calcDistance(point, q->left->data);
						int s_t = q->left->sort_dim;
						pri_queue.push(priorityInfo(q->left, distance,
							fabs(point.data[s_t]-q->left->data.data[s_t])));
					}
					q = q->right;
				}
				else
					break;
			}
			//更新最近邻
			float dis = calcDistance(point, q->data);
			if (dis < min_dis)
			{
				sec_min_dis = min_dis;
				min_dis = dis;
				min_subscript = q->data.subscript;
			}
			else if (dis == min_dis || dis < sec_min_dis)
				sec_min_dis = dis;
		}
		if (t > 600)//如果更新次数超过600次则直接退出循环，返回当前最近邻结果
			break;
	}
	nearestNodeInfo result(min_dis, sec_min_dis, min_subscript);
	return result;
}

这里t取600时运行情况已经同暴力查找时效率相当，如果想要加速，把阈值设的低一些。但是如果阈值设的太低会造成匹配结果较差，需要在效率和正确率上进行取舍。

OpenCV双目视觉棋盘格标定、特征匹配及三维坐标计算
OpenCV双目视觉棋盘格标定、特征匹配及三维坐标计算【下载地址】OpenCV双目视觉棋盘格标定特征匹配及三维坐标计算OpenCV双目视觉棋盘格标定、特征匹配及三维坐标计算本资源库提供了基于OpenCV的双目视觉系统标定和三维重建基础教程，专注于利用棋盘格作为特征目标进行相机校准，特征点匹配以及随后的三维坐标计算项目地址:https://gitcode.com/open-source-toolki
OpenCV图像拼接（4）图像拼接模块的一个匹配器类cv::detail::BestOf2NearestRangeMatcher 村北头的码农 OpenCV opencv 人工智能计算机视觉
操作系统：ubuntu22.04OpenCV版本：OpenCV4.9IDE:VisualStudioCode编程语言：C++11算法描述cv::detail::BestOf2NearestRangeMatcher是OpenCV库中用于图像拼接模块的一个匹配器类，专门用于寻找两幅图像之间的最佳特征点匹配。它是基于“最近邻与次近邻距离比”原则来过滤匹配点对的，以提高匹配结果的准确性。这个类特别适用于需
基于特征提取的方法实现对心室视频的追踪阿蛋会代码音视频 python 开发语言 opencv 目标检测计算机视觉
一、特征提取的方法本代码实现了一套基于计算机视觉的心脏运动定量分析系统，通过特征点追踪技术对超声心动图视频进行动态解析。核心技术采用ORB(OrientedFASTandRotatedBRIEF)特征检测算法，在每帧图像中提取具有旋转不变性的显著斑点特征，构建包含位置和方向信息的特征描述子。通过暴力匹配器(BFMatcher)进行跨帧特征点匹配，结合汉明距离阈值筛选出可信度高的空间对应点对。系统以
Ubuntu终端跑colmap实验记录——生成sparse和poses_bounds.npy Yunni_root 3D Gaussian &&Unity ubuntu bad-nerf 实验 colmap 经验分享计算机视觉 nerf
目录前言：colmap生成sparse1.打开工程进行自动重建（不需要）——just避雷！2.单步重建——生成sparse图像2.1提取特征点2.2特征点匹配2.3稀疏重建3.使用LLFF生成poses_bounds.npy前言：我一直习惯使用autodl的服务器，在上面配置了nerfstudio的环境，详细可以看我的这篇博客：Windows&&Linux跑通BAD-RFs实战__无数踩坑坑坑记录
opencv特征点匹配_opencv-python 4.2 BFMatcher匹配特征点福建低调 opencv特征点匹配
importcv2frommatplotlibimportpyplotasplt#读取需要特征匹配的两张照片，格式为灰度图。img1=cv2.imread("water1.jpg",0)img2=cv2.imread("water2.jpg",0)#BFMatcher匹配orb=cv2.ORB_create()#建立orb特征检测器kp1,des1=orb.detectAndCompute(img
[C#][opencvsharp]opencvsharp sift和surf特征点匹配 FL1623863129 C#人工智能机器学习算法
SIFT特征和SURF特征比较SIFT特征基本介绍SIFT(Scale-InvariantFeatureTransform)特征检测关键特征：建立尺度空间，寻找极值关键点定位（寻找关键点准确位置与删除弱边缘）关键点方向指定关键点描述子建立尺度空间，寻找极值工作原理构建图像高斯金字塔，求取DOG，发现最大与最小值在每一级构建的高斯金字塔，每一层根据sigma的值不同，可以分为几个待级，最少有4个。关
ORB-SLAM2论文总结 Mr.Qin_ SLAM slam orb ORB-SLAM2
ORB-SLAM2学文学习总结1系统概述2加速特征点匹配策略2.1词袋模型加速匹配2.2恒速运动模型加速匹配3系统原理详解3.1初始化3.2跟踪线程3.3局部建图线程3.4回环检测线程4一些总结4.1单目、双目、RGBD的差别4.2系统所用到的优化1系统概述 ORB-SLAM2支持单目、双目、RGB-D相机的输入，整个系统包含三个线程跟踪线程、局部建图线程、回环检测线程（当检测到回环时，回环融合
特征点匹配 harris 潇洒哥611 计算机视觉人工智能
算法的核心是利用局部窗口在图像上进行移动，判断灰度是否发生较大的变化。如果窗口内的灰度值（在梯度图上）都有较大的变化，那么这个窗口所在区域就存在角点。这样就可以将Harris角点检测算法分为以下三步：当窗口（局部区域）同时向x（水平）和y（垂直）两个方向移动时，计算窗口内部的像素值变化量E(x,y)；对于每个窗口，都计算其对应的一个角点响应函数R；然后对该函数进行阈值处理，如果R>threshol
opencv特征线检测与应用人工智能大讲堂计算机视觉 opencv 图像处理
1．前言我之前写过一个系列的文章讲述基于Opencv的图像拼接，拼接流水线中最重要的一步就是特征点识别以及特征点匹配，特征点的好坏直接决定了最终的拼接效果，但对于医疗图像而言，加之如果图像质量不好，则提取的特征点区分度并不高，如下图所示，很多特征点都匹配错了。那有没有什么办法呢？这时不如换个思路[换个角度看问题]，既然特征点不行，那就找特征线，Opencv中提供了两种线特征提取器，接下来就让我们分
图像处理中，采用极线约束准则来约束特征点匹配搜索空间，理论上在极线上进行搜索。这里的极线是什么线，怎么定义的？基本矩阵F和本质矩阵E有什么区别？神笔馬良图像处理人工智能
问题描述：图像处理中，采用极线约束准则来约束特征点匹配搜索空间，理论上在极线上进行搜索。这里的极线是什么线，怎么定义的？基本矩阵F和本质矩阵E有什么区别？问题1解答：极线是通过极线几何学的原理定义的。在摄影测量学和计算机视觉中，极线是由两个相机视图之间的对应点及其相机光心之间的几何关系推导而来的。假设有两个相机视图，记为相机A和相机B，它们之间的对应点为P和P′。相机A的光心为，相机B的光心为。那
特征点检测和特征点匹配（ORB）瓴龍 CV 计算机视觉 opencv
前言本文介绍了特征点检测的一些算法，然后基于OpenCV的ORB，实现了不同尺度和旋转的图像特征点匹配。本文用到的代码存储在这里。特征点是什么？当我们人在对比两张图片时（例如上面的妙蛙种子），我们可以轻而易举地找到两张图片的相似性，尽管我们很难去刻画这种相似性，但是这种观察力却是天生具备的。而对于计算机来说，必须要用它能够理解的方式才能区分图片。考虑如下三种区域类型：平坦区域（flat）：图中蓝色
04 帧 Frame 算法导航 ORB-SLAM2 SLAM ORB-SLAM2
文章目录04帧Frame4.1相机相关信息4.2特征点提取4.2.1特征点提取ExtractORB()4.3ORB-SLAM2对双目/RGBD特征点的预处理4.3.1双目视差公式4.3.2双目图像特征点匹配ComputeStereoMatches()4.3.3根据深度信息构造虚拟右目图像：`ComputeStereoFromRGBD()`4.4畸变矫正：`UndistortKeyPoints()`
LightGlue-OpenCV 实现实时相机图片特征点匹配 sugardisk opencv 数码相机人工智能
LightGlue-OpenCV文章目录LightGlue-OpenCVStep1:创建虚拟环境Step2:安装LightGlue-OpenCV并运行Step3:运行demo_camera.py效果原理LightGlue是一种新的基于深度神经网络，用来匹配图像中的局部特征的深度匹配器。是SuperGlue的加强版本。相比于SuperGlue，LightGlue在内存和计算方面更高效，同时结果更准确
图像拼接——基于homography的特征匹配算法 Jurio. CV Python 算法计算机视觉 python
目录1.任务要求2.数据集3.基于homography的特征匹配算法4.拼接流程展示4.1图片实例4.2特征点位图4.3特征点匹配结果4.4相机校准结果4.5拼接结果5.部分图像拼接结果展示1.任务要求输入：同一个场景的两张待拼接图像（有部分场景重合）。任务：从输入的两张图像中提取特征点和描述子，可以使用现有的图像处理库来执行此任务。自己实现特征匹配算法，将来自两张图像的特征点进行匹配。最后根据匹
【图像处理】常用图像增强算法（MATLAB实现） littlebrothers 图像处理信号处理图像处理 matlab
1引言图像增强是指按照某种特定的需求，突出图像中有用的信息，去除或者削弱无用的信息。图像增强的目的是使处理后的图像更适合人眼的视觉特性或者易于机器识别。在医学成像、遥感成像、人物摄影等领域，图像增强技术都有着广泛的应用。图像增强同时可以作为目标识别，目标跟踪，特征点匹配，图像融合，超分辨重构等图像处理算法的预处理算法。本文主要从空域和频域两个方面介绍了图像增强算法。空域中，主要分为灰度级增强，直方
实现两张图片的接缝线拼接赢勾喜欢海计算机视觉人工智能
使用ORB算法检测特征点，并通过BFMatcher进行特征点匹配。然后，根据Lowe'sratiotest选择好的匹配点，并使用findHomography计算单应性矩阵。最后，使用warpPerspective将图像进行透视变换，然后将第二张图像粘贴到变换后的图像上。importcv2importnumpyasnpdeffind_homography_and_blend(image1,image
大疆算法笔试题目解析（二）计算机视觉 NTFY 超得屁(°∀°)ﾉ算法计算机视觉人工智能
二、计算机视觉（100分）1.(20分)（特征点匹配）给定两幅图像AAA和BBB，要求对两幅图中的特征点xi,i=1,..,m,x_i,i=1,..,m,xi,i=1,..,m,和xi′,j=1,..,nx_i',j=1,..,nxi′,j=1,..,n进行匹配。特征点的结构为:{x,yx,yx,y坐标，128位描述子}，即x={int x,int y,floatdesc[128]}x=\{int
项目实战：用python的opencv库实现全景图像拼接会飞的神里绫华 python程序实战 python opencv 开发语言
文章目录前言一、程序主要架构二、程序实现原理1.sift特征点匹配算法2.ransac误匹配剔除三.代码实现过程总结前言opencv库是python中重要的图像处理库，也被称为计算机视觉开发库，这篇文章我们用利用opencv库来实现全景图像的拼接，总体上来说包含sift匹配和ransac误匹配剔除两大模块，那么话不多说，我们开始今天的正题。一、程序主要架构为了大家开始就有一个清晰的认知，首先介绍一
论文阅读：“基于快速特征点提取和描述算法与色调、饱和度和明度的图像特征点匹配算法” 如松茂矣三维重建论文阅读 ORB 图像配准图像拼接
文章目录摘要引言方法实验结果图像预处理结果对比图像配准结果对比参考文献摘要提出了一种基于快速点特征提取和描述（ORB）算法与色调、饱和度和明度（HSV）的图像特征点匹配算法。首先利用双边滤波和均值滤波结合对图像进行预处理，然后使用ORB算法进行特征点提取；接着利用K维二叉树（K-DTree）算法与汉明距离进行特征点粗匹配；再利用图像的HSV信息对匹配特征点对进行二次筛选。实验结果表明，在图像进行预
python+opencv图像模板匹配踩坑记录丸子妹 paddlepaddle python opencv
按照这篇博客opencv+python实现图像匹配----模板匹配、特征点匹配进行图像模板匹配#opencv模板匹配----单目标匹配importcv2#读取目标图片target=cv2.imread("target.jpg")#读取模板图片template=cv2.imread("template.jpg")#获得模板图片的高宽尺寸theight,twidth=template.shape[:2
slam 单目稠密深度详解蓝羽飞鸟 SLAM slam 算法 c++
单目计算深度比较复杂，一般可以用RGB-D相机直接得到深度，但还是练习一下。因为是稠密重建，对每个像素都算深度，所以就不是提取特征了。仅凭一幅图像无法估计出深度，要用不同视角下的图像来估计。特征点匹配法中，是根据不同视角中同一特征点的不同位置来进行三角测量估计深度，但是稠密重建是不用特征点的，要对每个像素都进行匹配，然后进行三角测量。怎么匹配呢，用极线搜索和块匹配。什么是极线搜索，如下（贴一张别人
Opencv之RANSAC算法用于直线拟合及特征点集匹配详解明月醉窗台 #C++-opencv opencv 算法人工智能计算机视觉图像处理
Opencv之RANSAC算法用于直线拟合及特征点集匹配详解讲述Ransac拟合与最小二乘在曲线拟合上的优缺点讲述在进行特征点匹配时，最近邻匹配与Ransac匹配的不同之处另外，Ransac也被用于椭圆拟合、变换矩阵求解等1.直线拟合1.1原理RANSAC(RANdomSAmpleConsensus,随机采样一致)算法是从一组含有“外点”(outliers)的数据中正确估计数学模型参数的迭代算法。
OpenCV python教程（1）： CMake 安装配置OpenCV与测试搞计算机的数学生 opencv cmake 配置失败 SIFT算法 python
OpenCVpython教程（1）：CMake安装配置OpenCV与测试本来用python调用opencv的SIFT特征点匹配算法，pip安装后发现，并不能调用。google一下，发现SIFT已经有了专利，不能直接使用，但是可以通过CMake配置编译源码的方式继续使用。接下来介绍python调用SIFT算法的两种方法，上一篇因为不恰当的言辞已经被和谐了，这次认真正经的重新写一遍。配置安装的难点在于
学习记录 Halcon 图片拼接被雨打湿的杜甫 Halcon 学习记录学习
一、图像拼接步骤1.拍图2.图像预处理3.提取特征点4.特征点匹配5.求变换矩阵6.拼接二、拼接算子1.proj_match_points_ransac(Image1,Image2::Rows1,Cols1,Rows2,Cols2,GrayMatchMethod,MaskSize,RowMove,ColMove,RowTolerance,ColTolerance,Rotation,MatchThr
【深蓝学院】手写VIO第7章--VINS初始化和VIO系统--笔记读书健身敲代码笔记
0.内容1.VIO回顾整个视觉前端pipeline回顾：两帧图像，可提取特征点，特征匹配（描述子暴力匹配或者光流）已知特征点匹配关系，利用几何约束计算relativepose([R|t])，translation只有方向，没有尺度使用三角化获得3维坐标，即可完成vslam系统的初始化有了3D特征点，后续可根据特征跟踪，使用PnP求解CameraPose，无需再使用几何约束IMU的加速度要和世界系的
《论文阅读27》SuperGlue: Learning Feature Matching with Graph Neural Networks Darren_pty 科研论文论文阅读
一、论文研究领域：图像特征点匹配论文：SuperGlue:LearningFeatureMatchingwithGraphNeuralNetworksCVPR2020veido论文code二、论文简述[参考][参考][参考]三、论文详述SuperGlue：使用图神经网络学习特征匹配本文介绍了SuperGlue，一种神经网络，通过共同寻找对应点和拒绝不匹配点来匹配两组本地特征。分配估计通过解决一个可
基于Matlab OpenSUFT的图像配准星光璀抱 Matlab matlab 图像处理计算机视觉
基于MatlabOpenSUFT的图像配准在图像处理领域，图像配准是一项非常重要的任务。它指的是将两张或多张图像中的相同目标对齐，使得它们可以进行比较或叠加。图像配准常用于遥感影像、医学图像，以及工业制造等领域。而MatlabOpenSUFT是Matlab语言中，一个用于图像配准的开源工具箱。本文将介绍如何结合MatlabOpenSUFT实现基于特征点匹配的图像配准。一、图像配准原理在进行图像配准
OpenCV（四十七）：RANSAC优化特征点匹配 Hdnw Android之OpenCV 算法 opencv C++计算机视觉
1.RANSAC算法介绍RANSAC是一种常用的参数估计方法，全称为RandomSampleConsensus（随机抽样一致性）。它的主要思想是通过随机选择一部分数据样本，构建模型并评估其拟合程度，迭代过程中逐步优化模型，最终得到一个拟合较好的模型。其基本流程如下：随机取样，计算规律(特征点匹配中计算单应矩阵)测试规律是否满足大多数数据循环前两步选取最佳规律，并输出满足数据的点2.RANSAC优化
OpenCV（四十六）：特征点匹配 Hdnw Android之OpenCV opencv 人工智能计算机视觉 C++
1.特征点匹配的定义特征点匹配是一种在两幅图像中寻找相互对应的特征点，并建立它们之间的对应关系的过程。具体而言，首先通过特征检测算法在两幅图像中寻找相互对应的特征点，然后，对于每个特征点，通过描述子提取算法计算其描述子，最后，使用匹配算法对两组特征点的描述子进行比较，以找到相互匹配的特征点对。2.DMatch()用于表示特征点匹配的数据结构cv::DMatch::DMatch(intqueryld
EmguCV-C#版本Opencv图像识别和处理 Big_潘大师计算机视觉 c#opencv EmguCV
目录0、简介1、图像处理（1）颜色处理（2）图像差（3）图像拼接（4）直方图（5）颜色空间/通道提取2、预处理（1）均衡化（2）阈值处理（3）滤波（4）形态学运算（5）ROI3、检测（1）角点检测（2）边缘检测（3）霍夫变换（4）轮廓（5）特征点匹配（6）Blob特征（7）凸包检测4、定位（1）找圆（2）模板匹配（3）拟合圆（4）分水岭5、图像变换（1）金字塔（2）仿射变换（3）透视变换（4）傅里
统一思想认识永夜-极光思想
1.统一思想认识的基础,才能有的放矢原因: 总有一种描述事物的方式最贴近本质,最容易让人理解. 如何让教育更轻松,在于找到最适合学生的方式. 难点在于,如何模拟对方的思维基础选择合适的方式. &
Joda Time使用笔记 bylijinnan java joda time
Joda Time的介绍可以参考这篇文章： http://www.ibm.com/developerworks/cn/java/j-jodatime.html 工作中也常常用到Joda Time，为了避免每次使用都查API，记录一下常用的用法： /** * DateTime变化（增减） */ @Tes
FileUtils API eksliang FileUtils FileUtils API
转载请出自出处：http://eksliang.iteye.com/blog/2217374 一、概述这是一个Java操作文件的常用库，是Apache对java的IO包的封装，这里面有两个非常核心的类FilenameUtils跟FileUtils，其中FilenameUtils是对文件名操作的封装;FileUtils是文件封装，开发中对文件的操作，几乎都可以在这个框架里面找到。非常的好用。
各种新兴技术不懂事的小屁孩技术
1:gradle Gradle 是以 Groovy 语言为基础，面向Java应用为主。基于DSL（领域特定语言）语法的自动化构建工具。现在构建系统常用到maven工具，现在有更容易上手的gradle，搭建java环境: http://www.ibm.com/developerworks/cn/opensource/os-cn-gradle/ 搭建android环境： http://m
tomcat6的https双向认证酷的飞上天空 tomcat6
1.生成服务器端证书 keytool -genkey -keyalg RSA -dname "cn=localhost,ou=sango,o=none,l=china,st=beijing,c=cn" -alias server -keypass password -keystore server.jks -storepass password -validity 36
托管虚拟桌面市场势不可挡蓝儿唯美
用户还需要冗余的数据中心，dinCloud的高级副总裁兼首席营销官Ali Din指出。该公司转售一个MSP可以让用户登录并管理和提供服务的用于DaaS的云自动化控制台，提供服务或者MSP也可以自己来控制。在某些情况下，MSP会在dinCloud的云服务上进行服务分层，如监控和补丁管理。 MSP的利润空间将根据其参与的程度而有所不同，Din说。 “我们有一些合作伙伴负责将我们推荐给客户作为个
spring学习——xml文件的配置 a-john spring
在Spring的学习中，对于其xml文件的配置是必不可少的。在Spring的多种装配Bean的方式中，采用XML配置也是最常见的。以下是一个简单的XML配置文件： <?xml version="1.0" encoding="UTF-8"?> <beans xmlns="http://www.springframework.or
HDU 4342 History repeat itself 模拟 aijuans 模拟
来源：http://acm.hdu.edu.cn/showproblem.php?pid=4342 题意：首先让求第几个非平方数，然后求从1到该数之间的每个sqrt(i)的下取整的和。思路：一个简单的模拟题目，但是由于数据范围大，需要用__int64。我们可以首先把平方数筛选出来，假如让求第n个非平方数的话，看n前面有多少个平方数，假设有x个，则第n个非平方数就是n+x。注意两种特殊情况，即
java中最常用jar包的用途 asia007 java
java中最常用jar包的用途 jar包用途axis.jarSOAP引擎包commons-discovery-0.2.jar用来发现、查找和实现可插入式接口，提供一些一般类实例化、单件的生命周期管理的常用方法.jaxrpc.jarAxis运行所需要的组件包saaj.jar创建到端点的点到点连接的方法、创建并处理SOAP消息和附件的方法，以及接收和处理SOAP错误的方法. w
ajax获取Struts框架中的json编码异常和Struts中的主控制器异常的解决办法百合不是茶 js json编码返回异常
一:ajax获取自定义Struts框架中的json编码出现以下问题: 1,强制flush输出 json编码打印在首页 2, 不强制flush js会解析json 打印出来的是错误的jsp页面却没有跳转到错误页面 3, ajax中的dataType的json 改为text 会
JUnit使用的设计模式 bijian1013 java 设计模式 JUnit
JUnit源代码涉及使用了大量设计模式 1、模板方法模式（Template Method）定义一个操作中的算法骨架，而将一些步骤延伸到子类中去，使得子类可以不改变一个算法的结构，即可重新定义该算法的某些特定步骤。这里需要复用的是算法的结构，也就是步骤，而步骤的实现可以在子类中完成。
Linux常用命令（摘录） sunjing crond chkconfig
chkconfig --list 查看linux所有服务 chkconfig --add servicename 添加linux服务 netstat -apn | grep 8080 查看端口占用 env 查看所有环境变量 echo $JAVA_HOME 查看JAVA_HOME环境变量安装编译器 yum install -y gcc
【Hadoop一】Hadoop伪集群环境搭建 bit1129 hadoop
结合网上多份文档，不断反复的修正hadoop启动和运行过程中出现的问题，终于把Hadoop2.5.2伪分布式安装起来，跑通了wordcount例子。Hadoop的安装复杂性的体现之一是，Hadoop的安装文档非常多，但是能一个文档走下来的少之又少，尤其是Hadoop不同版本的配置差异非常的大。Hadoop2.5.2于前两天发布，但是它的配置跟2.5.0，2.5.1没有分别。 &nb
Anychart图表系列五之事件监听白糖_ chart
创建图表事件监听非常简单：首先是通过addEventListener('监听类型',js监听方法)添加事件监听，然后在js监听方法中定义具体监听逻辑。以钻取操作为例，当用户点击图表某一个point的时候弹出point的name和value，代码如下： <script> //创建AnyChart var chart = new AnyChart(); //添加钻取操作&quo
Web前端相关段子 braveCS web前端
Web标准：结构、样式和行为分离使用语义化标签 0）标签的语义：使用有良好语义的标签，能够很好地实现自我解释，方便搜索引擎理解网页结构，抓取重要内容。去样式后也会根据浏览器的默认样式很好的组织网页内容，具有很好的可读性，从而实现对特殊终端的兼容。 1）div和span是没有语义的：只是分别用作块级元素和行内元素的区域分隔符。当页面内标签无法满足设计需求时，才会适当添加div
编程之美-24点游戏 bylijinnan 编程之美
import java.util.ArrayList; import java.util.Arrays; import java.util.HashSet; import java.util.List; import java.util.Random; import java.util.Set; public class PointGame { /**编程之美
主页面子页面传值总结 chengxuyuancsdn 总结
1、showModalDialog returnValue是javascript中html的window对象的属性,目的是返回窗口值,当用window.showModalDialog函数打开一个IE的模式窗口时,用于返回窗口的值主界面 var sonValue=window.showModalDialog("son.jsp"); 子界面 window.retu
[网络与经济]互联网+的含义 comsci 互联网+
互联网+后面是一个人的名字 = 网络控制系统互联网+你的名字 = 网络个人数据库每日提示:如果人觉得不舒服,千万不要外出到处走动,就呆在床上,玩玩手游,更不能够去开车,现在交通状况不
oracle 创建视图 with check option daizj 视图 view oralce
我们来看下面的例子： create or replace view testview as select empno,ename from emp where ename like ‘M%’ with check option; 这里我们创建了一个视图，并使用了with check option来限制了视图。然后我们来看一下视图包含的结果： select * from testv
ToastPlugin插件在cordova3.3下使用 dibov Cordova
自己开发的Todos应用，想实现“ 再按一次返回键退出程序 ”的功能，采用网上的ToastPlugins插件，发现代码或文章基本都是老版本，运行问题比较多。折腾了好久才弄好。下面吧基于cordova3.3下的ToastPlugins相关代码共享。 ToastPlugin.java package&nbs
C语言22个系统函数 dcj3sjt126com c function
C语言系统函数一、数学函数下列函数存放在math.h头文件中Double floor(double num) 求出不大于num的最大数。Double fmod(x, y) 求整数x/y的余数。Double frexp(num, exp); double num; int *exp; 将num分为数字部分（尾数）x和以2位的指数部分n，即num=x*2n，指数n存放在exp指向的变量中，返回x。D
开发一个类的流程 dcj3sjt126com 开发
本人近日根据自己的开发经验总结了一个类的开发流程。这个流程适用于单独开发的构件，并不适用于对一个项目中的系统对象开发。开发出的类可以存入私人类库，供以后复用。以下是开发流程： 1. 明确类的功能，抽象出类的大概结构 2. 初步设想类的接口 3. 类名设计（驼峰式命名） 4. 属性设置(权限设置) 判断某些变量是否有必要作为成员属
java 并发 shuizhaosi888 java 并发
能够写出高伸缩性的并发是一门艺术在JAVA SE5中新增了3个包 java.util.concurrent java.util.concurrent.atomic java.util.concurrent.locks 在java的内存模型中，类的实例字段、静态字段和构成数组的对象元素都会被多个线程所共享，局部变量与方法参数都是线程私有的，不会被共享。
Spring Security（11）——匿名认证 234390216 Spring Security ROLE_ANNOYMOUS 匿名
匿名认证目录 1.1 配置 1.2 AuthenticationTrustResolver 对于匿名访问的用户，Spring Security支持为其建立一个匿名的AnonymousAuthenticat
NODEJS项目实践0.2[ express,ajax通信...] 逐行分析JS源代码 Ajax nodejs express
一、前言通过上节学习，我们已经 ubuntu系统搭建了一个可以访问的nodejs系统，并做了nginx转发。本节原要做web端服务及 mongodb的存取，但写着写着，web端就
在Struts2 的Action中怎样获取表单提交上来的多个checkbox的值 lhbthanks java html struts checkbox
第一种方法：获取结果String类型在 Action 中获得的是一个 String 型数据，每一个被选中的 checkbox 的 value 被拼接在一起，每个值之间以逗号隔开(,)。所以在 Action 中定义一个跟 checkbox 的 name 同名的属性来接收这些被选中的 checkbox 的 value 即可。以下是实现的代码：前台 HTML 代码：
003.Kafka基本概念 nweiren hadoop kafka
Kafka基本概念：Topic、Partition、Message、Producer、Broker、Consumer。 Topic：消息源（Message）的分类。 Partition： Topic物理上的分组，一
Linux环境下安装JDK roadrunners jdk linux
1、准备工作创建JDK的安装目录： mkdir -p /usr/java/ 下载JDK，找到适合自己系统的JDK版本进行下载： http://www.oracle.com/technetwork/java/javase/downloads/index.html 把JDK安装包下载到/usr/java/目录，然后进行解压： tar -zxvf jre-7
Linux忘记root密码的解决思路 tomcat_oracle linux
1：使用同版本的linux启动系统，chroot到忘记密码的根分区passwd改密码　　2：grub启动菜单中加入init=/bin/bash进入系统，不过这时挂载的是只读分区。根据系统的分区情况进一步判断. 　　3: grub启动菜单中加入 single以单用户进入系统. 　　4:用以上方法mount到根分区把/etc/passwd中的root密码去除　　例如: 　　ro
跨浏览器 HTML5 postMessage 方法以及 message 事件模拟实现 xueyou jsonp jquery 框架 UI html5
postMessage 是 HTML5 新方法，它可以实现跨域窗口之间通讯。到目前为止，只有 IE8+, Firefox 3, Opera 9, Chrome 3和 Safari 4 支持，而本篇文章主要讲述 postMessage 方法与 message 事件跨浏览器实现。postMessage 方法 JSONP 技术不一样，前者是前端擅长跨域文档数据即时通讯，后者擅长针对跨域服务端数据通讯，p