轩辕小猪

霍夫变换

概述

霍夫变换是一种特征提取，被广泛应用在图像分析、电脑视觉以及数位影像处理。霍夫变换的基本原理在于利用点与线的对偶性，将原始图像空间的给定的曲线通过曲线表达形式变为参数空间的一个点。这样就把原始图像中给定曲线的检测问题转化为寻找参数空间中的峰值问题。也即把检测整体特性转化为检测局部特性。
霍夫变换于1962年由Paul Hough 首次提出，后于1972年由Richard Duda和Peter Hart推广使用，经典霍夫变换用来检测图像中的直线，后来霍夫变换扩展到任意形状物体的识别，多为圆和椭圆。

霍夫变换在OpenCV中分为霍夫线变换和霍夫圆变换两种，我们下面将分别进行介绍。

霍夫线变换

原理

众所周知, 一条直线在图像二维空间可由两个变量表示. 如:

在笛卡尔坐标系: 可由参数: 斜率和截距(m,b) 表示。
在极坐标系: 可由参数: 极径和极角(r, $\theta$ )表示。

对于霍夫变换, 我们将采用第二种方式极坐标系来表示直线. 因此, 直线的表达式可为:
$(-\frac{cos\theta}{sin\theta})x+(\frac{r}{sin\theta})$
即
$xcos\theta+ysin\theta$

对于任意一个点 $x_0,y0)$ , 我们可以将通过这个点的一族直线统一定义为:
$xcos\theta+ysin\theta$
表示每一对 $(r_{\theta},\theta)$ 代表一条通过点 $x_0,y_0)$ 的直线
如果对于一个给定点 $x_0,y_0)$ ，我们在极坐标对极径极角平面绘出所有通过它的直线, 将得到一条正弦曲线. 例如, 对于给定点 $x_0= 8$ 和 $y_0= 6$ 我们可以绘出下图 (在平面):

其中 $r$ > 0, $\theta > 2\pi$

我们可以对图像中所有的点进行上述操作。如果两个不同点进行上述操作后得到的曲线在平面 $\theta-r$ 相交, 这就意味着它们通过同一条直线. 例如,使用上面的例子我们继续对点 $x_1,y_1)$ 和点 $x_2,y_2)$ 绘图, 得到下图:

这三条曲线在平面相交于点 (0.925, 9.6), 坐标表示的是参数对 $(\theta,r)$ 或者是经过点 $x_0,y_0)$ 点 $x_1,y_1)$ 和点 $x_3,y_3)$ 组成的平面内的的直线。
综上所述，一般来说, 一条直线能够通过在平面 $(\theta,r)$ 寻找交于一点的曲线数量来检测。而越多曲线交于一点也就意味着这个交点表示的直线由更多的点组成. 。通常，我们可以定义检测一条线所需的最小交叉点数量的阈值。
这就是霍夫线变换的作用。它跟踪图像中每个点的曲线之间的交点。如果交叉点的数量大于某个阈值，那么可以认为这个交点所代表的参数对 $(\theta,r)$ 在原图像中为一条直线。

opencv霍夫变换函数

opencv中主要支持两种霍夫变换：标准霍夫变换和统计概率霍夫变换

标准霍夫变换（HoughLines()）

void HoughLines(InputArray image, OutputArray lines, double rho,
 double theta, int threshold, double srn=0, double stn=0 )

第一个参数，InputArray 类型的 image，输入图像，即源图像，需为8位的单通道二进制图像，可以将任意的源图载入进来后由函数修改成此格式后，再填在这里。
第二个参数，InputArray 类型的 lines，经过调用HoughLines函数后储存了霍夫线变换检测到线条的输出矢量。每一条线由具有两个元素的矢量表示 $(\rho,\theta)$ ，其中， $\rho$ 是离坐标原点((0,0)（也就是图像的左上角）的距离。 $\theta$ 是弧度线条旋转角度（0-垂直线，π/2-水平线）。
第三个参数，double类型的 $\rho$ ，以像素为单位的距离精度。另一种形容方式是直线搜索时的进步尺寸的单位半径。
第四个参数，double类型的 theta，以弧度为单位的角度精度。另一种形容方式是直线搜索时的进步尺寸的单位角度。
第五个参数，int类型的threshold，累加平面的阈值参数，即识别某部分为图中的一条直线时它在累加平面中必须达到的值。大于阈值threshold的线段才可以被检测通过并返回到结果中。
第六个参数，double类型的srn，有默认值0。对于多尺度的霍夫变换，这是第三个参数进步尺寸rho的除数距离。粗略的累加器进步尺寸直接是第三个参数rho，而精确的累加器进步尺寸为rho/srn。
第七个参数，double类型的stn，有默认值0，对于多尺度霍夫变换，srn表示第四个参数进步尺寸的单位角度theta的除数距离。且如果srn和stn同时为0，就表示使用经典的霍夫变换。否则，这两个参数应该都为正数。

算法流程

读取原始图像，并转换成灰度图，利用阈值分割或者边缘检测算子转换成二值化边缘图像
初始化霍夫空间，令所有 $Num(\theta,\rho)=0$
对于每一个像素点(x,y)，在参数空间中找出所有满足
$\rho = xcos\theta+ysin\theta$
的 $(\theta,\rho)$ 对,然后令 $Num(\theta,\rho)=Num(\theta,\rho)+1$
统计所有 $Num(\theta,\rho)$ 的大小，取出 $Num(\theta,\rho)>\tau$ 的参数（ $\tau$ 是所设的阈值），从而得到一条直线。
将上述流程取出的直线，确定与其相关线段的起始点与终止点（有一些算法，如蝴蝶形状宽度，峰值走廊之类）

统计概率霍夫变换（HoughLinesP()）

void HoughLinesP(InputArray image, OutputArray lines, double rho, double theta, 
int threshold, double minLineLength=0, double maxLineGap=0 )

第一个参数，InputArray类型的image，输入图像，即源图像，需为8位的单通道二进制图像，可以将任意的源图载入进来后由函数修改成此格式后，再填在这里。
第二个参数，InputArray类型的lines，经过调用HoughLinesP函数后后存储了检测到的线条的输出矢量，每一条线由具有四个元素的矢量(x_1,y_1, x_2, y_2）表示，其中，(x_1, y_1)和(x_2, y_2) 是是每个检测到的线段的结束点。
第三个参数，double类型的rho，以像素为单位的距离精度。另一种形容方式是直线搜索时的进步尺寸的单位半径。
第四个参数，double类型的theta，以弧度为单位的角度精度。另一种形容方式是直线搜索时的进步尺寸的单位角度。
[- 第五个参数，int类型的threshold，累加平面的阈值参数，即识别某部分为图中的一条直线时它在累加平面中必须达到的值。大于阈值threshold的线段才可以被检测通过并返回到结果中。
第六个参数，double类型的minLineLength，有默认值0，表示最低线段的长度，比这个设定参数短的线段就不能被显现出来。
第七个参数，double类型的maxLineGap，有默认值0，允许将同一行点与点之间连接起来的最大的距离。

标准霍夫变换本质上是把图像映射到它的参数空间上，它需要计算所有的M个边缘点，这样它的运算量和所需内存空间都会很大。如果在输入图像中只是处理m(m 该方法还有一个重要的特点就是能够检测出线端，即能够检测出图像中直线的两个端点，确切地定位图像中的直线。

算法流程

随机抽取图像中的一个特征点，即边缘点，如果该点已经被标定为是某一条直线上的点，则继续在剩下的边缘点中随机抽取一个边缘点，直到所有边缘点都抽取完了为止；
对该点进行霍夫变换，并进行累加和计算；
选取在霍夫空间内值最大的点，如果该点大于阈值的，则进行步骤4，否则回到步骤1；
根据霍夫变换得到的最大值，从该点出发，沿着直线的方向位移，从而找到直线的两个端点；
计算直线的长度，如果大于某个阈值，则被认为是好的直线输出，回到步骤1。

源码分析

HoughLines

struct LinePolar
{
	float rho;
	float angle;
};

struct hough_cmp_gt
{
	hough_cmp_gt(const int* _aux) : aux(_aux) {}
	inline bool operator()(int l1, int l2) const
	{
		return aux[l1] > aux[l2] || (aux[l1] == aux[l2] && l1 < l2);
	}
	const int* aux;
};

static void createTrigTable(int numangle, double min_theta, double theta_step,
	float irho, float *tabSin, float *tabCos)
{
	float ang = static_cast<float>(min_theta);
	for (int n = 0; n < numangle; ang += (float)theta_step, n++)
	{
		tabSin[n] = (float)(sin((double)ang) * irho);
		tabCos[n] = (float)(cos((double)ang) * irho);
	}
}

static void findLocalMaximums(int numrho, int numangle, int threshold,
	const int *accum, std::vector<int>& sort_buf)
{
	for (int r = 0; r < numrho; r++)
		for (int n = 0; n < numangle; n++)
		{
			//得到当前值在累加器数组的位置
			int base = (n + 1) * (numrho + 2) + r + 1;
			//得到计数值，并以它为基准，看看它是不是局部极大值
			if (accum[base] > threshold &&
				accum[base] > accum[base - 1] && accum[base] >= accum[base + 1] &&
				accum[base] > accum[base - numrho - 2] && accum[base] >= accum[base + numrho + 2])
				sort_buf.push_back(base);//把极大值位置存入排序数组内——sort_buf
		}
}

static void HoughLinesStandard(const Mat& img, std::vector<Vec2f>& lines, float rho,
	float theta,int threshold, int linesMax,double min_theta, double max_theta)
{
	int i, j;
	float irho = 1 / rho;
	//保证输入的图片的正确性
	CV_Assert(img.type() == CV_8UC1);
	//得到图像的指针
	const uchar* image = img.ptr();
	int step = (int)img.step;    //得到图像的步长
	int width = img.cols;     //图像的宽
	int height = img.rows;    //图像的高

	if (max_theta < min_theta) {
		CV_Error(CV_StsBadArg, "max_theta must be greater than min_theta");
	}
	//由角和距离的分辨率得到角度和距离的数量，即霍夫变换后角度和距离的个数
	int numangle = cvRound((max_theta - min_theta) / theta);   //霍夫空间，角度方向的大小
	int numrho = cvRound(((width + height) * 2 + 1) / rho);   //r的范围，这里以图像的周长作为rho的最大值

	//_accum为累加器数组，初始化该霍夫空间
	Mat _accum = Mat::zeros((numangle + 2), (numrho + 2), CV_32SC1);
	std::vector<int> _sort_buf;
	AutoBuffer<float> _tabSin(numangle);
	AutoBuffer<float> _tabCos(numangle);
	int *accum = _accum.ptr<int>();
	float *tabSin = _tabSin, *tabCos = _tabCos;

	// 事先计算好sinθi/ρ和cosθi/ρ，查表
	createTrigTable(numangle, min_theta, theta,
		irho, tabSin, tabCos);

	////执行步骤1，逐点进行霍夫空间变换，并把结果放入累加器数组内
	for (i = 0; i < height; i++)
		for (j = 0; j < width; j++)
		{
			if (image[i * step + j] != 0)
				for (int n = 0; n < numangle; n++)
				{
					//根据公式: ρ = xcosθ + ysinθ
					//cvRound()函数：四舍五入
					int r = cvRound(j * tabCos[n] + i * tabSin[n]);
					//因为theta是从0到π的，所以cos(theta)是有负的，所以就所有的r += 最大值的一半，让极径都>0
					r += (numrho - 1) / 2;
					//r表示的是距离，n表示的是角点，在累加器内找到它们所对应的位置（即霍夫空间内的位置），其值加1
					accum[(n + 1) * (numrho + 2) + r + 1]++;
				}
		}

	// 执行步骤2，找到局部极大值，即非极大值抑制
	// 霍夫空间,局部最大点,采用四邻域判断,比较。(也可以使8邻域或者更大的方式),如果不判断局部最大值,同时选用次大值与最大值,就可能会是两个相邻的直线,但实际是一条直线。
	// 选用最大值,也是去除离散的近似计算带来的误差,或合并近似曲线。
	findLocalMaximums(numrho, numangle, threshold, accum, _sort_buf);

	//执行步骤3，对存储在sort_buf数组内的累加器的数据按由大到小的顺序进行排序
	std::sort(_sort_buf.begin(), _sort_buf.end(), hough_cmp_gt(accum));

	// stage 4. store the first min(total,linesMax) lines to the output buffer 输出直线
	//linesMax是参数，表示最多输出几条直线
	linesMax = std::min(linesMax, (int)_sort_buf.size());
	//事先定义一个尺度
	double scale = 1. / (numrho + 2);
	for (i = 0; i < linesMax; i++)
	{
		//LinePolar 直线的数据结构
		//LinePolar结构在该文件的前面被定义
		LinePolar line;
		//idx为极大值在累加器数组的位置
		int idx = _sort_buf[i];
		//分离出该极大值在霍夫空间中的位置
		//因为n是从0开始的，而之前为了防止越界，所以将所有的n+1了，因此下面要-1，同理r
		int n = cvFloor(idx*scale) - 1;
		int r = idx - (n + 1)*(numrho + 2) - 1;
		line.rho = (r - (numrho - 1)*0.5f) * rho;  //因为之前统一将r += (numrho - 1) / 2， 因此需要还原以获得真实的rho
		line.angle = static_cast<float>(min_theta) + n * theta;
		lines.push_back(Vec2f(line.rho, line.angle)); //用序列存放多条直线
	}
}

HoughLinesP

static void HoughLinesProbabilistic(Mat& image, std::vector<Vec4i>& lines, float rho, float theta, 
	int threshold,int lineLength, int lineGap, int linesMax)
{
	Point pt;
	float irho = 1 / rho;
	RNG rng((uint64)-1); //随机数

	CV_Assert(image.type() == CV_8UC1);

	int width = image.cols;
	int height = image.rows;

	int numangle = cvRound(CV_PI / theta);
	int numrho = cvRound(((width + height) * 2 + 1) / rho);
	//accum为累加器矩阵，霍夫空间，mask为掩码矩阵，大小与输入图像相同
	Mat accum = Mat::zeros(numangle, numrho, CV_32SC1);
	Mat mask(height, width, CV_8UC1);
	//存储事先计算好的正弦余弦值
	std::vector<float> trigtab(numangle * 2);
	//事先计算好所需的所有正弦和余弦值
	for (int n = 0; n < numangle; n++)
	{
		trigtab[n * 2] = (float)(cos((double)n*theta) * irho);
		trigtab[n * 2 + 1] = (float)(sin((double)n*theta) * irho);
	}
	//复制首地址
	const float* ttab = &trigtab[0];
	uchar* mdata0 = mask.ptr();
	std::vector<Point> nzloc;

	// 步骤一：收集图像中的所有非零点，因为输入图像是边缘图像，所以非零点就是边缘点
	for (pt.y = 0; pt.y < height; pt.y++)
	{
		//提取出输入图像和掩码矩阵的每行地址指针
		const uchar* data = image.ptr(pt.y);
		uchar* mdata = mask.ptr(pt.y);

		for (pt.x = 0; pt.x < width; pt.x++)
		{
			if (data[pt.x])//是非零点
			{
				mdata[pt.x] = (uchar)1;  //掩码相应位置置为1
				nzloc.push_back(pt);   //将该点加入序列中
			}
			else
				mdata[pt.x] = 0;
		}
	}
	//得到边缘点的数量
	int count = (int)nzloc.size();

	// 步骤二：随机处理所有的边缘点
	for (; count > 0; count--)
	{
		// 在剩下的边缘点中随机选择一个点，idx为不大于count的随机数
		int idx = rng.uniform(0, count);
		//max_val为累加器的最大值，max_n为最大值所对应的角度
		int max_val = threshold - 1, max_n = 0;
		Point point = nzloc[idx];
		Point line_end[2];   //定义直线的两个端点
		float a, b;
		//累加器的地址指针，也就是霍夫空间的地址指针
		int* adata = accum.ptr<int>();
		int i = point.y, j = point.x, k, x0, y0, dx0, dy0, xflag;
		int good_line;
		const int shift = 16;

		//用序列中的最后一个元素替换被随机提取出来的元素
		nzloc[idx] = nzloc[count - 1];

		//检测这个坐标点是否已经计算过，也就是它已经属于其他直线
		//因为计算过的坐标点会在掩码矩阵mask的相对应位置清零
		if (!mdata0[i*width + j])
			continue;

		// 更新累加器矩阵，找到最有可能的直线
		for (int n = 0; n < numangle; n++, adata += numrho)
		{
			//由角度计算距离
			int r = cvRound(j * ttab[n * 2] + i * ttab[n * 2 + 1]);
			r += (numrho - 1) / 2;
			int val = ++adata[r];
			if (max_val < val)
			{
				max_val = val;
				max_n = n;
			}
		}

		// 如果上面得到的最大值小于阈值，则放弃该点，继续下一个点的计算
		if (max_val < threshold)
			continue;

		//从当前点出发，沿着它所在直线的方向前进，直到达到端点为止
		a = -ttab[max_n * 2 + 1];   //a=-sinθ
		b = ttab[max_n * 2];    //b = cosθ
		x0 = j;
		y0 = i;
		//确定当前点所在直线的角度是在45度～135度之间，还是在0～45或135度～180度之间
		//如过是在45度～135度之间
		if (fabs(a) > fabs(b))
		{
			xflag = 1;//置标识位，标识直线的粗略方向
		    //确定横、纵坐标的位移量
			dx0 = a > 0 ? 1 : -1;
			dy0 = cvRound(b*(1 << shift) / fabs(a));
			y0 = (y0 << shift) + (1 << (shift - 1));
		}
		//在0～45或135度～180度之间
		else
		{
			xflag = 0;  //清标志位
			dy0 = b > 0 ? 1 : -1;
			dx0 = cvRound(a*(1 << shift) / fabs(b));
			x0 = (x0 << shift) + (1 << (shift - 1));
		}
		//搜索直线的两个端点
		for (k = 0; k < 2; k++)
		{
			//gap表示两条直线的间隙，x和y为搜索位置，dx和dy为位移量
			int gap = 0, x = x0, y = y0, dx = dx0, dy = dy0;
			//搜索第二个端点的时候，反方向位移
			if (k > 0)
				dx = -dx, dy = -dy;

			//沿着直线的方向位移，直到到达图像的边界或大的间隙为止
			for (;; x += dx, y += dy)
			{
				uchar* mdata;
				int i1, j1;

				if (xflag)//确定新的位移后的坐标位置
				{
					j1 = x;
					i1 = y >> shift;
				}
				else
				{
					j1 = x >> shift;
					i1 = y;
				}
				//如果到达了图像的边界，停止位移，退出循环
				if (j1 < 0 || j1 >= width || i1 < 0 || i1 >= height)
					break;
				//定位位移后掩码矩阵位置
				mdata = mdata0 + i1*width + j1;

				// for each non-zero point:
				//    update line end,
				//    clear the mask element
				//    reset the gap
				//该掩码不为0，说明该点可能是在直线上
				if (*mdata)
				{
					gap = 0;//设置间隙为0
					//更新直线的端点位置
					line_end[k].y = i1;
					line_end[k].x = j1;
				}
				//掩码为0，说明不是直线，但仍继续位移，直到间隙大于所设置的阈值为止
				else if (++gap > lineGap)
					break;
			}
		}
		//由检测到的直线的两个端点粗略计算直线的长度
		//当直线长度大于所设置的阈值时，good_line为1，否则为0
		good_line = std::abs(line_end[1].x - line_end[0].x) >= lineLength ||
			std::abs(line_end[1].y - line_end[0].y) >= lineLength;
		//再次搜索端点，目的是更新累加器矩阵和更新掩码矩阵，以备下一次循环使用
		for (k = 0; k < 2; k++)
		{
			int x = x0, y = y0, dx = dx0, dy = dy0;

			if (k > 0)
				dx = -dx, dy = -dy;

			// walk along the line using fixed-point arithmetics,
			// stop at the image border or in case of too big gap
			for (;; x += dx, y += dy)
			{
				uchar* mdata;
				int i1, j1;

				if (xflag)
				{
					j1 = x;
					i1 = y >> shift;
				}
				else
				{
					j1 = x >> shift;
					i1 = y;
				}

				mdata = mdata0 + i1*width + j1;

				// for each non-zero point:
				//    update line end,
				//    clear the mask element
				//    reset the gap
				if (*mdata)
				{
					//if语句的作用是清除那些已经判定是好的直线上的点对应的累加器的值，避免再次利用这些累加值
					if (good_line)
					{
						adata = accum.ptr<int>();
						for (int n = 0; n < numangle; n++, adata += numrho)
						{
							int r = cvRound(j1 * ttab[n * 2] + i1 * ttab[n * 2 + 1]);
							r += (numrho - 1) / 2;
							adata[r]--;//相应的累加器减1
						}
					}
					//搜索过的位置，不管是好的直线，还是坏的直线，掩码相应位置都清0，这样下次就不会再重复搜索这些位置了，
					//从而达到减小计算边缘点的目的
					*mdata = 0;
				}
				//如果已经到达了直线的端点，则退出循环
				if (i1 == line_end[k].y && j1 == line_end[k].x)
					break;
			}
		}
		//如果是好的直线
		if (good_line)
		{
			Vec4i lr(line_end[0].x, line_end[0].y, line_end[1].x, line_end[1].y);
			//把两个端点压入序列中
			lines.push_back(lr);
			//如果检测到的直线数量大于阈值，则退出该函数
			if ((int)lines.size() >= linesMax)
				return;
		}
	}
}

代码结果

opencv调库

int main()
{
	Mat dst, cdst, cdstP;
	// 载入源图
	Mat src = imread("3.jpg", IMREAD_GRAYSCALE);

	// 边缘检测
	Canny(src, dst, 50, 200, 3);
	//转换为灰度图
	cvtColor(dst, cdst, COLOR_GRAY2BGR);
	cdstP = cdst.clone();
	// 标准霍夫变换
	vector<Vec2f> lines; //定义一个矢量结构lines用于存放得到的线段矢量集合
	HoughLines(dst, lines, 1, CV_PI / 180, 90, 0, 0); // runs the actual detection
													   // Draw the lines
	//HoughLinesStandard(dst, lines, 1, CV_PI / 180, 90, INT_MAX,0,CV_PI);
	//依次在图中绘制出每条线段
	for (size_t i = 0; i < lines.size(); i++)
	{
		float rho = lines[i][0], theta = lines[i][1];
		Point pt1, pt2;
		double a = cos(theta), b = sin(theta);
		double x0 = a*rho, y0 = b*rho;
		pt1.x = cvRound(x0 + 1000 * (-b));
		pt1.y = cvRound(y0 + 1000 * (a));
		pt2.x = cvRound(x0 - 1000 * (-b));
		pt2.y = cvRound(y0 - 1000 * (a));
		line(cdst, pt1, pt2, Scalar(0, 0, 255), 1, CV_AA);
	}
	// Probabilistic Line Transform
	vector<Vec4i> linesP; // will hold the results of the detection
	//统计概率霍夫变换
	HoughLinesP(dst, linesP, 1, CV_PI / 180, 80, 10, 5); // runs the actual detection
														  // Draw the lines
	//HoughLinesProbabilistic(dst, linesP, 1, CV_PI / 180, 80, 10, 5,INT_MAX);
	for (size_t i = 0; i < linesP.size(); i++)
	{
		Vec4i l = linesP[i];
		line(cdstP, Point(l[0], l[1]), Point(l[2], l[3]), Scalar(0, 0, 255), 1, LINE_AA);
	}
	// Show results
	imshow("src_pic", src);
	imshow("HoughLines", cdst);
	imshow("HoughLinesP", cdstP);
	// Wait and Exit
	waitKey();
	return 0;
}

源代码运行

霍夫圆变换

霍夫圆变换的基本原理和上面讲的霍夫线变化大体上是很类似的，只是点对应的二维极径极角空间被三维的圆心点x, y还有半径r空间取代。说“大体上类似”的原因是，如果完全用相同的方法的话，累加平面会被三维的累加容器所代替：在这三维中，一维是 x，一维是 y，另外一维是圆的半径 r。这就意味着需要大量的内存而且执行效率会很低，速度会很慢。

对直线来说, 一条直线能由参数极径极角 $(r,\theta)$ 表示. 而对圆来说, 我们需要三个参数来表示一个圆, 也就是： $C:(x_{center},y_{center},r)$

这里的表示圆心的位置 (下图中的绿点) 而 r 表示半径, 这样我们就能唯一的定义一个圆了, 见下图:

在OpenCV中，我们一般通过一个叫做“霍夫梯度法”的方法来解决圆变换的问题。

霍夫梯度法原理

首先对图像应用边缘检测，比如用canny边缘检测。
然后，对边缘图像中的每一个非零点，考虑其局部梯度，即用Sobel（）函数计算x和y方向的Sobel一阶导数得到梯度。
利用得到的梯度，由斜率指定的直线上的每一个点都在累加器中被累加，这里的斜率是从一个指定的最小值到指定的最大值的距离。
同时，标记边缘图像中每一个非0像素的位置。
然后从二维累加器中这些点中选择候选的中心，这些中心都大于给定阈值并且大于其所有近邻。这些候选的中心按照累加值降序排列，以便于最支持像素的中心首先出现。
接下来对每一个中心，考虑所有的非0像素。
这些像素按照其与中心的距离排序。从到最大半径的最小距离算起，选择非0像素最支持的一条半径。
如果一个中心收到边缘图像非0像素最充分的支持，并且到前期被选择的中心有足够的距离，那么它就会被保留下来。

这个实现可以使算法执行起来更高效，或许更加重要的是，能够帮助解决三维累加器中会产生许多噪声并且使得结果不稳定的稀疏分布问题。

缺陷

在霍夫梯度法中，我们使用Sobel导数来计算局部梯度，那么随之而来的假设是，其可以视作等同于一条局部切线，但这个并不是一个数值稳定的做法。在大多数情况下，这样做会得到正确的结果，但或许会在输出中产生一些噪声。
在边缘图像中的整个非0像素集被看做每个中心的候选部分。因此，如果把累加器的阈值设置偏低，算法将要消耗比较长的时间。第三，因为每一个中心只选择一个圆，如果有同心圆，就只能选择其中的一个。
因为中心是按照其关联的累加器值的升序排列的，并且如果新的中心过于接近之前已经接受的中心的话，就不会被保留下来。且当有许多同心圆或者是近似的同心圆时，霍夫梯度法的倾向是保留最大的一个圆。可以说这是一种比较极端的做法，因为在这里默认Sobel导数会产生噪声，若是对于无穷分辨率的平滑图像而言的话，这才是必须的。

HoughCircles()

void HoughCircles(InputArray image,OutputArray circles, int method,double dp, double minDist, double param1=100,double param2=100, int minRadius=0, int maxRadius=0 )

第一个参数，InputArray类型的image，输入图像，即源图像，需为8位的灰度单通道图像。
第二个参数，InputArray类型的circles，经过调用HoughCircles函数后此参数存储了检测到的圆的输出矢量，每个矢量由包含了3个元素的浮点矢量(x, y, radius)表示。
第三个参数，int类型的method，即使用的检测方法，目前OpenCV中就霍夫梯度法一种可以使用，它的标识符为CV_HOUGH_GRADIENT，在此参数处填这个标识符即可。
第四个参数，double类型的dp，用来检测圆心的累加器图像的分辨率于输入图像之比的倒数，且此参数允许创建一个比输入图像分辨率低的累加器。上述文字不好理解的话，来看例子吧。例如，如果dp= 1时，累加器和输入图像具有相同的分辨率。如果dp=2，累加器便有输入图像一半那么大的宽度和高度。
第五个参数，double类型的minDist，为霍夫变换检测到的圆的圆心之间的最小距离，即让我们的算法能明显区分的两个不同圆之间的最小距离。这个参数如果太小的话，多个相邻的圆可能被错误地检测成了一个重合的圆。反之，这个参数设置太大的话，某些圆就不能被检测出来了。
第六个参数，double类型的param1，有默认值100。它是第三个参数method设置的检测方法的对应的参数。对当前唯一的方法霍夫梯度法CV_HOUGH_GRADIENT，它表示传递给canny边缘检测算子的高阈值，而低阈值为高阈值的一半。
第七个参数，double类型的param2，也有默认值100。它是第三个参数method设置的检测方法的对应的参数。对当前唯一的方法霍夫梯度法CV_HOUGH_GRADIENT，它表示在检测阶段圆心的累加器阈值。它越小的话，就可以检测到更多根本不存在的圆，而它越大的话，能通过检测的圆就更加接近完美的圆形了。
第八个参数，int类型的minRadius,有默认值0，表示圆半径的最小值。
第九个参数，int类型的maxRadius,也有默认值0，表示圆半径的最大值。

源代码解析

static void HoughCirclesGradient(InputArray _image, OutputArray _circles, float dp, float minDist,
	int minRadius, int maxRadius, int cannyThreshold,
	int accThreshold, int maxCircles, int kernelSize, bool centersOnly)
{
	CV_Assert(kernelSize == -1 || kernelSize == 3 || kernelSize == 5 || kernelSize == 7);
	//控制dp不能比1小
	dp = max(dp, 1.f);
	float idp = 1.f / dp;

	Mat edges, dx, dy;//edges表示图像边缘矩阵
	//Sobel算子，一阶导数边缘检测算子.dx,dy分别表示x和y方向的差分阶数，kernersize核为3,
	Sobel(_image, dx, CV_16S, 1, 0, kernelSize, 1, 0, BORDER_REPLICATE);
	Sobel(_image, dy, CV_16S, 0, 1, kernelSize, 1, 0, BORDER_REPLICATE);
	Canny(dx, dy, edges, std::max(1, cannyThreshold / 2), cannyThreshold, false);

	Mutex mtx;//互斥信号量
	//设置多线程数
	int numThreads = std::max(1, getNumThreads());
	//三维霍尔空间
	std::vector<Mat> accumVec;
	NZPointSet nz(_image.rows(), _image.cols());
	//沿着梯度和梯度的反方向，并行计算边缘图像每个像素点
	parallel_for_(Range(0, edges.rows),
		HoughCirclesAccumInvoker(edges, dx, dy, minRadius, maxRadius, idp, accumVec, nz, mtx),
		numThreads);
	//计算圆周点的总数
	int nzSz = cv::countNonZero(nz.positions);
	if (nzSz <= 0)
		return;

	Mat accum = accumVec[0];
	//二维累加器中每个候选中心点
	for (size_t i = 1; i < accumVec.size(); i++)
	{
		accum += accumVec[i];
	}
	accumVec.clear();

	std::vector<int> centers;

	// 4 rows when multithreaded because there is a bit overhead
	// and on the other side there are some row ranges where centers are concentrated
	//并行遍历整个累加器矩阵，找到可能的圆心
	parallel_for_(Range(1, accum.rows - 1),
		HoughCirclesFindCentersInvoker(accum, centers, accThreshold, mtx),
		(numThreads > 1) ? ((accum.rows - 2) / 4) : 1);
	//计算圆心的总数
	int centerCnt = (int)centers.size();
	if (centerCnt == 0)
		return;
	//对圆心按照由大到小的顺序进行排序
	std::sort(centers.begin(), centers.end(), hough_cmp_gt(accum.ptr<int>()));

	std::vector<Vec3f> circles;
	circles.reserve(256);
	if (centersOnly)
	{
		// 最大半径小于0时，只能得到一个圆心
		GetCircleCenters(centers, circles, accum.cols, minDist, dp);
	}

	else
	{
		std::vector<EstimatedCircle> circlesEst;
		//分两种情况计算圆周半径，一种使用列表法，一种用矩阵法。
		if (nzSz < maxRadius * maxRadius)
		{
			// Faster to use a list
			NZPointList nzList(nzSz);
			nz.toList(nzList);
			// One loop iteration per thread if multithreaded.
			//并行计算圆周的半径
			parallel_for_(Range(0, centerCnt),
				HoughCircleEstimateRadiusInvoker<NZPointList>(nzList, nzSz, centers, circlesEst, accum.cols,
					accThreshold, minRadius, maxRadius, dp, mtx),
				numThreads);
		}
		else
		{
			// 矩阵法，遍历圆周中心，并行计算圆周半径
			parallel_for_(Range(0, centerCnt),
				HoughCircleEstimateRadiusInvoker<NZPointSet>(nz, nzSz, centers, circlesEst, accum.cols,
					accThreshold, minRadius, maxRadius, dp, mtx),
				numThreads);
		}

		// Sort by accumulator value
		std::sort(circlesEst.begin(), circlesEst.end(), cmpAccum);
		//给定的GetCircle将被连续调用n-1次。结果保存在circles中
		std::transform(circlesEst.begin(), circlesEst.end(), std::back_inserter(circles), GetCircle);
		//剔除半径小于minRadius的半径圆
		RemoveOverlaps(circles, minDist);
	}
	//返回所有的圆集合
	if (circles.size() > 0)
	{
		int numCircles = std::min(maxCircles, int(circles.size()));
		_circles.create(1, numCircles, CV_32FC3);
		Mat(1, numCircles, CV_32FC3, &circles[0]).copyTo(_circles.getMat());
		return;
	}
}

结果展示

int main()
{
	// Loads an image
	Mat src = imread("1.jpg", IMREAD_COLOR);

	Mat gray;
	cvtColor(src, gray, COLOR_BGR2GRAY);
	medianBlur(gray, gray, 5);
	vector<Vec3f> circles;
	HoughCircles(gray, circles, HOUGH_GRADIENT, 1, gray.rows / 16, 100, 30, 1, 50);
	//HoughCircles1(gray, circles, HOUGH_GRADIENT, 1,gray.rows / 16,100, 30, 1, 50,-1,3);
	for (size_t i = 0; i < circles.size(); i++)
	{
		Vec3i c = circles[i];
		Point center = Point(c[0], c[1]);
		// circle center
		circle(src, center, 1, Scalar(0, 100, 100), 3, LINE_AA);
		// circle outline
		int radius = c[2];
		circle(src, center, radius, Scalar(0, 255, 0), 3, LINE_AA);
	}
	imshow("detected circles", src);
	waitKey();
	return 0;
}

参考文章

https://docs.opencv.org/3.4.1/d4/d70/tutorial_hough_circle.html.
https://www.cnblogs.com/kk17/p/9693132.html.
https://docs.opencv.org/3.4.1/d4/d70/tutorial_hough_circle.html.

你可能感兴趣的:(图像处理)

遥感影像的切片处理 sand&wich 计算机视觉 python 图像处理
在遥感影像分析中，经常需要将大尺寸的影像切分成小片段，以便于进行详细的分析和处理。这种方法特别适用于机器学习和图像处理任务，如对象检测、图像分类等。以下是如何使用Python和OpenCV库来实现这一过程，同时确保每个影像片段保留正确的地理信息。准备环境首先，确保安装了必要的Python库，包括numpy、opencv-python和xml.etree.ElementTree。这些库将用于图像处理
Python实现下载当前年份的谷歌影像 sand&wich python 开发语言
在GIS项目和地图应用中，获取最新的地理影像数据是非常重要的。本文将介绍如何使用Python代码从Google地图自动下载当前年份的影像数据，并将其保存为高分辨率的TIFF格式文件。这个过程涉及地理坐标转换、多线程下载和图像处理。关键功能该脚本的核心功能包括：坐标转换：支持WGS-84与WebMercator投影之间转换，以及处理中国GCJ-02偏移。自动化下载：多线程下载地图瓦片，提高效率。图像
Python实现TIFF 文件转换为 PNG 和 JPG 格式 sand&wich python 开发语言
在日常的图像处理工作中，可能会遇到需要将TIFF格式的图像转换为其他格式的情况，例如PNG和JPG。下面，本文将介绍如何使用Python和GDAL库实现这一功能。准备工作在开始之前，请确保已经安装了必要的库：GDAL（GeospatialDataAbstractionLibrary）可以使用以下命令安装GDAL：pipinstallgdal代码实现以下是一个将TIFF文件转换为PNG文件的示例代码
OpenCV图像处理技术（Python）——入门森屿_ opencv
©FuXianjun.AllRightsReserved.OpenCV入门图像作为人类感知世界的视觉基础，是人类获取信息、表达信息的重要手段，OpenCV作为一个开源的计算机视觉库，它包括几百个易用的图像成像和视觉函数，既可以用于学术研究，也可用于工业邻域，它于1999年由因特尔的GaryBradski启动，OpenCV库主要由C和C++语言编写，它可以在多个操作系统上运行。1.1图像处理基本操作
opencv学习：图像旋转的两种方法，旋转后的图片进行模板匹配代码实现夜清寒风学习 opencv 机器学习人工智能计算机视觉
图像旋转在图像处理中，rotate和rot90是两种常见的图像旋转方法，它们在功能和使用上有一些区别。下面我将分别介绍这两种方法，并解释它们的主要区别rot90方法rot90方法是NumPy提供的一种数组旋转函数，它主要用于对二维数组（如图像）进行90度的旋转。这个方法比较简单，只支持90度的倍数旋转，不支持任意角度旋转。使用NumPy进行旋转使用NumPy的rot90函数对模板图像进行旋转操作。
Python OpenCV图像处理：从基础到高级的全方位指南极客代码玩转Python 开发语言 python opencv 图像处理计算机视觉
目录第一部分：PythonOpenCV图像处理基础1.1OpenCV简介1.2PythonOpenCV安装1.3实战案例：图像显示与保存1.4注意事项第二部分：PythonOpenCV图像处理高级技巧2.1图像变换2.2图像增强2.3图像复原第三部分：PythonOpenCV图像处理实战项目3.1图像滤波3.2图像分割3.3图像特征提取第四部分：PythonOpenCV图像处理注意事项与优化策略4
服务器状态监控php源码,服务器状态监控_监控Linux服务器网站状态的SHELL脚本温糯米服务器状态监控php源码
摘要腾兴网为您分享:监控Linux服务器网站状态的SHELL脚本，蜗牛集市，同花顺，探客宝，手柄助手等软件知识，以及日期倒计时插件，云南省教育资源公共，rui手机桌面，小屁孩桌面便签，合金装备崛起复仇，朝夕日历，photoshop图像处理软件,一年级学生每日计划表，悟空找房，饿了吗外卖商家版，逃生，中国民宿网，realpolitiks，交通安全知识竞赛，雅思流利说等软件it资讯，欢迎关注腾兴网。1
多模态Transformer之文本与图像联合建模 - Transformer教程 shandianfk_com ChatGPT Transformer transformer 深度学习人工智能
大家好，今天我们来聊聊一个既前沿又有趣的话题——多模态Transformer，特别是文本与图像的联合建模。对于很多小伙伴来说，Transformer这个词已经不陌生了，但它不仅仅应用于自然语言处理，还能在图像处理、甚至是多模态数据的处理上大显身手。接下来，我会带大家深入了解什么是多模态Transformer，以及它是如何实现文本与图像的联合建模的。Transformer简介首先，我们简单回顾一下T
Matlab2024a安装教程是阿宇呢信息可视化开发语言
MATLAB是一款商业数学软件，用于算法开发、数据可视化、数据分析以及数值计算的高级技术计算语言和交互式环境，主要包括MATLAB和Simulink两大部分，可以进行矩阵运算、绘制函数和数据、实现算法、创建用户界面、连接其他编程语言的程序等，主要应用于工程计算、控制设计、信号处理与通讯、图像处理、信号检测、金融建模设计与分析等领域。1.解压安装包：①鼠标右击【MATLABR2024a(64bit)
图像处理的作用（6幅图诗）静月园
静月园著2020年1月️4日1自然力出现的图形画面，即无序，又有形。奇妙令人联想无限。好象理石花纹，又类似草木树植。2为何要如此色彩？好奇怪哦！自然的物态鬼斧神工。3孩童们信手涂鸦，但是脑控制了手的动作，所绘画的物体形状代表了孩子们对环境人物的所看，所听，所理解的形状。脑的心理活动影像，被转换成手的动作输出到笔尖的移动动作上，于是我们看到了简单的结构形状图。而对于我们的写作者来说，我们的作家脑内有
OpenCV高阶操作富士达幸运星 opencv 人工智能计算机视觉
在图像处理与计算机视觉领域，OpenCV（OpenSourceComputerVisionLibrary）无疑是最为强大且广泛使用的工具之一。从基础的图像读取、1.图片的上下，采样下采样（Downsampling）下采样通常用于减小图像的尺寸，从而减少图像中的像素数。这个过程可以通过多种方法实现，但最常见的是通过图像金字塔中的pyrDown函数（在OpenCV中）或其他类似的滤波器（如平均池化、最
opencv 之实战项目识别银行卡上的数字 SEVEN-YEARS opencv 计算机视觉人工智能
OpenCV之实战项目：识别银行卡上的数字引言在日常生活中，银行卡的识别是一个常见的需求，特别是在金融领域。本实战项目旨在使用OpenCV库来识别银行卡上的数字。我们将通过模板匹配的方法，结合图像处理技术，来准确识别银行卡上的数字序列。项目准备本项目需要安装Python和OpenCV库。确保已经安装了必要的库，并准备好银行卡图像和数字模板图像。实验素材定义函数importcv2defsort_co
【图像压缩】奇异值分解SVD灰色图像压缩（可设置压缩比）【含Matlab源码 4358期】 Matlab武动乾坤 Matlab图像处理（进阶版）matlab
✅博主简介：热爱科研的Matlab仿真开发者，修心和技术同步精进，Matlab项目合作可私信。个人主页：海神之光代码获取方式：海神之光Matlab王者学习之路—代码获取方式⛳️座右铭：行百里者，半于九十。更多Matlab仿真内容点击Matlab图像处理（进阶版）路径规划（Matlab）神经网络预测与分类（Matlab）优化求解（Matlab）语音处理（Matlab）信号处理（Matlab）车间调度
Python OpenCV精讲系列 - 高级图像处理技术（五）极客代码 Python OpenCV精讲 python opencv 图像处理开发语言人工智能计算机视觉
⚡️⚡️专栏：PythonOpenCV精讲⚡️⚡️本专栏聚焦于Python结合OpenCV库进行计算机视觉开发的专业教程。通过系统化的课程设计，从基础概念入手，逐步深入到图像处理、特征检测、物体识别等多个领域。适合希望在计算机视觉方向上建立坚实基础的技术人员及研究者。每一课不仅包含理论讲解，更有实战代码示例，助力读者快速将所学应用于实际项目中，提升解决复杂视觉问题的能力。无论是入门者还是寻求技能进
K-means 算法的介绍与应用小魏冬琅 matlab 算法 kmeans 机器学习
目录引言K-means算法的基本原理表格总结：K-means算法的主要步骤K-means算法的MATLAB实现优化方法与改进K-means算法的应用领域表格总结：K-means算法的主要应用领域结论引言K-means算法是一种经典的基于距离的聚类算法，在数据挖掘、模式识别、图像处理等多个领域中得到了广泛应用。其核心思想是将相似的数据对象聚类到同一个簇中，而使得簇内对象的相似度最大、簇间的相似度最小
基于VGG的猫狗识别卑微小鹿 tensorflow tensorflow
由于猫和狗的数据在这里，所以就做了一下分类的神经网络1、首先进行图像处理：importcsvimportglobimportosimportrandomos.environ['TF_CPP_MIN_LOG_LEVEL']='2'importtensorflowastffromtensorflowimportkerasfromtensorflow.kerasimportlayersimportnum
MATLAB车牌定位和识别系统清风明月来几时图像算法处理 matlab 开发语言
有很多方法可以实现MATLAB车牌的定位和识别系统。以下是一种可能的实现步骤：车牌定位：使用图像处理技术（如边缘检测、区域生长或颜色分割）来检测图像中的车牌区域。使用形态学操作来排除不符合车牌形状的区域。对车牌区域进行裁剪或调整大小，以便后续的识别。车牌识别：将车牌图像转换为灰度图像。使用图像处理技术（如二值化、滤波或增强）来减少噪音并突出字符。使用字符分割算法将车牌中的字符分开。使用特征提取方法
MATLAB车牌识别系统清风明月来几时图像算法处理 matlab 开发语言
MATLAB车牌识别系统是一个基于MATLAB开发的用于识别和提取车牌信息的系统。该系统使用图像处理和机器学习算法来实现车牌的定位和字符识别。以下是一个基本的MATLAB车牌识别系统的工作流程：图像预处理：首先，将输入的图像进行预处理，包括灰度化、高斯平滑、边缘检测等操作，以提高后续的车牌定位和字符识别的准确性。车牌定位：在预处理后的图像中，使用形态学运算和边缘检测算法来寻找车牌的位置。这可以通过
直方图匹配（Histogram Matching）姜太公钓鲸233 计算机视觉人工智能机器学习
直方图匹配（HistogramMatching），也被称为直方图规定化（HistogramSpecification）或直方图修正（HistogramEqualization），是一种图像处理技术，用于调整图像的直方图，以使其与某个目标直方图相匹配。目标直方图通常是用户定义的或者是希望获得的期望分布。直方图匹配的目标是改变图像的像素值分布，从而使其在视觉上更接近目标直方图。这对于图像增强、风格迁移
uint8 姜太公钓鲸233 python numpy
无符号8位整数（uint8）是一种数据类型，通常用于表示整数，但它不包括负数，只能表示非负的整数值。它的范围是从0到255，共有256个不同的可能取值。在计算机中，整数数据类型可以分为有符号和无符号。有符号整数可以表示正数、负数和零，而无符号整数只能表示非负的整数。在图像处理中，无符号8位整数通常用于表示灰度图像的像素值。一个像素的灰度值代表了图像中对应点的亮度强度，通常从0（黑色）到255（白色
【Python第三方库】OpenCV库实用指南墨辰JC Python opencv python 人工智能学习
文章目录前言安装OpenCV读取图像图像基本操作获取图像信息裁剪图像图像缩放图像转换为灰度图图像模糊处理边缘检测图像翻转图像保存视频相关操作方法讲解读取视频从摄像头读取视频前言OpenCV（OpenSourceComputerVisionLibrary）作为一个强大的计算机视觉库，提供了丰富的图像处理和计算机视觉功能，尤其在图像识别、对象检测、视频分析等领域有着广泛的应用。本文将带领读者使用Pyt
计算机视觉之旅-进阶-图像滤波处理撸码猿计算机视觉图像处理人工智能
1.基本概念1.1.数字图像图像处理的对象是数字图像,它是由像素点阵列表示的图像。需要了解像素、图像分辨率、灰度级、RBG等图像表示方法。用numpy数组表示,每个元素为像素值。例如RGB图像 importnumpyasnp img=np.array([[[255,0,0],[0,255,0]],[[0,0,255],[255,255,255]]]) 1.2.采样和量化数字图像是通过采样和量化得到
动手学深度学习（pytorch土堆）-03常见的Transforms #include<菜鸡> 深度学习深度学习 pytorch 人工智能
Composetransforms.Compose是PyTorch中的一个函数，用于将多个图像变换操作组合在一起，形成一个变换流水线。这样可以将一系列的图像处理操作整合为一个步骤，便于对图像进行批量预处理或增强。基本用法transforms.Compose接受一个列表，列表中的每个元素是一个变换操作。这些操作会按照给定的顺序依次作用在输入的图像上。Example:>>>transforms.Com
论文学习笔记 VMamba: Visual State Space Model Wils0nEdwards 学习笔记
概览这篇论文的动机源于在计算机视觉领域设计计算高效的网络架构的持续需求。当前的视觉模型如卷积神经网络（CNNs）和视觉Transformer（ViTs）在处理大规模视觉任务时展现出良好的表现，但都存在各自的局限性。特别是，ViTs尽管在处理大规模数据上具有优势，但其自注意力机制的二次复杂度对高分辨率图像处理时的计算成本极高。因此，研究者希望通过引入新的架构来降低这种复杂度，并提高视觉任务的效率。现
数字图像处理（一系列对图像进行处理、分析和改进的技术）编程日记✧ 智能医疗计算机视觉图像处理人工智能
数字图像处理是指对图像进行一系列的数学和算法处理，以增强、分析或理解图像的内容。这些处理包括从基础的像素操作到复杂的高维变换和机器学习模型。1.图像降噪在图像获取和传输过程中，往往会引入噪声。降噪技术用于减少这些噪声，同时尽量保持图像的细节。常见方法有：均值滤波：将像素邻域内的像素值取平均值，从而平滑图像。这种方法简单但可能会模糊边缘。高斯滤波：使用高斯函数为权重对像素进行加权平均，可以更好地平滑
python图像处理的图像几何变换 yava_free 图像处理 python 计算机视觉
一.图像几何变换图像几何变换不改变图像的像素值，在图像平面上进行像素变换。适当的几何变换可以最大程度地消除由于成像角度、透视关系乃至镜头自身原因所造成的几何失真所产生的负面影响。几何变换常常作为图像处理应用的预处理步骤，是图像归一化的核心工作之一[1]。一个几何变换需要两部分运算：空间变换：包括平移、缩放、旋转和正平行投影等，需要用它来表示输出图像与输入图像之间的像素映射关系。灰度插值算法：按照这
OpenCV3最常用的基本操作 HeoLis
OpenCV介绍OpenCV的全称是OpenSourceComputerVisionLibrary，是一个跨平台的计算机视觉库。OpenCV是由英特尔公司发起并参与开发，以BSD许可证授权发行，可以在商业和研究领域中免费使用。OpenCV可用于开发实时的图像处理、计算机视觉以及模式识别程序。该程序库也可以使用英特尔公司的IPP进行加速处理。以上是维基百科关于OpenCV的介绍，简单来说它就是处理图
yolov5 +gui界面+单目测距实现对图片视频摄像头的测距毕设宇航 QQ767172261 yolov5 单目测距
可实现对图片，视频，摄像头的检测项目概述本项目旨在实现一个集成了YOLOv5目标检测算法、图形用户界面（GUI）以及单目测距功能的系统。该系统能够对图片、视频或实时摄像头输入进行目标检测，并估算目标的距离。通过结合YOLOv5的强大检测能力和单目测距技术，系统能够在多种应用场景中提供高效、准确的目标检测和测距功能。技术栈YOLOv5：用于目标检测的深度学习模型。OpenCV：用于图像处理和单目测距
Python中cv2 (OpenCV, opencv-python)库的安装、使用方法demo最新详细教程猫头虎 AI人工智能技术专栏 python opencv 开发语言计算机视觉语音识别目标检测神经网络
Python中cv2(OpenCV,opencv-python)库的安装、使用方法demo最新详细教程文章目录Python中cv2(OpenCV,opencv-python)库的安装、使用方法demo最新详细教程摘要引言正文OpenCV库概述安装OpenCV环境要求安装命令验证安装基础使用方法读取和显示图像图像处理示例❓常见问题解答小结参考资料表格总结总结和未来展望温馨提示摘要本文全面介绍了Pyt
c#视觉应用开发中如何使用Emgu CV在C#中进行图像处理？ openwin_top C#视觉应用开发问题系列 c#图像处理开发语言
microPythonPython最小内核源码解析NI-motion运动控制c语言示例代码解析python编程示例系列python编程示例系列二python的Web神器Streamlit如何应聘高薪职位EmguCV是OpenCV的.NET包装器，可以让开发者在.NET语言（如C#）中使用OpenCV的功能进行图像处理。在进行图像处理时，EmguCV提供了丰富的API可以使用。以下是使用EmguCV
怎么样才能成为专业的程序员？ cocos2d-x小菜编程 PHP
如何要想成为一名专业的程序员？仅仅会写代码是不够的。从团队合作去解决问题到版本控制，你还得具备其他关键技能的工具包。当我们询问相关的专业开发人员，那些必备的关键技能都是什么的时候，下面是我们了解到的情况。关于如何学习代码，各种声音很多，然后很多人就被误导为成为专业开发人员懂得一门编程语言就够了？！呵呵，就像其他工作一样，光会一个技能那是远远不够的。如果你想要成为
java web开发高并发处理 BreakingBad java Web 并发开发处理高
java处理高并发高负载类网站中数据库的设计方法（java教程,java处理大量数据，java高负载数据）一：高并发高负载类网站关注点之数据库没错,首先是数据库,这是大多数应用所面临的首个SPOF。尤其是Web2.0的应用，数据库的响应是首先要解决的。一般来说MySQL是最常用的，可能最初是一个mysql主机，当数据增加到100万以上，那么，MySQL的效能急剧下降。常用的优化措施是M-S（
mysql批量更新 ekian mysql
mysql更新优化：一版的更新的话都是采用update set的方式，但是如果需要批量更新的话，只能for循环的执行更新。或者采用executeBatch的方式，执行更新。无论哪种方式，性能都不见得多好。三千多条的更新，需要3分多钟。查询了批量更新的优化，有说replace into的方式，即： replace into tableName(id,status) values
微软BI（3） 18289753290 微软BI SSIS
1) Q：该列违反了完整性约束错误；已获得 OLE DB 记录。源:“Microsoft SQL Server Native Client 11.0” Hresult: 0x80004005 说明:“不能将值 NULL 插入列 'FZCHID'，表 'JRB_EnterpriseCredit.dbo.QYFZCH'；列不允许有 Null 值。INSERT 失败。”。 A：一般这类问题的存在是
Java中的List g21121 java
List是一个有序的 collection（也称为序列）。此接口的用户可以对列表中每个元素的插入位置进行精确地控制。用户可以根据元素的整数索引（在列表中的位置）访问元素，并搜索列表中的元素。与 set 不同，列表通常允许重复
读书笔记永夜-极光读书笔记
1. K是一家加工厂,需要采购原材料,有A,B,C,D 4家供应商,其中A给出的价格最低,性价比最高,那么假如你是这家企业的采购经理,你会如何决策? 传统决策: A:100%订单 B,C,D:0% &nbs
centos 安装 Codeblocks 随便小屋 codeblocks
1.安装gcc,需要c和c++两部分,默认安装下,CentOS不安装编译器的,在终端输入以下命令即可yum install gccyum install gcc-c++ 2.安装gtk2-devel,因为默认已经安装了正式产品需要的支持库,但是没有安装开发所需要的文档.yum install gtk2* 3. 安装wxGTK yum search w
23种设计模式的形象比喻 aijuans 设计模式
1、ABSTRACT FACTORY—追MM少不了请吃饭了，麦当劳的鸡翅和肯德基的鸡翅都是MM爱吃的东西，虽然口味有所不同，但不管你带MM去麦当劳或肯德基，只管向服务员说“来四个鸡翅”就行了。麦当劳和肯德基就是生产鸡翅的Factory 　　工厂模式：客户类和工厂类分开。消费者任何时候需要某种产品，只需向工厂请求即可。消费者无须修改就可以接纳新产品。缺点是当产品修改时，工厂类也要做相应的修改。如：
开发管理 CheckLists aoyouzi 开发管理 CheckLists
开发管理 CheckLists(23) -使项目组度过完整的生命周期开发管理 CheckLists(22) -组织项目资源开发管理 CheckLists(21) -控制项目的范围开发管理 CheckLists(20) -项目利益相关者责任开发管理 CheckLists(19) -选择合适的团队成员开发管理 CheckLists(18) -敏捷开发 Scrum Master 工作开发管理 C
js实现切换百合不是茶 JavaScript 栏目切换
js主要功能之一就是实现页面的特效,窗体的切换可以减少页面的大小,被门户网站大量应用思路: 1,先将要显示的设置为display:bisible 否则设为none 2,设置栏目的id ,js获取栏目的id,如果id为Null就设置为显示 3,判断js获取的id名字;再设置是否显示代码实现: html代码: <di
周鸿祎在360新员工入职培训上的讲话 bijian1013 感悟项目管理人生职场
这篇文章也是最近偶尔看到的，考虑到原博客发布者可能将其删除等原因，也更方便个人查找，特将原文拷贝再发布的。“学东西是为自己的，不要整天以混的姿态来跟公司博弈，就算是混，我觉得你要是能在混的时间里，收获一些别的有利于人生发展的东西，也是不错的，看你怎么把握了”，看了之后，对这句话记忆犹新。 &
前端Web开发的页面效果 Bill_chen html Web Microsoft
1.IE6下png图片的透明显示： <img src="图片地址" border="0" style="Filter.Alpha(Opacity)=数值(100),style=数值(3)"/> 或在<head></head>间加一段JS代码让透明png图片正常显示。 2.<li>标
【JVM五】老年代垃圾回收：并发标记清理GC(CMS GC) bit1129 垃圾回收
CMS概述并发标记清理垃圾回收(Concurrent Mark and Sweep GC）算法的主要目标是在GC过程中，减少暂停用户线程的次数以及在不得不暂停用户线程的请夸功能，尽可能短的暂停用户线程的时间。这对于交互式应用，比如web应用来说，是非常重要的。 CMS垃圾回收针对新生代和老年代采用不同的策略。相比同吞吐量垃圾回收，它要复杂的多。吞吐量垃圾回收在执
Struts2技术总结白糖_ struts2
必备jar文件早在struts2.0.*的时候，struts2的必备jar包需要如下几个： commons-logging-*.jar Apache旗下commons项目的log日志包 freemarker-*.jar
Jquery easyui layout应用注意事项 bozch jquery 浏览器 easyui layout
在jquery easyui中提供了easyui-layout布局，他的布局比较局限，类似java中GUI的border布局。下面对其使用注意事项作简要介绍：如果在现有的工程中前台界面均应用了jquery easyui，那么在布局的时候最好应用jquery eaysui的layout布局，否则在表单页面（编辑、查看、添加等等）在不同的浏览器会出
java-拷贝特殊链表：有一个特殊的链表，其中每个节点不但有指向下一个节点的指针pNext，还有一个指向链表中任意节点的指针pRand，如何拷贝这个特殊链表？ bylijinnan java
public class CopySpecialLinkedList { /** * 题目：有一个特殊的链表，其中每个节点不但有指向下一个节点的指针pNext，还有一个指向链表中任意节点的指针pRand，如何拷贝这个特殊链表？拷贝pNext指针非常容易，所以题目的难点是如何拷贝pRand指针。假设原来链表为A1 -> A2 ->... -> An，新拷贝
color Chen.H JavaScript html css
<!DOCTYPE HTML PUBLIC "-//W3C//DTD HTML 4.01 Transitional//EN" "http://www.w3.org/TR/html4/loose.dtd"> <HTML> <HEAD>&nbs
[信息与战争]移动通讯与网络 comsci 网络
两个坚持:手机的电池必须可以取下来光纤不能够入户,只能够到楼宇建议大家找这本书看看:<&
oracle flashback query(闪回查询) daizj oracle flashback query flashback table
在Oracle 10g中，Flash back家族分为以下成员： Flashback Database Flashback Drop Flashback Table Flashback Query(分Flashback Query,Flashback Version Query，Flashback Transaction Query) 下面介绍一下Flashback Drop 和Flas
zeus持久层DAO单元测试 deng520159 单元测试
zeus代码测试正紧张进行中,但由于工作比较忙,但速度比较慢.现在已经完成读写分离单元测试了,现在把几种情况单元测试的例子发出来,希望有人能进出意见,让它走下去. 本文是zeus的dao单元测试: 1.单元测试直接上代码 package com.dengliang.zeus.webdemo.test; import org.junit.Test; import o
C语言学习三printf函数和scanf函数学习 dcj3sjt126com c printf scanf language
printf函数 /* 2013年3月10日20:42:32 地点：北京潘家园功能：目的：测试%x %X %#x %#X的用法 */ # include <stdio.h> int main(void) { printf("哈哈！\n"); // \n表示换行 int i = 10; printf
那你为什么小时候不好好读书? dcj3sjt126com life
dady, 我今天捡到了十块钱, 不过我还给那个人了 good girl! 那个人有没有和你讲thank you啊没有啦....他拉我的耳朵我才把钱还给他的, 他哪里会和我讲thank you 爸爸, 如果地上有一张5块一张10块你拿哪一张呢.... 当然是拿十块的咯... 爸爸你很笨的, 你不会两张都拿爸爸为什么上个月那个人来跟你讨钱, 你告诉他没
iptables开放端口 Fanyucai linux iptables 端口
1，找到配置文件 vi /etc/sysconfig/iptables 2，添加端口开放，增加一行，开放18081端口 -A INPUT -m state --state NEW -m tcp -p tcp --dport 18081 -j ACCEPT 3，保存 ESC :wq! 4，重启服务 service iptables
Ehcache（05）——缓存的查询 234390216 排序 ehcache 统计 query
缓存的查询目录 1. 使Cache可查询 1.1 基于Xml配置 1.2 基于代码的配置 2 指定可搜索的属性 2.1 可查询属性类型 2.2 &
通过hashset找到数组中重复的元素 jackyrong hashset
如何在hashset中快速找到重复的元素呢?方法很多，下面是其中一个办法： int[] array = {1,1,2,3,4,5,6,7,8,8}; Set<Integer> set = new HashSet<Integer>(); for(int i = 0
使用ajax和window.history.pushState无刷新改变页面内容和地址栏URL lanrikey history
后退时关闭当前页面 <script type="text/javascript"> jQuery(document).ready(function ($) { if (window.history && window.history.pushState) {
应用程序的通信成本 netkiller.github.com 虚拟机应用服务器陈景峰 netkiller neo
应用程序的通信成本什么是通信一个程序中两个以上功能相互传递信号或数据叫做通信。什么是成本这是是指时间成本与空间成本。时间就是传递数据所花费的时间。空间是指传递过程耗费容量大小。都有哪些通信方式全局变量线程间通信共享内存共享文件管道 Socket 硬件（串口，USB）等等全局变量全局变量是成本最低通信方法，通过设置
一维数组与二维数组的声明与定义恋洁e生二维数组一维数组定义声明初始化
/** * */ package test20111005; /** * @author FlyingFire * @date:2011-11-18 上午04:33:36 * @author ：代码整理 * @introduce :一维数组与二维数组的初始化 *summary： */ public c
Spring Mybatis独立事务配置 toknowme mybatis
在项目中有很多地方会使用到独立事务，下面以获取主键为例（1）修改配置文件spring-mybatis.xml  <tx:annotation-driven transaction-manager="transactionManager" /> &n
更新Anadroid SDK Tooks之后，Eclipse提示No update were found xp9802 eclipse
使用Android SDK Manager 更新了Anadroid SDK Tooks 之后，打开eclipse提示 This Android SDK requires Android Developer Toolkit version 23.0.0 or above, 点击Check for Updates 检测一会后提示 No update were found