隆华爱读书我不爱读书所以我没书读

基于OpenCV的绿幕抠像与图像融合

一、背景知识

Keying，即抠像，从一幅图像中提取所要的前景，让它与背景分离起来。Key通常只包含一个通道，是一幅黑白图像，通常黑色的区域（0）代表完全透明，而白色区域（1）代表完全不透明，而灰色区域表示着半透明。

本实验用到以下抠像技术：

1.Luma Keying（亮度抠像）

亮度抠像一般用于画面上有明显亮度差异的镜头抠像，是基于lab中的L通道的抠像技术，对于明暗反差很大的图像我们应用这种抠像技术使背景透明。如明亮天空背景下拍摄的画面，就可以利用抠像将天空去除替换成想要的动态天空素材进行再编辑等等。

以上图为例，在Lab (L亮度, ab色度）通道下的各通道图如下：

可以看到L通道背景和人物的差异值很明显，可以用于区分前景和背景。

2.Chroma Keying（色度抠像）

色度抠像又称色度键，是基于RGB模式的抠像技术，其从原理上最接近最初的蓝绿幕技术，即通过前景和背景颜色差异将背景从画面中抠除并替换。

当然这种抠像方法有一个小问题就是前景如果出现背景色也会被抠除，有可能会出现内部零散的点。这可以通过形态学的膨胀、腐蚀操作进行改善。

3.Difference Keying（差值抠像）

差值抠像比较特殊，其原理是通过寻找两段同机位拍摄的画面的差别并将其保留，而将没有差别画面作为背景去除。其基本思想是，先把前景物体和背景一起拍摄下来，然后保持机位不变，去掉前景物体，单独拍摄背景。这样拍摄下来的两个画面相比较，在理想状态下，背景部分是完全相同的，而前景出现的部分则是不同的，这些不同的部分就是需要保留的通道。

事实上这就是之前做过的实验背景相减：

通过如上两张图片得到如下掩膜：

一般这种抠像方式主要用于无法运用蓝/绿幕抠像的场景。

本实验中使用的是Color Difference Keying，名字相似但思想和上面完全不一样，计算的是RGB中三个通道的差异，根据差异程度来判断前景和背景，可应用于绿幕抠图。

4.3D Keying（三维抠像）

三维抠像原理是将图像的色彩区域规整为三维空间显示模式，将RGB三个通道视为三维空间的三个坐标系，颜色的差异程度用空间距离来衡量。

选择哪一种抠像手段要取决于素材，而且素材对前期的拍摄有一些要求，所以在抠像之前先要对素材进行分析。分析它的亮度范围，分析它的色彩，分析它的遮挡关系，分析要提取的范围以及背景等。通常一种抠像手段是很难达到要求的，这时候就需要多种手段并用，达到最终目的。

二、实验内容

采用蓝（绿）幕抠像的方法，提取测试图像或视频中的前景，并与新背景合成。

测试图像或视频可以从bm.avi中截取，下面是部分视频片段（CSDN放不了本地视频资源，放下载还收费！）：

三、实验过程

1.整体思路

整个实验的流程如下：

①打开视频文件

②提取视频文件的每一帧，进行抠图操作，得到alpha通道的掩膜mask

③通过掩膜将原视频的帧与背景进行融合

④显示前景和背景融合后的帧

⑤读取下一帧，重复②

代码框架如下：

//背景图
background = imread("room_cut.jpg");
//打开视频文件
VideoCapture capture;
capture.open("source3.mp4"); 
if (!capture.isOpened())
{
    cout << "无法打开视频文件！" << endl;
    return -1;
}

//命名窗口
namedWindow("输入视频", WINDOW_AUTOSIZE);
namedWindow("输出视频", WINDOW_AUTOSIZE);

while (capture.read(frame))
{
    //对每一帧提取的图像进行抠图操作，得到alpha通道的mask
    Keying();

    //将背景融合
    Mat result = replace_and_blend(mask);

    //中途退出
    char c = waitKey(1);
    if (c == 27)
    {
        break;
    }

    //imshow("mask", mask);

    imshow("输出视频", result);
    imshow("输入视频", frame);
}
waitKey(0);
destroyAllWindows();
return 0;

2.Keying（抠图）方法

2.1 Luma Keying

Luma Keying一般针对亮度L通道进行抠图，用于明暗差异大的图片，但也不仅仅适用于亮度差异大的图片，它的思想可以推广至某一通道有较大差异的情况。

输出我们绿幕的图片的G通道如下：

可以看到，由于我们的视频素材是带有绿幕的，图像背景是绿幕所以G值较大，前景G值较小，这导致了前景和背景在G通道的数值差异较大，因此我们使用Luma Keying的思想对图片的G通道进行操作。

计算掩膜mask的公式如下：

$\begin{equation} mask= \begin{cases} 0& \text{ $ T_{0}<G<T_{1} $ } \\ 1& \text{ $ otherwise $ } \end{cases} \end{equation}$

上述公式中，表示像素在G通道的值， $T_{0}$ 、 $T_{1}$ 表示低阈值和高阈值。同时公式中的取值在，后续写出的所有公式都默认取值在，但在OpenCV实现时范围是。

对于上述公式的直观理解是，如果G通道的值在一个高范围 $[T_{0},T_{1}]$ 之间，说明是背景，设置为0；其他情况都设置为1。

产生的结果如下：

可以看到上述公式有一个问题就是，取值只有0和1，这样导致边缘过渡不平滑。对其进行边缘软化，公式修改为如下：

$\begin{equation} mask= \begin{cases} 0& \text{ $ T_{0}<G<T_{1} $ } \\ 1& \text{ $ d>C $ } \\ \frac{d}{C} & \text{ $ otherwise $ } \end{cases} \end{equation}$

其中 $d=min(|G-T_{0}|,|G-T_{1}|)$

上述公式中多加了一个阈值参数和。对上述公式的直观理解是，当通道的值仍于高范围 $[T_{0},T_{1}]$ 之间，说明是背景，设置为0；当通道的值不在高范围之内时，计算，是通道的值离两个阈值的最短距离，如果超过了阈值，说明离背景的范围很远，可以直接设为1；其他情况，则平滑过渡。对于上述情况，平滑过渡后得到的结果如下：

可以看到不是输出的取值不只有0和1，还有平滑过渡的其他数值。

代码实现如下：

//使用LumaKeying对G通道抠图
void LumaKeying(Mat& src, Mat& mask, int threshold0, int threshold1, int C)
{
	//使用G通道
	split(src, channels);
	//imshow("G通道图像", channels[1]);

	//初始化mask
	mask = Mat::zeros(src.size(), CV_8UC1);
	for (int y = 0; y < channels[1].rows; y++)
	{
		for (int x = 0; x < channels[1].cols; x++)
		{
			double L = channels[1].at(y, x);
			//cout << L << " ";
			double d = min(abs(L - threshold0), abs(L - threshold1));
			if (L > threshold0 && L < threshold1)//在阈值之间，说明是背景
				mask.at(y, x) = 0;
			else if (d > C)//大于C说明一定是前景
				mask.at(y, x) = 255;
			else//软化边缘
				mask.at(y, x) = int(d * 255.0 / C);
		}
		//cout << endl;
	}
	//imshow("LumaKeying'mask", mask);
}

输出的值结果如下（T0=120,T1=200,C=10）：

2.2 Chroma Keying

我们还可以直接对色调进行操作，在HSV通道中，每一种颜色是由固定的范围HSV三通道值构成的，我们只需要根据是否属于绿色范围来区分前景和背景，从而进行抠图。各种颜色在HSV的范围如下表：

	黑	灰	白	红		橙	黄	绿	青	蓝	紫
hmin	0	0	0	0	156	11	26	35	78	100	125
hmax	180	180	180	10	180	25	34	77	99	124	155
smin	0	0	0	43		43	43	43	43	43	43
smax	255	43	30	255		255	255	255	255	255	255
vmin	0	46	221	46		46	46	46	46	46	46
vmax	46	220	255	255		255	255	255	255	255	255

只需将绿色和其他颜色区分出来即可，以下是代码：

//将每一帧从rgb转化为hsv三通道
cvtColor(frame, hsv, COLOR_BGR2HSV);
//筛选绿幕范围，筛选完后人物为黑色0，背景为白色255
inRange(hsv, Scalar(35, 43, 46), Scalar(77, 255, 255), mask);
bitwise_not(mask, mask);//取反操作，将0变为255，255变为0

输出结果如下：

2.3 Color Difference Keying

同样是对颜色进行处理，上面是对HSV中的色调处理，而Color Difference Keying处理的是RGB通道。

我们从Luma keying可以知道，绿幕背景的G通道值往往较大，除了对G通道的值大小进行衡量，还可以衡量G通道与其他B、R两通道差异程度，公式如下：

$\begin{equation} mask= \begin{cases} 0& \text{ $ d>T_{0}$ } \\ 1& \text{ $ T_{0}-d>T_{1} $ } \\ \frac{T_{0}-d}{T_{1}} & \text{ $ otherwise $ } \end{cases} \end{equation}$

其中

此时是指G通道与R、B通道中最大者的差距，可能为负数。 $T_{0}$ 和 $T_{1}$ 不再表示低高阈值。

上述公示的直观理解是：背景区域的G值往往较大，而R、B两个通道的值相对较小，因此值较大者代表越接近背景区域，当大于阈值 $T_{0}$ 时认为是背景；而当小于阈值 $T_{0}$ ，且与阈值 $T_{0}$ 距离大于 $T_{1}$ 时，说明已经离背景区域差的很远，可以认为是前景；在这之间的都进行平滑过渡。

代码实现如下：

//使用Color Difference Keying抠图
void ColorDifferenceKeying(Mat& src, Mat& mask, int threshold0, int threshold1)
{
	split(src, channels);
	//初始化mask
	mask = Mat::zeros(src.size(), CV_8UC1);
	for (int y = 0; y < channels[1].rows; y++)
	{
		for (int x = 0; x < channels[1].cols; x++)
		{
			double B = channels[0].at(y, x);
			double G = channels[1].at(y, x);
			double R = channels[2].at(y, x);
			double d = G - max(R, B);
			//cout << d << " ";
			if (d > threshold0)//大于阈值T0表示背景
				mask.at(y, x) = 0;
			else if (threshold0 - d > threshold1)//说明是前景
				mask.at(y, x) = 255;
			else//软化边缘
				mask.at(y, x) = int((threshold0 - d) * 255.0 / threshold1);
		}
		//cout << endl;
	}
	//imshow("Color Difference Keying", mask);
}

输出mask结果（T0=70，T1=40）：

2.4 3D Keying

将图像的BGR三个颜色通道映射到三维坐标空间，这样对于任意一个像素都可以映射为三维空间中的一个坐标点。

那么衡量背景与前景差异程度就转化为三维坐标系中点与点的空间距离。背景因为都是绿幕或者蓝幕，所以点会聚集在某一空间区域，在更优化时可以使用聚类，本实验仅人为地给出距离阈值。

具体方法上，我们可以任意选取背景中的4个点（或更多），计算所有像素与这四个节点的欧氏距离，并取最小的一个当作是该像素与背景的距离。当距离小于某一低阈值 $T_{0}$ 时，说明该点与背景距离较近，认为是背景；当距离大于某一高阈值 $T_{1}$ 时，说明离背景很远，认为是前景；其余情况进行边缘软化。

公式如下：

$\begin{equation} mask= \begin{cases} 0& \text{ $ d<T_{0}$ } \\ 1& \text{ $ d>T_{1} $ } \\ \frac{d-T_{0}}{T_{1}-T_{0}} & \text{ $ otherwise $ } \end{cases} \end{equation}$

其中 $d=min{||c-s_{i}||}$

上述公式中，是像素的BGR颜色， $s_{i}$ 是随机选取的几个背景点。

为了方便，我默认随机选取图片四个角周围的4个像素点作为背景的参考点。

代码实现如下：

//使用3D Keying抠图
void threeDKeying(Mat& src, Mat& mask, int threshold0, int threshold1)
{
	//定义原图像的四个s点
	Point samples[4] = { Point(100, 100),Point(src.cols - 100,src.rows - 100),Point(100,src.rows - 100),Point(src.cols - 100,100) };
	//分离三个RGB通道
	split(src, channels);
	//初始化mask
	mask = Mat::zeros(src.size(), CV_8UC1);
	for (int y = 0; y < channels[1].rows; y++)
	{
		for (int x = 0; x < channels[1].cols; x++)
		{
			double B = channels[0].at(y, x);
			double G = channels[1].at(y, x);
			double R = channels[2].at(y, x);

			double d = 1e9;
			//计算与四个样本点的最短空间距离
			for (int k = 0; k < 4; k++)
			{
				double dis = 0;
				//计算距离
				for (int c = 0; c < 3; c++)
				{
					double delta=double(src.at(samples[k].y, samples[k].x)[c])- double(channels[c].at(y, x));
					dis += delta * delta;
				}
				d = min(d, dis);
			}

			//cout << d << " ";
			if (d < threshold0)//与样本点的距离小于阈值T0，说明是背景
				mask.at(y, x) = 0;
			else if (d > threshold1)//与样本点的距离大于阈值T0，说明是前景
				mask.at(y, x) = 255;
			else//软化边缘
				mask.at(y, x) = int((d - threshold0) * 255.0 / (threshold1 - threshold0));
		}
		//cout << endl;
	}
	//imshow("3D Keying", mask);
}

输出结果（T0=300，T1=3000）：

三、图片合成

采用以下公式对前景和背景进行融合：

$C=\alpha F+(1-\alpha)B$

其中表示合成后的图片，表示前景图，表示背景图， $\alpha$ 表示透明度，由各点抠图的得到的计算而来。在BGR三通道的图像中，分别用上述公式处理BGR三通道，最后再合成。

代码如下：

//默认背景图和前景图尺寸大小一致
Mat replace_and_blend(Mat& mask)//融合
{
	//合成后的图片
	Mat result = Mat::zeros(frame.size(), frame.type());
	for (int y = 0; y < frame.rows; y++)
	{
		for (int x = 0; x < frame.cols; x++)
		{
			int m = mask.at(y, x);
			//权重
			double weight = m / 255.0;     
			//混合
			result.at(y, x)[0] = (frame.at(y, x)[0] * weight + background.at(y, x)[0] * (1.0 - weight));
			result.at(y, x)[1] = (frame.at(y, x)[1] * weight + background.at(y, x)[1] * (1.0 - weight));
			result.at(y, x)[2] = (frame.at(y, x)[2] * weight + background.at(y, x)[2] * (1.0 - weight));

		}
	}
	return result;
}

使用如下背景图：

各种抠图方法的运行结果：

luma keying的合成结果

从上面可以看到luma keying的合成结果不太理想，前景边缘很多地方没有正确区分。

Chroma Keying的合成结果

从上面可以看到Chroma Keying的合成结果也不太理想，前景边缘被去除掉了更多，原因很可能是前景边缘与背景相接近，光靠绿色范围识别的话很容易被判定为背景。

Color Difference Keying

从上面可以看到Color Difference Keying的合成结果很不错，基本正确识别前景和背景，前景虽然仍然略有一些绿色边缘没有去除，但整体效果相比前面两种方法有了大大提升。

3D Keying

从上面可以看到，3D Keying的合成结果也很好。

四、效果对比

luma

chroma

color difference

可以看到在实现的4种方法中，Color Difference Keying和3D keying的效果最好。

Luma keying和Chroma Keying效果一般，人物前景有部分内部点没有连通，边缘也不光滑，可以对其稍微优化，进行如下形态学操作：

//对mask进行形态学操作
Mat k = getStructuringElement(MORPH_RECT, Size(3, 3), Point(-1, -1));//返回指定形状和尺寸的核用于后面的形态学操作
morphologyEx(mask, mask, MORPH_CLOSE, k); //通过闭操作 填充内部的小白点，去除干扰
erode(mask, mask, k); //腐蚀操作
GaussianBlur(mask, mask, Size(3, 3), 0, 0); //高斯模糊

结果如下：

luma形态学操作后

chroma形态学操作后

效果提升有限，仍然不太理想。因为算法过于简单化，对于luma keying来说只考虑了一个通道误差较大，对于chroma keying来说有点“一刀切”没有考虑图片具体特征和细节。

五、其他

更换背景图和视频文件：

六、源代码

#include
#include
using namespace std;
using namespace cv;

Mat background, frame, hsv, mask;
Mat channels[3];

//使用LumaKeying对G通道抠图
void LumaKeying(Mat& src, Mat& mask, int threshold0, int threshold1, int C)
{
	//使用G通道
	split(src, channels);
	//imshow("G通道图像", channels[1]);

	//初始化mask
	mask = Mat::zeros(src.size(), CV_8UC1);
	for (int y = 0; y < channels[1].rows; y++)
	{
		for (int x = 0; x < channels[1].cols; x++)
		{
			double L = channels[1].at(y, x);
			//cout << L << " ";
			double d = min(abs(L - threshold0), abs(L - threshold1));
			if (L > threshold0 && L < threshold1)//在阈值之间，说明是背景
				mask.at(y, x) = 0;
			else if (d > C)//大于C说明一定是前景
				mask.at(y, x) = 255;
			else//软化边缘
				mask.at(y, x) = int(d * 255.0 / C);
		}
		//cout << endl;
	}
	//imshow("LumaKeying'mask", mask);
}

//使用Color Difference Keying抠图
void ColorDifferenceKeying(Mat& src, Mat& mask, int threshold0, int threshold1)
{
	split(src, channels);
	//初始化mask
	mask = Mat::zeros(src.size(), CV_8UC1);
	for (int y = 0; y < channels[1].rows; y++)
	{
		for (int x = 0; x < channels[1].cols; x++)
		{
			double B = channels[0].at(y, x);
			double G = channels[1].at(y, x);
			double R = channels[2].at(y, x);
			double d = G - max(R, B);
			//cout << d << " ";
			if (d > threshold0)//大于阈值T0表示背景
				mask.at(y, x) = 0;
			else if (threshold0 - d > threshold1)//说明是前景
				mask.at(y, x) = 255;
			else//软化边缘
				mask.at(y, x) = int((threshold0 - d) * 255.0 / threshold1);
		}
		//cout << endl;
	}
	//imshow("Color Difference Keying", mask);
}

//使用3D Keying抠图
void threeDKeying(Mat& src, Mat& mask, int threshold0, int threshold1)
{
	//定义原图像的四个s点
	Point samples[4] = { Point(100, 100),Point(src.cols - 100,src.rows - 100),Point(100,src.rows - 100),Point(src.cols - 100,100) };
	//分离三个RGB通道
	split(src, channels);
	//初始化mask
	mask = Mat::zeros(src.size(), CV_8UC1);
	for (int y = 0; y < channels[1].rows; y++)
	{
		for (int x = 0; x < channels[1].cols; x++)
		{
			double B = channels[0].at(y, x);
			double G = channels[1].at(y, x);
			double R = channels[2].at(y, x);

			double d = 1e9;
			//计算与四个样本点的最短空间距离
			for (int k = 0; k < 4; k++)
			{
				double dis = 0;
				//计算距离
				for (int c = 0; c < 3; c++)
				{
					double delta=double(src.at(samples[k].y, samples[k].x)[c])- double(channels[c].at(y, x));
					dis += delta * delta;
				}
				d = min(d, dis);
			}

			//cout << d << " ";
			if (d < threshold0)//与样本点的距离小于阈值T0，说明是背景
				mask.at(y, x) = 0;
			else if (d > threshold1)//与样本点的距离大于阈值T0，说明是前景
				mask.at(y, x) = 255;
			else//软化边缘
				mask.at(y, x) = int((d - threshold0) * 255.0 / (threshold1 - threshold0));
		}
		//cout << endl;
	}
	//imshow("3D Keying", mask);
}


Mat replace_and_blend(Mat& mask)//融合
{
	//合成后的图片
	Mat result = Mat::zeros(frame.size(), frame.type());
	for (int y = 0; y < frame.rows; y++)
	{
		for (int x = 0; x < frame.cols; x++)
		{
			int m = mask.at(y, x);
			//权重
			double weight = m / 255.0;     
			//混合
			result.at(y, x)[0] = (frame.at(y, x)[0] * weight + background.at(y, x)[0] * (1.0 - weight));
			result.at(y, x)[1] = (frame.at(y, x)[1] * weight + background.at(y, x)[1] * (1.0 - weight));
			result.at(y, x)[2] = (frame.at(y, x)[2] * weight + background.at(y, x)[2] * (1.0 - weight));

		}
	}
	return result;
}


int main()  
{
	//背景图
	background = imread("room_cut.jpg");

	//打开视频文件
	VideoCapture capture;
	capture.open("source3.mp4"); 

	if (!capture.isOpened())
	{
		cout << "无法打开视频文件！" << endl;
		return -1;
	}
	namedWindow("输入视频", WINDOW_AUTOSIZE);
	namedWindow("输出视频", WINDOW_AUTOSIZE);

	while (capture.read(frame))      
	{
		将每一帧从rgb转化为hsv三通道
		//cvtColor(frame, hsv, COLOR_BGR2HSV);
		筛选绿幕范围，筛选完后人物为黑色0，背景为白色255
		//inRange(hsv, Scalar(35, 43, 46), Scalar(77, 255, 255), mask);
		//bitwise_not(mask, mask);//取反操作，将0变为255，255变为0

		//LumaKeying(frame, mask, 120, 200, 10);
		ColorDifferenceKeying(frame, mask, 70, 40);
		//threeDKeying(frame, mask, 300, 3000);

		//对mask进行形态学操作
		Mat k = getStructuringElement(MORPH_RECT, Size(3, 3), Point(-1, -1));//返回指定形状和尺寸的核用于后面的形态学操作
		morphologyEx(mask, mask, MORPH_CLOSE, k); //通过闭操作 填充内部的小白点，去除干扰
		erode(mask, mask, k); //腐蚀操作
		GaussianBlur(mask, mask, Size(3, 3), 0, 0); //高斯模糊

		//背景融合与替换
		Mat result = replace_and_blend(mask);

		//中途退出
		char c = waitKey(1);
		if (c == 27)
		{
			break;
		}

		//imshow("背景", background);

		//imshow("mask", mask); 

		imshow("输出视频", result);
		imshow("输入视频", frame);

		//waitKey(0);
	}
	waitKey(0);
	destroyAllWindows();
	return 0;
}

你可能感兴趣的:(opencv,计算机视觉,c++)

Python从0到100（七十六）：计算机视觉-直方图和自适应直方图均衡化是Dream呀 python 计算机视觉开发语言
前言：零基础学Python：Python从0到100最新最全教程。想做这件事情很久了，这次我更新了自己所写过的所有博客，汇集成了Python从0到100，共一百节课，帮助大家一个月时间里从零基础到学习Python基础语法、Python爬虫、Web开发、计算机视觉、机器学习、神经网络以及人工智能相关知识，成为学习学习和学业的先行者！欢迎大家订阅专栏：零基础学Python：Python从0到100最新
opencv借助ffmpeg读取sdp文件进行rtp拉流 20231019 诗筱涵 rtsp 用简单代码实现功能 OpenCV rtp
20231019ffmpeg装起来很快编译命令g++rtp_ffmpeg_test.cpp-ooutput$(pkg-config--libsopencv4)代码如下#include#include#include#includeusingnamespacestd;usingnamespacecv;intmain(intargc,char**argv){cout>frame;if(frame.em
【OpenCV C++】存图，如何以时间命名，“年月日-时分秒“产生唯一的文件名呢？“年月日-时分秒-毫秒“ 自动检查存储目录，若不存在自动创建存图 R-G-B OpenCV C++C/C++opencv c++人工智能
文章目录1生成文件名（格式:"年月日-时分秒"格式）2生成文件名（格式:"年月日-时分秒-毫秒"）3多模式存图函数4综合调用实例5注意：默认参数只能在头文件中定义，不能在实现中重复默认参数mode==1→“年月日-时分”→YYYYMMDD-HHMM的文件名；例如：20250310-1647mode==2→"年月日-时分秒-毫秒"→YYYYMMDD-HHMMSS-MMM（适用采集存储帧率搞得图片，增
C++：const和constexpr两个关键字壹十壹 C++c++
在C++中，constexpr和const是两个关键字，用于定义常量，但它们有不同的语义和用途。以下是它们的详细对比和示例：1.const含义：表示变量是只读的，其值在程序运行期间不能被修改。初始化：可以在运行时（run-time）进行初始化。用法：通常用于修饰变量、函数参数或返回值。不能保证变量在编译期求值。示例constintx=10;//编译时常量inty=20;constintz=y;//
SOPHON SDK解码视频流的常见调试方法算能开发者社区 SOPHON SDK常见问题 linux 人工智能
SOPHONSDK解码视频流的常见调试方法1.rtsp连接测试2.判断rtsp是否正常工作3.确认解码器是否能正常工作：（url为文件名或者rtsp连接地址）4.确认解码器和vpp的OpenCV接口是否正常工作5.解码不正确或者无法解码的最终调试手段1.rtsp连接测试ffmpeg-rtsp_transporttcp-iurl-frawvideo-y/dev/null或者ffmpeg-rtsp_t
《 YOLOv5、YOLOv8、YOLO11训练的关键文件：data.yaml文件编写全解》空云风语人工智能 YOLO 机器视觉目标跟踪人工智能计算机视觉 YOLO
走进YOLOv5、YOLOv8、YOLO11的data.yaml在计算机视觉领域的广袤星空中，目标检测无疑是一颗璀璨的明星，它广泛应用于自动驾驶、智能安防、工业检测、医疗影像分析等众多关键领域，发挥着不可或缺的作用。而YOLO系列算法，更是以其独特的“一次看全（YouOnlyLookOnce）”理念和卓越的性能，在目标检测领域中独树一帜，成为了众多研究者和开发者的首选工具。从最初的YOLOv1横空
机器学习之线性代数珠峰日记 AI理论与实践机器学习线性代数人工智能
文章目录一、引言：线性代数为何是AI的基石二、向量：AI世界的基本构建块（一）向量的定义（二）向量基础操作（三）重要概念三、矩阵：AI数据的强大容器（一）矩阵的定义（二）矩阵运算（三）矩阵特性（四）矩阵分解（五）Python示例（使用NumPy库）四、线性代数在AI中的应用（一）数据表示（二）降维：PCA（三）线性回归（四）计算机视觉（五）自然语言处理一、引言：线性代数为何是AI的基石在人工智能领
qt c++线程中的同步和异步我要进步！ qt c++
一、线程同步用于协调多个线程对共享资源的访问，避免竞态条件。常用工具：QMutex（互斥锁）保护临界区，确保一次仅一个线程访问资源。QMutexmutex;intsharedData=0;voidThread::run(){mutex.lock();sharedData++;//安全操作mutex.unlock();}QMutexLocker自动管理锁生命周期：{QMutexLockerlocke
深度解析：DETR的多尺度特征融合 AI天才研究院 AI大模型企业级应用开发实战 DeepSeek R1 &大数据AI人工智能大模型计算科学神经计算深度学习神经网络大数据人工智能大型语言模型 AI AGI LLM Java Python 架构设计 Agent RPA
"深度解析：DETR的多尺度特征融合"作者：禅与计算机程序设计艺术1.背景介绍1.1目标检测的挑战与传统方法的局限性目标检测是计算机视觉领域中的一个基本任务，其目标是识别图像或视频中所有感兴趣的目标，并确定它们的位置和类别。传统的目标检测方法，如FasterR-CNN和YOLO，通常依赖于预定义的锚框或候选区域来生成目标proposals。然而，这些方法存在一些固有的局限性：人工先验知识:锚框的设
C++ time(0)函数宁玉AC c学习
time(0)函数返回当前格林尼治标准时间与格林尼治标准时间1970年0分0秒的时间间隔。头文件#include//问题：得到当前时间。#include#includeusingnamespacestd;intmain(){inttotalSeconds=time(0);intcurrentSeconds=totalSeconds%60;inttotalMinutes=totalSeconds/6
C++随机数宁玉AC c学习 c++开发语言
目录一、名著参考二、详解1.rand()函数2.time(0)3.srand(time(0))4.获取指定范围内的随机数（含指定位数）一、名著参考可以使用cstdlib头文件中的rand()函数来获得随机整数；这个函数返回0~RAND_MAX之间的随机整数；rand()函数生成的是伪随机数。即每次在同一个系统上执行这个函数的时候，rand()函数生成同一序列的数。rand()函数的算法使用一个叫种
C++11之列表初始化 Octopus2077 c++学习笔记
发展历史C++11是C++的第⼆个主要版本，并且是从C++98起的最重要更新。它引⼊了⼤量更改，标准化了既有实践，并改进了对C++程序员可⽤的抽象。在它最终由ISO在2011年8⽉12⽇采纳前，⼈们曾使⽤名称“C++0x”，因为它曾被期待在2010年之前发布。C++03与C++11期间花了8年时间，故⽽这是迄今为⽌最⻓的版本间隔。从那时起，C++有规律地每3年更新⼀次。列表初始化（注意区分列表初始
目标检测项目 sho_re 神经网络人工智能 pytorch 目标检测
·识别图片中有哪些物体并且找到物体的存在位置多任务：位置+类别目标种类与数量繁多的问题目标尺度不均的问题遮挡、噪声等外部环境干扰VOC数据集：PASCALVOC挑战赛(ThePASCALVisualObjectClasses)是一个世界级的计算机视觉挑战赛。4大类，20小类VOC2007：9963图片/24640目标VOC2012：23080图片/54900目标·COCO数据集：起源于微软2014
基于llama_cpp 调用本地模型（llama）实现基本推理月光技术杂谈大模型初探 llama llama.cpp python LLM 集成显卡本地模型 AI
零基础实践本地推理模型基本应用：基于llama_cpp的本地模型调用。本文先安装llama_cpppython库，再编写程序，利用其调用llama-2-7b-chat.Q4_K_M.ggu模型。背景llama_cpp是一个基于C++的高性能库（llama.cpp）的Python绑定，支持在CPU或GPU上高效运行LLaMA及其衍生模型（如LLaMA2），并通过量化技术（如GGUF格式）优化内存使用
动态规划双剑合璧：C++与Python征服洛谷三大经典DP问题三流搬砖艺术家动态规划 c++python
动态规划核心思想状态定义→转移方程→边界处理→时空优化本文精选洛谷动态规划题单中三大经典问题，通过C++与Python双语言对比实现，彻底掌握DP精髓！题目一：P1048采药（01背包模板）题目描述在限定时间T内采集草药，每株草药有采集时间time[i]和价值value[i]，求最大总价值。解题思路状态定义：dp[j]表示时间j能获得的最大价值转移方程：dp[j]=max(dp[j],dp[j-t
C语言_数据结构总结7:顺序队列（循环队列） *.✧屠苏隐遥(ﾉ◕ヮ◕)ﾉ*.✧ C语言—数据结构数据结构 c语言开发语言算法 visual studio visualstudio
纯C语言实现，不涉及C++队列简称队，也是一种操作受限的线性表。只允许表的一端进行插入，表的另一端进行删除特性：先进先出针对顺序队列存在的“假溢出”问题，引出的循环队列概念。循环队列将顺序队列臆造为一个环状的空间，即把存储队列元素的表从逻辑上视为一个环。当队首指针Q->front=MaxSize-1后，再前进一个位置就自动到0，这可以利用除法取余运算（%）来实现。循环队列中的判空和判满条件分析：显
C++：入门详解（关于C与C++基本差别）梅茜Mercy c++c语言 java
目录一.C++的第一个程序二.命名空间（namespace）1.命名空间的定义与使用：（1）命名空间里可以定义变量，函数，结构体等多种类型（2）命名空间调用（：：）与展开（3）命名空间的嵌套（4）具体使用场景三.缺省参数1.基本定义：2.几个注意：四.函数重载1.定义与使用：五.引用1.定义：2.引用的特性：3.引用的使用（区别传值返回和传引用返回）：4.const引用：六.inline内联一.C
人脸识别，dlib优化，Dlib/OpenCV交叉编译 yiyayiya557 linux 嵌入式
参考文章：GitRepo镜像使用帮助https://mirrors.tuna.tsinghua.edu.cn/help/git-repo/交叉编译Dlib+OpenCV交叉编译移植到ARM64-v8平台（编译不通过，不可用）https://blog.csdn.net/kaychangeek/article/details/80365320Qt移植到ARM64-v8平台(NXPi.MX8M)笔记（未
C++开源库大全大王算法 C/C++开发实战365 C++入门及项目实战宝典 c++开源
程序员要站在巨人的肩膀上，C++拥有丰富的开源库，这里包括：标准库、Web应用框架、人工智能、数据库、图片处理、机器学习、日志、代码分析等。标准库C++StandardLibrary：是一系列类和函数的集合，使用核心语言编写，也是C++ISO自身标准的一部分。
C++11使用mutex和condition_variable实现线程同步追烽少年x C++基础 c++
C++11使用mutex和condition_variable实现线程同步在实现项目的过程中，突然有一个问题：C++中A、B、C三个线程模拟购买100张车票，A输出99，B输出98，C输出97,然后又循环A输出96，B95,C94,直到0，使用线程同步，如何实现？这是一种按顺序执行线程的问题，应该实现？代码如下：#include#include#include#include#include//共
c++计算n的阶乘（用循环和递归） Absinthe_苦艾酒 c/c++c++算法数据结构
1.循环//计算阶乘#includeusingnamespacestd;intfct(int*p){intsum=1;while(*p>=2){sum*=((*p)--);}returnsum;}intmain(){cout>n;coutusingnamespacestd;//使用递归计算阶乘intfct(intn){if(n==1)return1;elsereturnn*fct(n-1);}in
树莓派-C++之异常 lalalaouhei c++开发语言后端
2021SC@SDUSCC++异常用官方的话来说就是程序在执行过程中产生的问题，换句通俗的话来讲就是程序执行的出现的异常，比如程序崩了、内存泄漏了、数组越界以及其他异常信息的出现，又如运行时耗尽了内存或遇到意外的非法输入。一个简单的例子就是尝试除以零的操作。异常存在于程序的正常功能之外，并要求程序立即处理。不能不处理异常，异常是足够重要的，使程序不能继续正常执行的事件。一、异常处理所谓“处理”，可
C++中map和set的详解 jiajia651304 c++算法开发语言
C++中map和set的介绍与使用一、map的介绍与使用二、set的介绍与使用三、总结在C++编程中，map和set是标准模板库（STL）中两种非常重要的关联容器。它们基于平衡二叉搜索树（通常是红黑树）的数据结构来实现，提供了高效的数据存储和检索功能。本文将详细介绍map和set的特点、用法以及一些常见的操作示例。一、map的介绍与使用1.map的基本概念map是一个键值对容器，其中每个键都是唯一
Qt基础之四十一：记一次QVector的bad alloc问题追踪草上爬 Qt那些事儿 qt QVector vector bad alloc
目录一.QVector的特点二.QVector的内存分配策略三.badalloc问题追踪一.QVector的特点QVector是Qt容器类库中的一个重要组成部分，它提供了类似于C++标准库中的std::vector的功能，但同时拥有Qt独特的优势。QVector是一个动态数组，支持添加、插入和删除元素。与其他容器相比，QVector在随机访问元素时具有出色的性能，同时在尾部添加和删除元素时依然高效
C++内存操纵的艺术 longdong7889 后端学习 c++java 开发语言
C++内存操纵的艺术在C++的混沌宇宙中，指针是打开时空裂缝的密钥。本文将以全新视角解构指针的本质，揭示从堆栈穿梭到多维空间映射的进阶技法，展示现代C++赋予指针的惊人可能性。一、指针本体论：内存的波粒二象性所有指针变量都是量子化的存在，既指向具体内存位置，又携带类型信息波。通过类型系统实验可验证其双重属性：templatevoidquantum_observer(T*ptr){std::cout
C++入门之容易忽视的namespace和函数重载不会的码 c++开发语言后端
目录命名空间命名空间的定义命名空间的用法1.直接把std整个展开2.对部分常用的展开3.指定命名空间缺省参数全缺省：（所有的参数都指定一个默认值）半缺省：(只有部分被参数指定默认值，而不是一半的参数)函数重载那么为什么C语言不支持函数重载，C++支持呢？extern"C"命名空间在C/C++中，变量、函数都是大量存在的，这些变量、函数的名称将都存在于全局作用域中，可能会导致很多冲突。使用命名空间的
C++内存管理秘籍：深入解析与实战代码示例 my1121716951 编程 c++java 开发语言
C++内存管理秘籍：深入解析与实战代码示例一、内存管理的基本概念二、内存泄漏与野指针三、智能指针：现代C++的内存管理利器四、实战代码示例示例1：传统动态内存管理示例2：使用`std::unique_ptr`示例3：使用`std::shared_ptr`五、总结在C++编程的世界里，内存管理是一项既基础又核心的技能。它直接关系到程序的性能、稳定性和可维护性。不同于一些高级语言自动管理内存的特性，C
C++之list删除元素 csdn_zhangchunfeng C++VS 技术管理索引列表 c++
C++之list删除元素对容器list存储的元素执行删除操作的时候，一般都是使用其成员函数实现的：（1）clear（）：删除list容器中的所有元素（2）remove（value）：删除容器中所有为value的元素（3）remove_if（）：删除容器中满足条件的元素（4）unique（）：删除容器中相邻的重复元素，只留下一个（5）erase（）：删除list容器中指定位置处的元素，也可以删除容器
【C++基础学习笔记】C++的输入输出流及缺省参数大家好我叫张同学深入浅出学习C++c++
我要做一个好奇宝宝，带着疑问来阅读，哼~C++如何进行输入输出？和C语言何有区别？C++的缺省参数是什么？如何理解和掌握？文章目录C++的输入&输出缺省参数缺省参数的概念缺省参数的分类1.全缺省参数2.半缺省参数：C++的输入&输出婴儿降生到这个世界上时，会以自己独特的方式向这个崭新的世界打招呼。跟新生婴儿类似，C++语言刚出来后，也算是一个新事物，作为一门新的编程语言也会有自己问候这个美好世界的
C++之string类讨厌下雨的天空 c++
1.string类的重要性：C语言中，字符串是以“\0”结尾的一些字符的集合，为了操作方便，C标准库中提供了一些str系列的库函数，但是这些库函数与字符串是分离开的，不太符合OPP的思想，而且底层空间需要用户自行管理，稍不留神可能会越界访问。string是一个对象，使用字符的顺序表实现的，就是一个字符顺序表。基本构造：classstring{private:size_tsize;size_tcap
PHP如何实现二维数组排序？ IT独行者二维数组 PHP 排序　
二维数组在PHP开发中经常遇到，但是他的排序就不如一维数组那样用内置函数来的方便了，（一维数组排序可以参考本站另一篇文章【PHP中数组排序函数详解汇总】）。二维数组的排序需要我们自己写函数处理了，这里UncleToo给大家分享一个PHP二维数组排序的函数：代码： functionarray_sort($arr,$keys,$type='asc'){ $keysvalue= $new_arr
【Hadoop十七】HDFS HA配置 bit1129 hadoop
基于Zookeeper的HDFS HA配置主要涉及两个文件,core-site和hdfs-site.xml。测试环境有三台 hadoop.master hadoop.slave1 hadoop.slave2 hadoop.master包含的组件NameNode, JournalNode, Zookeeper，DFSZKFailoverController
由wsdl生成的java vo类不适合做普通java vo darrenzhu VO wsdl webservice rpc
开发java webservice项目时，如果我们通过SOAP协议来输入输出，我们会利用工具从wsdl文件生成webservice的client端类，但是这里面生成的java data model类却不适合做为项目中的普通java vo类来使用，当然有一中情况例外，如果这个自动生成的类里面的properties都是基本数据类型，就没问题，但是如果有集合类，就不行。原因如下： 1)使用了集合如Li
JAVA海量数据处理之二（BitMap）周凡杨 java 算法 bitmap bitset 数据
路漫漫其修远兮，吾将上下而求索。想要更快，就要深入挖掘 JAVA 基础的数据结构，从来分析出所编写的 JAVA 代码为什么把内存耗尽，思考有什么办法可以节省内存呢？啊哈！算法。这里采用了 BitMap 思想。首先来看一个实验：指定 VM 参数大小： -Xms256m -Xmx540m
java类型与数据库类型 g21121 java
很多时候我们用hibernate的时候往往并不是十分关心数据库类型和java类型的对应关心，因为大多数hbm文件是自动生成的，但有些时候诸如：数据库设计、没有生成工具、使用原始JDBC、使用mybatis(ibatIS)等等情况，就会手动的去对应数据库与java的数据类型关心，当然比较简单的数据类型即使配置错了也会很快发现问题，但有些数据类型却并不是十分常见，这就给程序员带来了很多麻烦。 &nb
Linux命令 510888780 linux命令
系统信息 arch 显示机器的处理器架构(1) uname -m 显示机器的处理器架构(2) uname -r 显示正在使用的内核版本 dmidecode -q 显示硬件系统部件 - (SMBIOS / DMI) hdparm -i /dev/hda 罗列一个磁盘的架构特性 hdparm -tT /dev/sda 在磁盘上执行测试性读取操作 cat /proc/cpuinfo 显示C
java常用JVM参数墙头上一根草 java jvm参数
-Xms：初始堆大小，默认为物理内存的1/64(<1GB)；默认(MinHeapFreeRatio参数可以调整)空余堆内存小于40%时，JVM就会增大堆直到-Xmx的最大限制 -Xmx：最大堆大小，默认(MaxHeapFreeRatio参数可以调整)空余堆内存大于70%时，JVM会减少堆直到 -Xms的最小限制 -Xmn：新生代的内存空间大小，注意：此处的大小是（eden+ 2
我的spring学习笔记9-Spring使用工厂方法实例化Bean的注意点 aijuans Spring 3
方法一： <bean id="musicBox" class="onlyfun.caterpillar.factory.MusicBoxFactory" factory-method="createMusicBoxStatic"></bean> 方法二：
mysql查询性能优化之二 annan211 UNION mysql 查询优化索引优化
1 union的限制有时mysql无法将限制条件从外层下推到内层，这使得原本能够限制部分返回结果的条件无法应用到内层查询的优化上。如果希望union的各个子句能够根据limit只取部分结果集，或者希望能够先排好序在合并结果集的话，就需要在union的各个子句中分别使用这些子句。例如想将两个子查询结果联合起来，然后再取前20条记录，那么mys
数据的备份与恢复百合不是茶 oracle sql 数据恢复数据备份
数据的备份与恢复的方式有: 表,方案 ,数据库; 数据的备份: 导出到的常见命令; 参数说明 USERID 确定执行导出实用程序的用户名和口令 BUFFER 确定导出数据时所使用的缓冲区大小，其大小用字节表示 FILE 指定导出的二进制文
线程组 bijian1013 java 多线程 thread java多线程线程组
有些程序包含了相当数量的线程。这时，如果按照线程的功能将他们分成不同的类别将很有用。线程组可以用来同时对一组线程进行操作。创建线程组：ThreadGroup g = new ThreadGroup(groupName); &nbs
top命令找到占用CPU最高的java线程 bijian1013 java linux top
上次分析系统中占用CPU高的问题，得到一些使用Java自身调试工具的经验，与大家分享。 (1)使用top命令找出占用cpu最高的JAVA进程PID:28174 (2)如下命令找出占用cpu最高的线程 top -Hp 28174 -d 1 -n 1 32694 root 20 0 3249m 2.0g 11m S 2 6.4 3:31.12 java
【持久化框架MyBatis3四】MyBatis3一对一关联查询 bit1129 Mybatis3
当两个实体具有1对1的对应关系时，可以使用One-To-One的进行映射关联查询 One-To-One示例数据以学生表Student和地址信息表为例，每个学生都有都有1个唯一的地址(现实中，这种对应关系是不合适的，因为人和地址是多对一的关系)，这里只是演示目的学生表 CREATE TABLE STUDENTS (
C/C++图片或文件的读写 bitcarter 写图片
先看代码： /*strTmpResult是文件或图片字符串 * filePath文件需要写入的地址或路径 */ int writeFile(std::string &strTmpResult,std::string &filePath) { int i,len = strTmpResult.length(); unsigned cha
nginx自定义指定加载配置 ronin47
进入 /usr/local/nginx/conf/include 目录，创建 nginx.node.conf 文件，在里面输入如下代码： upstream nodejs { server 127.0.0.1:3000; #server 127.0.0.1:3001; keepalive 64; } server { liste
java-71-数值的整数次方.实现函数double Power(double base, int exponent)，求base的exponent次方 bylijinnan double
public class Power { /** *Q71-数值的整数次方 *实现函数double Power(double base, int exponent)，求base的exponent次方。不需要考虑溢出。 */ private static boolean InvalidInput=false; public static void main(
Android四大组件的理解 Cb123456 android 四大组件的理解
分享一下，今天在Android开发文档-开发者指南中看到的: App components are the essential building blocks of an Android
[宇宙与计算]涡旋场计算与拓扑分析 comsci 计算
怎么阐述我这个理论呢？。。。。。。。。。首先：宇宙是一个非线性的拓扑结构与涡旋轨道时空的统一体。。。。我们要在宇宙中寻找到一个适合人类居住的行星，时间非常重要，早一个刻度和晚一个刻度，这颗行星的
同一个Tomcat不同Web应用之间共享会话Session cwqcwqmax9 session
实现两个WEB之间通过session 共享数据查看tomcat 关于 HTTP Connector 中有个emptySessionPath 其解释如下： If set to true, all paths for session cookies will be set to /. This can be useful for portlet specification impleme
springmvc Spring3 MVC，ajax，乱码 dashuaifu spring jquery mvc Ajax
springmvc Spring3 MVC @ResponseBody返回，jquery ajax调用中文乱码问题解决 Spring3.0 MVC @ResponseBody 的作用是把返回值直接写到HTTP response body里。具体实现AnnotationMethodHandlerAdapter类handleResponseBody方法，具体实
搭建WAMP环境 dcj3sjt126com wamp
这里先解释一下WAMP是什么意思。W:windows，A：Apache，M：MYSQL，P：PHP。也就是说本文说明的是在windows系统下搭建以apache做服务器、MYSQL为数据库的PHP开发环境。工欲善其事，必须先利其器。因为笔者的系统是WinXP，所以下文指的系统均为此系统。笔者所使用的Apache版本为apache_2.2.11-
yii2 使用raw http request dcj3sjt126com http
Parses a raw HTTP request using yii\helpers\Json::decode() To enable parsing for JSON requests you can configure yii\web\Request::$parsers using this class: 'request' =&g
Quartz-1.8.6 理论部分 eksliang quartz
转载请出自出处：http://eksliang.iteye.com/blog/2207691 一.概述基于Quartz-1.8.6进行学习，因为Quartz2.0以后的API发生的非常大的变化，统一采用了build模式进行构建；什么是quartz? 答：简单的说他是一个开源的java作业调度框架，为在 Java 应用程序中进行作业调度提供了简单却强大的机制。并且还能和Sp
什么是POJO？ gupeng_ie java POJO 框架 Hibernate
POJO--Plain Old Java Objects(简单的java对象) POJO是一个简单的、正规Java对象，它不包含业务逻辑处理或持久化逻辑等，也不是JavaBean、EntityBean等，不具有任何特殊角色和不继承或不实现任何其它Java框架的类或接口。 POJO对象有时也被称为Data对象，大量应用于表现现实中的对象。如果项目中使用了Hiber
jQuery网站顶部定时折叠广告 ini JavaScript html jquery Web css
效果体验：http://hovertree.com/texiao/jquery/4.htmHTML文件代码： <!DOCTYPE html> <html xmlns="http://www.w3.org/1999/xhtml"> <head> <title>网页顶部定时收起广告jQuery特效 - HoverTree<
Spring boot内嵌的tomcat启动失败 kane_xie spring boot
根据这篇guide创建了一个简单的spring boot应用，能运行且成功的访问。但移植到现有项目（基于hbase）中的时候，却报出以下错误： SEVERE: A child container failed during start java.util.concurrent.ExecutionException: org.apache.catalina.Lif
leetcode: sort list michelle_0916 Algorithm linked list sort
Sort a linked list in O(n log n) time using constant space complexity. ====analysis======= mergeSort for singly-linked list ====code======= /** * Definition for sin
nginx的安装与配置,中途遇到问题的解决 qifeifei nginx
我使用的是ubuntu13.04系统，在安装nginx的时候遇到如下几个问题，然后找思路解决的，nginx 的下载与安装 wget http://nginx.org/download/nginx-1.0.11.tar.gz tar zxvf nginx-1.0.11.tar.gz ./configure make make install 安装的时候出现
用枚举来处理java自定义异常 tcrct java enum exception
在系统开发过程中，总少不免要自己处理一些异常信息，然后将异常信息变成友好的提示返回到客户端的这样一个过程，之前都是new一个自定义的异常，当然这个所谓的自定义异常也是继承RuntimeException的，但这样往往会造成异常信息说明不一致的情况，所以就想到了用枚举来解决的办法。 1，先创建一个接口，里面有两个方法，一个是getCode, 一个是getMessage public
erlang supervisor分析 wudixiaotie erlang
当我们给supervisor指定需要创建的子进程的时候，会指定M,F,A,如果是simple_one_for_one的策略的话，启动子进程的方式是supervisor:start_child(SupName, OtherArgs),这种方式可以根据调用者的需求传不同的参数给需要启动的子进程的方法。和最初的参数合并成一个数组，A ++ OtherArgs。那么这个时候就有个问题了，既然参数不一致，那