春春的菜鸟

OpenCV（C++）学习笔记（一）

新坑。学习下如何使用OpenCV。

使用教材，《OpenCV3编程入门》—毛星云电子工业出版社。（感谢毛佬留下的宝贵知识财富！

使用的IDE。Visual Studio 2022+OpenCV 4.6.0。环境什么的安装细节很多blog都有，不多赘述。

旧坑还在继续加油，但是难度比较大，一是因为教授的飞机语速，二是由于确实内容比较难懂。只能说，菜鸟会尽力写完的。

别质疑，先相信！

一、初识OpenCV

1.5 简单的DIP程序

图像腐蚀(erode)

原理：卷积核和图像按位相乘，并滑动。将计算结果中的最小值赋予中心像素作为结果。

实现：卷积，若全部按位相乘的结果都不为0，则结果为1，否则为0

效果：（对二值图像）图像中白的色块减少，黑色增加。

腐蚀可以清除掉图像的一些毛刺和细节，腐蚀一般也可以用来消除噪点

#include
#include
#include
using namespace cv;
int main()
{
    Mat image = imread("test.jpg"); //载入图像到test
    imshow("【原始图】", image);
    Mat element = getStructuringElement(MORPH_RECT, Size(15, 15)); //设定卷积核大小为15x15的正方形，元素均为1
    std::cout << element;
    Mat result;
    erode(image, result, element);
    imshow("【结果】", result);
    waitKey(0);

    return 0;
}

PS：ptr是opencv中用于提取矩阵的指针，该指针可以按行或按列访问矩阵的像素数据。

例子：char *data = x.ptr(j)，作用为取出x矩阵的指向其 j 行的char类型指针

下面是对erode函数的参数的说明（不感兴趣可以不看）：

dst = cv2.erode(
InputArray src,
OutputArray dst,
InputArray kernel,
Point anchor = Point(-1, -1),
int iterations = 1,
int borderType = BORDER_CONSTANT,
const Scalar & borderValue = morphologyDefaultBorderValue()
);

参数说明：
第一个参数，InputArray类型的src，输入图像，即源图像，填Mat类的对象即可。图像通道的数量可以是任意的，但图像深度应为CV_8U，CV_16U，CV_16S，CV_32F或 CV_64F其中之一。
第二个参数，OutputArray类型的dst，处理结果。需要和源图片有一样的尺寸和类型。
第三个参数，InputArray类型的kernel，膨胀操作的核。若为NULL时，表示的是使用参考点位于中心3x3的核。

图像膨胀（dilate）——与图像腐蚀相对的一个操作

实现：用一个结构元素(一般是3×3的大小)扫描图像中的每一个像素，用结构元素中的每一个像素与其覆盖的像素做“与”操作，如果都为0，则该像素为0，否则为1。

效果：（对二值图像）图像中黑的色块减少，白色增加。

图像模糊——均值滤波

Canny算子边缘检测

#include
#include
#include
#include
#include  //引用这个库，就可以避免CV_BGR2GRAY在OpenCV4中报错
using namespace cv;

int main()
{
    Mat image = imread("test.jpg"); //载入图像到test
    imshow("【原始图】", image);
    Mat edge, grayImage;

    cvtColor(image, grayImage, CV_BGR2GRAY);
    //原图转化为灰度图像

    blur(grayImage, edge, Size(3, 3));
    //3x3平均滤波器去噪
    
    Canny(edge, edge, 3, 6, 3);
    //Canny算子

    imshow("【结果】", edge);
    waitKey(0);

    return 0;
}

对于OpenCV中的颜色转换函数——void cvtColor(srcimage,dstimage, int code, int dstCn=0)

第一个参数是输入图像
第二个参数是输出图像
第三个参数是颜色空间转换的标识符
第四个参数为目标图像的通道数，若该参数是0，表示目标图像取源图像的的通道数。

值得留意的是：opencv默认的图片通道存储顺序是BGR，即蓝绿红，不是RGB

1.6 OpenCV视频操作基础

读取播放视频

VideoCapture是OpenCV 2.X中的一个类，对应于C语言中的CvCapture结构体。

#include

using namespace cv;
int main()
{
    VideoCapture capture("1.avi");
    /*创建变量后读入视频，也可以分为以下两步操作：
    VideoCapture capture;
    capture.open（“1.avi”）;
    */    

    while(1)
    {
        Mat frame;
        capture >> frame;         //读取当前帧
        if (frame.empty())        //播放完成则退出循环
        {
            break;
        }
        imshow("读取视频",frame);
        waitKey(30);
    }
    return 0;
}

调用摄像头采集图像

和读取视频的区别就是VideoCapture capture（x）的参数x改成0——表示调用摄像头。

二、开始前的认知准备

2.1 OpenCV官方例程赏析

在OpenCV文件夹里的“.......\opencv\sources\samples\cpp\tutorial_code”有官方示例程序。其内容按照组件模块分类，适合学习。

2.1.1 彩色目标跟踪：Camshift

“.......\opencv\sources\samples\cpp\tutorial_code”中找到Camshiftdemo.cpp。复制黏贴新建一个文件就可以运行了。

2.1.2 光流：optical flow

2.1.3 点追踪:lkdemo

2.1.4 人脸识别：objectDetection

2.1.5 支持向量机引导

2.2 编译OpenCV源代码

PS：vs2017及以上的版本已经基本包含CMake的功能了，所以可以不用再下载CMake了。

而解决方案可以直接生成。（.sln文件）

2.5 argc与argv参数

在查看OpenCV的示例程序时，经常看到int argc和char *argv [ ] 。其中arg指的是argument（参数），用于统计运行程序时送给main函数的命令行参数的个数；argv加上*和 [ ] 成为*argv[ ] 。表示字符串数组，用于存放指向字符串参数的指针数组，每个元素指向一个参数。

2.6 printf（）

printf（）函数一般调用形式为 int printf(const char *format，...)。括号的前面的参数是希望输出的格式，后面是输出的表列。

printf有“格式字符串”的定义——用于指定输出格式。格式字符串 都是以%开头的字符串，在%之后跟有各种格式字符。

包括：

格式字符串	作用
%d	将整数转成十进制
%f	将整数转换成浮点数
%u	十进制无符号整数
%o	将整数转换成八进制
%c	将整数转换成对应的ASCII字符
%s	将整数转换成字符串
%x	整数转换为小写十六进制
%X	整数转换为大写十六进制
%p	输出地址符
%%	输出百分比符号，不进行转换

除了格式字符串，还有一些特殊规定的字符，如下：

规定字符	作用
\n	换行
\f	清屏并且换页
\r	回车
\t	Tab符号（4个空格）
\xhh	用16进制表示的ASCII码，其中每个h可以用0~f中的一个代替

如有多种对输出格式的设置，则在%后直接添加，无需添加%。

三、HighGUI图形用户界面初步

HighGUI模块是高层GUI图形用户界面模块，包含媒体输入输出、视频捕捉、图像和视频的编码解码、图形交互界面的接口等内容。第三章中我们将学习到，一些常用的交互操作，包括图像载入、显示和输出、为程序添加滑动条、鼠标操作等。

3.1 图像载入、显示和输出到文件

3.1.1 OpenCV的命名空间

OpenCV中C++类和函数都是定义在命名空间cv之内的，有两种方法可以调用：其一，在代码#include库完毕后，添加using namespace cv；的代码；否则，在每一次调用OpenCV的类和函数时，都要在前面添加上 cv:: ,这种情况非常繁琐，很不推荐。（但是第一种方法使用之后，使用cout等std的函数和类的时候需要添加 std:: ）

3.1.2 Mat类简析

为了方便使用，OpenCV使用Mat类作为数据结构进行图像存取。默认大小为0。当然，在初始化时也可以指定其初始尺寸，比如定义一个Mat类对象，cv::Mat pic(320,640,cv::Scalar(100));

一般来说，我们可以用Mat srcImage = imread（“1.jpg”）来将文件名为“1.jpg”的图像文件加入到名为srcImage的Mat变量中。

3.1.4 图像载入：imread（）

其原型为 Mat imread（const string&filename，int flags = 1）。

第一个参数填入待载入文件的路径。（imrad支持.bmp、dib、jpeg、jpg、jpe、jp2、png、pbm、pgm、ppm、sr、ras、tiff、tif格式的文件）

第二个参数指定加载图像的颜色类型，默认为1，对应三通道彩色图像。为了方便记忆，这里就直接给出我们经过查找定义以及分析总结得到的结论。

flags>0，返回三通道彩色图像

flags=0，返回灰度图

flags<0，返回包含Alpha通道的加载图像

另外，请记住，彩色图像通道存储的方式是BGR而非RGB。

3.1.5 图像显示：imshow（）

原型： void imshow（const string&winname，InputArray mat）

第一个参数：填写需要显示的窗口标识名。默认为CV_WINDOW_AUTOSIZE，即显示原始图像大小。否则图像会缩放以适应窗口。（缩放取决于图像深度，规则如下：

若图像是8位无符号，显示原图

若16位无符号或32位整型，则用像素值除以256。即将灰度值映射到【0~255】

若是32位浮点型，用像素值乘以255。亦即映射到【0-255】

第二个参数：填需要显示的图像

3.1.6 InputArray类型

详细定义较长。大多情况，将InputArray/OutArray类型当作Mat类型即可。

3.1.7 创建窗口：namedWindow（）

namedWindow函数用于创建一个窗口。如果只是简单进行图片显示，直接使用imread和imshow即可。但是如果需要在显示窗口之前就用到窗口名时（比如滑动条的使用），就需要用到namedWindow。

原型如下： void namedWindow（const string&winname，int flags-WINDOW_AUTOSIZE）;

第一个参数，填写被用作窗口标识符的窗口名称。

第二个参数，是窗口标识。可以是如下几种值

WINDOW_NORMAL,用户可以改变窗口大小

WINDOW_AUTOSIZE（默认值），窗口大小自动适应图像大小，用户无法手动改变

WINDOW_OPENGL，窗口创建时会支持OpenGL

namedWindow是通过指定的名字，创建一个可以作为图像和进度条的容器窗口。（如已经存在相同名称的窗口，则不执行任何操作）。同样的，我们可以使用destroyWindow（）或者destroyAllWindow（）来关闭窗口，并取消之前分配的与窗口相关的内存空间。

3.1.8 输出图像到文件：imwrite（）

原型：bool imwrite（const string& filename，InputArray img，const vector¶ms=vector()）；

第一个参数，const string&类型的filename，填需要写入的文件名（带后缀），如“1.jpg”

第二个参数，InputArray类型的img，一般填一个Mat类型的图像数据（也就是待输出的图像）

第三个参数，一般无需填写，默认为vector（）。如果一定要填写，按照下面的规则填

对JPEG图片，参数表示从0-100的图片质量，默认95

对PNG，表示压缩级别，从0-9。越高，尺寸越小，压缩时间越长

对PPM、PGM、PBM，表示一个二进制格式标志，取0或1，默认1

3.2 滑动条的创建和使用

滑动条（Trackbar也叫做轨迹条）是OpenCV动态调节参数特别好用的一种工具，依附于窗口存在。（由于OpenCV没有按钮的功能，很多时候，可以用仅含0-1的滑动条实现按钮的按下和弹起的效果）

3.2.1 创建滑动条：createTrackbar（）

createTrackerbar（）经常和一个回调函数配合使用。

createTrackerbar（）函数原型：int createTrackerbar（const string& trackbarname, const string&winname, int* value, int count, TrackbarCallback onChange = 0, void* userdat = 0）;

第一个参数，trackbarname是轨迹条的名字，用来代表创建的轨迹条。

第二个参数，winname是窗口的名字，表示轨迹条依附的窗口名字，即对应namedWindow（）创建窗口时填的某一个窗口名

第三个参数，int* 类型的value，指针，表示滑块的位置。滑块初始位置就是该变量当前的值。

第四个参数，int的count，表示滑块可以达到的最大位置的值，最小位置的值始终为0

第五个参数，TrackbarCallback类型的onChange（默认值为0）。是一个指向回调函数的指针，每次滑块位置改变，这个函数都会回调。

第六个参数，void*类型的userdata（默认值为0），是用户传给回调函数的数据，用于处理轨迹条事件。若第三个参数value实际参数是全局变量的话，可以无视此参数

createTrackerbar（）为我们创建了一个显示在winname（第二个参数）窗口上的有名称和范围的轨迹条（Trackbar，或者说是滑块范围控制工具），指定一个和轨迹条位置同步的变量，而且指定onChange（第五个参数），在轨迹条位置改变时调用这个回调函数。

回调函数的定义：简单来说，就是一个通过函数指针调用的函数。如果我们把函数的指针（地址）作为参数传回给另一个函数，当这个指针被用来调用其所指向的函数时，就是回调函数。回调函数不由该函数的实现对象直接调用，而是在特定事件或条件发生时由另外一方调用，作为对该事件的响应。下面进行较为详细的解释

回调函数解释：

#include 

// 回调函数原型
typedef void (*CallbackFunction)(int);

// 具体函数，接受回调函数作为参数
void performOperation(int value, CallbackFunction callback) {
    // 执行某些操作
    // ...

    // 在适当的时候调用回调函数
    callback(value);
}

// 回调函数实现
void callbackFunction(int value) {
    std::cout << "Callback executed with value: " << value << std::endl;
}

int main() {
    int data = 42;

    performOperation(data, callbackFunction);  // 传递回调函数作为参数

    return 0;
}

在上面的示例中，performOperation 函数接受一个整数参数和一个回调函数（通过函数指针来表示）。在 performOperation 函数内部，可以执行一些操作，并在适当的时候调用传递的回调函数。

在 main 函数中，我们定义了一个整数变量 data，然后调用 performOperation 函数，并传递 data 和 callbackFunction 作为参数。当 performOperation 函数执行到适当的位置时，会调用传递的回调函数 callbackFunction，并将 data 作为参数传递给回调函数。

通过使用回调函数，我们可以灵活地在程序执行期间插入自定义的逻辑，并根据需要处理特定的事件和操作。这种设计模式使得程序能够更灵敏地响应不同的情景和需求，并提高了代码的可扩展性和可维护性。

回到创建滑动条

下面是一个关于createTrackbar的小例子。

createTrackbar("对比度：","【效果图窗口】"，&g_nContrastValue,300,on_Change);
//g_nContrastValue为全局的整型变量，on_Change为回调函数的函数名（PS：在C/C++中，函数名就是指向函数地址的指针）

完整代码如下：

#include
#include"opencv2/highgui/highgui.hpp"
using namespace cv;
using namespace std;

#define WINDOW_NAME "【线性混合示例】"    //为窗口标题定义的宏

//-----------------------【全局变量声明部分】------------------------
//           描述：全局变量声明
//-------------------------------------------------------------------
const int g_nMaxAlphaValue = 100;//Alpha的最大值
int g_nAlphaValueSlider;//滑动条对应的变量
double g_dAlphaValue;
double g_dBetaValue;

//声明存储图像的变量
Mat g_srcImage1, g_srcImage2, g_dstImage;

//-----------------------【on_Trackbar函数】-----------------------
//                 描述：响应滑动条的回调函数
// ----------------------------------------------------------------
void on_Trackbar(int, void*)
{
	//求出当前alpha值相对于最大值的比例
	g_dAlphaValue = (double)g_nAlphaValueSlider / g_nMaxAlphaValue;
	//则beta值为1减去alpha值
	g_dBetaValue = (1.0 - g_dAlphaValue);

	//根据alpha和beta值进行线性混合
	addWeighted(g_srcImage1, g_dAlphaValue, g_srcImage2, g_dBetaValue, 0.0, g_dstImage);

	//显示效果图
	imshow(WINDOW_NAME, g_dstImage);
}

//---------------------【main（）函数】----------------------------
//     描述：控制台应用程序的入口函数，我们的程序从这里开始执行
//-----------------------------------------------------------------

int main(int argc, char** argv)
{
	//加载图像（两张图像的尺寸应相同）
	g_srcImage1 = imread("1.jpg");
	g_srcImage2 = imread("2.jpg");
	if (!g_srcImage1.data)
	{
		printf("读取第一幅图片错误，请确定目录下是否由imread函数指定图片存在！ \n");
		return -1;
	}
	if (!g_srcImage2.data)
	{
		printf("读取第二幅图片错误，请确定目录下是否由imread函数指定图片存在！ \n");
		return -1;
	}
	//设置滑动条初值为70
	g_nAlphaValueSlider = 70;

	//创建窗口
	namedWindow(WINDOW_NAME, 1);

	//在创建的窗口中创建一个滑动条控件
	char TrackbarName[50];
	sprintf(TrackbarName, "透明值 %d", g_nMaxAlphaValue);

	createTrackbar(TrackbarName, WINDOW_NAME, &g_nAlphaValueSlider, g_nMaxAlphaValue, on_Trackbar);

	//结果在回调函数中显示
	on_Trackbar(g_nAlphaValueSlider, 0);
	//按任意键退出
	waitKey(0);

	return 0;
}

附：这里出了点问题，我把第二个imread的文件名的 “.” 打成 “，”了，检查了半天，甚至把if中换成了.empty()来确保不是判断的问题。最后发现是文件名打错了。。。大家要多多检查。。。

那么上面这个程序执行的结果就是，生成一个名为【线性混合示例】的窗口，有一个滑动条可以调节两张图片混合时各自的透明度，具体效果如下图。

3.2.2 获取当前轨迹条的位置：getTrackbarPos（）函数

getTrackbarPos()是和createTrackbar配合使用的函数，用于获取当前轨迹条的位置。函数原型为：int getTrackbarPos( const string& trackbarname, const string& winname );

第一个参数，const string&类型的trackbarname，是轨迹条的名字

第二个参数，const string&类型的winname，表示轨迹条所属的窗口名称

3.3 鼠标操作

OpenCV中鼠标操作和滑动条的消息映射方式类似，也是通过一个中介函数配合一个回调函数来实现的。创建和指定滑动条回调函数的函数是createTrackbar，同样的，对于鼠标，函数是SetMouseCallback。

函数原型是：void SetMouseCallback( const string& winname, MouseCallback onMouse, void* userdata=0 );

第一个参数，窗口的名字

第二个参数，指定窗口内每次鼠标事件发生的时候，被调用的函数指针。

第三个参数，void*类型的userdata（默认为0），用户定义的传递到回调函数的参数

示例程序如下：

#include
using namespace cv;

#define WINDOW_NAME "程序窗口" //为窗口标题定义的宏

//全局函数声明
void on_MouseHandle(int event, int x, int y, int flags, void* param);
void DrawRectangle(Mat& img, Rect box);
void ShowHelpText();

//全局变量声明
Rect g_rectangle;
bool g_bDrawingBox = false; //是否进行绘制
RNG g_rng(12345);

int main()
{
	//【1】准备参数
	g_rectangle = Rect(-1, -1, 0, 0);
	Mat srcImage(600, 800, CV_8UC3), tempImage;
	srcImage.copyTo(tempImage);
	g_rectangle = Rect(-1, -1, 0, 0);
	srcImage = Scalar::all(0);

	//【2】设置鼠标操作回调函数
	namedWindow(WINDOW_NAME);
	setMouseCallback(WINDOW_NAME, on_MouseHandle, (void*)&srcImage);

	//【3】程序主循环，当进行绘制的标识符为真时，进行绘制
	while (1)
	{
		srcImage.copyTo(tempImage);//复制源图到tempImage
		if (g_bDrawingBox)
			DrawRectangle(tempImage, g_rectangle);//当绘制的标识符为真，则进行绘制
		imshow(WINDOW_NAME, tempImage);
		if (waitKey(10) == 27)
			break;
	}
	return 0;
}

//------------------------on_MmouseHandle()函数--------------------------------------
//-------------------描述：鼠标回调函数，根据不同鼠标事件进行不同操作----------------
//-----------------------------------------------------------------------------------
void on_MouseHandle(int event, int x, int y, int flags, void* param)
{
	Mat& image = *(Mat*)param;
	switch (event)
	{
		//鼠标移动消息
		case EVENT_MOUSEMOVE:
		{
			if (g_bDrawingBox)//如果绘制标识符是真，则记录下长和宽到RECT型变量中
			{
				g_rectangle.width = x - g_rectangle.x;
				g_rectangle.height = y - g_rectangle.y;
			}
		}
		break;
		case EVENT_LBUTTONDOWN:
		{
			g_bDrawingBox = true;
			g_rectangle = Rect(x, y, 0, 0);//记录起始点
		}
		break;
		case EVENT_LBUTTONUP:
		{
			g_bDrawingBox = false;//将标识符置为false
			//对高和宽小于0的处理
			if (g_rectangle.width < 0)
			{
				g_rectangle.x += g_rectangle.width;
				g_rectangle.width *= -1;
			}
			if (g_rectangle.height < 0)
			{
				g_rectangle.y += g_rectangle.y;
				g_rectangle.height *= -1;
			}
			//调用函数进行绘制
			DrawRectangle(image, g_rectangle);
		}
		break;
	}
}

//------------------【DrawRectangle()函数】-----------------
//        描述：自定义矩形绘制函数
//----------------------------------------------------------
void DrawRectangle(Mat& img, Rect box)
{
	rectangle(img, box.tl(), box.br(), Scalar(g_rng.uniform(0, 255), g_rng.uniform(0, 255), g_rng.uniform(0, 255)));
	//随机颜色
}

最终实现效果如下图

简单来说，我们可以通过按下鼠标左键和松开来在窗口中绘制彩色的矩形。而程序中的on_MouseHandle就是回调函数。其中一个switch语句定义了对于不同的鼠标事件进行对应的操作。

四、OpenCV数据结构与基本绘图

4.1、基础图像容器Mat（位图）

4.1.2 Mat结构使用

对于OpenCV 1.X时代的基于C语言接口而建的图像存储格式IplImage*，如果在退出前没有及时release掉，会造成内存泄露。但C++的出现带来了类的概念。

对于Mat类，需要知道以下两点：

1、不必手动为其开辟空间（实际上，大多数OpenCV函数仍然会手动为输出数据开辟空间，每次传递一个以存在的Mat对象时，开辟好的的矩阵空间会被重新使用）

2、不必在不需要时立即将空间释放

总而言之，Mat这个类由两个数据部分组成——矩阵头（包含矩阵尺寸、存储方法、存储地址等信息）和一个指向存储所有像素值的矩阵的指针。矩阵头尺寸是常数值，但矩阵尺寸会根据图像的不同而不同，通常比矩阵头的尺寸大数几个数量级。因此，在程序中传递图像并创建副本时，大的开销是由矩阵造成的，而非信息头。OpenCV是一个DIP库，囊括了大量函数，而使用函数时难免需要在其中传递图像，所以，应尽量减少大图像的复制。

为了解决上述问题，OpenCV有引用计数机制。其思路是让每个Mat对象有自己的信息头，但是共享同一个矩阵。是通过让矩阵指针指向同一地址而实现，而拷贝构造函数则只复制信息头和矩阵指针。请看以下代码:

Mat A,C;                  //仅创建信息头部分
A = imread("1.jpg",CV_LOAD_IMAGE_COLOR);      //为矩阵开辟内存
Mat B(A);                 //使用拷贝构造函数
C = A；                   //赋值运算符

以上代码中所有Mat对象都指向一个数据矩阵。虽然信息头不同，但通过任何一个对象所做的改变也会影响其他对象。这里有一个功能：可以创建只引用部分数据的信息头。比如，创建一个感兴趣区域（ROI），只需要创建包含边界信息的信息头

Mat D(A,Rect(10, 10, 100, 100) );//矩形界定
Mat E = A(Range:all(), Range(1,3) );//行和列界定

对于一个属于多个Mat对象的矩阵，最后一个使用它的对象，负责清理（通过引用计数机制实现）。复制Mat对象的信息头时，会增加矩阵的引用次数，当一个头被释放之后，计数减一；计数为0，矩阵就会被清理。但有些时候，你会想复制矩阵本身（不只是信息头和矩阵指针），可以使用clone（）或者copyTo（）。

Mat F = A.clone();
Mat G;
A.copyTo(G);

这样一来，改变F或者G就不影响A信息头指向的矩阵。

本小节可总结为4个要点：

1、OpenCV函数中输出图像的内存分配是自动完成的。

2、使用OpenCV的C++接口无需考虑内存释放问题

3、赋值运算符（“=”）和拷贝构造函数（构造函数）只是复制信息头

4、使用clone（）、copyTo（）复制一幅图像的矩阵

4.1.3 像素值的存储方法

存储像素值需要指定颜色空间和数据类型。其中，颜色空间是指针对一个给定的颜色，如何组合颜色元素以对其编码。最简单的颜色空间是灰度级空间，只处理黑色和白色。

对于彩色，则有更多种类的颜色空间。但都是将颜色分成三或四个基本元素。RGB颜色空间就是最常用的颜色空间。基色是R(红)、G（绿）、B（蓝），有时为了表示透明颜色有第四个元素alpha（A）。每个组成元素都有其定义域（取决于其数据类型）。最小的是char，占一个字节或者8位，可以是有符号型（0~255）或者无符号（uchar，-128~+127）。

4.1.4 显式创建Mat对象的七种方法

在第一章里，我们学习过imwrite（）将一个矩阵（图像）写入到图像文件中。但是如果是debug，观看实际值会更加方便，我们可以通过Mat的运算符 “ << ” 实现，但是，“ << ”只对二维矩阵有效。

Mat不但是一个非常有用的图像容器类，同时也是一个通用的矩阵类，我们也可以用它创建和操作多维矩阵。创建方法有多种，如下：

【方法一】使用Mat（）构造函数

最常用的方法是直接用Mat构造函数（）。

Mat M(2,2, CV_8UC3, Scalar(0,0,255));
cout<<"M = "<

 
  程序运行结果如下： 
   
   
   对于输出结果，是对于Mat的默认输出形式。先存储第一个元素的三个通道数据，再存储第二个元素三个通道数据。对于同一行的不同元素不予“ ； ”分隔，而对不同行直接，是以“ ； ”进行分割的。 
   
   对于二维多通道图像，首先定义其尺寸，亦即行数和列数，最后，需要指定存储数据类型以及每个矩阵点的通道数。为此，根据下面的规则有多种定义： 
  CV_[The number of bits per item][Signed or Unsigned][Type Prefix]C[The channel number] 
  即CV_[位数][带符号与否][类型前缀]C[通道数] 
  比如CV_8UC3表示使用8位的unsigned char型，每个像素由三个元素组成三通道。而预先定义的通道数可以多达四个。另外，Scalar是个short型的向量，能够使用指定的定制化值来初始化矩阵，还能用于表示颜色（后文会详细讲解）。若是需要更多通道数，可以用大写宏将通道数放在小括号中，如方法二中代码所示 
  【方法二】在C\C++中通过构造函数进行初始化 
  这种方法是在C\C++中通过构造函数初始化 
  int sz[3] = {2,2,2};
Mat L(3,sz,CV_8UC3, Scalar::all(0)); 
  这段代码演示了如何创建一个超过两维的矩阵：指定维数，然后传递一个指向一个数组的指针，这个数组包含每个维度的尺寸；后续的两个参数与方法一中的相同 
  PS:这段代码输出时有错误，如你所见，“春春的菜鸟”无法解决。留给有缘人，解决了可以评论、私信告诉我，感谢！ 
  【方法三】为已存在的Ipllmage指针创建信息头 
  方法三是为已存在的iplimage（为了方便阅读，我将其改为小写）指针创建信息头，示范代码如下： 
  IplImage* img = cvLoadImage("1.jpg",1);
Mat mtx(img);             //转换IplImage*->Mat 
   
   PS: IplImage是OpenCV中CxCore部分基础的数据结构，用来表示图像，其中Ipl是Intel Image Processing Library的简写。OpenCV2.1版本之前使用IplImage*数据结构来表示图像，2.1之后的版本使用图像容器Mat来存储。IplImage结构体如下所示。 
   
   【方法四】利用create（）函数 
  利用Mat类中的create（）成员函数进行Mat类的初始化操作，示范代码如下： 
  M.create(4,4,CV_8UC2);
cout<<" M = "<
 
   此方法不能为矩阵设置初始值，只是在改变尺寸时重新为矩阵数据开辟内存而已。 
  【方法五】采用Matlab式的初始化方式 
  方法五采用matlab形式的初始化方法。zeros（）、ones（）、eye（）。 
  zeros（行，列，格式） 
  ones（）和eye（）的使用格式同上，而后者是生成单位矩阵。 
  【方法六】对小矩阵使用逗号分隔式初始化函数 
  Mat C = (Mat_(3,3) << 0, -1, 0, -1, 5, -1, 0, -1, 0); 
  运行结果是生成了一个3行3列的矩阵，元素为 “ << ” 后面的序列。 
  【方法七】为已存在的对象创建新信息头 
  使用clone（）、或者copyTo（）为已经存在的Mat对象创建一个新的信息头，但是实际上二者还是共享一个矩阵。 
  Mat RowClone = C.row(1).clone();
cout<< "RowClone = " <
 
   
  4.1.5 OpenCV中的格式化输出方法 
  OpenCV提供了风格各异的格式化输出方法。这一节将一一演示和列举。 
          首先是下面代码中将要使用的 r 矩阵的定义。需要注意，我们可以通过用randu（）产生的随机值来填充矩阵——当然，需要上下限来确保随机值在一定范围内。 
  Mat r = Mat（10，3，CV_8UC3）；
randu(r, Scalar::all(0), Scalar::all(255)); //上下限是（255，255，255）和（0，0，0） 
  输出风格有以下几种： 
  【一】OpenCV默认风格 
  【二】Python风格 
  【三】逗号分隔分隔（Comma separated values，CSV） 
  【四】Numpy风格 
  【五】C语言风格 
  #include 
using namespace cv;
using namespace std;

int main()
{
    Mat r = Mat(10,3,CV_8UC3);
    randu(r, Scalar::all(0), Scalar::all(255)); //上下限是（255，255，255）和（0，0，0）
    cout << "r (OpenCV默认风格) = \n" << r << ";" << endl << endl;
    cout << "r (Python风格) = \n" << format(r, Formatter::FMT_PYTHON) << ";" << endl << endl;
    cout << "r (逗号分隔风格) = \n" << format(r, Formatter::FMT_CSV) << ";" << endl << endl;
    cout << "r (Numpy风格) = \n" << format(r, Formatter::FMT_NUMPY) << ";" << endl << endl;
    cout << "r (C语言风格) = \n" << format(r, Formatter::FMT_C) << ";" << endl << endl;

    return 0;
} 
   
   
   
   
  4.1.6 输出其他常用数据结构 
   除了Mat类型，OpenCV同样支持使用 “<<” 打印其他常用OpenCV数据结构。 
  1.定义和输出二维点 
  2.定义和输出三维点 
  3.定义和输出基于Mat的std::vector 
  4.定义和输出std::vector 
  #include 
using namespace cv;
using namespace std;

int main()
{
    Point2f p(6, 2);
    cout << "【二维点】p=" << p << ";\n" << endl;
    Point3f p3f(8, 2, 0);
    cout << "【二维点】p=" << p3f << ";\n" << endl;
    vector v;
    v.push_back(3);
    v.push_back(5);
    v.push_back(7);
    cout << "【基于Mat的vector】shortvec = \n" << Mat(v) << ";\n" << endl;
    vector points(20);
    for (size_t i = 0;i < points.size();++i)
        points[i] = Point2f((float)(i * 5), (float)(i % 7));
    cout << "【二维点向量】points = \n" << points << ";";

    return 0;
} 
   
  4.2 常用数据结构和函数 
  4.2.1 点的表示：Point类 
  Point类数据结构表示了二维坐标系下的点，即由其图像坐标x和y指定的2D点。用法如下： 
  Point point；
point.x = 10；
point.y = 8；
//或者是 
Point point = Point(10,8);

//另外，在OpenCV中有如下定义：
typedef Point_ Point2i;
typedef Point2i Point;
typedef Point_ Point2f; 
  所以Point_、Point2i、Point互相等价，Point_、Point2f互相等价。 
  4.2.2 颜色的表示：Scalar类 
          Scalar（）表示具有4个元素的数组，在OpenCV中被大量用于传递像素值，例如最常用的RGB。对于Scalar函数来说，如果不需要第四个参数（除了R、G、B），则无需写出来；如果只写3个参数，OpenCV认为我们只想表示3个参数。 
          下面是个例子。 
  Scalar(a,b,c);     //红色分量为c，绿色分量为b，蓝色分量为a 
  PS：Scalar类的源头为Scalar_类，而Scalar_是Vec4x的一个变种，常用的Scalar就是Scalar_。这就解释了为什么许多函数的参数输入可以是Mat，也可以是Scalar。 
  4.2.3 尺寸的表示：Size类 
          通过在代码中对Siz类进行“转到定义”操作，我们可以在........\opencv\sources\modules\core\include\opencv2\core\core.hpp路径下，找到Size类的相关源代码（注意，由于OpenCV版本不同，路径可能稍有不同，但是core.hpp的文件名应当还是未改变的） 
  typedef Size_ Size2i;
typedef Size2i Size;
 
          其中，Size_是个模板类，Size_表示其内部模板所代表的类型为int。那么上面两行代码就是首先给已知的Size_起个新名字——Size2i。然后又给Size2i起个新名字——Size（所以，Size_、Size2i、Size等价） 
          追根溯源到Size_模板类的定义，可以发现内部重载了一些构造函数，其中使用频率最高的是下面这个 
  Size_(_Tp _width,_Tp _height)
_Tp width,height；//宽度和高度

//例子：构造出的Size宽度高度都为5
Size（5，5） 
  4.2.4 矩形的表示：Rect类 
          Rect类的成员变量有x、y、width、height，分别为左上角点的坐标和矩形的宽和高。常用的成员函数有：Size（）return Size；area（）return矩形的面积；contains（Point）判断点是否在矩形内；inside（Rect）函数判断矩形是否在该矩阵内；tl（）return左上点角坐标；br（）返回右下角点坐标。值得注意的是，如果想求两个矩形的交集和并集，可用如下格式： 
  Rect rect = rect1 & rect2;
Rect rect = rect1 | rect2;

//如果想让矩形进行平移操作和缩放操作，甚至可以这也写
Rect rectShift = rect + point;
Rect rectScale = rect + size; 
  4.2.5 颜色空间转换：cvtColor（）函数 
          cvtColor（）是OpenCV里的颜色空间转换函数，可以实现RGB颜色向HSV、HSI等颜色空间的转换，也可以转换为灰度图像。 
          原型如下： 
  viod cvtColor(InputArray src, OutputArray dst, int code, int dstCn = 0)
 
  第一个参数为输入图像，第二个为输出图像，第三个参数是颜色空间转换的标识符（具体可查对应表格，本书P98），第四个是目标图像的通道数，若该参数是0，表示目标图像通道数取自源图像。下面是调用示例： 
  //OpenCV2 Version
cvtColor(srcImage,dstImage,CV_GRAY2BGR)
//OpenCV3 Version
cvtColor(srcImage,dstImage,COLOR_GRAY2BGR) 
          不难发现，在OpenCV2中，标识符的前缀多为CV_，而在OpenCV3中被COLOR_的宏命名形式取代。另外，再次提醒一下，OpenCV默认存储为BGR。 
          本节最后，使用下面的示例代码，进行简单的cvtColor函数的使用。 
  #include "opencv2/imgproc/imgproc.hpp"
#include "opencv2/highgui/highgui.hpp"
#include

using namespace cv;
using namespace std;

void main()
{
	//【1】载入图片
	Mat src = imread("1111.jpg", 1), dst;
	//【2】转换颜色空间
	cvtColor(src, dst, COLOR_BGR2Lab);
	//【3】显示效果图
	imshow("效果图",dst);
	//【4】保持窗口显示
	waitKey();
} 
  4.2.6 其他常用知识点 
  本小节列举一些OpenCV的core模块中其他常用的知识点，如下。 
  1.Matx是一个轻量级的Mat，使用前规定好大小，比如2*3的float型的Matx，可以声明为Matx23f。 
  2.Vec是Matx的一个派生类，是一个一维的Matx，跟vector很相似，有如下定义。 
  template class Vec: public Matx<_Tp, n, 1>{...};
typedef Vec Vec2b; 
  3.Range类其实就是为了使OpenCV的使用更像Matlab而产生的。比如，Range::all（）其实就是Matlab中的符号。而Range（a，b）其实就是Matlab中的a:b，注意此处的a、b都为整型。 
  4.OpenCV中防止内存溢出的函数有alignPtr、alignSize、allocate、deallocat、fastMalloc、fastFree等 
  5.中一些函数使用起来很方便，有计算向量角度的函数fastAtan2、计算立方根的函数cubeRoot、向上取整函数cvCeil、向下取整函数cvFloor、四舍五入函数cvRound等。还有一些类似Matlab里的函数，比如cvIsInf判断自变量是否无穷大，cvIsNaN判断自变量是否是个数 
  6.显示文字相关的函数：grtTextSize、cvInitFont、putText 
  7.作图相关的函数：circle、clipLine、ellipse、ellipse2Poly、line、rectangle、polylines、类LineIterator 
  8.填充相关的函数：fillConvexPoly、fillPoly 
  9.OpenCV中RNG（）函数能够为初始化随机数状态的生成器 
   
  4.3 基本图形绘制 
          本节主要讲述使用point在图像中定义2D点、如何使用Scalar表示颜色的值。涉及到以下函数： 
  ·绘制直线——line 
  ·绘制椭圆——ellipse 
  ·绘制矩形——rectangle 
  ·绘制圆——circle 
  ·绘制填充多边形——fillPoly 
  4.3.1 DrawEllipse（）的写法 
  #define WINDOW_WIDTH 600 //定义窗口大小的宏


//--------------------【DrawEllipse()】-------------------
// 描述：自定义的绘制函数，实现了绘制不同角度、相同尺寸的椭圆
//-------------------------------------------------------
void DrawEllipse(Mat img, double angle)
{
    int thickness = 2;
    int lineType = 8;
    ellipse( img,
        Point( WINDOW_WIDTH/2, WINDOW_WIDTH/2 ),
        Size( WINDOW_WIDTH/4, WINDOW_WIDTH/16 ),
        angle,
        0,
        360,
        Scalar( 255, 129, 0 ),
        thickness,
        lineType);
} 
          DrawEllipse（）调用了ellipse，将椭圆画到img上，椭圆中心为( WINDOW_WIDTH/2, WINDOW_WIDTH/2 ) ，并且大小位于矩形（ WINDOW_WIDTH/4, WINDOW_WIDTH/16 ）。旋转角度为angle（0-360度）。颜色为Scalar（255，129，0）代表的蓝色，thickness为线宽2，lineType为8（8联通线型） 
  4.3.2 DrawFilledCircle() 
  //---------------------【DrawFilledCircle()】--------------------------------
//                   描述：实现了实心圆的绘制
//---------------------------------------------------------------------------
void DrawFilledCircle( Mat img, Point center )
{
    int thickness = -1;
    int lineType = 8;
    circle(img,
        center,
        WINDOW_WIDTH / 32,
        Scalar(0, 0, 255),
        thickness,
        lineType);
} 
          参数基本和DrawEllipse相同意义，不予赘述 
  4.3.3 DrawPolygon（） 
  //---------------------【DrawPolygon()】---------------------------------
//                描述:实现凹多边形的绘制
//

void DrawPolygon(Mat img)
{
    int lineType = 8;
    
    //创建一些点
    Point rookPoints[1][20];
    rookPoints[0][0] = Point(WINDOW_WIDTH / 4, 7 * WINDOW_WIDTH / 8);
    rookPoints[0][1] = Point(3 * WINDOW_WIDTH / 4, 7 * WINDOW_WIDTH / 8);
    rookPoints[0][2] = Point(3 * WINDOW_WIDTH / 4, 13 * WINDOW_WIDTH / 16);
    rookPoints[0][3] = Point(11 * WINDOW_WIDTH / 16, 13 * WINDOW_WIDTH / 16);
    rookPoints[0][4] = Point(19 * WINDOW_WIDTH / 32, 3 * WINDOW_WIDTH / 8);
    rookPoints[0][5] = Point(3 * WINDOW_WIDTH / 4, 3 * WINDOW_WIDTH / 8);
    rookPoints[0][6] = Point(3 * WINDOW_WIDTH / 4, 3 * WINDOW_WIDTH / 8);
    rookPoints[0][7] = Point(26 * WINDOW_WIDTH / 40, WINDOW_WIDTH / 8);
    rookPoints[0][8] = Point(26 * WINDOW_WIDTH / 40, WINDOW_WIDTH / 4);
    rookPoints[0][9] = Point(22 * WINDOW_WIDTH / 40, WINDOW_WIDTH / 4);
    rookPoints[0][10] = Point(22 * WINDOW_WIDTH / 40, WINDOW_WIDTH / 8);
    rookPoints[0][11] = Point(18 * WINDOW_WIDTH / 40, WINDOW_WIDTH / 8);
    rookPoints[0][12] = Point(18 * WINDOW_WIDTH / 40, WINDOW_WIDTH / 4);
    rookPoints[0][13] = Point(14 * WINDOW_WIDTH / 40, WINDOW_WIDTH / 4);
    rookPoints[0][14] = Point(14 * WINDOW_WIDTH / 40, WINDOW_WIDTH / 8);
    rookPoints[0][15] = Point(WINDOW_WIDTH / 4, WINDOW_WIDTH / 8);
    rookPoints[0][16] = Point(WINDOW_WIDTH / 4, 3 * WINDOW_WIDTH / 8);
    rookPoints[0][17] = Point(13 * WINDOW_WIDTH / 32, 3 * WINDOW_WIDTH / 8);
    rookPoints[0][18] = Point(5 * WINDOW_WIDTH / 16, 13 * WINDOW_WIDTH / 16);
    rookPoints[0][19] = Point(WINDOW_WIDTH / 4, 13 * WINDOW_WIDTH / 16);
    
    const Point* ppt[1] = { rookPoints[0] };
    int npt[] = { 20 };
    fillPoly(img,
        ppt,
        npt,
        1,
        Scalar(255, 255, 255),
        lineType);
} 
          DrawPolygon（）函数是用于绘制凹多边形的函数，区别于前两个函数的是，增加了多边形的顶点集ppt，要绘制的多边形的顶点数目为npt。要绘制的多边形的数量为1 
  4.3.4 DrawLine（） 
  //-------------------------【DrawLine()】-----------------------------
//                          描述:绘制线
//--------------------------------------------------------------------
void DrawLine(Mat img, Point start, Point end)
{
    int thickness = 2;
    int lineType = 8;
    line(img,
        start,
        end,
        Scalar(0, 0, 0),
        thickness,
        lineType);
}
 
          start和end是线的起点和终点。 
  4.3.5 main（） 
  //------------------【头文件、命名空间包含部分】--------------------

//            描述：包含程序所使用的头文件和命名空间
//------------------------------------------------------------------
#include 
#include
#include
#include
using namespace cv;

//----------------------【宏定义部分】----------------------------
//                  描述：定义一些辅助宏
//----------------------------------------------------------------
#define WINDOW_NAME1 "【绘制图1】"          //为窗口标题定义的宏
#define WINDOW_NAME2 "【绘制图2】"          //为窗口标题定义的宏
#define WINDOW_WIDTH 600                    //定义窗口大小的宏
//--------------------【main（）】-------------------------------
//   描述：控制台应用程序的入口函数，我们的程序从这里开始执行
//---------------------------------------------------------------

int main(void)
{
    //创建空白Mat以供绘图
    Mat atomImg = Mat::zeros(WINDOW_WIDTH, WINDOW_WIDTH, CV_8UC3);
    Mat rookImg = Mat::zeros(WINDOW_WIDTH, WINDOW_WIDTH, CV_8UC3);

    //------------------<绘制化学的原子示例图>----------------
    
    //【1.1】先绘制出椭圆
    DrawEllipse(atomImg, 90);
    DrawEllipse(atomImg, 0);
    DrawEllipse(atomImg, 45);
    DrawEllipse(atomImg, -45);

    //【1.2】再绘制圆心
    DrawFilledCircle(atomImg, Point(WINDOW_WIDTH / 2, WINDOW_WIDTH / 2));

    //------------------------<2>绘制组合图---------------------------
    //【2.1】先绘制出多边形
    DrawPolygon(rookImg);

    //【2.2】绘制矩形
    rectangle(rookImg,
        Point(0, 7 * WINDOW_WIDTH / 8),
        Point(WINDOW_WIDTH, WINDOW_WIDTH),
        Scalar(0, 255, 255),
        -1,
        8);

    //【2.3】绘制一些线段
    DrawLine(rookImg, Point(0, 15 * WINDOW_WIDTH / 16), Point(WINDOW_WIDTH, 15 * WINDOW_WIDTH / 16));
    DrawLine(rookImg, Point(WINDOW_WIDTH / 4, 7 * WINDOW_WIDTH / 8), Point(WINDOW_WIDTH / 4, WINDOW_WIDTH));
    DrawLine(rookImg, Point(WINDOW_WIDTH / 2, 7 * WINDOW_WIDTH / 8), Point(WINDOW_WIDTH / 2, WINDOW_WIDTH));
    DrawLine(rookImg, Point(3 * WINDOW_WIDTH / 4, 7 * WINDOW_WIDTH / 8), Point(3 * WINDOW_WIDTH / 4, WINDOW_WIDTH));

    //----------------------<3>显示绘制出的图像-------------------------
    imshow(WINDOW_NAME1, atomImg);
    moveWindow(WINDOW_NAME1, 0, 200);
    imshow(WINDOW_NAME2, rookImg);
    moveWindow(WINDOW_NAME2, WINDOW_WIDTH, 200);

    waitKey(0);
    return 0;
} 
         请留意，C++如果函数定义在main（）后，需要在main之前进行声明。 
          运行结果图如下：

回答我！！！如何用“快递分拣”讲明白OSI五层模型？茫忙然计算机网络网络
刚开始学习计算机网络时，会比较难理解计算机网络的五层协议，毕竟确实挺抽象的，接下来我用寄快递的过程来类比计算机网络的五层协议（物理层、数据链路层、网络层、传输层、应用层），帮助大家理解每一层的功能和作用。1.物理层（PhysicalLayer）——交通工具和道路快递中的比喻：卡车、飞机、轮船等运输工具，以及高速公路、铁路、航线等物理路径。功能：负责将包裹（数据）从一个地点物理传输到另一个地点，不关
Python基于深度学习的动物图片识别技术的研究与实现 Java老徐 Python 毕业设计 python 深度学习开发语言深度学习的动物图片识别技术 Python动物图片识别技术
博主介绍：✌程序员徐师兄、7年大厂程序员经历。全网粉丝12w+、csdn博客专家、掘金/华为云/阿里云/InfoQ等平台优质作者、专注于Java技术领域和毕业项目实战✌文末获取源码联系精彩专栏推荐订阅不然下次找不到哟2022-2024年最全的计算机软件毕业设计选题大全：1000个热门选题推荐✅Java项目精品实战案例《100套》Java微信小程序项目实战《100套》感兴趣的可以先收藏起来，还有大家
【Spark】查询优化中分区（Partitioning）和分桶（Bucketing）是什么关系？什么时候应当分区，什么时候应当分桶？ petrel2015 spark 大数据分布式数据库
在学习Spark的过程中，分区和分桶乍一看很像，都能为了计算加速，但是仔细一想，一查还是有些差异的，甚至说差异很大。那么具体有什么差异点，有什么相同点。我做出了如下的整理，供大家参考，欢迎指正。相同点分区（Partitioning）和分桶（Bucketing）在很多方面具有相似性，它们都是用于优化大数据查询性能的技术数据划分的目的：优化查询性能分区和分桶的核心目标是通过将数据分割成更小的逻辑单元来
【深度学习与大模型基础】第7章-特征分解与奇异值分解 lynn-66 深度学习与大模型基础算法机器学习人工智能
一、特征分解特征分解（EigenDecomposition）是线性代数中的一种重要方法，广泛应用于计算机行业的多个领域，如机器学习、图像处理和数据分析等。特征分解将一个方阵分解为特征值和特征向量的形式，帮助我们理解矩阵的结构和性质。1.特征分解的定义对于一个n×n的方阵A，如果存在一个非零向量v和一个标量λ，使得：则称λ为矩阵A的特征值，v为对应的特征向量。特征分解将矩阵A分解为：其中：Q是由特征
【论文阅读】Persistent Homology Captures the Generalization of Neural Networks Without A Validation Set 开心星人论文阅读论文阅读
将神经网络表征为加权的无环图，直接根据模型的权重矩阵构造PD。计算相邻batch的权重矩阵PD之间的距离。比较同调收敛性与神经网络的验证精度变化趋势摘要机器学习从业者通常通过监控模型的某些指标来估计其泛化误差，并在训练数值收敛之前停止训练，以防止过拟合。通常，这种误差度量或任务相关的指标是通过一个验证集（holdoutset）来计算的。因为这些数据没有直接用于更新模型参数，通常假设模型在验证集上的
论文阅读笔记——MAGICDRIVE: STREET VIEW GENERATION WITH DIVERSE 3D GEOMETRY CONTROL 寻丶幽风论文阅读笔记论文阅读笔记 3d 人工智能自动驾驶
MagicDrive论文MagicDrive通过对3D数据和文本数据的多模态条件融合和隐式视角转换，实现了高质量、多视角一致的3D场景生成。几何条件编码Cross-attention：针对顺序数据，适合处理文本标记和边界框等可变长度输入。Additiveencoderbranch：对于地图等网络状规则数据，能够有效保留空间结构。对于文本按照模版构建：“Adrivingsceneat{locatio
【笔记】扩散模型（五）：Classifier-Free Guidance 理论推导与代码实现 LittleNyima Diffusion Models 笔记机器学习深度学习
论文链接：Classifier-FreeDiffusionGuidance上一篇文章我们学习了ClassifierGuidance，这种方法通过引入一个额外的分类器，使用梯度引导的方式成功地实现了条件生成。虽然ClassifierGuidance可以直接复用训练好的diffusionmodels，不过这种方法的问题是很明显的，首先需要额外训练一个分类器，而且这个分类器不仅仅分类一般的图像，还需要分
震惊！ “深度学习”都在学习什么扉间798 深度学习学习人工智能
常见的机器学习分类算法俗话说三个臭皮匠胜过诸葛亮这里面集成学习就是将单一的算法弱弱结合算法融合用投票给特征值加权重AdaBoost集成学习算法通过迭代训练一系列弱分类器，给予分类错误样本更高权重，使得后续弱分类器更关注这些样本，然后将这些弱分类器线性组合成强分类器，提高整体分类性能。（一）投票机制投票是一种直观且常用的算法融合策略。在多分类问题中，假设有多个分类器对同一数据进行分类判断。每个分类器
【论文阅读】Availability Attacks Create Shortcuts 开心星人论文阅读论文阅读
还得重复读这一篇论文，有些地方理解不够透彻可用性攻击通过在训练数据中添加难以察觉的扰动，使数据无法被机器学习算法利用，从而防止数据被未经授权地使用。例如，一家私人公司未经用户同意就收集了超过30亿张人脸图像，用于构建商业人脸识别模型。为解决这些担忧，许多数据投毒攻击被提出，以防止数据被未经授权的深度模型学习。它们通过在训练数据中添加难以察觉的扰动，使模型无法从数据中学习太多信息，从而导致模型在未见
深度学习 | pytorch + torchvision + python 版本对应及环境安装 zfgfdgbhs 深度学习 python pytorch
目录一、版本对应二、安装命令（pip）1.版本（1）v2.5.1~v2.0.0（2）v1.13.1~v1.11.0（3）v1.10.1~v1.7.02.安装全过程（1）选择版本（2）安装结果参考文章一、版本对应下表来自pytorch的github官方文档：pytorch/vision:Datasets,TransformsandModelsspecifictoComputerVisionpytor
《面向模式的软件体系结构3-资源管理模式》读书笔记（7）--- Coordinator模式 weixin_33699914 人工智能
3.3Coordinator模式Coordinator（协调者）模式描述了如何通过协调涉及多个参与者（每个参与者都包含资源、资源使用者和资源提供者）的任务的完成来维护系统的一致性。这个模式提出了一个解决方案，使得在涉及多个参与者的任务中，或者所有参与者的任务都完成，或者一项任务都没有完成。这确保了系统总是处于一致的状态。1.问题很多系统都会执行涉及不止一个参与者的任务。一个参与者是一个主动实体，既
机器学习 Day01人工智能概述山北雨夜漫步机器学习人工智能
1.什么样的程序适合在gpu上运行计算密集型的程序：此类程序主要运算集中在寄存器，寄存器读写速度快，而GPU拥有强大的计算能力，能高效处理大量的寄存器运算，因此适合在GPU上运行。像科学计算中的数值模拟、密码破解等场景的程序，都属于计算密集型，在GPU上运行可大幅提升运算速度。易于并行的程序：GPU采用SIMD架构，有众多核心，同一时间每个核心适合做相同的事。易于并行的程序能充分利用GPU这一特性
L2-050懂蛇语c++（pta天梯赛。测试点1。） zzy678 c++
这个题目看上去还挺简单的，但是自己做的时候就超时了一开始只有19分。我自己stl学的不是很好，然后一开始自己用的pair和vector一起写的发现了一些小问题改了之后才得19。。。其中两个就是超时问题。可能查找太慢？之后又查看了一些别人写的，参考了使用map和vector混用的方法就很好过了，但是那个测试点1就是过不了。最后，我发现就是首字的处理方式应该优化。一个小小小坑。大家注意。#includ
网络空间安全专业培养方案及学习建议菜根Sec 学习网络安全网络空间安全信息安全大学专业
一、网络空间安全专业培养方案（示例）本文以武汉大学网络空间安全专业培养方案为例，列举本科期间学习的课程。详情参见：https://cse.whu.edu.cn/rcpy/lxspy/zyjs/wlkjaqzypyfa.htm1、培养目标网络空间安全学科是综台计算机、通信、电子、数学、物理、生物、管理、法律和教育等学科，并发展演绎而形成的交叉学科。培养的本科生要求掌握网络空间安全学科的基本理论、基本
网络安全证书培训机构有哪些菜根Sec web安全安全网络安全
一、前言少叙记得刚入行的时候，想考一个证书来装装门面，结果发现费用太高了，比当时一个月的工资都高，感叹网络安全这帮人真舍得花钱，遂放弃。后来入职网络安全公司，考了一个CISP，在工作中逐渐发现，证书这个东西还是要根据自身需求来，并非越多越好。当前笔者的主要任务还是通过学习来增强自己的能力，后续看看是否有机会既能让读者享受物美价廉的考试认证服务，又能让培训机构及时找到生源，实现双赢。如果找到合适的培
嵌入式Linux驱动开发：从基础知识到实践精通坚持坚持那些年
本文还有配套的精品资源，点击获取简介：嵌入式Linux由于其稳定性、可定制性和丰富资源，在智能设备领域得到广泛应用。掌握嵌入式Linux驱动程序设计对于开发者至关重要。本课程从基础知识点出发，详细介绍了内核接口理解、设备树编程、I/O操作、字符与块设备驱动、网络驱动、电源管理、调试技巧、硬件抽象层、设备模型和模块化编程等关键技能，并通过实际操作实践来强化学习，帮助开发者成长为嵌入式Linux驱动开
机器学习：让计算机学会思考的艺术平凡而伟大. 机器学习机器学习人工智能
目录什么是机器学习？机器学习的基本步骤常见的机器学习算法机器学习的实际应用如何入门机器学习？结语在当今数字化时代，机器学习（MachineLearning,ML）已经成为一个炙手可热的话题。从推荐系统到自动驾驶汽车，再到语音助手，机器学习的应用无处不在。然而，对于许多人来说，机器学习仍然是一个神秘而复杂的领域。本文将用通俗易懂的语言，带你走进机器学习的世界，了解它的基本原理和应用。什么是机器学习？
机器学习中的 K-均值聚类算法及其优缺点平凡而伟大. 机器学习机器学习算法均值算法
K-均值聚类是一种常用的无监督学习算法，用于将数据集中的样本分成K个簇。其基本原理是将所有样本点划分到K个簇使得簇内样本点之间的距离尽可能接近，而不同簇之间的距离尽可能远。算法流程如下：随机选择K个样本点作为初始的聚类中心。将每个样本点分配到与其最近的聚类中心所在的簇。更新每个簇的聚类中心为该簇所有样本点的平均值。重复第2步和第3步，直到聚类中心不再变化或者达到最大迭代次数。优点：简单且易于实现。
一文讲清楚深度学习和机器学习平凡而伟大. 机器学习人工智能深度学习机器学习人工智能
目录1.定义机器学习（MachineLearning,ML）深度学习（DeepLearning,DL）2.工作原理机器学习深度学习3.应用场景机器学习深度学习4.主要区别5.为什么选择深度学习？6.总结深度学习和机器学习是人工智能（AI）领域中两个密切相关但有所区别的概念。要清楚地解释它们之间的关系，我们可以从定义、工作原理、应用场景以及两者的主要区别等方面进行探讨。1.定义机器学习（Machin
C语言_数据结构总结8：链式队列 *.✧屠苏隐遥(ﾉ◕ヮ◕)ﾉ*.✧ C语言—数据结构数据结构 c语言开发语言 visualstudio visual studio 链表
纯C语言实现，不涉及C++链队列队列的链式表示称为链队列，它实际上是一个同时具有队头指针和队尾指针的单链表，头指针指向对头结点，尾指针指向队尾结点。头结点是链式队列中的特殊结点，通常不存储实际的队列元素数据，其主要作用是方便对队列的操作，例如在进行入队、出队操作时，可以统一操作逻辑，无需特殊处理队列为空的情况。它作为队列的头部标识，其next指针指向队列中的第一个真正存储数据的结点。尾结点（注意区
C语言_数据结构总结10：二叉树的递归/非递归遍历 *.✧屠苏隐遥(ﾉ◕ヮ◕)ﾉ*.✧ C语言—数据结构数据结构算法链表 visualstudio visual studio c语言 b树
纯C语言实现，不涉及C++遍历是二叉树各种操作的基础，例如对于一棵给定二叉树求结点的双亲/求结点的孩子/求二叉树的高度/求叶结点个数/判断两棵二叉树是否相等……所有这些操作都是在二叉树遍历的过程中进行的。因此必须掌握二叉树的各种遍历过程，并能灵活用以解决各种问题。常见的遍历次序有：先序，中序，后序->其中“序”是指根结点何时被访问。先序：根结点->左子树->右子树中序:左子树->根结点->右子树后
编译链接过程 YancyKahn 编译链接编译链接 GCC
编译链接过程C/C++程序从文本到可执行文件之间是一个复杂的过程.对于源代码(.c/.cpp)文件我们是不能直接运行的,必须经过一系列的处理才能转化为机器语言,再通过链接相应的文件转化为可执行程序.这个过程称为编译链接过程.本文篇幅较长,想直接看分析过程点击这里下面是从源代码到可执行文件的整个编译链接的过程:整个编译链接过程无非就分为编译过程和链接过程1.编译过程C文件编译过程又可分为:编译和汇编
pyspark学习rdd处理数据方法——学习记录亭午学习
python黑马程序员"""文件，按JSON字符串存储1.城市按销售额排名2.全部城市有哪些商品类别在售卖3.上海市有哪些商品类别在售卖"""frompysparkimportSparkConf,SparkContextimportosimportjsonos.environ['PYSPARK_PYTHON']=r"D:\anaconda\envs\py10\python.exe"#创建Spark
回归任务中的评价指标MAE，MSE，RMSE，R-Squared 旺旺棒棒冰统计学习方法机器学习回归评价指标 r2 mse
转自博客。仅供自己学习使用，如有侵权，请联系删除分类任务的评价指标有准确率，P值，R值，F1值，而回归任务的评价指标就是MSE，RMSE，MAE、R-SquaredMSE均方误差MSE是真实值与预测值的差值的平方和然后求平均。通过平方的形式便于求导，所以常被用作线性回归的损失函数。MSE=1m∑i=1m(yi−y^i)2MSE=\frac{1}{m}\sum_{i=1}^{m}\left(y_{i
第十八章：模板的多态力量_《C++ Templates》notes 郭涤生 c/c++c++开发语言笔记
模板的多态力量一、动态多态vs静态多态二、奇异递归模板模式（CRTP）三、策略模式（编译期策略选择）关键要点总结第一部分：多选题(10题)第二部分：设计题(5题)答案与详解多选题答案：设计题参考答案1.编译期策略选择器2.类型安全访问者模式3.概念约束数学库4.编译期工厂模式5.静态多态容器测试说明一、动态多态vs静态多态核心概念：动态多态：基于虚函数和继承体系，函数调用在运行时决定（通过虚函数表
DeepSeek：智能搜索与分析的新纪元 XRC2231 学习
在人工智能浪潮席卷全球的今天，DeepSeek如同一颗璀璨的新星，以其独特的魅力和强大的功能，在AI领域脱颖而出。DeepSeek，这一基于深度学习和数据挖掘技术的智能搜索与分析系统，不仅重新定义了搜索引擎的边界，更以其卓越的性能和广泛的应用场景，为全球用户带来了前所未有的智能体验。本文将从DeepSeek的定义、特点、应用场景、优势等方面进行全面而深入的介绍，带您领略这一新兴技术的独特魅力。一、
图像质量评价学习笔记02：IQA模型性能评价指标（PLCC、SROCC、KROCC、RMSE）可靠的豆包蟹同志图像质量评估IQA 图像处理计算机视觉人工智能算法
性能好的图像质量评价（IQA）算法，其质量评测分数会与主观质量分数高度一致，IQA有许多评价指标，为了衡量方法测试结果与主观评价之间的一致性，视频质量专家组VQEG（VideoQualityExpertsGroup，目前国际上对视频质量进行标准化及性能测试的权威组织）提出了四个可以验证客观评价结果和主观评价结果之间的紧密程度的四个指标：PLCC、SROCC、KROCC和RMSE，也是目前最常用的I
计算机基础：编码01，无符号数编码水饺编程 MFC学习笔记 Win32学习笔记 mfc c++visual studio windows
专栏导航本节文章分别属于《Win32学习笔记》和《MFC学习笔记》两个专栏，故划分为两个专栏导航。读者可以自行选择前往哪个专栏。（一）WIn32专栏导航上一篇：计算机基础：二进制基础13，十六进制与二进制的相互转换回到目录下一篇：计算机基础：编码02，有符号数编码，原码（二）MFC专栏导航上一篇：计算机基础：二进制基础13，十六进制与二进制的相互转换回到目录下一篇：计算机基础：编码02，有符号数编
CPP编译与链接过程阿斯顿的风格 c++开发语言 ubuntu linux bash 编译汇编
1.概述在C++中，从源代码（.cpp文件）到最终可执行程序，需要经历以下四个主要阶段：预处理（Preprocessing）编译（Compilation）汇编（Assembly）链接（Linking）2.预处理预处理阶段是编译流程的第一步，主要处理以#开头的指令，包括宏定义、文件包含以及条件编译等。2.1文件包含（#include）工作原理：当预处理器遇到#include指令时，会在文件系统中查找
第十七章:Future Directions_《C++ Templates》notes 郭涤生 c/c++c++开发语言笔记
FutureDirections核心重难点：示例代码：设计题多选题答案设计题详解核心重难点：泛型非类型模板参数允许任意类型作为非类型模板参数（如template）需解决类型推导和链接问题编译期控制流constexprif替代模板偏特化（减少代码膨胀）折叠表达式优化可变参数模板处理反射与元编程增强类型检查（is_convertible_v等）反射提案（如成员变量/函数查询）模块化支持解决传统头文件包
springmvc 下 freemarker页面枚举的遍历输出杨白白 enum freemarker
spring mvc freemarker 中遍历枚举 1枚举类型有一个本地方法叫values（），这个方法可以直接返回枚举数组。所以可以利用这个遍历。 enum public enum BooleanEnum { TRUE(Boolean.TRUE, "是"), FALSE(Boolean.FALSE, "否");
实习简要总结 byalias 工作
来白虹不知不觉中已经一个多月了，因为项目还在需求分析及项目架构阶段，自己在这段时间都是在学习相关技术知识，现在对这段时间的工作及学习情况做一个总结：（1）工作技能方面大体分为两个阶段，Java Web 基础阶段和Java EE阶段 1）Java Web阶段在这个阶段，自己主要着重学习了 JSP, Servlet, JDBC, MySQL，这些知识的核心点都过了一遍，也
Quartz——DateIntervalTrigger触发器 eksliang quartz
转载请出自出处：http://eksliang.iteye.com/blog/2208559 一.概述 simpleTrigger 内部实现机制是通过计算间隔时间来计算下次的执行时间，这就导致他有不适合调度的定时任务。例如我们想每天的 1：00AM 执行任务，如果使用 SimpleTrigger，间隔时间就是一天。注意这里就会有一个问题，即当有 misfired 的任务并且恢复执行时，该执行时间
Unix快捷键 18289753290 unix Unix；快捷键;
复制，删除，粘贴： dd:删除光标所在的行 &nbs
获取Android设备屏幕的相关参数酷的飞上天空 android
包含屏幕的分辨率以及屏幕宽度的最大dp 高度最大dp TextView text = (TextView)findViewById(R.id.text); DisplayMetrics dm = new DisplayMetrics(); text.append("getResources().ge
要做物联网？先保护好你的数据蓝儿唯美数据
根据Beecham Research的说法，那些在行业中希望利用物联网的关键领域需要提供更好的安全性。在Beecham的物联网安全威胁图谱上，展示了那些可能产生内外部攻击并且需要通过快速发展的物联网行业加以解决的关键领域。 Beecham Research的技术主管Jon Howes说：“之所以我们目前还没有看到与物联网相关的严重安全事件，是因为目前还没有在大型客户和企业应用中进行部署，也就
Java取模（求余）运算随便小屋 java
整数之间的取模求余运算很好求，但几乎没有遇到过对负数进行取模求余，直接看下面代码： /** * * @author Logic * */ public class Test { public static void main(String[] args) { // TODO A
SQL注入介绍 aijuans sql注入
二、SQL注入范例这里我们根据用户登录页面 <form action="" > 用户名：<input type="text" name="username"><br/> 密码：<input type="password" name="passwor
优雅代码风格 aoyouzi 代码
总结了几点关于优雅代码风格的描述：代码简单：不隐藏设计者的意图，抽象干净利落，控制语句直截了当。接口清晰：类型接口表现力直白，字面表达含义，API 相互呼应以增强可测试性。依赖项少：依赖关系越少越好，依赖少证明内聚程度高，低耦合利于自动测试，便于重构。没有重复：重复代码意味着某些概念或想法没有在代码中良好的体现，及时重构消除重复。战术分层：代码分层清晰，隔离明确，
布尔数组百合不是茶 java 布尔数组
androi中提到了布尔数组; 布尔数组默认的是false, 并且只会打印false或者是true 布尔数组的例子; 根据字符数组创建布尔数组 char[] c = {'p','u','b','l','i','c'}; //根据字符数组的长度创建布尔数组的个数 boolean[] b = new bool
web.xml之welcome-file-list、error-page bijian1013 java web.xml servlet error-page
welcome-file-list 1.定义： <welcome-file-list> <welcome-file>login.jsp</welcome> </welcome-file-list> 2.作用：用来指定WEB应用首页名称。 error-page1.定义： <error-page&g
richfaces 4 fileUpload组件删除上传的文件 sunjing clear Richfaces 4 fileupload
页面代码 <h:form id="fileForm"> <rich:
技术文章备忘 bit1129 技术文章
Zookeeper http://wenku.baidu.com/view/bab171ffaef8941ea76e05b8.html http://wenku.baidu.com/link?url=8thAIwFTnPh2KL2b0p1V7XSgmF9ZEFgw4V_MkIpA9j8BX2rDQMPgK5l3wcs9oBTxeekOnm5P3BK8c6K2DWynq9nfUCkRlTt9uV
org.hibernate.hql.ast.QuerySyntaxException: unexpected token: on near line 1解决方案白糖_ Hibernate
文章摘自：http://blog.csdn.net/yangwawa19870921/article/details/7553181 在编写HQL时，可能会出现这种代码： select a.name,b.age from TableA a left join TableB b on a.id=b.id 如果这是HQL，那么这段代码就是错误的，因为HQL不支持
sqlserver按照字段内容进行排序 bozch 按照内容排序
在做项目的时候，遇到了这样的一个需求：从数据库中取出的数据集，首先要将某个数据或者多个数据按照地段内容放到前面显示，例如:从学生表中取出姓李的放到数据集的前面； select * fro
编程珠玑-第一章-位图排序 bylijinnan java 编程珠玑
import java.io.BufferedWriter; import java.io.File; import java.io.FileWriter; import java.io.IOException; import java.io.Writer; import java.util.Random; public class BitMapSearch {
Java关于==和equals chenbowen00 java
关于==和equals概念其实很简单，一个是比较内存地址是否相同，一个比较的是值内容是否相同。虽然理解上不难，但是有时存在一些理解误区，如下情况： 1、 String a = "aaa"; a=="aaa"; ==> true 2、 new String("aaa")==new String("aaa
[IT与资本]软件行业需对外界投资热情保持警惕 comsci it
我还是那个看法,软件行业需要增强内生动力,尽量依靠自有资金和营业收入来进行经营,避免在资本市场上经受各种不同类型的风险,为企业自主研发核心技术和产品提供稳定,温和的外部环境... 如果我们在自己尚未掌握核心技术之前,企图依靠上市来筹集资金,然后使劲往某个领域砸钱,然
oracle 数据块结构 daizj oracle 块数据块块结构行目录
oracle 数据块是数据库存储的最小单位，一般为操作系统块的N倍。其结构为：块头－－〉空行－－〉数据，其实际为纵行结构。块的标准大小由初始化参数DB_BLOCK_SIZE指定。具有标准大小的块称为标准块（Standard Block）。块的大小和标准块的大小不同的块叫非标准块（Nonstandard Block）。同一数据库中，Oracle9i及以上版本支持同一数据库中同时使用标
github上一些觉得对自己工作有用的项目收集 dengkane github
github上一些觉得对自己工作有用的项目收集技能类 markdown语法中文说明回到顶部全文检索 elasticsearch bigdesk elasticsearch管理插件回到顶部 nosql mapdb 支持亿级别map, list, 支持事务. 可考虑做为缓存使用 C
初二上学期难记单词二 dcj3sjt126com english word
dangerous 危险的 panda 熊猫 lion 狮子 elephant 象 monkey 猴子 tiger 老虎 deer 鹿 snake 蛇 rabbit 兔子 duck 鸭 horse 马 forest 森林 fall 跌倒；落下 climb 爬；攀登 finish 完成；结束 cinema 电影院；电影 seafood 海鲜；海产食品 bank 银行
8、mysql外键(FOREIGN KEY)的简单使用 dcj3sjt126com mysql
一、基本概念 1、MySQL中“键”和“索引”的定义相同，所以外键和主键一样也是索引的一种。不同的是MySQL会自动为所有表的主键进行索引，但是外键字段必须由用户进行明确的索引。用于外键关系的字段必须在所有的参照表中进行明确地索引，InnoDB不能自动地创建索引。 2、外键可以是一对一的，一个表的记录只能与另一个表的一条记录连接，或者是一对多的，一个表的记录与另一个表的多条记录连接。 3、如
java循环标签 Foreach shuizhaosi888 标签 java循环 foreach
1. 简单的for循环 public static void main(String[] args) { for (int i = 1, y = i + 10; i < 5 && y < 12; i++, y = i * 2) { System.err.println("i=" + i + " y="
Spring Security（05）——异常信息本地化 234390216 exception Spring Security 异常信息本地化
异常信息本地化 Spring Security支持将展现给终端用户看的异常信息本地化，这些信息包括认证失败、访问被拒绝等。而对于展现给开发者看的异常信息和日志信息（如配置错误）则是不能够进行本地化的，它们是以英文硬编码在Spring Security的代码中的。在Spring-Security-core-x
DUBBO架构服务端告警Failed to send message Response javamingtingzhao 架构 DUBBO
废话不多说，警告日志如下，不知道有哪位遇到过，此异常在服务端抛出(服务器启动第一次运行会有这个警告)，后续运行没问题，找了好久真心不知道哪里错了。 WARN 2015-07-18 22:31:15,272 com.alibaba.dubbo.remoting.transport.dispatcher.ChannelEventRunnable.run(84)
JS中Date对象中几个用法 leeqq JavaScript Date 最后一天
近来工作中遇到这样的两个需求 1. 给个Date对象，找出该时间所在月的第一天和最后一天 2. 给个Date对象，找出该时间所在周的第一天和最后一天需求1中的找月第一天很简单，我记得api中有setDate方法可以使用使用setDate方法前，先看看getDate var date = new Date(); console.log(date); // Sat J
MFC中使用ado技术操作数据库你不认识的休道人 sql mfc
1.在stdafx.h中导入ado动态链接库 #import"C:\Program Files\Common Files\System\ado\msado15.dll" no_namespace rename("EOF","end")2.在CTestApp文件的InitInstance()函数中domodal之前写::CoIniti
Android Studio加速 rensanning android studio
Android Studio慢、吃内存！启动时后会立即通过Gradle来sync & build工程。（1）设置Android Studio a) 禁用插件 File -> Settings... Plugins 去掉一些没有用的插件。比如：Git Integration、GitHub、Google Cloud Testing、Google Cloud
各数据库的批量Update操作 tomcat_oracle java oracle sql mysql sqlite
MyBatis的update元素的用法与insert元素基本相同，因此本篇不打算重复了。本篇仅记录批量update操作的 sql语句，懂得SQL语句，那么MyBatis部分的操作就简单了。　　注意：下列批量更新语句都是作为一个事务整体执行，要不全部成功，要不全部回滚。 MSSQL的SQL语句　WITH R AS（　　SELECT 'John' as name, 18 as
html禁止清除input文本输入缓存 xp9802 input
多数浏览器默认会缓存input的值，只有使用ctl+F5强制刷新的才可以清除缓存记录。如果不想让浏览器缓存input的值，有2种方法：方法一：在不想使用缓存的input中添加 autocomplete="off"; eg: <input type="text" autocomplete="off" name

OpenCV（C++） 学习笔记（一）