EN7ROPY

OpenCV3学习笔记

一、OpenCV数据类型
- 1. 大型数组类型
- - 1.1 Mat类
  - 1.2 SparseMat类
二、Mat类基础操作
- 1. 图像的读写
- - 1.1 读取
  - 1.2 写入
- 2. 创建一个Mat类
- 3. 色彩空间转换
- 4. 图像像素指针&掩膜操作（Mask）的实现
- 5. 像素数据的读写&修改
- 6. 图像的线性混合
- 7. 对比度&亮度增强——点操作
- 8. 绘制基础图型
- - 8.1 图形&文字绘制
  - 8.2 随机线生成
  - 8.3 椒盐噪声
- 9. 图像模糊
- - 9.1 均值模糊&高斯模糊：
  - 9.2 中值滤波&双边滤波
- 10. 形态学操作
- - 10.1 膨胀与腐蚀
  - 10.2 开、闭、形态学梯度、顶帽、黑帽：
  - 10.3 水平&竖直线条提取：
- 11. 图像的升采样和降采样、高斯不同
- 12. 阈值操作
- 13. 自定义线性滤波
- 14. 图像边缘提取
- - 14.1 Sobel算子 & Scharr算子
  - 14.2 Laplance算子
  - 14.3 Canny算子
- 15.基础图形检测
- - 15.1 霍夫变换——直线检测
  - 15.2 霍夫变换——圆
- 16. 像素重映射
- 17.灰度直方图
- - 17.1 直方图均衡化
  - 17.2 直方图计算

一、OpenCV数据类型

第一类是直接从C++中继承的基础数据类型（如int和float等）。这些类型包括简单的数组和矩阵，一些简单的几何概念，比如点、矩形、大小等；
第二类是辅助对象。这同时也代表些对象代表更抽象的概念，比如垃圾收集指针类、用于数据切片的范围对象 (range objects) 以及抽象的终止条件类等；
第三类可以称为大型数组类型。这些对象原本目的是涵盖数组或一些其他的原语、程序集或更常见的基础数据类型。这一类的典型代表是cv::Mat类，该类用来代表任意维度的包含任意基础元素的数组。存储图片对象是cv::Mat类的特殊用途。

为快速上手，先从第三类的Mat类开始。

1. 大型数组类型

比较具有代表性的是 cv::Mat和cv::SparseMat 类型。

cv::Mat针对的是密集连续性的存储，大多数的图像数据被存储为这种类，即使数据为空，预留的存储空间仍然存在；
cv::SparseMat针对的是稀疏的存储方式，只有数据不为0才保留空间，否则不会预留。显然cv::SparseMat存储更为节省空间，典型使用cv::SparseMat的例如直方图数据的存储。

1.1 Mat类

Mat 是一个类，由两个数据部分组成：

矩阵头（包含矩阵尺寸，存储方法，存储地址等信息）
一个指向存储所有像素值的矩阵（根据所选存储方法的不同矩阵可以是不同的维数）的指针。

1.2 SparseMat类

二、Mat类基础操作

1. 图像的读写

1.1 读取

imread功能是加载图像文件成为一个Mat对象，其中：
第一个参数为图像文件的路径；
第二个参数，表示加载的图像是什么类型，支持常见的三个参数值：

IMREAD_UNCHANGED (<0) 表示加载原图，不做任何改变
IMREAD_GRAYSCALE (=0)表示把原图作为灰度图像加载进来
IMREAD_COLOR (>0) 表示把原图作为RGB图像加载进来

注意：OpenCV支持JPG、PNG、TIFF等常见格式图像文件加载。

同时用到的函数还有：

namedWindow：功能是创建一个OpenCV窗口，它是由OpenCV自动创建与释放，你无需取销毁它。常见用法是：
namedWindow(“Window Title”, WINDOW_AUTOSIZE)。
— WINDOW_AUTOSIZE，会自动根据图像大小，显示窗口大小，不能人为改变窗口大小；
— WINDOW_NORMAL，跟QT集成的时候会使用，允许修改窗口大小。
destroyWindow：功能是销毁指定的窗口。
imshow：根据窗口名称显示图像到指定的窗口上去，第一个参数是窗口名称，第二参数是Mat对象

//加载图像
#include 
#include 

using namespace std;
using namespace cv;

int main()
{
     
    Mat image = imread("C://1.jpg");			//加载图像
    if (image.empty())
    {
     
        return -1;
    }
    namedWindow("Example1", WINDOW_AUTOSIZE);	//创建窗口
    imshow("Example1", image);					//显示图像
    waitKey(0);
    destroyWindow("Example1");					//销毁窗口
    return 0;
}

//加载为灰度图
#include 
#include 

using namespace std;
using namespace cv;

int main()
{
     
    Mat image = imread("C://1.jpg", 0);		//IMREAD_GRAYSCALE (=0)表示把原图作为灰度图像加载进来
    if (image.empty())
    {
     
        return -1;
    }
    namedWindow("Example1", WINDOW_AUTOSIZE);
    imshow("Example1", image);
    waitKey(0);
    destroyWindow("Example1");
    return 0;
}

1.2 写入

imwrite功能是保存图像文件到指定目录路径，有三个参数：

第一个参数表示需要写入的路径&文件名，必须要加上后缀，比如“123.png”；
第二个参数表示Mat类型的图像数据，是你要保存的对象。
第三个参数表示为特定格式保存的参数编码，它有一个默认值std::vector< int >()，所以一般情况下不用写。

注意：只有8位、16位的PNG、JPG、Tiff文件格式而且是单通道或者三通道的BGR的图像才可以通过这种方式保存，保存PNG格式的时候可以保存透明通道的图片

#include 
#include 

using namespace std;
using namespace cv;

int main()
{
     
    Mat image = imread("C://1.jpg");
    if (image.empty())
    {
     
        return -1;
    }

    Mat image_out;
    cvtColor(image, image_out, COLOR_BGR2HLS);     //转换为灰度图

    imwrite("D://1_out.png", image_out);	//将转换后image_out的写入到"D://1_out.png"

    namedWindow("Output Window", WINDOW_AUTOSIZE);
    imshow("Output Window", image_out);
    waitKey(0);
    destroyWindow("Output Window");
    return 0;
}

2. 创建一个Mat类

Mat对象构造函数：Mat()
Mat对象构造方法：A.create()

赋值一个全为0的Mat：img = Scalar(0)。

//三种建立Mat类的方式
#include 
#include 

using namespace cv;
using namespace std;

int main(int argc, char** args) {
     

	Mat M;
	M.create(4, 3, CV_32FC3);
	M = Scalar((126.3928), (12.3334), (246.12));
	cout << "M = " << endl << M << endl << endl;

	Mat A = Mat(3, 2, CV_16SC3);
	A = Scalar(1, 2, 3);
	cout << endl << "A = " << endl << A << endl << endl;

	Mat D = (Mat_<double>(3, 3) << 0, -1, 0, -1, 5, -1, 0, -1, 0);
	cout << "D = " << endl << D << endl << endl;

	waitKey(0);
	return 0;
	}
/*
M =
[126.3928, 12.3334, 246.12, 126.3928, 12.3334, 246.12, 126.3928, 12.3334, 246.12;
 126.3928, 12.3334, 246.12, 126.3928, 12.3334, 246.12, 126.3928, 12.3334, 246.12;
 126.3928, 12.3334, 246.12, 126.3928, 12.3334, 246.12, 126.3928, 12.3334, 246.12;
 126.3928, 12.3334, 246.12, 126.3928, 12.3334, 246.12, 126.3928, 12.3334, 246.12]


A =
[1, 2, 3, 1, 2, 3;
 1, 2, 3, 1, 2, 3;
 1, 2, 3, 1, 2, 3]

D =
[0, -1, 0;
 -1, 5, -1;
 0, -1, 0]


C:\Users\CK Yang\source\repos\LXCV01\x64\Debug\LXCV01.exe (进程 18808)已退出，代码为 0。
要在调试停止时自动关闭控制台，请启用“工具”->“选项”->“调试”->“调试停止时自动关闭控制台”。
按任意键关闭此窗口. . .
*/
}

创建Mat类型的函数十分灵活：

#include 
#include 

using namespace cv;
using namespace std;

int main(int argc, char** args) {
     

	Mat M;
	M.create(4, 3, CV_32FC3);
	M = Scalar((126.3928), (12.3334), (246.12));
	cout << "M = " << endl << M << endl << endl;

	Mat A = Mat(3, 2, CV_16SC3);
	A = Scalar(1, 2, 3);
	cout << endl << "A = " << endl << A << endl << endl;

	Mat B = Mat(Size(3, 4), CV_8SC3);
	B = Scalar(2, 3, 4);
	cout << "B = " << endl << B << endl << endl;

	Mat C = Mat(Size(2, 3), CV_16SC2, Scalar(2, 3, 4));
	cout << "C = " << endl << C << endl << endl;
	
	Mat D = (Mat_<double>(3, 3) << 0, -1, 0, -1, 5, -1, 0, -1, 0);
	cout << "D = " << endl << D << endl << endl;

	
	waitKey(0);
	return 0;
	}
/*
A =
[1, 2, 3, 1, 2, 3;
 1, 2, 3, 1, 2, 3;
 1, 2, 3, 1, 2, 3]

B =
[  2,   3,   4,   2,   3,   4,   2,   3,   4;
   2,   3,   4,   2,   3,   4,   2,   3,   4;
   2,   3,   4,   2,   3,   4,   2,   3,   4;
   2,   3,   4,   2,   3,   4,   2,   3,   4]

C =
[2, 3, 2, 3;
 2, 3, 2, 3;
 2, 3, 2, 3]

D =
[0, -1, 0;
 -1, 5, -1;
 0, -1, 0]

*/

还可通过imread(“C:/2.jpg”);的方式建立图像的Mat

#include 
#include 

using namespace cv;
using namespace std;

int main(int argc, char** args)
	{
     
	Mat image = imread("C:/2.jpg");

	if (image.empty()) 
	{
     
		return -1;
	}

	namedWindow("My Image", WINDOW_AUTOSIZE);
	imshow("My Image", image);

	Mat M;
	M.create(4, 3, CV_32FC3);
	M = Scalar((126.3928), (12.3334), (246.12));
	cout << "M = " << endl << " " << M << endl << endl;
	uchar* firstRow = M.ptr<uchar>(0);
	printf("%d\n", *firstRow);

	Mat C = (Mat_<double>(3, 3) << 0, -1, 0, -1, 5, -1, 0, -1, 0);
	cout << "C = " << endl << " " << C << endl << endl;

	waitKey(0);
	cvDestroyAllWindows();
	return 0;
}

Mat的type和depth：
例：CV_32FC3——表示的是元素类型是一个32位的浮点数，通道为3。

数据类型中：
U（unsigned integer）表示的是无符号整数，
S（signed integer）是有符号整数，
F（float）是浮点数。
通道数中：C1，C2，C3，C4则表示通道数是1,2,3,4。

type一般是在创建Mat对象时设定，如果要取得Mat的元素类型，则无需使用type，使用depth：
depth是矩阵中元素的一个通道的数据类型，这个值和type是相关的。
例如： type为 CV_16SC2，一个2通道的16位的有符号整数。那么，depth则是CV_16S。

depth：将type的值去掉通道信息就是depth值：CV_8U、CV_16S、CV_32F、CV_64F。
elemSize：矩阵一个元素占用的字节数，例如：type是CV_16SC3，那么elemSize = 3 * 16 / 8 = 6
bytes
elemSize1：矩阵元素一个通道占用的字节数，例如：type是CV_16CS3，那么elemSize1 = 16 / 8 = 2
bytes = elemSize / channels

常用方法：

void copyTo(Mat)：完全复制；
Mat clone()：完全复制；
void convertTo(Mat, int type)：转换Mat为指定type；
int type()：查看Mat的type；
size()：查看Mat的size；
int channels()：查看Mat的channels；
int depth()：查看Mat的depth；
bool empty()：查看Mat是否为empty；
uchar* ptr(i=0)：像素指针。

注：

部分复制：一般情况下只会复制Mat对象的头和指针部分，不会复制数据部分

Mat A= imread(imgFilePath);
Mat B(A)

完全复制：如果想把Mat对象的头部和数据部分一起复制，可以通过如下两个API实现

Mat F = A.clone();
Mat G;
A.copyTo(G);

#include 
#include 

using namespace cv;
using namespace std;

int main(int argc, char** args) {
     

	Mat M;
	M.create(4, 3, CV_32FC3);
	M = Scalar((126.3928), (12.3334), (246.12));
	cout << "M = " << endl << M << endl << endl;

	Mat A = Mat(3, 2, CV_16SC3);
	A = Scalar(1, 2, 3);
	cout << endl << "A = " << endl << A << endl << endl;

	Mat B = Mat(Size(3, 4), CV_8SC3);
	B = Scalar(2, 3, 4);
	cout << "B = " << endl << B << endl << endl;

	Mat E;
	A.copyTo(E);
	cout << "E = " << endl << E << endl << endl;

	Mat F;
	A.convertTo(F, CV_32FC3);
	cout << "F = " << endl << F << endl << endl;

	Mat G = B.clone();
	cout << "G = " << endl << G << endl << endl;

3. 色彩空间转换

cvtColor( image, gray_image, COLOR_BGR2GRAY )
cvtColor功能是把图像从一个彩色空间转换到另外一个色彩空间，有三个参数：

第一个参数表示源图像；
第二参数表示色彩空间转换之后的图像；
第三个参数表示源和目标色彩空间如：COLOR_BGR2HLS 、COLOR_BGR2GRAY 等。

#include 
#include 

using namespace std;
using namespace cv;

int main()
{
     
    Mat image = imread("C://1.jpg");
    if (image.empty())
    {
     
        return -1;
    }

    Mat image_out;
    cvtColor(image, image_out, COLOR_BGR2HLS);     //转换色彩空间为COLOR_BGR2HLS

    namedWindow("Output Window", WINDOW_AUTOSIZE);
    imshow("Output Window", image_out);
    waitKey(0);
    destroyWindow("Output Window");
    return 0;
}

4. 图像像素指针&掩膜操作（Mask）的实现

Mat.ptr(int i=0) 功能是获取像素矩阵的指针，索引 i 表示行数，从0开始计数。

获得当前行指针const uchar* current= myImage.ptr< uchar>(row)；
获取当前像素点P(row, col)的像素值 p(row, col) = current[col]。

注意：掩膜Mask也被称之为Kernel。

实现一个下图的掩膜操作，功能是提高图像的对比度：

这能干嘛？我下载的某个PDF文档看着比较瞎眼，就可以用这个来让它看着没那么瞎眼。

saturate_cast< uchar>()是像素范围处理函数，功能是确保RGB值的范围在0~255之间。

saturate_cast（-100），返回 0；
saturate_cast（288），返回255；
saturate_cast（100），返回100。

#include 
#include 

using namespace std;
using namespace cv;

int main()
{
     
    Mat image = imread("C://2.png");
    Mat image_output = Mat::zeros(image.size(), image.type());	//创立一个元素全为0的Mat类型作为输出图像，size和type与输入图像保持一致。

    if (image.empty())
    {
     
        return -1;
    }

    namedWindow("Input",WINDOW_AUTOSIZE);
    imshow("Input", image);
    
    int cols = image.cols * image.channels();
    int rows = image.rows;

    for (int row = 1; row < (rows - 1); row++)
    {
     
        const uchar* current = image.ptr<uchar>(row);		//获取当前行指针
        const uchar* next = image.ptr<uchar>(row + 1);		//获取下一行指针
        const uchar* previous = image.ptr<uchar>(row - 1);	//获取上一行指针

        uchar* output = image_output.ptr<uchar>(row);		//获取想要输出的图像的行指针

        for (int col = 1 * image.channels(); col < cols; col++)		//为什么要* image.channels()？思考下彩色图像显示的原理。
        {
     
            output[col] = saturate_cast<uchar> ( current[col] * 5 - (current[col] - image.channels()) - (current[col] + image.channels()) - next[col] - previous[col] );
            //掩膜操作
        }
    }

    namedWindow("Output", WINDOW_AUTOSIZE);
    imshow("Output", image_output);
    
    waitKey(0);
    destroyWindow("Output");
    destroyWindow("INput");

    return 0;
}

除了利用图像像素指针进行掩膜操作，还能用OpenCV的api完成同样的操作，操作步骤：

定义掩膜：Mat kernel = (Mat_(3,3) << 0, -1, 0, -1, 5, -1, 0, -1,
0);
调用filter2D( image, image_output, src.depth(), kernel)：
其中image和 image_output是Mat类型变量；
src.depth表示位图深度，有32、24、8等，根据图像属性变化；
kernel是刚才定义的掩膜。

#include 
#include 

using namespace std;
using namespace cv;

int main()
{
     
    Mat image = imread("C://2.png");
    Mat image_output = Mat::zeros(image.size(), image.type());

    if (image.empty())
    {
     
        return -1;
    }

    namedWindow("Input", WINDOW_AUTOSIZE);
    imshow("Input", image);

    Mat kernel = (Mat_<char>(3, 3) << 0, -1, 0, -1, 5, -1, 0, -1, 0);	//定义掩膜
    filter2D(image, image_output, image.depth(), kernel);	//调用filter2D

    namedWindow("Output", WINDOW_AUTOSIZE);
    imshow("Output", image_output);

    waitKey(0);
    destroyWindow("Output");
    destroyWindow("INput");

    return 0;
}

5. 像素数据的读写&修改

灰度图像：只有1个通道，可直接赋值修改。
img.at(y, x) = 128;

//获取灰度图像的像素值
#include 
#include 

using namespace std;
using namespace cv;

int main()
{
     
	Mat image = imread("C://wn.jpg");
	Mat image_gray;

	if (image.empty())
	{
     
		return -1;
	}

	namedWindow("input", WINDOW_AUTOSIZE);
	imshow("input", image);

	cvtColor(image, image_gray, COLOR_BGR2GRAY);
	namedWindow("output_gray", WINDOW_AUTOSIZE);
	imshow("output_gray", image_gray);

	int height = image_gray.rows;		//获取image_gray的行数，作为图像的高度
	int width = image_gray.cols;		//获取image_gray的列数，作为图像的宽度

	for (int row = 0; row < height; row++) {
     
		for (int col = 0; col < width; col++) {
     
			int pixel_gray = image_gray.at<uchar>(row, col);	//获取每一个灰度像素点的值
			cout << "rows = " << row << ",cols = " << col << ",pixel_gray = " << pixel_gray << endl;
		}
	}


	waitKey(0);

	return 0;
}

修改像素值，并显示修改像素值后的灰度图片，以颜色反转为例：

//灰度图像颜色反转
#include 
#include 

using namespace std;
using namespace cv;

int main()
{
     
	Mat image = imread("C://wn.jpg");
	Mat image_gray;

	if (image.empty())
	{
     
		return -1;
	}

	namedWindow("input", WINDOW_AUTOSIZE);
	imshow("input", image);

	cvtColor(image, image_gray, COLOR_BGR2GRAY);
	namedWindow("output_gray", WINDOW_AUTOSIZE);
	imshow("output_gray", image_gray);

	int height = image_gray.rows;		//获取image_gray的行数，作为图像的高度
	int width = image_gray.cols;		//获取image_gray的列数，作为图像的宽度

	for (int row = 0; row < height; row++) {
     
		for (int col = 0; col < width; col++) {
     
			int pixel_gray = image_gray.at<uchar>(row, col);	//获取每一个灰度像素点的值，赋值给pixel_gray
			cout << "rows = " << row << ",cols = " << col << ",pixel_gray = " << pixel_gray << endl;
			image_gray.at<uchar>(row, col) = 255 - pixel_gray;	//修改每一个灰度像素点的值，效果是颜色反转。
		}
	}

	namedWindow("output_gray_reverse", WINDOW_AUTOSIZE);
	imshow("output_gray_reverse", image_gray);		//显示修改像素值后的图片

	waitKey(0);

	return 0;
}

RGB三通道图像：分通道逐个修改。
img.at(y,x)[0]=128; // blue
img.at(y,x)[1]=128; // green
img.at(y,x)[2]=128; // red

彩色像素值的修改，以颜色反转为例：

//rgb图像颜色反转
#include 
#include 

using namespace std;
using namespace cv;

int main()
{
     
	Mat image = imread("C://wn.jpg");
	Mat image_gray;

	if (image.empty())
	{
     
		return -1;
	}

	namedWindow("input", WINDOW_AUTOSIZE);
	imshow("input", image);

	cvtColor(image, image_gray, COLOR_BGR2GRAY);
	namedWindow("output_gray", WINDOW_AUTOSIZE);
	imshow("output_gray", image_gray);

	int height = image.rows;
	int width = image.cols;

	for (int row = 0; row < height; row++) {
     
		for (int col = 0; col < width; col++) {
     
			int pixel_b = image.at<Vec3b>(row, col)[0];
			int pixel_g = image.at<Vec3b>(row, col)[1];
			int pixel_r = image.at<Vec3b>(row, col)[2];

			cout << "rows = " << row << ",cols = " << col << ",Blue = " << pixel_b << ",Green = " << pixel_g << ",Red = " << pixel_r << endl;

			image.at<Vec3b>(row, col)[0] = 255 - pixel_b;
			image.at<Vec3b>(row, col)[1] = 255 - pixel_g;
			image.at<Vec3b>(row, col)[2] = 255 - pixel_r;
		}
	}
	namedWindow("output_reverse", WINDOW_AUTOSIZE);
	imshow("output_reverse", image);
	
	waitKey(0);

	return 0;
}

注意：OpenCV中有api可以实现图片色彩反转：bitwise_not(image, image_out);

//利用bitwise_not(image, image_out);进行色彩反转
#include 
#include 

using namespace std;
using namespace cv;

int main()
{
     
	Mat image = imread("C://wn.jpg");
	Mat image_gray;
	Mat image_out;

	if (image.empty())
	{
     
		return -1;
	}

	namedWindow("input", WINDOW_AUTOSIZE);
	imshow("input", image);

	cvtColor(image, image_gray, COLOR_BGR2GRAY);
	namedWindow("output_gray", WINDOW_AUTOSIZE);
	imshow("output_gray", image_gray);

	bitwise_not(image, image_out);
	
	namedWindow("output_reverse", WINDOW_AUTOSIZE);
	imshow("output_reverse", image_out);
	
	waitKey(0);

	return 0;
}

注意：数据类型有区别！

Vec3b对应三通道的顺序是blue、green、red的uchar类型数据；
Vec3f对应三通道的顺序是blue、green、red的float类型数据；
把CV_8UC1转换到CV32F1实现如下：
Mat.convertTo(dst, CV_32F)。

6. 图像的线性混合

f0——第一张图像；
f1——第二张图像；
α——混合参数。

相关api：addWeighted()，作用就是线性混合。

参数1：输入图像Mat
参数2：输入图像的alpha值
参数3：输入图像Mat
参数4：输入图像的alpha值
参数5：gamma值
参数6：输出图像Mat

注意：两张图像的大小和类型必须一致才可以进行操作。

#include 
#include 

using namespace std;
using namespace cv;

int main()
{
     
	Mat image0 = imread("C://eg//wn.jpg");	//输入图像0
	Mat image1 = imread("C://eg//m.jpg");	//输入图像1

	Mat image_out;

	float alpha = 0.1;	//混合参数α

	if (image0.empty() || image1.empty()) {
     
		cout << "images are not found " << endl;
		return -1;
	}
	

	namedWindow("input0", WINDOW_AUTOSIZE);
	imshow("input0", image0);
	namedWindow("input1", WINDOW_AUTOSIZE);
	imshow("input1", image1);
	
	if (image0.cols == image1.cols && image0.rows == image1.rows && image0.type() == image1.type()) {
     
		addWeighted(image0, alpha, image1, (1 - alpha), 0.0, image_out);
		namedWindow("output", WINDOW_AUTOSIZE);
		imshow("output", image_out);
	}
	else {
     
		cout << "2 images' size or type are different " << endl;
		return -1;
	}
	waitKey(0);
	cvDestroyAllWindows();

	return 0;
}
}

权重不同，混合程度也不同，结果如下：
alpha = 0.25

alpha = 0.75

7. 对比度&亮度增强——点操作

图像变换可以看作如下：

像素变换 – 点操作；
邻域操作 – 区域。

调整图像亮度和对比度属于像素变换-点操作。

alpha——对比度
beta——亮度

8. 绘制基础图型

8.1 图形&文字绘制

#include 
#include 

using namespace std;
using namespace cv;

Mat image;			//声明全局的Mat image

void Line();		//声明绘制Line的函数Line()
void Rectangle();	//矩形
void Ellipse();		//椭圆
void Circle();		//圆
void FillPolygon();	//实心多边形
void Text();		//文本

int main()
{
     
	image = imread("C://eg//2.jpg");	//输入图像

	if (image.empty()) {
     
		return -1;
	}

	Line();			//
	Rectangle();	//
	Ellipse();		//
	Circle();
	FillPolygon();
	Text();

	namedWindow("input", WINDOW_AUTOSIZE);
	imshow("input", image);

	waitKey(0);
	cvDestroyAllWindows();

	return 0;
}

void Line() {
     
	Point a = Point(10, 20);			//坐标
	Point b = Point(110, 120);

	Scalar color = Scalar(0, 0, 255);	//颜色为红

	line(image, a, b, color, 1, LINE_4);
}

void Rectangle() {
     
	Rect rect = Rect(50, 100, 50, 50);	//坐标&形状
	Scalar color = Scalar(255, 0, 0);	//蓝色

	rectangle(image, rect, color, 1, LINE_4);
}

void Ellipse() {
     
	Point a = Point(image.rows / 2, image.cols / 2);	//圆心
	Size b = Size(image.rows / 8, image.cols / 4);		//尺寸
	Scalar color = Scalar(0, 255, 0);	//绿色

	ellipse(image, a, b, 90, 0, 360, color, 1, LINE_4);	
}

void Circle() {
     
	Point a = Point(image.rows / 1.5, image.cols / 1.2);	//圆心
	int r = image.rows / 6;					//半径
	Scalar color = Scalar(203, 192, 255);	//pink

	circle(image, a, r, color, 1, LINE_4);
}	

void FillPolygon() {
     
	Point pts[1][5];
	pts[0][0] = Point(100, 100);
	pts[0][1] = Point(150, 225);
	pts[0][2] = Point(200, 100);
	pts[0][3] = Point(80, 180);
	pts[0][4] = Point(220, 180);

	const Point* ppts[] = {
      pts[0] };
	int npt[] = {
      5 };
	Scalar color = Scalar(219, 112, 147);

	fillPoly(image, ppts, npt, 1, color, 8);
} 

void Text() {
     
	Point p = Point(160, 460);
	Scalar color = Scalar(60, 20, 220);
	string text = "????";

	putText(image, text, p, CV_FONT_NORMAL, 2, color, 2, LINE_4);
}

8.2 随机线生成

#include 
#include 

using namespace std;
using namespace cv;

Mat image;			//声明全局的Mat image

void RDMLine();

int main()
{
     
	image = imread("C://eg//2.jpg");	//输入图像

	if (image.empty()) {
     
		return -1;
	}

	RDMLine();

	waitKey(0);
	cvDestroyAllWindows();

	return 0;
}

void RDMLine() {
     
	RNG rng(getTickCount());
	Point p1, p2;
	Mat image0 = Mat::zeros(image.size(), image.type());

	namedWindow("RDMLine", WINDOW_AUTOSIZE);
	for (int i = 0; i < 100000; i++) {
     
		p1.x = rng.uniform(0, image.cols);
		p2.x = rng.uniform(0, image.cols);
		p1.y = rng.uniform(0, image.rows);
		p2.y = rng.uniform(0, image.rows);

		Scalar color = Scalar(rng.uniform(0, 255), rng.uniform(0, 255), rng.uniform(0, 255));
		if (waitKey(50) > 0) {
     
			break;
		}
		line(image0, p1, p2, color, 1, LINE_4);
		imshow("RDMLine", image0);
	}
}

8.3 椒盐噪声

#include  
#include  
using namespace cv;

void SPNoice(Mat image_0, int n);

int main(int argc, char** argv) {
     

    Mat image;
	image = imread("C://eg//akane.jpg");
	if (image.empty()) {
     
		return -1;
	}
	
	char input_title[] = "input image";
	char output_title0[] = "output image";

	namedWindow(input_title, CV_WINDOW_AUTOSIZE);
	namedWindow(output_title0, CV_WINDOW_AUTOSIZE);

	imshow(input_title, image);

    SPNoice(image,500);
    imwrite("C://eg//akane_spnoice.jpg", image);	//保存椒盐噪声图
	imshow(output_title0, image);

	waitKey(0);
	cvDestroyAllWindows();
	return 0;
}

//
void SPNoice(   Mat image_0,    //输入输出图像
                int n           //椒盐个数
            ) 
{
     
    int noice = 0;  //噪声种类，0为椒噪声，1为盐噪声

    int C_row = 0;  //像素点
    int C_col = 0;
   
    //每循环一次，添加一个椒盐噪声
    while (n > 0) {
     
        noice = rand() % 2;     //随机确定椒盐噪声种类
                              
        //随机产生函数获取被修改的图像Mat对应像素点的位置
        C_row = rand() % image_0.rows;
        C_col = rand() % image_0.cols;

        //灰度图
        if (image_0.channels() == 1) {
     

            if (noice == 0) {
     
                image_0.at<uchar>(C_row, C_col) = 0;
            }
            else if(noice == 1) {
     
                image_0.at<uchar>(C_row, C_col) = 255;
            }
        }

        //RGB图
        else if(image_0.channels() == 3) {
     

            if (noice == 0) {
     
                image_0.at<Vec3b>(C_row, C_col)[0] = 0;
                image_0.at<Vec3b>(C_row, C_col)[1] = 0;
                image_0.at<Vec3b>(C_row, C_col)[2] = 0;
            }
            else if (noice == 1) {
     
                image_0.at<Vec3b>(C_row, C_col)[0] = 255;
                image_0.at<Vec3b>(C_row, C_col)[1] = 255;
                image_0.at<Vec3b>(C_row, C_col)[2] = 255;
            }
        }
        
       
        n--;
    }
}

9. 图像模糊

卷积：假设有6x6的图像像素点矩阵。6x6上面是个3x3的窗口，从左向右，从上向下移动，黄色的每个像个像素点值之和取平均值赋给中心红色像素作为它卷积处理之后新的像素值。每次移动一个像素格。

9.1 均值模糊&高斯模糊：

#include  
#include  
using namespace cv;

int main(int argc, char** argv) {
     
	Mat image, image_blur, image_Gblur;
	image = imread("C://eg//akane_spnoice.jpg");
	if (image.empty()) {
     
		return -1;
	}

	char input_title[] = "input image";
	char output_title0[] = "blur image";
	String output_title1 = "gaussian blur image";
	namedWindow(input_title, CV_WINDOW_AUTOSIZE);
	namedWindow(output_title0, CV_WINDOW_AUTOSIZE);
	namedWindow(output_title1, WINDOW_AUTOSIZE);

	imshow(input_title, image);

	blur(image, image_blur, Size(5, 5), Point(-1, -1));		//均值模糊
	imshow(output_title0, image_blur);

	GaussianBlur(image, image_Gblur, Size(11, 11), 11, 11);		//高斯模糊
	imshow(output_title1, image_Gblur);

	waitKey(0);
	cvDestroyAllWindows();

	return 0;
}

9.2 中值滤波&双边滤波

中值模糊medianBlur（Mat src, Mat dest, ksize）

Mat src：输入图像；
Mat dest：输出图像；
ksize：卷积核尺寸。

双边模糊bilateralFilter(src, dest, d, sigma color, sigma space)

src：输入图像；
dest：输出图像；
d：计算的半径，半径之内的像数都会被纳入计算，如果提供-1 则根据sigma space参数取值；
sigma color 颜色空间过滤器的sigma值，这个参数的值月大，表明该像素邻域内有更宽广的范围颜色会被混合到一起，产生较大的半相等颜色区域，看着雾蒙蒙的；
sigma space 如果d的值大于0则声明无效，否则根据它来计算d值，中值模糊的ksize大小必须是大于1，而且必须是奇数。

#include  
#include  
using namespace cv;

int main(int argc, char** argv) {
     
	Mat image, image_median_blur, image_bilateral_blur;
	image = imread("C://eg//akane_spnoice.jpg");
	if (image.empty()) {
     
		return -1;
	}

	char input_title[] = "input image";
	char output_title0[] = "median blur image";
	String output_title1 = "bilateral blur image";
	namedWindow(input_title, CV_WINDOW_AUTOSIZE);
	namedWindow(output_title0, CV_WINDOW_AUTOSIZE);
	namedWindow(output_title1, WINDOW_AUTOSIZE);

	imshow(input_title, image);

	medianBlur(image, image_median_blur, 3);
	imshow(output_title0, image_median_blur);

	bilateralFilter(image, image_bilateral_blur, 15, 150, 20);
	imshow(output_title1, image_bilateral_blur);

	waitKey(0);
	cvDestroyAllWindows();

	return 0;
}

10. 形态学操作

10.1 膨胀与腐蚀

关键api：

getStructuringElement(int shape, Size ksize, Point anchor)：返回指定形状和尺寸的结构元素。
shape形状 (MORPH_RECT \MORPH_CROSS \MORPH_ELLIPSE)；
ksize大小；
anchor锚点，默认是Point(-1, -1)意思就是中心像素。
dilate(image, image_dilate, kernel)膨胀;
erode(image, image_erode, kernel)腐蚀.

#include  
#include  
using namespace cv;

int main(int argc, char** argv) {
     
	Mat image, image_dilate, image_erode;
	image = imread("C://eg//i.png");
	if (image.empty()) {
     
		return -1;
	}
	imshow("image", image);

	Mat kernel = getStructuringElement(MORPH_RECT, Size(7, 7), Point(-1, -1));

	dilate(image, image_dilate, kernel);

	erode(image, image_erode, kernel);

	imshow("image_dilate", image_dilate);
	imshow("image_erode", image_erode);
	

	waitKey(0);
	cvDestroyAllWindows();

	return 0;
}

10.2 开、闭、形态学梯度、顶帽、黑帽：

开：先腐蚀后膨胀，可以去掉小的对象，假设对象是前景色，背景是黑色；
闭：先膨胀后腐蚀，可以填充小的洞，假设对象是前景色，背景是黑色；
形态学梯度：膨胀减去腐蚀，又称为基本梯度（其它还包括-内部梯度、方向梯度）；
顶帽：原图像和开操作图像的差值；
黑帽：闭操作图像和原图像的差值。

关键api：
morphologyEx(src, dest, CV_MOP_BLACKHAT, kernel);

Mat src – 输入图像
Mat dest – 输出
int OPT – CV_MOP_OPEN/ CV_MOP_CLOSE/ CV_MOP_GRADIENT /CV_MOP_TOPHAT/ CV_MOP_BLACKHAT 形态学操作类型
Mat kernel 结构元素
int Iteration 迭代次数，默认是1

#include  
#include  
using namespace cv;

int main(int argc, char** argv) {
     
	Mat image, image_open, image_close, image_gradient, image_tophat, image_blackhat;
	image = imread("C://eg//i_spnoice.jpg");
	if (image.empty()) {
     
		return -1;
	}
	imshow("image", image);

	Mat kernel = getStructuringElement(MORPH_RECT, Size(3,3), Point(-1, -1));

	morphologyEx(image, image_open, CV_MOP_OPEN, kernel);			//开
	morphologyEx(image, image_close, CV_MOP_CLOSE, kernel);			//闭
	morphologyEx(image, image_gradient, CV_MOP_GRADIENT, kernel);	//形态学梯度
	morphologyEx(image, image_tophat, CV_MOP_TOPHAT, kernel);		//顶帽
	morphologyEx(image, image_blackhat, CV_MOP_BLACKHAT, kernel);	//黑帽

	imshow("image_open", image_open);
	imshow("image_close", image_close);
	imshow("image_gradient", image_gradient);
	imshow("image_tophat", image_tophat);
	imshow("image_blackhat", image_blackhat);


	waitKey(0);
	cvDestroyAllWindows();

	return 0;
}

10.3 水平&竖直线条提取：

输入图像彩色图像 imread
转换为灰度图像 – cvtColor
转换为二值图像 – adaptiveThreshold
定义结构元素
开操作（腐蚀+膨胀）提取水平与垂直线

#include  
#include  
using namespace cv;

int main(int argc, char** argv) {
     
	Mat image, image_gray, image_binary, imahe_line_w, imahe_line_h;
	image = imread("C://eg//3.png");
	if (image.empty()) {
     
		return -1;
	}
	imshow("image", image);

	if (image.channels() == 3) {
     
		cvtColor(image, image_gray, COLOR_BGR2GRAY);
	}
	else if(image.channels() == 1) {
     
		image_gray = image;
	}
	namedWindow("image_gray", WINDOW_AUTOSIZE);
	imshow("image_gray", image_gray);


	adaptiveThreshold(image_gray, image_binary, 255, ADAPTIVE_THRESH_MEAN_C, THRESH_BINARY, 15, 1);
	bitwise_not(image_binary, image_binary);

	namedWindow("image_binary", WINDOW_AUTOSIZE);
	imshow("image_binary", image_binary);


	Mat line_w, line_h;
	line_w = getStructuringElement(MORPH_RECT, Size(image.cols / 30, 1), Point(-1, -1));
	line_h = getStructuringElement(MORPH_RECT, Size(1, image.rows / 30), Point(-1, -1));

	morphologyEx(image_binary, imahe_line_w, CV_MOP_OPEN, line_w);
	morphologyEx(image_binary, imahe_line_h, CV_MOP_OPEN, line_h);
	imshow("imahe_line_w", imahe_line_w);
	imshow("imahe_line_h", imahe_line_h);

	waitKey(0);
	cvDestroyAllWindows();

	return 0;
}

11. 图像的升采样和降采样、高斯不同

两种采样的目的是放缩图片大小，放缩图像也可以使用几何变换，这里使用图像金字塔的方式，
升采样(cv::pyrUp) – zoom in 放大
降采样 (cv::pyrDown) – zoom out 缩小
高斯金子塔是从底向上，逐层降采样得到。
降采样之后图像大小是原图像MxN的M/2 x N/2 ,就是对原图像删除偶数行与列，即得到降采样之后上一层的图片。高斯金子塔的生成过程分为两步：
1. 对当前层进行高斯模糊
2. 删除当前层的偶数行与列
这样即可得到上一层的图像，这样上一层跟下一层相比，都只有它的1/4大小
高斯不同的定义：就是把同一张图像在不同的参数下做高斯模糊之后的结果相减，得到的输出图像。称为高斯不同(DOG)。
高斯不同是图像的内在特征，在灰度图像增强、角点检测中经常用到。

#include 
#include 
#include "math.h"

using namespace std;
using namespace cv;
int main(int agrc, char** argv) {
     
	Mat image;
	image = imread("C://eg//3.jpg");
	if (image.empty()) {
     
		return -1;
	}
	Mat image_big, image_small;
	namedWindow("image", CV_WINDOW_AUTOSIZE);
	namedWindow("image_big", CV_WINDOW_AUTOSIZE);
	imshow("image", image);

	pyrUp(image, image_big, Size(image.cols * 2, image.rows * 2));//升采样
	imshow("image_big", image_big);

	pyrDown(image, image_small, Size(image.cols / 2, image.rows / 2));//降采样
	imshow("image_small", image_small);

	Mat image_gray, g1, g2, g3;
	cvtColor(image, image_gray, CV_BGR2GRAY);
	GaussianBlur(image_gray, g1, Size(5, 5), 0, 0);
	GaussianBlur(g1, g2, Size(5, 5), 0, 0);
	subtract(g1, g2, g3, Mat());	//高斯不同

	Mat image_DOG = g3;
	normalize(image_DOG, image_DOG, 255, 0, NORM_MINMAX);
	imshow("DOG Image", image_DOG);

	waitKey(0);
	return 0;
}

12. 阈值操作

基本的图像阈值操作有：二值化、反二值化、截断、取零、反取零，还有后面三个以后再学。

#include 
#include 
#include 
using namespace std;
using namespace cv;

int thresh = 128;

int main(int argc, char** argv) {
     
	Mat image, image_gray, image_out0, image_out1, image_out2, image_out3, image_out4;
	image = imread("C://eg//3.png");
	if (image.empty()) {
     
		printf("could not load image...\n");
		return -1;
	}
	cvtColor(image, image_gray, CV_BGR2GRAY);

	threshold(image_gray, image_out0, thresh, 255, THRESH_BINARY);		//二值化
	threshold(image_gray, image_out1, thresh, 255, THRESH_BINARY_INV);	//反二值化
	threshold(image_gray, image_out2, thresh, 255, THRESH_TRUNC);		//截断
	threshold(image_gray, image_out3, thresh, 255, THRESH_TOZERO);		//取零
	threshold(image_gray, image_out4, thresh, 255, THRESH_TOZERO_INV);	//反取零

	imshow("THRESH_BINARY", image_out0);
	imshow("THRESH_BINARY_INV", image_out1);
	imshow("THRESH_TRUNC", image_out2);
	imshow("THRESH_TOZERO", image_out3);
	imshow("THRESH_TOZERO_INV",image_out4);

	waitKey(0);
	return 0;
}

利用二值化阈值操作来去水印

#include 
#include 
#include 
using namespace std;
using namespace cv;

int thresh = 175;

int main(int argc, char** argv) {
     
	Mat image, image_gray, image_out0;
	image = imread("C://eg//4.png");
	if (image.empty()) {
     
		printf("could not load image...\n");
		return -1;
	}
	imshow("image", image);

	cvtColor(image, image_gray, CV_BGR2GRAY);

	threshold(image_gray, image_out0, thresh, 255, THRESH_BINARY);
	imshow("THRESH_BINARY", image_out0);
	imwrite("C://eg//4_out.png", image_out0);

	waitKey(0);
	return 0;
}

13. 自定义线性滤波

卷积是图像处理中一个操作，是kernel在图像的每个像素上的操作。Kernel本质上一个固定大小的矩阵数组，其中心点称为锚点(anchor point)。
把kernel放到像素数组之上，求锚点周围覆盖的像素乘积之和（包括锚点），用来替换锚点覆盖下像素点值称为卷积处理。
自定义卷积模糊：
filter2D(
Mat src, //输入图像
Mat dst, // 模糊图像
int depth, // 图像深度32/8
Mat kernel, // 卷积核/模板
Point anchor, // 锚点位置
double delta // 计算出来的像素+delta
)
注意：其中 kernel是可以自定义的卷积核

#include 
#include 

using namespace std;
using namespace cv;



int main(int argc, char** argv) {
     
	Mat image, image_out;
	image = imread("C://eg//jr.jpg");
	if (image.empty()) {
     
		printf("could not load image...\n");
		return -1;
	}
	imshow("image", image);
	int ksize = 5;
	Mat kernel = Mat::ones(Size(ksize, ksize), CV_32F) / (ksize * ksize);

	filter2D(image, image_out, -1, kernel, Point(-1, -1));
	imshow("image_out", image_out);


	waitKey(0);
	return 0;
}

卷积边界问题：图像卷积的时候边界像素，不能被卷积操作，原因在于边界像素没有完全跟kernel重叠，所以当3x3滤波时候有1个像素的边缘没有被处理，5x5滤波的时候有2个像素的边缘没有被处理。

相关api：
copyMakeBorder(
Mat src, // 输入图像
Mat dst, // 添加边缘图像
int top, // 边缘长度，一般上下左右都取相同值，
int bottom,
int left,
int right,
int borderType // 边缘类型
Scalar value）
边缘类型：
BORDER_DEFAULT – OpenCV中默认的处理方法，镜像填充；
BORDER_CONSTANT – 用指定像素值填充边缘；
BORDER_REPLICATE – 用最边缘的像素值作为插值来填充边缘像素；
BORDER_WRAP – 用另外一边的图像来填充。

#include 
#include 

using namespace std;
using namespace cv;

int main(int argc, char** argv) {
     
	Mat image, image_out0, image_out1, image_out2, image_out3;
	image = imread("C://eg//jr.jpg");
	if (image.empty()) {
     
		printf("could not load image...\n");
		return -1;
	}
	imshow("image", image);

	copyMakeBorder(image, image_out0, 9, 9, 9, 9, BORDER_CONSTANT, Scalar(123, 123, 123));
	imshow("image_out", image_out0);
	
	copyMakeBorder(image, image_out1, 9, 9, 9, 9, BORDER_DEFAULT, Scalar(123, 123, 123));
	imshow("image_out1", image_out1);

	copyMakeBorder(image, image_out2, 9, 9, 9, 9, BORDER_WRAP, Scalar(123, 123, 123));
	imshow("image_out2", image_out2);

	copyMakeBorder(image, image_out3, 9, 9, 9, 9, BORDER_REPLICATE, Scalar(123, 123, 123));
	imshow("image_out3", image_out3);

	waitKey(0);
	return 0;
}

加边界-卷积-去边界操作：

#include 
#include 

using namespace std;
using namespace cv;



int main(int argc, char** argv) {
     
	Mat image, image_addborder, image_out;
	image = imread("C://eg//jr.jpg");
	if (image.empty()) {
     
		return -1;
	}
	imshow("image", image);
	int ksize = 3;

	copyMakeBorder(image, image_addborder, ksize / 2, ksize / 2, ksize / 2, ksize / 2, BORDER_REPLICATE, Scalar(123, 123, 123));
	imshow("image_addborder", image_addborder);


	Mat kernel = Mat::ones(Size(ksize, ksize) , CV_32F) / (float)(ksize * ksize);


	filter2D(image_addborder, image_out, -1, kernel, Point(-1, -1), (0, 0), BORDER_REPLICATE);
	imshow("image_out", image_out);


	waitKey(0);
	return 0;
}

14. 图像边缘提取

边缘是像素值发生跃迁的地方，是图像的显著特征之一，在图像特征提取、对象检测、模式识别等方面都有重要的作用。
如何捕捉/提取边缘？
对图像求导数，delta = f(x) – f(x-1), delta越大，说明像素在X方向变化越大，边缘信号越强。

14.1 Sobel算子 & Scharr算子

注意：相比sobel算子，scharr算子能计算出更小的梯度变化

处理步骤：

高斯模糊去噪声
转换为灰度图像
分别在水平梯度、垂直梯度进行计算。
取绝对值并求和，得到最终结果

相关api：
- cv::Sobel (
  InputArray Src // 输入图像
  OutputArray dst// 输出图像，大小与输入图像一致
  int depth // 输出图像深度.
  Int dx. // X方向，几阶导数
  int dy // Y方向，几阶导数.
  int ksize, SOBEL算子kernel大小，必须是1、3、5、7、
  double scale = 1
  double delta = 0
  int borderType = BORDER_DEFAULT
  )
- cv::Scharr (
  InputArray Src // 输入图像
  OutputArray dst// 输出图像，大小与输入图像一致
  int depth // 输出图像深度.
  Int dx. // X方向，几阶导数
  int dy // Y方向，几阶导数.
  double scale = 1
  double delta = 0
  int borderType = BORDER_DEFAULT
  )
- GaussianBlur( src, dst, Size(3,3), 0, 0, BORDER_DEFAULT );
- cvtColor( src, gray, COLOR_RGB2GRAY );
- addWeighted( A, 0.5,B, 0.5, 0, AB);
- convertScaleAbs(A, B)// 计算图像A的像素绝对值，输出到图像B
- saturate_cast< uchar> () //截断

#include 
#include 

using namespace std;
using namespace cv;



int main(int argc, char** argv) {
     
	Mat image, image_GaussianBlur, image_gray;
	image = imread("C://eg//2.jpg");
	if (image.empty()) {
     
		return -1;
	}
	imshow("image", image);

	GaussianBlur(image, image_GaussianBlur, Size(3, 3), 0, 0);
	cvtColor(image_GaussianBlur, image_gray, CV_BGR2GRAY);
	imshow("image_gray", image_gray);
	
	//sobel
	Mat image_sobel_x, image_sobel_y;

	Sobel(image_gray, image_sobel_x, CV_16S, 1, 0, 3);
	Sobel(image_gray, image_sobel_y, CV_16S, 0, 1, 3);

	convertScaleAbs(image_sobel_x, image_sobel_x);
	convertScaleAbs(image_sobel_y, image_sobel_y);

	Mat image_sobel = Mat(image_sobel_x.size(), image_sobel_x.type());

	int width = image_sobel_x.cols;
	int height = image_sobel_x.rows;

	for (int row = 0; row < height; row++) {
     
		for (int col = 0; col < width; col++) {
     
			int pixel_x = image_sobel_x.at <uchar>(row, col);
			int pixel_y = image_sobel_y.at <uchar>(row, col);

			image_sobel.at<uchar>(row, col) = saturate_cast<uchar>(pixel_x + pixel_y);
		}
	}
	imshow("image_sobel", image_sobel);

	//scharr
	Mat image_scharr_x, image_scharr_y;

	Scharr(image_gray, image_scharr_x, CV_16S, 1, 0, 3);
	Scharr(image_gray, image_scharr_y, CV_16S, 0, 1, 3);

	convertScaleAbs(image_scharr_x, image_scharr_x);
	convertScaleAbs(image_scharr_y, image_scharr_y);

	Mat image_scharr = Mat(image_scharr_x.size(), image_scharr_x.type());
	int width1 = image_scharr_x.cols;
	int height1 = image_scharr_x.rows;

	for (int row = 0; row < height1; row++) {
     
		for (int col = 0; col < width1; col++) {
     
			int pixel_x = image_scharr_x.at<uchar>(row, col);
			int pixel_y = image_scharr_y.at<uchar>(row, col);

			image_scharr.at<uchar>(row, col) = saturate_cast<uchar>(pixel_x + pixel_y);
		}
	}
	imshow("image_scharr", image_scharr);

	waitKey(0);
	return 0;
}

14.2 Laplance算子

处理步骤

高斯模糊去噪声
转换为灰度图像
拉普拉斯 – 二阶导数计算Laplacian()
取绝对值convertScaleAbs()，显示结果

#include 
#include 

using namespace std;
using namespace cv;



int main(int argc, char** argv) {
     
	Mat image, image_GaussianBlur, image_gray;
	image = imread("C://eg//2.jpg");
	if (image.empty()) {
     
		return -1;
	}
	imshow("image", image);

	GaussianBlur(image, image_GaussianBlur, Size(3, 3), 0, 0);
	cvtColor(image_GaussianBlur, image_gray, CV_BGR2GRAY);
	imshow("image_gray", image_gray);
	
	Mat image_laplance;
	Laplacian(image_gray, image_laplance, CV_16S, 3);
	convertScaleAbs(image_laplance, image_laplance);
	//threshold(image_laplance, image_laplance, 0, 255, THRESH_OTSU | THRESH_BINARY);

	imshow("image_laplance", image_laplance);

	waitKey(0);
	return 0;
}

14.3 Canny算子

Canny算子被很多人推崇为当今最优的边缘检测的算法。

Canny算子的流程：

高斯滤波消除噪声；
将图像转换为灰度图；
用一阶偏导的有限差分来计算梯度的幅值和方向；
对梯度幅值进行非极大值抑制；
用双阈值算法检测和连接边缘：T1， T2为阈值，凡是高于T2的都保留，凡是小于T1都丢弃，从高于T2的像素出发，凡是大于T1而且相互连接的，都保留。最终得到一个输出二值图像。
推荐的高低阈值比值为 T2: T1 = 3:1/2:1其中T2为高阈值，T1为低阈值。

相关api：
- Canny（
  InputArray src, // 8-bit的输入图像
  OutputArray edges,// 输出边缘图像，一般都是二值图像，背景是黑色
  double threshold1,// 低阈值，常取高阈值的1/2或者1/3
  double threshold2,// 高阈值
  int aptertureSize,// Soble算子的size，通常3x3，取值3
  bool L2gradient // 选择 true表示是L2来归一化，否则用L1归一化，默认选择L1。
  ）

#include 
#include 

using namespace std;
using namespace cv;

int main(int argc, char** argv) {
     
	Mat image, image_GaussianBlur, image_gray;

	int value_min = 50;
	float value_mul = 2.0;
	int value_max = 255;

	image = imread("C://eg//3.jpg");
	if (image.empty()) {
     
		return -1;
	}
	imshow("image", image);

	GaussianBlur(image, image_GaussianBlur, Size(3, 3), 0, 0);
	cvtColor(image_GaussianBlur, image_gray, CV_BGR2GRAY);
	imshow("image_gray", image_gray);

	Mat image_canny;
	Canny(image_gray, image_canny, value_min, value_min * value_mul, 3, false);
	imshow("image_canny", image_canny);

	waitKey(0);
	return 0;
}

15.基础图形检测

15.1 霍夫变换——直线检测

在边缘检测已经完成的条件下，霍夫直线变换用来做直线检测，主要是平面空间到极坐标空间转换。
直线从直角坐标系转换到极坐标系：r = xcosθ + ysinθ
可以看到，根据以上公式，同时在图像空间处于一条直线的 n个点将他们的坐标代入，会得到n个在参数空间中关于r和θ的函数，表示为图像就是n条曲线，n条曲线总会相交于同一点。图像空间中共线的点在参数空间中曲线相交于一点。
也就是说，如果一幅图像空间（x-y）中的像素构成一条直线，那么这些像素坐标值（x, y）在参数空间对应的曲线一定相交于一个点，所以我们只需要将图像空间（x-y）中的所有像素点变换成参数空间（r-θ）的曲线，并在参数空间检测曲线的交点，得到交点（r，θ）就可以确定直线了。
霍夫变换的直线检测是把图像空间中的直线变换到参数空间中的点，通过统计特性来解决检测问题。为何要用？以及如何使用统计特性？因为确定一点时，找到一个能够与这点构成直线的点有无限种可能。在现实应用里，我们就要限定（r-θ）的密度，也就是要将θ离散化。
霍夫变换检测直线的原理：

图像空间（x-y） > 参数空间（r-θ）；
将参数空间的θ离散化，并求出每个θ对应的r；
统计每个θ对应的r，并对r计数，通过计数最多的r及其θ计算出直线。

霍夫变换api：

//标准霍夫变换、多尺度霍夫变换
CV_EXPORTS_W void HoughLines( InputArray image, OutputArray lines, 
　　double rho, double theta, int threshold, 
　　double srn = 0, double stn = 0, 
　　double min_theta = 0, double max_theta = CV_PI );
　　
　　//InputArray image：输入图像，必须是8位单通道图像。 
　　//OutputArray lines：检测到的线条参数集合。 
　　//double rho：以像素为单位的距离步长。 
　　//double theta：以弧度为单位的角度步长。 
　　//int threshold：累加计数值的阈值参数，当参数空间某个交点的累加计数的值超过该阈值，则认为该交点对应了图像空间的一条直线。 
　　//double srn：默认值为0，用于在多尺度霍夫变换中作为参数rho的除数，rho=rho/srn。 
　　//double stn：默认值为0，用于在多尺度霍夫变换中作为参数theta的除数，theta=theta/stn。
　　//如果srn和stn同时为0，就表示HoughLines函数执行标准霍夫变换，否则就是执行多尺度霍夫变换。

//渐进概率式霍夫变换
CV_EXPORTS_W void HoughLinesP( InputArray image, OutputArray lines, 
　　double rho, double theta, int threshold, 
　　double minLineLength = 0, double maxLineGap = 0 ); 
　　
　　//InputArray image：输入图像，必须是8位单通道图像。 
　　//OutputArray lines：检测到的线条参数集合。 
　　//double rho：直线搜索时的距离步长，以像素为单位。 
　　//double theta：直线搜索时的角度步长，以弧度为单位。 
　　//int threshold：累加计数值的阈值参数，当参数空间某个交点的累加计数的值超过该阈值，则认为该交点对应了图像空间的一条直线。 
　　//double minLineLength：默认值为0，表示最小线段长度阈值（像素）。 
　　//double maxLineGap：线段上最近两点之间的阈值.默认值为0，表示直线断裂的最大间隔距离阈值。即如果有两条线段是在一条直线上，但它们之间有间隙，那么如果这个间隔距离小于该值，则被认为是一条线段，否则认为是两条线段。

使用霍夫变换api检测直线具体步骤：

转换为灰度图；
高斯模糊去噪；
边缘检测；
二值化（判断此处是否为直线点，就看灰度值==255）；
映射到霍夫空间（准备两个容器，一个用来展示hough-space概况，一个数组hough-space用来储存voting的值，因为投票过程往往有某个极大值超过阈值，多达几千，不能直接用灰度图来记录投票信息）；
取局部极大值，设定阈值，过滤干扰直线；
绘制直线、标定角点。

#include 
#include 

using namespace cv;
using namespace std;
int thresh_b = 128;
int main(int argc, char** argv) {
     
	Mat image, image_gray,image_GaussianBlur, image_binary, image_canny, ;
	
	image = imread("C://eg//line1.png");
	if (image.empty()) {
     
		return -1;
	}

	namedWindow("image",CV_WINDOW_AUTOSIZE);
	imshow("image", image);

	cvtColor(image, image_gray, CV_BGRA2GRAY);	
	threshold(image_gray, image_binary, thresh_b, 255, THRESH_BINARY);
	GaussianBlur(image_binary, image_GaussianBlur, Size(3, 3), 0);
	Canny(image_GaussianBlur, image_canny, 50, 100);

	vector<Vec2f> lines;
	HoughLines(image_canny, lines, 1, CV_PI / 180, 150, 0, 0);
	for (size_t i = 0; i < lines.size(); i++) {
     
		float rho = lines[i][0]; 
		float theta = lines[i][1];
		Point pt1, pt2;
		double a = cos(theta), b = sin(theta);
		double x0 = a * rho, y0 = b * rho;

		pt1.x = cvRound(x0 + 1000 * (-b)); //cvRound四舍五入
		pt1.y = cvRound(y0 + 1000 * (a));
		pt2.x = cvRound(x0 - 1000 * (-b));
		pt2.y = cvRound(y0 - 1000 * (a));
		line(image, pt1, pt2, Scalar(0, 0, 255), 1, CV_AA);
	}
	imshow("image_out0", image);

	waitKey(0);
	return 0;
}

#include 
#include 

using namespace cv;
using namespace std;
int thresh_b = 128;
int main(int argc, char** argv) {
     
	Mat image, image_gray,image_GaussianBlur, image_binary, image_canny, ;
	
	image = imread("C://eg//line1.png");
	if (image.empty()) {
     
		return -1;
	}

	namedWindow("image",CV_WINDOW_AUTOSIZE);
	imshow("image", image);

	cvtColor(image, image_gray, CV_BGRA2GRAY);	
	threshold(image_gray, image_binary, thresh_b, 255, THRESH_BINARY);
	GaussianBlur(image_binary, image_GaussianBlur, Size(3, 3), 0);
	Canny(image_GaussianBlur, image_canny, 50, 100);

	vector<Vec4f> plines;
	HoughLinesP(image_canny, plines, 1, CV_PI / 180.0, 10, 0, 10);
	Scalar color = Scalar(0, 0, 255);
	for (size_t i = 0; i < plines.size(); i++) {
     
		Vec4f hline = plines[i];
		line(image, Point(hline[0], hline[1]), Point(hline[2], hline[3]), color, 3, LINE_AA);
	}
	imshow("image_output", image);

	waitKey(0);
	return 0;
}

15.2 霍夫变换——圆

HoughCircles(
InputArray image, // 输入图像 ,必须是8位的单通道灰度图像
OutputArray circles, // 输出结果，发现的圆信息圆心坐标，圆半径
Int method, 	// 方法 - HOUGH_GRADIENT
Double dp, 		// dp = 1; 
Double mindist, // 10 最短距离-可以分辨是两个圆的，否则认为是同心圆- src_gray.rows/8
Double param1, 	// canny edge detection low threshold
Double param2, 	// 中心点累加器阈值 – 候选圆心
Int minradius, 	// 最小半径
Int maxradius	// 最大半径 
)

#include 
#include 

using namespace cv;
using namespace std;

int thresh_b = 128;

int main(int argc, char** argv) {
     
	Mat image, image_gray, image_GaussianBlur, image_binary, image_canny;
	
	image = imread("C://eg//circle.png");
	if (image.empty()) {
     
		return -1;
	}

	namedWindow("image",CV_WINDOW_AUTOSIZE);
	imshow("image", image);

	cvtColor(image, image_gray, CV_BGRA2GRAY);	
	threshold(image_gray, image_binary, thresh_b, 255, THRESH_BINARY);
	GaussianBlur(image_binary, image_GaussianBlur, Size(5, 5), 0);

	vector<Vec3f> circles;
	HoughCircles(image_GaussianBlur, circles, HOUGH_GRADIENT, 1, 10, 100, 32, 70, 125);

	for (size_t i = 0; i < circles.size(); i++) {
     
		Point center(cvRound(circles[i][0]), cvRound(circles[i][1]));
		int r = cvRound(circles[i][2]);

		circle(image, center, r, Scalar(0, 0, 255), 8, LINE_4, 0);
	}

	imshow("image_out", image);

	waitKey(0);
	return 0;
}

16. 像素重映射

17.灰度直方图

灰度直方图是表示不同灰度出现频率的图像，为柱状图；是图像的统计学特征。

17.1 直方图均衡化

目的是提高图像的对比度，拉伸图像的灰度值范围。

相关api：

equalizeHist(
InputArray src,//输入图像，必须是8-bit的单通道图像
OutputArray dst// 输出结果
)

#include 
#include 

using namespace cv;
using namespace std;

int main()
{
     
	Mat image, image_gray, image_out;

	image = imread("C://eg//4.jpg");
	if (image.empty()) {
     
		return -1;
	}
	cvtColor(image, image_gray, CV_BGR2GRAY);

	equalizeHist(image_gray, image_out);

	imshow("image", image);
	imshow("image_gray", image_gray);
	imshow("image_out", image_out);

	waitKey(0);
	return 0;
}

17.2 直方图计算

split(// 把多通道图像分为多个单通道图像
const Mat &src, //输入图像
Mat* mvbegin）// 输出的通道图像数组

calcHist(
const Mat* images,//输入图像指针
int images,// 图像数目
const int* channels,// 通道数
InputArray mask,// 输入mask，可选，不用
OutputArray hist,//输出的直方图数据
int dims,// 维数
const int* histsize,// 直方图级数
const float* ranges,// 值域范围
bool uniform,// true by default
bool accumulate// false by defaut
)

你可能感兴趣的:(opencv,计算机视觉)

YOLOv12模型详解及代码复现清风AI 深度学习算法详解及代码复现计算机视觉 YOLO 人工智能机器学习神经网络 python 算法
算法背景在计算机视觉领域不断发展壮大的背景下，YOLOv12算法应运而生。这一突破性成果源自JosephRedmon和AliFarhadi等研究人员在华盛顿大学的开创性工作。他们的目标是解决实时物体检测这一关键问题，在速度和精度之间寻求最佳平衡。YOLOv12延续了前作YOLOv1的成功理念，将其定位为一种回归问题，而非传统的区域提议+分类方法。这种创新方法不仅简化了整个检测过程，还显著提高了处理
AI大模型推理加速：技术与实践详解 AI大模型学习者人工智能
近年来，AI大模型在自然语言处理、计算机视觉等领域取得了突破性进展。然而，大模型的推理速度却成为其落地应用的瓶颈。本文将详细探讨AI大模型推理加速的技术手段和实践经验，并结合具体案例进行分析。一、挑战与机遇1.1挑战庞大的参数量:大模型通常拥有数十亿甚至数千亿个参数，例如GPT-3拥有1750亿个参数。如此庞大的参数量导致模型文件体积巨大，加载和推理都需要消耗大量的内存和计算资源。复杂的计算图:大
OpenCV图像基础天行者@ opencv 人工智能计算机视觉
OpenCV其实就是一堆C和C++语言的源代码文件,这些源代码文件中实现了许多常用的计算机视觉算法。OpenCV的全称是OpenSourceComputerVisionLibrary,是一个开放源代码的计算机视觉库OpenCV最初由英特尔公司发起并开发,以BSD许可证授权发行,可以在商业和研究领域中免费使用,现在美国WillowGarage为OpenCV提供主要的支持OpenCV可用于开发实时的图
大模型（DeepSeek等）是否会动摇AI工程师的工作？点我头像干啥 Ai 深度学习人工智能 AI编程计算机视觉
引言近年来，人工智能（AI）领域取得了突飞猛进的发展，尤其是大模型（如GPT-3、BERT、DeepSeek等）的出现，极大地推动了自然语言处理（NLP）、计算机视觉（CV）等领域的进步。大模型凭借其强大的泛化能力和广泛的应用场景，逐渐成为AI领域的核心技术之一。然而，随着大模型的普及，一个备受关注的问题浮出水面：大模型是否会动摇AI工程师的工作？本文将从多个角度探讨这一问题，分析大模型对AI工程
Java线程协作式中断机制超人汪小建(seaboat) 线程协作式中断机制 jvm
跟着作者的65节课彻底搞懂Java并发原理专栏，一步步彻底搞懂Java并发原理。作者简介：笔名seaboat，擅长工程算法、人工智能算法、自然语言处理、计算机视觉、架构、分布式、高并发、大数据和搜索引擎等方面的技术，大多数编程语言都会使用，但更擅长Java、Python和C++。平时喜欢看书写作、运动、画画。崇尚技术自由，崇尚思想自由。出版书籍：《Tomcat内核设计剖析》、《图解数据结构与算法》
Python与人工智能：为何它们是天作之合？纪至训至 python 人工智能开发语言
引言在人工智能（AI）飞速发展的今天，Python已成为这一领域的“明星语言”。从机器学习到深度学习，从自然语言处理到计算机视觉，Python的身影无处不在。那么，Python究竟为何能成为AI开发的首选工具？本文将探讨Python与AI之间的深度关联，并解析其背后的原因。1.Python的简洁性与可读性AI开发的核心在于快速迭代和实验，而Python以其简洁的语法和直观的代码结构著称。开发者无需
Python深度学习033：Python、PyTorch、CUDA和显卡驱动之间的关系若北辰 Python深度学习 python 深度学习 pytorch
Python、PyTorch、CUDA和显卡驱动之间的关系相当紧密，它们共同构成了一个能够执行深度学习模型的高效计算环境。下面是它们之间关系的简要概述：PythonPython是一种编程语言，广泛用于科学计算、数据分析和机器学习。它是开发和运行PyTorch代码的基础环境。PyTorchPyTorch是一个开源的机器学习库，用于应用如自然语言处理和计算机视觉的深度学习模型。它提供了丰富的API，使
android 基于OpenCV4.8微笑检测自动拍照 mmsx android 作业源码分享 android opencv
一，前言1、基于OpenCV4.8微笑检测自动拍照存储2、左侧有一个预览小框，有人脸时候会有红色框框。3、当真人入境时候，微笑。相机预览捕捉到了人的微笑，自动拍照保存。opencv库的编译就不说了。这篇有介绍：androidopencv导入进行编译_编译androidopencv-CSDN博客二、加载人脸特征和微笑特征文件faceCascade=loadCascade(R.raw.haarcasc
AI基于深度学习的代码搜索案例（一）人工智能MOS 人工智能深度学习机器学习
1.背景近年来，人工智能逐渐进入各个领域并展现出了强大的能力。在计算机视觉领域，以ImageNet为例，计算机的图像分类水平已经超过了人类。在自然语言处理(NLP)领域，BERT、XLNet以及MASS也一遍遍的刷新着任务榜单。当人工智能进入游戏领域，也取得了惊人的成绩，在Atari系列游戏中，计算机很容易超过了大部分人类，在围棋比赛中，AlphaGo和AlphaZero也已经超越了人类顶尖棋手。
67-OpenCVSharp 创建实现Halcon的tile_images_offset算子（用于图像拼接，对每张图像设置偏移量）搬码驿站 #opencv 计算机视觉人工智能算法图像处理
以下是基于OpenCvSharp实现的Halcontile_images_offset算子的高性能函数。该函数不仅支持图像拼接，还允许对每张图像设置偏移量（offset），以灵活布局图像。代码中包含了详细注释和性能优化策略。为了优化运行时间和性能，我们可以从以下几个方面对代码进行改进：并行处理：利用多核CPU的能力，通过Parallel.For或其他并行技术加速图像复制操作。减少边界检查开销：在确
Anaconda与VS Code wei099
最近在学习机器学习和计算机视觉，使用GoogleColab来运行网上的示例代码。考虑到网页上写代码效率太低，没有代码补全功能，没有函数提示，不利于对代码的了解，于是还是决定折腾一下在自己的Windows本上安装工作环境。想要学习机器学习的技能，不可避免要具备熟练使用Python编程的能力。Anaconda是Python软件包管理器，可以大大减少使用者安装各种包的麻烦，提高工作效率。我先后安装了An
使用Python进行火焰检测与识别：从基础理论到高级实现的全面指南快撑死的鱼 python算法解析 python 开发语言
使用Python进行火焰检测与识别：从基础理论到高级实现的全面指南火灾是一种常见而危险的自然灾害，在工业、家庭和公共场所中，实时检测火焰并做出响应是保障安全的重要手段。随着计算机视觉技术的发展，使用图像处理和机器学习的方法进行火焰检测已经成为可能。Python作为一种功能强大且广泛使用的编程语言，提供了丰富的库和工具，能够有效地实现火焰检测和识别。在本文中，我们将深入探讨如何使用Python进行火
Diffusion Transformer与Differential Transformer：技术创新与应用前景 AI大模型learner 深度学习人工智能机器学习
引言Transformer架构已成为自然语言处理（NLP）和计算机视觉（CV）领域的主流技术。随着技术的不断发展，DiffusionTransformer和DifferentialTransformer等新型架构逐步涌现，为生成模型和注意力机制带来了突破性的进展。本文旨在从科学视角探讨这两种模型的核心原理、技术特点及应用前景。DiffusionTransformer概念与原理DiffusionTr
计算机视觉算法实战——车道线检测喵了个AI 计算机视觉实战项目计算机视觉
✨个人主页欢迎您的访问✨期待您的三连✨✨个人主页欢迎您的访问✨期待您的三连✨✨个人主页欢迎您的访问✨期待您的三连✨车道线检测是计算机视觉领域的一个重要研究方向，尤其在自动驾驶和高级驾驶辅助系统（ADAS）中具有广泛应用。本文将深入探讨当前主流的车道线检测算法，选择性能最好的算法进行详细介绍，并涵盖数据集、代码实现、优秀论文、具体应用以及未来的研究方向和改进方向。1.当前相关的算法✨✨车道线检测算法
Vision Transformer (ViT)：将Transformer带入计算机视觉的革命性尝试（代码实现）阿正的梦工坊 Deep Learning DL Papers transformer 计算机视觉深度学习
VisionTransformer(ViT)：将Transformer带入计算机视觉的革命性尝试作为一名深度学习研究者，如果你对自然语言处理（NLP）领域的Transformer架构了如指掌，那么你一定不会对它在序列建模中的强大能力感到陌生。然而，2021年由GoogleResearch团队在ICLR上发表的论文《ANIMAGEISWORTH16x16WORDS:TRANSFORMERSFORIM
图像去雾常见数据集梦姐的编程日志图像处理深度学习人工智能
近年来，随着深度学习技术的快速发展，图像去雾任务成为计算机视觉领域的重要研究方向之一。高质量的数据集是算法研究的基础，本文将介绍一些常用的图像去雾数据集，包括其特点、应用场景以及下载地址。1.RESIDE数据集RESIDE（REalisticSingleImageDEhazing）数据集是目前最常用的图像去雾数据集之一。该数据集提供了多种规模的子数据集，主要分为以下几部分：IndoorTraini
点云从入门到精通技术详解100篇-基于激光雷达点云的三维目标检测格图素书目标检测人工智能计算机视觉
目录前言图像目标检测算法研究现状点云目标检测算法研究现状基于投影图的方法基于体素的方法基于点云的多模态融合方法2地面点云滤波及神经网络2.1目标检测数据集及采集设备2.1.1KITTI数据集2.1.2车载激光雷达2.2地面点云滤波算法2.2.1RANSAC算法2.2.2CSF算法本文篇幅较长，分为上下两篇，下篇详见基于激光雷达点云的三维目标检测（续）前言近几年来，在计算机视觉领域，利用深度学习卷积
探索水下视觉新境界：基于Retinex理论的水下图像增强项目葛冉忱Edith
探索水下视觉新境界：基于Retinex理论的水下图像增强项目【下载地址】基于ace-urcp-retinex的水下图像增强代码本资源文件提供了一个基于Retinex理论的水下图像增强方法的代码实现。该方法旨在消除水下图像捕捉过程中产生的色彩失真和光线散射问题，从而显著提高水下图像的可视性。Retinex理论是一种模拟人类视觉系统处理图像的计算机视觉概念。它认为，人类视觉系统通过分离物体表面反射的光
【AIGC】计算机视觉-YOLO系列家族 LeeZhao@ 计算机视觉 AIGC 计算机视觉 YOLO
YOLO系列家族（1）YOLO发展史（2）YOLOX（3）YOLOv6（4）YOLOv7（5）YOLOv8（6）YOLOv9（7）YOLOv10（8）YOLOv11（9）YOLOv12（1）YOLO发展史YOLO(YouOnlyLookOnce）是一种流行的物体检测和图像分割模型，由华盛顿大学的约瑟夫-雷德蒙（JosephRedmon）和阿里-法哈迪（AliFarhadi）开发。YOLO于2015
【视频】V4L2、ffmpeg、OpenCV中对YUV的定义郭老二视频音视频 ffmpeg opencv
1、常见的YUV格式1.1YUV420每像素16位IMC1：YYYYYYYYVV--UU–IMC3：YYYYYYYYUU--VV–每像素12位I420:YYYYYYYYUUVV=>YUV420PYV12:YYYYYYYYVVUU=>YUV420PNV12:YYYYYYYYUVUV=>YUV420SP（最受欢迎格式）NV21:YYYYYYYYVUVU=>YUV420SPIMC2：YYYYYYYYYY
整理：4篇论文介绍实时语义分割的未来，Transformer架构下的性能与效率平衡 mslion transformer 深度学习人工智能语义分割
在Transformer架构推动下，计算机视觉领域致力于打造一个极为强大且通用的大规模模型，它能处理物体检测、图像分割等多种任务。不少基于Transformer架构的研究成果显著，其通用模型在特定应用中表现出色，在图像和视频分割方面，通用设计的研究成果也超越了以往定制模型。其中，分割一切模型（SAM）在交互式分割中表现突出，能统一应对点、边界框、掩码和文本输入等交互方式。然而，多数此类研究存在弊端
计算机视觉算法实战——茶园害虫识别（主页有源码）喵了个AI 计算机视觉实战项目计算机视觉算法人工智能
✨个人主页欢迎您的访问✨期待您的三连✨✨个人主页欢迎您的访问✨期待您的三连✨✨个人主页欢迎您的访问✨期待您的三连✨1.引言茶园害虫识别是农业领域中的一个重要研究方向，旨在通过计算机视觉技术自动识别茶园中的害虫种类，从而帮助农民及时采取防治措施，减少经济损失。随着深度学习技术的快速发展，茶园害虫识别的准确性和效率得到了显著提升，为智慧农业提供了强有力的技术支持。2.当前相关算法在茶园害虫识别领域，常
计算机视觉算法实战——图像配准（主页有源码）喵了个AI 计算机视觉实战项目计算机视觉
✨个人主页欢迎您的访问✨期待您的三连✨✨个人主页欢迎您的访问✨期待您的三连✨✨个人主页欢迎您的访问✨期待您的三连✨1.领域简介图像配准（ImageRegistration）是计算机视觉中的一个重要研究方向，旨在将两幅或多幅图像在空间上对齐。这些图像可能来自不同的传感器、不同的时间或不同的视角。图像配准在医学影像、遥感、自动驾驶、机器人导航等领域有着广泛的应用。其核心目标是通过几何变换（如平移、旋转
20250310：OpenCV mat对象与base64互转微风❤水墨 AI模型部署 Mat转base64
代码：https://github.com/ReneNyffenegger/cpp-base64指南：https://renenyffenegger.ch/notes/development/Base64/Encoding-and-decoding-base-64-with-cpp/实操：
YOLOv5改进：在C3块不同位置添加EMA注意力机制，有效提升计算机视觉性能 UksApps YOLO 计算机视觉深度学习
计算机视觉中的目标检测是一个重要的任务，而YOLOv5是目前广泛应用的一种高效目标检测算法。为了进一步提升YOLOv5的性能，我们在C3块的不同位置添加了EMA（ExponentialMovingAverage）注意力机制。EMA注意力机制是一种用于提升模型的感知能力和特征表达能力的技术。在YOLOv5中，我们将EMA注意力机制嵌入到C3块中，以增强这一块的特征表示能力。下面是我们改进的YOLOv
opencv python 光流法 weixin_34241036 人工智能 python
OpticalFlow光流法光流是由对象或相机的移动引起的两个连续帧之间的图像对象的明显运动的模式.它是2D矢量场，其中每个矢量是位移矢量，表示从第一帧到第二帧的点的移动.上图表示的是一个球在连续的5帧图像中的运动,箭头显示其位移矢量.光流法原理的基础：目标像素强度在连续帧之间不变相邻像素具有相似的运动第一帧的像素I(x,y,t),在dt时间之后的下一帧中移动距离(dx，dy),因为这些像素是相同
OpenCV-Python 光流 LeonDL168 Opencv-Python opencv python 人工智能
40.1光流由于目标对象或者摄像机的移动造成的图像对象在连续两帧图像中的移动被称为光流。它是一个2D向量场，可以用来显示一个点从第一帧图像到第二帧图像之间的移动。如下图所示（ImageCourtesy:WikipediaarticleonOpticalFlow）：OpticalFlow上图显示了一个点在连续的五帧图像间的移动。箭头表示光流场向量。光流在很多领域中都很有用：•由运动重建结构•视频压缩
LeNet-5卷积神经网络详解 LChuck 深度学习人工智能神经网络深度学习数据结构计算机视觉 AIGC
LeNet-5卷积神经网络详解1.历史背景LeNet-5是由YannLeCun等人在1998年提出的一种卷积神经网络架构，是深度学习领域的一个重要里程碑。这个网络最初是为了解决手写数字识别问题而设计的，在当时取得了突破性的成果。它的成功不仅证明了卷积神经网络在计算机视觉任务中的有效性，更为后来深度学习的发展奠定了重要基础。图1：LeNet-5网络结构示意图2.网络结构LeNet-5的结构非常优雅且
【论文阅读】Learning Transferable Visual Models From Natural Language Supervision（2021） Bosenya12 论文阅读
摘要State-of-the-art（最先进的）computervisionsystems（计算机视觉系统）aretrainedtopredictafixedsetofpredeterminedobjectcategories（被训练来预测一组固定的预定对象类别）.Thisrestrictedformofsupervision（受限制的监督形式）limitstheirgenerality（通用性）
【全流程】配置 Jetson Nano 摄像头使用 GStreamer 传输 RTSP 流到本地（整合版）咚叶大人 visual studio tcp/ip 硬件架构实时音视频计算机视觉
文末附录内容：【本地编译OpenCV支持GStreamer（Windows方案）】写在前面：为什么选择GStreamer？在JetsonNano这样的微机平台中，我们选择视频流传输工具时应该综合考虑硬件兼容性、延迟、资源占用和开发效率这几个方面。以下是GStreamer与其他常见几种工具做对比：工具/框架优势局限性适用场景GStreamer✅深度整合NVIDIA硬件编码（NVENC/NVDEC）✅
矩阵求逆（JAVA）初等行变换 qiuwanchi 矩阵求逆（JAVA）
package gaodai.matrix; import gaodai.determinant.DeterminantCalculation; import java.util.ArrayList; import java.util.List; import java.util.Scanner; /** * 矩阵求逆(初等行变换) * @author 邱万迟 *
JDK timer antlove java jdk schedule code timer
1.java.util.Timer.schedule(TimerTask task, long delay)：多长时间（毫秒）后执行任务 2.java.util.Timer.schedule(TimerTask task, Date time)：设定某个时间执行任务 3.java.util.Timer.schedule(TimerTask task, long delay,longperiod
JVM调优总结 -Xms -Xmx -Xmn -Xss coder_xpf jvm 应用服务器
堆大小设置JVM 中最大堆大小有三方面限制：相关操作系统的数据模型（32-bt还是64-bit）限制；系统的可用虚拟内存限制；系统的可用物理内存限制。32位系统下，一般限制在1.5G~2G；64为操作系统对内存无限制。我在Windows Server 2003 系统，3.5G物理内存，JDK5.0下测试，最大可设置为1478m。典型设置： java -Xmx
JDBC连接数据库 Array_06 jdbc
package Util; import java.sql.Connection; import java.sql.DriverManager; import java.sql.ResultSet; import java.sql.SQLException; import java.sql.Statement; public class JDBCUtil { //完
Unsupported major.minor version 51.0（jdk版本错误） oloz java
java.lang.UnsupportedClassVersionError: cn/support/cache/CacheType : Unsupported major.minor version 51.0 (unable to load class cn.support.cache.CacheType) at org.apache.catalina.loader.WebappClassL
用多个线程处理1个List集合 362217990 多线程 thread list 集合
昨天发了一个提问，启动5个线程将一个List中的内容，然后将5个线程的内容拼接起来，由于时间比较急迫，自己就写了一个Demo，希望对菜鸟有参考意义。。 import java.util.ArrayList; import java.util.List; import java.util.concurrent.CountDownLatch; public c
JSP简单访问数据库香水浓 sql mysql jsp
学习使用javaBean，代码很烂，仅为留个脚印 public class DBHelper { private String driverName; private String url; private String user; private String password; private Connection connection; privat
Flex4中使用组件添加柱状图、饼状图等图表 AdyZhang Flex
1.添加一个最简单的柱状图 ? 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 <?xml version= "1.0"&n
Android 5.0 - ProgressBar 进度条无法展示到按钮的前面 aijuans android
在低于SDK < 21 的版本中，ProgressBar 可以展示到按钮前面，并且为之在按钮的中间，但是切换到android 5.0后进度条ProgressBar 展示顺序变化了，按钮再前面，ProgressBar 在后面了我的xml配置文件如下： [html] view plain copy <RelativeLa
查询汇总的sql baalwolf sql
select list.listname, list.createtime,listcount from dream_list as list , (select listid,count(listid) as listcount from dream_list_user group by listid order by count(
Linux du命令和df命令区别 BigBird2012 linux
1，两者区别 du，disk usage,是通过搜索文件来计算每个文件的大小然后累加，du能看到的文件只是一些当前存在的，没有被删除的。他计算的大小就是当前他认为存在的所有文件大小的累加和。
AngularJS中的$apply，用还是不用？ bijian1013 JavaScript AngularJS $apply
在AngularJS开发中，何时应该调用$scope.$apply()，何时不应该调用。下面我们透彻地解释这个问题。但是首先，让我们把$apply转换成一种简化的形式。 scope.$apply就像一个懒惰的工人。它需要按照命
[Zookeeper学习笔记十]Zookeeper源代码分析之ClientCnxn数据序列化和反序列化 bit1129 zookeeper
ClientCnxn是Zookeeper客户端和Zookeeper服务器端进行通信和事件通知处理的主要类，它内部包含两个类，1. SendThread 2. EventThread， SendThread负责客户端和服务器端的数据通信，也包括事件信息的传输，EventThread主要在客户端回调注册的Watchers进行通知处理 ClientCnxn构造方法 &
【Java命令一】jmap bit1129 Java命令
jmap命令的用法： [hadoop@hadoop sbin]$ jmap Usage: jmap [option] <pid> (to connect to running process) jmap [option] <executable <core> (to connect to a
Apache 服务器安全防护及实战 ronin47
此文转自IBM. Apache 服务简介 Web 服务器也称为 WWW 服务器或 HTTP 服务器 (HTTP Server)，它是 Internet 上最常见也是使用最频繁的服务器之一，Web 服务器能够为用户提供网页浏览、论坛访问等等服务。由于用户在通过 Web 浏览器访问信息资源的过程中，无须再关心一些技术性的细节，而且界面非常友好，因而 Web 在 Internet 上一推出就得到
unity 3d实例化位置出现布置？ brotherlamp unity教程 unity unity资料 unity视频 unity自学
问：unity 3d实例化位置出现布置？答：实例化的同时就可以指定被实例化的物体的位置,即 position Instantiate (original : Object, position : Vector3, rotation : Quaternion) : Object 这样你不需要再用Transform.Position了, 如果你省略了第二个参数(
《重构，改善现有代码的设计》第八章 Duplicate Observed Data bylijinnan java 重构
import java.awt.Color; import java.awt.Container; import java.awt.FlowLayout; import java.awt.Label; import java.awt.TextField; import java.awt.event.FocusAdapter; import java.awt.event.FocusE
struts2更改struts.xml配置目录 chiangfai struts.xml
struts2默认是读取classes目录下的配置文件，要更改配置文件目录，比如放在WEB-INF下，路径应该写成../struts.xml(非/WEB-INF/struts.xml) web.xml文件修改如下： <filter> <filter-name>struts2</filter-name> <filter-class&g
redis做缓存时的一点优化 chenchao051 redis hadoop pipeline
最近集群上有个job，其中需要短时间内频繁访问缓存，大概7亿多次。我这边的缓存是使用redis来做的，问题就来了。首先，redis中存的是普通kv，没有考虑使用hash等解结构，那么以为着这个job需要访问7亿多次redis，导致效率低，且出现很多redi
mysql导出数据不输出标题行 daizj mysql 数据导出去掉第一行去掉标题
当想使用数据库中的某些数据，想将其导入到文件中，而想去掉第一行的标题是可以加上-N参数如通过下面命令导出数据： mysql -uuserName -ppasswd -hhost -Pport -Ddatabase -e " select * from tableName" > exportResult.txt 结果为： studentid
phpexcel导出excel表简单入门示例 dcj3sjt126com PHP Excel phpexcel
先下载PHPEXCEL类文件，放在class目录下面，然后新建一个index.php文件，内容如下 <?php error_reporting(E_ALL); ini_set('display_errors', TRUE); ini_set('display_startup_errors', TRUE); if (PHP_SAPI == 'cli') die('
爱情格言 dcj3sjt126com 格言
1) I love you not because of who you are, but because of who I am when I am with you. 　　我爱你，不是因为你是一个怎样的人，而是因为我喜欢与你在一起时的感觉。 　　2) No man or woman is worth your tears, and the one who is, won‘t
转 Activity 详解——Activity文档翻译 e200702084 android UI sqlite 配置管理网络应用
activity 展现在用户面前的经常是全屏窗口，你也可以将 activity 作为浮动窗口来使用（使用设置了 windowIsFloating 的主题），或者嵌入到其他的 activity （使用 ActivityGroup ）中。当用户离开 activity 时你可以在 onPause() 进行相应的操作。更重要的是，用户做的任何改变都应该在该点上提交 ( 经常提交到 ContentPro
win7安装MongoDB服务 geeksun mongodb
1. 下载MongoDB的windows版本：mongodb-win32-x86_64-2008plus-ssl-3.0.4.zip，Linux版本也在这里下载，下载地址： http://www.mongodb.org/downloads 2. 解压MongoDB在D:\server\mongodb, 在D:\server\mongodb下创建d
Javascript魔法方法:__defineGetter__,__defineSetter__ hongtoushizi js
转载自： http://www.blackglory.me/javascript-magic-method-definegetter-definesetter/ 在javascript的类中,可以用defineGetter和defineSetter_控制成员变量的Get和Set行为例如,在一个图书类中,我们自动为Book加上书名符号: function Book(name){
错误的日期格式可能导致走nginx proxy cache时不能进行304响应 jinnianshilongnian cache
昨天在整合某些系统的nginx配置时，出现了当使用nginx cache时无法返回304响应的情况，出问题的响应头： Content-Type:text/html; charset=gb2312 Date:Mon, 05 Jan 2015 01:58:05 GMT Expires:Mon , 05 Jan 15 02:03:00 GMT Last-Modified:Mon, 05
数据源架构模式之行数据入口 home198979 PHP 架构行数据入口
注：看不懂的请勿踩，此文章非针对java，java爱好者可直接略过。一、概念行数据入口（Row Data Gateway）：充当数据源中单条记录入口的对象，每行一个实例。二、简单实现行数据入口为了方便理解，还是先简单实现： <?php /** * 行数据入口类 */ class OrderGateway { /*定义元数
Linux各个目录的作用及内容 pda158 linux 脚本
1）根目录“/” 　　根目录位于目录结构的最顶层，用斜线（/）表示，类似于 Windows 操作系统的“C:\“，包含Fedora操作系统中所有的目录和文件。　　2）/bin 　　/bin 　　目录又称为二进制目录，包含了那些供系统管理员和普通用户使用的重要 linux命令的二进制映像。该目录存放的内容包括各种可执行文件，还有某些可执行文件的符号连接。常用的命令有：cp、d
ubuntu12.04上编译openjdk7 ol_beta HotSpot jvm jdk OpenJDK
获取源码从openjdk代码仓库获取(比较慢) 安装mercurial Mercurial是一个版本管理工具。 sudo apt-get install mercurial 将以下内容添加到$HOME/.hgrc文件中，如果没有则自己创建一个： [extensions] forest=/home/lichengwu/hgforest-crew/forest.py fe
将数据库字段转换成设计文档所需的字段 vipbooks 设计模式工作正则表达式
哈哈，出差这么久终于回来了，回家的感觉真好！ PowerDesigner的物理数据库一出来，设计文档中要改的字段就多得不计其数，如果要把PowerDesigner中的字段一个个Copy到设计文档中，那将会是一件非常痛苦的事情。