隆华爱读书我不爱读书所以我没书读

基于OpenCV（C++）的简单哈哈镜实现

一、介绍

在现实生活中，哈哈镜是指一种表面凹凸不平的镜子，可以反应出人像及物体的扭曲面貌。

本文介绍如何设计变换函数对实时视频（从摄像头读取）进行变形，生成哈哈镜的效果。

具体的要求有：

①采用双线性插值进行图像重采样

②采用cv::VideoCapture读取摄像头视频，并进行实时处理和显示结果。

③优化代码执行效率，改善实时性。（需要打开编译优化，VS下使用release模式编译）。

④将使用哈哈镜过程录制成视频。

二、过程

1、读取摄像头视频并显示

第一次学习OpenCV视频文件读取，有很多没有学习过的函数和方法，参考了该教程。

读取摄像头视频需要使用到以下函数：

①读取视摄像头实时画面数据：

VideoCapture capture(0)

参数0默认是笔记本的摄像头；参数1表示外接摄像头。

②判断摄像头是否打开：

capture.isOpened()

判断视频读取或者摄像头调用是否成功，成功则返回true。

③将画面读取到Mat帧：

capture.read(frame)

如果没有读取帧到Mat对象，那么会返回0。在C++语法下也可以直接使用capture >> frame

④将画面停留、阻塞：

waitKey(20)

“20”表示延时为20ms，相当于1s内显示50帧的画面。

在之前实验中waitKey一般设置为waitKey()或者waitKey(0)，意思都是让画面永久停留。

同时waitKey也会等待键盘输入并将当前字符的ASCII码对应的十进制值返回。

在该实验中，如果仍然设置为永久停留，那么函数将一直阻塞，相当于一直阻塞在第一帧数据中，即画面会停留在一个画面的。所以这里需要设置阻塞时间。

阻塞时间越短，那么摄像头读取的实时画面帧率也会越高，视频也会越流畅。但是帧率越高，后续哈哈镜处理的时间成本也越大，导致延迟增加。同时人所能感受到的帧率是有限的，一般动画为24帧/秒，因此这里设置20ms即可。

将上面函数组合起来使用：

Mat frame;
VideoCapture capture(0);//读取视摄像头实时画面数据，0默认是笔记本的摄像头；如果是外接摄像头，这里改为1
while (capture.isOpened())//判断摄像头是否打开
{   
    //读取当前帧
    if (!capture.read(frame))//相当于 capture >> frame
    {
        cout << "摄像头断开连接或视频读取完成..." << endl;
        break;
    }
    if (!frame.empty())//判断输入的视频帧是否为空的
        imshow("window", frame); //在window窗口显示frame摄像头数据画面
    char key = waitKey(20);//延时20ms，相当于1s内显示50帧的画面
    if (key == 27)//输入"Ese"键则退出
        break;
}

capture.release();     //释放摄像头资源
destroyAllWindows();   //释放全部窗口

运行上面函数就可以测试自己的摄像头了，这时候对摄像头读取出来的一帧一帧画面是没有作任何处理直接显示出来的。一般来说此时运行是很流畅的，基本感觉不到延迟。

在该实验中我们设置了key=27（也就是ESE的ASC码）时才会终止。这里需要注意，无论设置成key='q'还是其他的键，都必须使用鼠标点击一下跳出来的视频窗口，激活这个窗口后输入设置的键才能触发（不是点黑框框的终端窗口，是点击有视频的“window”）。

同时因为上面函数有while(1)循环，因此如果直接关掉窗口是不会停止的，会接着再次弹出一个窗口。而如果直接中断终端，那么VS会报异常。正确的关闭方法是使用ESE键正常终止或直接点击VS里的强制终止进程。

所以整个过程思路就是：

①定义一个Mat数据容器frame用来存放摄像头的实时画面数据，使用 VideoCapture函数来获取摄像头的实时画面数据；

②把VideoCapture函数读取的摄像头数据，写到Mat数据容器frame，读取的是当前帧；

③判断frame是否为空，如果不为空，用一个窗口显示摄像头的画面；

④释放资源。

上述摄像头读取出来的画面与我们生活中的场景是相同的，但我们日常习惯了镜像后的画面。因此将原有的画面进行镜像，即上下不变，左右相反，方法如下：

void mirroY(Mat src, Mat& dst)//将src图像镜像变换到dst
{
    dst = src.clone();
    int cols = src.cols;
    for (int i = 0; i < cols; i++)//对于每一列都相反
        src.col(cols - 1 - i).copyTo(dst.col(i));
}

2、对实时视频进行变形

上面只是对摄像头读取出来的画面进行了一次镜像翻转，接下来需要继续对画面进行处理。

2.1 凸透镜变换映射函数

哈哈镜放大效果的基本原理是图像的中心区域呈现类似凸透镜效果。简单来说就是变形后的图像的像素点位置映射到原有的图像上时，要更加靠近中心区域。

哈哈镜的实现原理如下：

假设输入图像的宽高为，图像中心点的坐标，可知满足如下关系：

$cx=\frac{w}{2},cy=\frac{h}{w}$

因为哈哈镜转化后的图像宽高不变，因此上述对于原图像和转化后的图像都是满足的。

那么变换后的图像中任意一点到中心点的距离为:

$d=\sqrt{(x'-cx)^2+(y'-cy)^2}$

设拉伸变换的中心区域的半径为，可以理解为是哈哈镜的范围大小。

对于变换后与原图像的映射关系如下：

$x=(x'-cx)*\frac{d}{r}+cx$

$y=(y'-cx)*\frac{d}{r}+cy$

上面的坐标采用的是直角坐标系。我们程序中对于某一点的坐标使用的是二维数组，因此对于，事实上表示的直角坐标是。

函数的实现过程如下：

void transformImg()
{
    int h = img_transformed.rows;
    int w = img_transformed.cols;
    float center_x = (float)w / 2;
    float center_y = (float)h / 2;
    float radius = 300;//该值可以自行定义，它决定了哈哈镜中心放大区域的大小，当图像很大时，应该相应的调大
    float dx, dy, distance, x_, y_;
    for (int y = 0; y < h; y++)
    {
        for (int x = 0; x < w; x++)
        {
            dx = x - center_x;
            dy = y - center_y;
            distance = dx * dx + dy * dy;
            if (distance < radius * radius)
            {
                x_ = dx * sqrt(distance) / radius + center_x;
                y_ = dy * sqrt(distance) / radius + center_y;
                //双线性插值
                /.../
            }
            else
            {
                img_transformed.at(y, x)[0] = img_mirro.at(y, x)[0];
                img_transformed.at(y, x)[1] = img_mirro.at(y, x)[1];
                img_transformed.at(y, x)[2] = img_mirro.at(y, x)[2];
            }
        }
    }
}

上述代码中没有写完全，双线性插值部分在下面部分补充。

上面计算出的可能是含有小数的，如，在原图像上是找不到这样的位置的，需要进行处理。可以直接使用NN（最近邻）算法，也就是将上述位置四舍五入为，但这样误差较大，会出现较多模糊点。这里使用双线性插值进行重采样。

为了不对程序数组中的索引造成混淆，后续用表示坐标。

2.2 双线性插值

思路是计算出这个点的周围四个点（左上，右上，左下，右下）的像素值，设为

$px_{(y_1,x_1)}=a,px_{(y_1,x_2)}=b,px_{(y_2,x_1)}=c,px_{D(y_2,x_2)}=d$

先进行2次水平方向的线性插值:

之间的插值:

$e=a+\frac{x-x_1}{x_2-x_1}\cdot(b-a)$

之间的插值:

$f=c+\frac{x-x_1}{x_2-x_1}\cdot(d-c)$

再进行1次竖直方向的线性插值：

$g=e+\frac{y-y_1}{y_2-y_1}\cdot(f-e)$

由此得到该位置的像素值。

并不是所有映射后的像素点都需要2次水平插值1次竖直插值，对于整数位置的像素点可能只需要1次水平或竖直插值，或者不需要插值。

//双线性插值
int x1, y1, x2, y2;
//计算该点周围的四个点(y1,x1),(y1,x2),(y2,x1),(y2,x2)
x1 = (int)x_;
x2 = (x_ - x1 == 0) ? x1 : x1 + 1;
y1 = (int)y_;
y2 = (y_ - y1 == 0) ? y1 : y1 + 1;
//小数部分
float dt_x, dt_y;
dt_x = x_ - x1;
dt_y = y_ - y1;
for (int i = 0; i < 3; i++)
{
    int a = img_mirro.at(y1, x1)[i];
    int b = img_mirro.at(y1, x2)[i];
    int c = img_mirro.at(y2, x1)[i];
    int d = img_mirro.at(y2, x2)[i];
    //2次水平插值
    float e = a + (b - a) * dt_x;
    float f = c + (d - c) * dt_x;
    //1次竖直插值
    float g = e + (f - e) * dt_y;
    img_transformed.at(y, x)[i] = (int)g;
}

2.3 程序运行

可以看到范围内的区域形成了凸透镜的效果，而范围外的区域没有变化，形成了哈哈镜的效果。

3、代码优化

上述算法执行时，是在遍历每一个位置时才计算映射到原图像的位置。

对于相同尺寸大小的画面，摄像头采集到的各个帧的画面中点的映射位置是一样的。如果对于每一帧都要进行了重复的运算，那么会产生较大延迟。

因此只需在处理第一帧时计算映射位置并存储该映射的位置，后续每一帧都直接取出该映射位置即可。

创建全局变量的结构体数组pos：

bool first;
struct position
{
    int x1, x2, y1, y2;
    float dt_x, dt_y;
};
position pos[2000][2000];

修改后的函数如下：

void transformImg()
{
    int h = img_transformed.rows;
    int w = img_transformed.cols;
    float center_x = (float)w / 2;
    float center_y = (float)h / 2;
    float radius = 300;//该值可以自行定义，它决定了哈哈镜中心放大区域的大小，当图像很大时，应该相应的调大

    float dx, dy, distance, x_, y_;
    
    for (int y = 0; y < h; y++)
    {
        for (int x = 0; x < w; x++)
        {
                dx = x - center_x;
                dy = y - center_y;
                distance = dx * dx + dy * dy;
                if (distance < radius * radius)
                {
                    if (!first)//只会在第一帧时计算
                    {
                        x_ = dx * sqrt(distance) / radius + center_x;
                        y_ = dy * sqrt(distance) / radius + center_y;
                        //双线性插值
                        //计算该点周围的四个点(y1,x1),(y1,x2),(y2,x1),(y2,x2)
                        pos[y][x].x1 = (int)x_;
                        pos[y][x].x2 = (x_ - pos[y][x].x1 == 0) ? pos[y][x].x1 : pos[y][x].x1 + 1;
                        pos[y][x].y1 = (int)y_;
                        pos[y][x].y2 = (y_ - pos[y][x].y1 == 0) ? pos[y][x].y1 : pos[y][x].y1 + 1;
                        //小数部分
                        pos[y][x].dt_x = x_ - pos[y][x].x1;
                        pos[y][x].dt_y = y_ - pos[y][x].y1;
                    }
                    for (int i = 0; i < 3; i++)
                    {
                        int a = img_mirro.at(pos[y][x].y1, pos[y][x].x1)[i];
                        int b = img_mirro.at(pos[y][x].y1, pos[y][x].x2)[i];
                        int c = img_mirro.at(pos[y][x].y2, pos[y][x].x1)[i];
                        int d = img_mirro.at(pos[y][x].y2, pos[y][x].x2)[i];
                        //2次水平插值
                        float e = a + (b - a) * pos[y][x].dt_x;
                        float f = c + (d - c) * pos[y][x].dt_x;
                        //1次竖直插值
                        float g = e + (f - e) * pos[y][x].dt_y;
                        img_transformed.at(y, x)[i] = (int)g;
                    }
                }
                else
                {
                    img_transformed.at(y, x)[0] = img_mirro.at(y, x)[0];
                    img_transformed.at(y, x)[1] = img_mirro.at(y, x)[1];
                    img_transformed.at(y, x)[2] = img_mirro.at(y, x)[2];
                }
        }
    }
    if (!first)//后续的帧不再进行计算
        first = 1;
}

4、release模式编译

没有打开编译优化时，优化后的代码依然有延迟。

刚开始改用release模式编译的时候，将debug模式下的属性表复制到了release模式的属性表，没有显示找不到库，但是个别函数显示无法解析的错误。

经过查找资料后发现，有两个原因：

①debug模式和Release模式配置不一样，需要单独配置。debug模式附加依赖项比Release模式多了一个“d”, Debug模式是：opencv_world460d.lib，release模式是opencv_world460.lib

②debug模式代码生成运行库是多线程调试 DLL (/MDd)，release模式是：多线程调试 DLL (/MD)

将上述问题修改完后，即可成功运行。经过编译优化之后，基本感觉不到延迟，实时性有了很大提升。

具体效果见自己测试的视频。

5、保存视频

OpenCV提供VideoWriter类写视频文件，类的构造函数可以指定文件名、播放帧率、帧尺寸、是否创建彩色视频。

VideoWriter函数参数如下：

VideoWriter(filename, fourcc, fps, frameSize, isColor)

①参数filename：保存的文件的路径/文件名，默认保存在当前文件夹下

②参数fourcc：指定编码器

fourcc 指定编码器有如下几种：

CV_FOURCC('P', 'I', 'M', '1') = MPEG-1 code

CV_FOURCC('M', 'J', 'P', 'G') = motion-jpeg codec

CV_FOURCC('M', 'P', '4', '2') = MPEG-4.2 codec

CV_FOURCC('D', 'I', 'V', '3') = MPEG-4.3 codec

CV_FOURCC('D', 'I', 'V', 'X') = MPEG-4 codec

CV_FOURCC('U', '2', '6', '3') = H263 codec

CV_FOURCC('I', '2', '6', '3') = H263I codec

CV_FOURCC('F', 'L', 'V', '1') = FLV1 codec

③参数fps：要保存的视频的帧率，即1秒多少帧

④参数frameSize：要保存的文件的画面尺寸

⑤参数isColor：指示是黑白画面还是彩色的画面，1表示彩色，0表示黑白。

需要注意的是：

        ①写入视频前需安装对应的编解码器
        ②生成视频是否支持彩色应与构造函数设置一致
        ③生成视频尺寸需与读取视频尺寸一致

以下是创建过程：

int codec = VideoWriter::fourcc('M', 'J', 'P', 'G'); // 选择编码格式
double fps = 30.0; //设置视频帧率
string filename = "哈哈镜vedio.avi"; //保存的视频文件名称
Size size0 = Size(capture.get(CAP_PROP_FRAME_WIDTH), capture.get(CAP_PROP_FRAME_HEIGHT));
VideoWriter writer(filename, codec, fps, size0, 1); //创建保存视频文件的视频流

//也可以创建时不指定参数VideoWriter writer，然后调用writer.open();

然后在显示图片之前调用如下函数即可保存到writer中：

writer << img;//写入writer保存视频
//或writer.write(img)

在最后退出后，会自动生成名为“哈哈镜vedio.avi”的视频文件，点击即可播放。

三、代码

#include   
#include
using namespace std;
using namespace cv;

Mat img, img_mirro, img_transformed;
bool first;
struct position
{
    int x1, x2, y1, y2;
    float dt_x, dt_y;
};
position pos[2000][2000];


void mirroY(Mat src, Mat& dst)//将src图像镜像变换到dst
{
    dst = src.clone();
    int cols = src.cols;
    for (int i = 0; i < cols; i++)//对于每一列都相反
        src.col(cols - 1 - i).copyTo(dst.col(i));
}

void transformImg()
{
    int h = img_transformed.rows;
    int w = img_transformed.cols;
    float center_x = (float)w / 2;
    float center_y = (float)h / 2;
    float radius = 300;//该值可以自行定义，它决定了哈哈镜中心放大区域的大小，当图像很大时，应该相应的调大

    float dx, dy, distance, x_, y_;
    
    for (int y = 0; y < h; y++)
    {
        for (int x = 0; x < w; x++)
        {
                dx = x - center_x;
                dy = y - center_y;
                distance = dx * dx + dy * dy;
                if (distance < radius * radius)
                {
                    if (!first)//只会在第一帧时计算
                    {
                        x_ = dx * sqrt(distance) / radius + center_x;
                        y_ = dy * sqrt(distance) / radius + center_y;
                        //双线性插值
                        //计算该点周围的四个点(y1,x1),(y1,x2),(y2,x1),(y2,x2)
                        pos[y][x].x1 = (int)x_;
                        pos[y][x].x2 = (x_ - pos[y][x].x1 == 0) ? pos[y][x].x1 : pos[y][x].x1 + 1;
                        pos[y][x].y1 = (int)y_;
                        pos[y][x].y2 = (y_ - pos[y][x].y1 == 0) ? pos[y][x].y1 : pos[y][x].y1 + 1;
                        //小数部分
                        pos[y][x].dt_x = x_ - pos[y][x].x1;
                        pos[y][x].dt_y = y_ - pos[y][x].y1;
                    }
                    for (int i = 0; i < 3; i++)
                    {
                        int a = img_mirro.at(pos[y][x].y1, pos[y][x].x1)[i];
                        int b = img_mirro.at(pos[y][x].y1, pos[y][x].x2)[i];
                        int c = img_mirro.at(pos[y][x].y2, pos[y][x].x1)[i];
                        int d = img_mirro.at(pos[y][x].y2, pos[y][x].x2)[i];
                        //2次水平插值
                        float e = a + (b - a) * pos[y][x].dt_x;
                        float f = c + (d - c) * pos[y][x].dt_x;
                        //1次竖直插值
                        float g = e + (f - e) * pos[y][x].dt_y;
                        img_transformed.at(y, x)[i] = (int)g;
                    }
                }
                else
                {
                    img_transformed.at(y, x)[0] = img_mirro.at(y, x)[0];
                    img_transformed.at(y, x)[1] = img_mirro.at(y, x)[1];
                    img_transformed.at(y, x)[2] = img_mirro.at(y, x)[2];
                }
        }
    }
    if (!first)//后续的帧不再进行计算
        first = 1;
}

int main(int argc, char** argv)
{
    VideoCapture capture(0);//读取视摄像头实时画面数据，0默认是笔记本的摄像头；如果是外接摄像头，这里改为1

    int codec = VideoWriter::fourcc('M', 'J', 'P', 'G'); // 选择编码格式
    double fps = 30.0; //设置视频帧率
    string filename = "哈哈镜vedio.avi"; //保存的视频文件名称
    Size size0 = Size(capture.get(CAP_PROP_FRAME_WIDTH), capture.get(CAP_PROP_FRAME_HEIGHT));
    VideoWriter writer(filename, codec, fps, size0, 1); //创建保存视频文件的视频流
    //也可以创建时不指定参数，然后调用writer.open(); 

    while (capture.isOpened())//判断摄像头是否打开
    {   
        //读取当前帧
        if (!capture.read(img))//相当于 capture >> frame
        {
            cout << "摄像头断开连接或视频读取完成..." << endl;
            break;
        }
        if (!img.empty())//判断输入的视频帧是否为空的
        {
            mirroY(img, img_mirro);//对原图像镜像
            img_transformed = Mat::zeros(img_mirro.size(), img_mirro.type());
            //转换图像
            transformImg();
            writer << img_transformed;//写入writer保存视频，或writer.write(img)
            imshow("哈哈镜", img_transformed); //在window窗口显示frame摄像头数据画面
        }
        char key = waitKey(20);//延时20ms，相当于1s内显示50帧的画面
        if (key == 27)//输入"Ese"键则退出
            break;
    }

    capture.release();     //释放摄像头资源
    destroyAllWindows();   //释放全部窗口

	return 0;
}

FPGA小白到项目实战：Verilog+Vivado全流程通关指南（附光学类岗位技能映射）阿牛的药铺算法移植部署 fpga开发 verilog
FPGA小白到项目实战：Verilog+Vivado全流程通关指南（附光学类岗位技能映射）引言：为什么这个FPGA入门路线能帮你快速上岗？本文设计了一条**"Verilog语法→工具链操作→光学项目实战→岗位技能对标"的阶梯式学习路径。不同于泛泛而谈的FPGA教程，我们聚焦光学类产品开发**核心能力（时序接口设计、图像处理算法移植、高速接口应用），通过3个递进式项目（从LED闪烁到图像边缘检测），
PyTorch & TensorFlow速成复习：从基础语法到模型部署实战（附FPGA移植衔接）阿牛的药铺算法移植部署 pytorch tensorflow fpga开发
PyTorch&TensorFlow速成复习：从基础语法到模型部署实战（附FPGA移植衔接）引言：为什么算法移植工程师必须掌握框架基础？针对光学类产品算法FPGA移植岗位需求（如可见光/红外图像处理），深度学习框架是算法落地的"桥梁"——既要用PyTorch/TensorFlow验证算法可行性，又要将训练好的模型（如CNN、目标检测）转换为FPGA可部署的格式（ONNX、TFLite）。本文采用"
霍夫变换（Hough Transform）算法原来详解和纯C++代码实现以及OpenCV中的使用示例点云SLAM 算法图形图像处理算法 opencv 图像处理与计算机视觉算法直线提取检测目标检测霍夫变换算法
霍夫变换（HoughTransform）是一种经典的图像处理与计算机视觉算法，广泛用于检测图像中的几何形状，例如直线、圆、椭圆等。其核心思想是将图像空间中的“点”映射到参数空间中的“曲线”，从而将形状检测问题转化为参数空间中的峰值检测问题。一、霍夫变换基本思想输入：边缘图像（如经过Canny边缘检测）输出：一组满足几何模型的形状（如直线、圆）关键思想：图像空间中的一个点→参数空间中的一个曲线参数空
用OpenCV标定相机内参应用示例（C++和Python）
下面是一个完整的使用OpenCV进行相机内参标定（CameraCalibration）的示例，包括C++和Python两个版本，基于棋盘格图案标定。一、目标：相机标定通过拍摄多张带有棋盘格图案的图像，估计相机的内参：相机矩阵（内参）K畸变系数distCoeffs可选外参（R,T）标定精度指标（如重投影误差）二、棋盘格参数设置（根据自己的棋盘格设置）：棋盘格角点数：9x6（内角点，9列×6行）；每个
被动降噪的概念及编程实现 CodeByte 人工智能算法 javascript 编程
被动降噪是指通过编程技术和算法，对输入的数据进行处理，以减少或消除其中的噪声。噪声可以是各种形式的干扰，例如来自传感器、通信信号或其他外部源的干扰。在本文中，我们将探讨被动降噪的意义以及如何使用编程来实现这一目标。被动降噪的意义：噪声对数据的准确性和可靠性产生负面影响。在许多应用领域，例如图像处理、音频处理和信号处理中，噪声的存在可能导致数据质量下降，使得后续的分析和处理变得困难。因此，被动降噪技
目标检测（object detection）加油吧zkf 目标检测目标检测人工智能计算机视觉
目标检测作为计算机视觉的核心技术，在自动驾驶、安防监控、医疗影像等领域发挥着不可替代的作用。本文将系统讲解目标检测的概念、原理、主流模型、常见数据集及应用场景，帮助读者构建对这一技术的完整认知。一、目标检测的核心概念目标检测（ObjectDetection）是指在图像或视频中自动定位并识别出所有感兴趣的目标的技术。它需要解决两个核心问题：分类（Classification）：确定图像中每个目标的类
微算法科技的前沿探索：量子机器学习算法在视觉任务中的革新应用 MicroTech2025 量子计算算法
在信息技术飞速发展的今天，计算机视觉作为人工智能领域的重要分支，正逐步渗透到我们生活的方方面面。从自动驾驶到人脸识别，从医疗影像分析到安防监控，计算机视觉技术展现了巨大的应用潜力。然而，随着视觉任务复杂度的不断提升，传统机器学习算法在处理大规模、高维度数据时遇到了计算瓶颈。在此背景下，量子计算作为一种颠覆性的计算模式，以其独特的并行处理能力和指数级增长的计算空间，为解决这一难题提供了新的思路。微算
Android 图像处理 - Bitmap 图像处理观察记录（基本图像复制、带目录创建的图像复制、字节流处理的图像复制、并发图像复制、单线程池顺序图像复制）
Bitmap图像处理观察记录1、基本图像复制从应用内部存储目录读取test.png使用BitmapFactory解码为Bitmap对象将Bitmap重新压缩保存为newTest.png操作成功，compress返回trueFilefile=newFile(getFilesDir(),"test.png");StringabsolutePath=file.getAbsolutePath();Bitm
OpenCV图像数据处理:convertTo,normalize和scaleAdd luofeiju OpenCV函数实战 opencv
在OpenCV图像处理的世界里，有几个函数进行一些基本数据变换：cv::convertTo()：类型转换与线性缩放；cv::normalize()：归一化处理；cv::scaleAdd()：加权叠加运算。cv::addWeighted():与scaleAdd相似，进行加权叠加运算；一、cv::convertTo()：线性变换+数据类型转换voidcv::Mat::convertTo(OutputA
Matplotlib-图像处理与可视化
Matplotlib-图像处理与可视化一、图像数据的本质：从数组到像素二、基础操作：加载与显示图像1.加载图像数据2.显示单张图像3.显示灰度图像三、进阶可视化：通道分离与色彩调整1.分离RGB通道2.调整亮度与对比度四、实用技巧：色彩映射与像素值分析1.自定义色彩映射（Colormap）2.像素值分布直方图五、多图对比与标注：算法结果可视化1.边缘检测结果对比2.图像标注：突出感兴趣区域六、注意
用Python和OpenCV从零搭建一个完整的双目视觉系统（三） presenttttt 双目立体视觉数码相机
本系列文章旨在系统性地阐述如何利用Python与OpenCV库，从零开始构建一个完整的双目立体视觉系统。本项目github地址：https://github.com/present-cjn/stereo-vision-python.git在上一篇文章中，我们为项目设计了清晰的架构。现在，我们将深入第一个，也是整个双目视觉系统最关键的模块——相机标定(CameraCalibration)。如果说双目
（一）OpenCV——噪声去除（降噪）
高斯滤波器（针对高斯噪声）高斯噪声是指它的概率密度函数服从高斯分布（即正态分布）的一类噪声。常见的高斯噪声包括起伏噪声、宇宙噪声、热噪声和散粒噪声等等。高斯滤波(Gaussianfilter)包含许多种，包括低通、带通和高通等，我们通常图像上说的高斯滤波，指的是高斯模糊(GaussianBlur)，是一种高斯低通滤波，其过滤调图像高频成分（图像细节部分），保留图像低频成分（图像平滑区域），所以对图
前端开发常见问题
技术文章大纲性能优化问题页面加载速度慢的常见原因及解决方案渲染阻塞资源的处理方法图片与媒体文件优化策略懒加载与代码分割的实现方式浏览器兼容性问题不同浏览器对CSS特性的支持差异JavaScriptAPI的兼容性处理方案Polyfill的使用场景与实现方法自动化测试工具在兼容性测试中的应用响应式设计挑战移动端与桌面端布局适配问题媒体查询的最佳实践方案视口单位与相对单位的正确使用高DPI屏幕的图像处理
OpenCV图片操作100例：从入门到精通指南（1）总有刁民想爱朕ha opencv 计算机视觉人工智能
OpenCV图片操作100例：从入门到精通指南本文整理了100个OpenCV实用技巧，涵盖图像处理各个领域，助你轻松掌握计算机视觉核心技能！一、入门必备：基础操作1.图像读写与显示importcv2#读取图像（BGR格式）img=cv2.imread('image.jpg')#显示图像cv2.imshow('示例图片',img)cv2.waitKey(0)#按任意键退出cv2.destroyAll
OpenCV图片操作100例：从入门到精通指南（3）总有刁民想爱朕ha opencv 人工智能计算机视觉
高效学习路径：1️⃣分阶段学习：入门：1-20例（基础操作）进阶：21-50例（图像处理）高级：51-100例（计算机视觉）2️⃣项目驱动学习：证件照背景替换（1-15例）停车场车位检测（30-45例）视频运动追踪（70-85例）3️⃣性能优化技巧：#使用UMat加速图像处理umat_img=cv2.UMat(img)processed=cv2.GaussianBlur(umat_img,(5,5
Python OpenCV教程从入门到精通的全面指南【文末送书】一键难忘 python opencv 开发语言
文章目录PythonOpenCV从入门到精通1.安装OpenCV2.基本操作2.1读取和显示图像2.2图像基本操作3.图像处理3.1图像转换3.2图像阈值处理3.3图像平滑4.边缘检测和轮廓4.1Canny边缘检测4.2轮廓检测5.高级操作5.1特征检测5.2目标跟踪5.3深度学习与OpenCVPythonOpenCV从入门到精通【文末送书】PythonOpenCV从入门到精通OpenCV(Ope
OpenCV入门到精通：AI视觉处理的完整指南 AI云原生与云计算技术学院人工智能 opencv 计算机视觉 ai
OpenCV入门到精通：AI视觉处理的完整指南关键词：OpenCV、计算机视觉、图像预处理、目标检测、AI视觉应用摘要：本文是一份面向AI视觉爱好者的OpenCV完整学习指南。从OpenCV的核心概念讲起，结合生活案例、代码示例和项目实战，逐步拆解图像读取/显示、灰度化、边缘检测、目标检测等关键技术。无论你是想入门计算机视觉的新手，还是希望用OpenCV解决实际问题的开发者，都能通过本文掌握从理论
CNN 猫狗识别：从理论到实战的深度解析爱熬夜的小古 cnn 深度学习人工智能
在计算机视觉领域，卷积神经网络（ConvolutionalNeuralNetwork，CNN）凭借其强大的特征提取和模式识别能力，成为图像分类任务的主流技术。猫狗识别作为经典的图像分类问题，不仅能帮助我们理解CNN的工作原理，还能为实际应用提供技术支持。本文将深入探讨CNN在猫狗识别中的应用，从理论基础到实战代码，带你全面掌握这项技术。一、CNN基础理论概述（一）CNN的核心组件卷积层：是CNN的
OpenCV入门到精通：从基础到实战的全面指南
摘要：本文旨在为初学者和有一定经验的开发者提供OpenCV从入门到精通的全面指南。文章首先介绍了OpenCV的基本概念和安装方法，然后深入讲解了图像处理基础、特征检测与匹配、视频处理与分析等核心内容，最后通过实战案例展示了OpenCV在计算机视觉任务中的应用。关键词：OpenCV；图像处理；特征检测；视频分析；实战案例引言OpenCV（OpenSourceComputerVisionLibrary
libjpeg-turbo图片解码 VS opencv momomo_mocs opencv 人工智能计算机视觉
#include#include#includestd::pairJpegTurboDecode(conststd::string&raw_jpeg_data,std::vector*result_data){if(nullptr==result_data){LOG(INFO)(const_cast(raw_jpeg_data.data())),raw_jpeg_data.size(),&widt
OpenCV探索之旅：多尺度视觉与形状的灵魂--图像金字塔与轮廓分析
在我们学会用Canny算法勾勒处世界的轮廓之后，一个更深层次的问题摆在了面前：这些由像素组成的线条，如何才能被赋予“生命”，成为我们能够理解和分析的“形状”？如果一个物体在图像中时大时小，我们又该如何稳定地识别它？欢迎来到本次的探索之旅。我们将建造两种强大的“金字塔”，赋予我们跨越尺度的“鹰之眼”；然后，我们将不仅仅是找到轮廓，更要深入其内部，测量它的面积、周长，找到它的重心，甚至量化它的“形状”
【零基础学AI】第31讲：目标检测 - YOLO算法 1989 0基础学AI 人工智能目标检测 YOLO rnn lstm tensorflow
本节课你将学到YOLO算法的核心思想和工作原理如何使用YOLO进行物体检测构建一个简单的物体检测系统开始之前环境要求Python3.8+需要安装的包：opencv-python,numpy,matplotlib硬件要求：推荐使用GPU（非必须）前置知识基本Python编程能力了解卷积神经网络（CNN）的基本概念（第24讲内容）核心概念什么是目标检测？目标检测就像教计算机"看"图片中的物体。它不仅要
三维表面轮廓仪的维护保养是确保其长期稳定运行的关键 CHOTEST中图仪器显微测量技术和微观形貌分析仪器轮廓尺寸测量系列轮廓仪白光干涉光学测量仪
三维表面轮廓仪是一种高精度测量设备，用于非接触式或接触式测量物体表面的三维形貌、粗糙度、台阶高度、纹理特征等参数。其主要基于光学原理进行测量。它利用激光或其他光源投射到被测物体表面，通过接收反射光或散射光，结合计算机图像处理技术，获取物体表面的三维坐标数据。这些数据可以进一步用于分析物体表面的形状、粗糙度、纹理等特征。广泛应用于材料科学、半导体制造、精密机械、生物医学、纳米技术等领域，是质量控制、
【人工智能面经第五期：模型训练与优化核心面试深度问答】码上有前 Pytorch Python 深度学习人工智能面试职场和发展
作者：“码上有前”文章简介：人工智能面经欢迎小伙伴们点赞、收藏⭐、留言模型训练与优化核心面试深度问答摘要围绕模型训练与优化的训练技巧（正则化、迁移学习）和数据工程（数据增强、标注质量）展开，通过20个关键问题，解析正则化协同策略、迁移学习适配场景、数据增强实践等核心要点，助力读者掌握人工智能与计算机视觉岗位面试中模型训练优化的知识体系，明晰技术原理与实际应用的关联。目录训练技巧-正则化策略相关问题
【python实用小脚本-135】Python 实现图像卡通化：轻松将照片转换为卡通风格 Kyln.Wu Python python opencv 开发语言
引言在数字图像处理领域，将普通照片转换为卡通风格的效果一直备受关注。无论是为了制作个性化的头像、设计创意海报，还是单纯为了娱乐，卡通化效果都能为图像增添趣味性和艺术感。然而，手动使用图像编辑软件（如Photoshop）进行卡通化处理，不仅操作复杂，而且需要一定的设计技巧。假设你是一位社交媒体爱好者，想要将自己的照片转换成卡通风格，用作头像或分享。手动处理不仅耗时，而且效果可能不尽如人意。这种情况下
带印章的财务报表有什么工具可以解析？ TextIn智能文档云平台文档解析人工智能 textin
TextIn的文档解析工具可以解决财务报表的精准解析。不止印章，TextIn文档解析可以将文档中的复杂表格、手写笔记、图片印章等进行梳理，转换成大模型友好的内容格式（Markdown）。日常财务报表中常见手写签名、批注及各类印章覆盖，对传统OCR识别构成巨大挑战。TextIn文档解析具备强大的图像处理与文字识别能力，能有效分离背景印章干扰，清晰辨识覆盖文字，并对潦草、连笔的手写体保持较高的识别准确
OpenCV颜色矩哈希算法------cv::img_hash::ColorMomentHash
操作系统：ubuntu22.04OpenCV版本：OpenCV4.9IDE:VisualStudioCode编程语言：C++11算法描述该类实现了颜色矩哈希算法（ColorMomentHash），用于图像相似性比较。它基于图像在HSV颜色空间中的颜色矩统计特征来生成哈希值，对颜色分布的变化具有较好的鲁棒性。适用于以下场景：图像检索图像去重水印检测色彩变化较大的图像匹配公共成员函数compute(I
OpenCV哈希算法------Marr-Hildreth 边缘检测哈希算法村北头的码农 OpenCV opencv 哈希算法人工智能
操作系统：ubuntu22.04OpenCV版本：OpenCV4.9IDE:VisualStudioCode编程语言：C++11算法描述该类实现了Marr-Hildreth边缘检测哈希算法（Marr-HildrethHash），用于图像相似性比较。它基于Marr-Hildreth边缘检测器（也称为LaplacianofGaussian,LoG）提取图像边缘信息，并生成二进制哈希值。这种哈希方法对图
OpenCV 图像哈希类cv::img_hash::AverageHash 村北头的码农 OpenCV opencv 哈希算法人工智能
操作系统：ubuntu22.04OpenCV版本：OpenCV4.9IDE:VisualStudioCode编程语言：C++11算法描述cv::img_hash::AverageHash是OpenCV中用于图像哈希（ImageHashing）的一个类，属于opencv_img_hash模块。它实现了平均哈希算法（AverageHash,aHash），可以快速计算图像的“指纹”或“感知哈希值”，用于
机器学习手写字体识别系统：技术演进与应用实践万能小贤哥机器学习人工智能
引言：手写字体识别的技术定位与价值在信息处理领域，人工录入手写文本的低效性与机器识别的高效性形成鲜明对比。例如，医疗处方的人工处理需约5分钟/张，而采用手写字体识别技术可将时间缩短至10秒/张，显著提升处理效率。作为计算机视觉与人工智能的重要分支，手写字体识别技术通过将手写文本转换为可编辑电子文本，不仅大幅减少人工输入时间和错误，降低人工处理成本，还能在大量数据处理时保持高于人工录入的准确性，是人
Java常用排序算法/程序员必须掌握的8大排序算法 cugfy java
分类： 1）插入排序（直接插入排序、希尔排序） 2）交换排序（冒泡排序、快速排序） 3）选择排序（直接选择排序、堆排序） 4）归并排序 5）分配排序（基数排序）所需辅助空间最多：归并排序所需辅助空间最少：堆排序平均速度最快：快速排序不稳定：快速排序，希尔排序，堆排序。先来看看8种排序之间的关系： 1.直接插入排序（1
【Spark102】Spark存储模块BlockManager剖析 bit1129 manager
Spark围绕着BlockManager构建了存储模块，包括RDD，Shuffle，Broadcast的存储都使用了BlockManager。而BlockManager在实现上是一个针对每个应用的Master/Executor结构，即Driver上BlockManager充当了Master角色，而各个Slave上(具体到应用范围，就是Executor)的BlockManager充当了Slave角色
linux 查看端口被占用情况详解 daizj linux 端口占用 netstat lsof
经常在启动一个程序会碰到端口被占用，这里讲一下怎么查看端口是否被占用，及哪个程序占用，怎么Kill掉已占用端口的程序 1、lsof -i:port port为端口号 [root@slave /data/spark-1.4.0-bin-cdh4]# lsof -i:8080 COMMAND PID USER FD TY
Hosts文件使用周凡杨 hosts locahost
一切都要从localhost说起，经常在tomcat容器起动后，访问页面时输入http://localhost:8088/index.jsp，大家都知道localhost代表本机地址，如果本机IP是10.10.134.21，那就相当于http://10.10.134.21:8088/index.jsp，有时候也会看到http: 127.0.0.1:
java excel工具 g21121 Java excel
直接上代码，一看就懂，利用的是jxl： import java.io.File; import java.io.IOException; import jxl.Cell; import jxl.Sheet; import jxl.Workbook; import jxl.read.biff.BiffException; import jxl.write.Label; import
web报表工具finereport常用函数的用法总结（数组函数）老A不折腾 finereport web报表函数总结
ADD2ARRAY ADDARRAY(array,insertArray, start):在数组第start个位置插入insertArray中的所有元素，再返回该数组。示例： ADDARRAY([3,4, 1, 5, 7], [23, 43, 22], 3)返回[3, 4, 23, 43, 22, 1, 5, 7]. ADDARRAY([3,4, 1, 5, 7], "测试&q
游戏服务器网络带宽负载计算墙头上一根草服务器
家庭所安装的4M，8M宽带。其中M是指，Mbits/S 其中要提前说明的是： 8bits = 1Byte 即8位等于1字节。我们硬盘大小50G。意思是50*1024M字节，约为 50000多字节。但是网宽是以“位”为单位的，所以，8Mbits就是1M字节。是容积体积的单位。 8Mbits/s后面的S是秒。8Mbits/s意思是每秒8M位，即每秒1M字节。我是在计算我们网络流量时想到的
我的spring学习笔记2-IoC（反向控制依赖注入） aijuans Spring 3 系列
IoC（反向控制依赖注入）这是Spring提出来了，这也是Spring一大特色。这里我不用多说，我们看Spring教程就可以了解。当然我们不用Spring也可以用IoC，下面我将介绍不用Spring的IoC。 IoC不是框架，她是java的技术，如今大多数轻量级的容器都会用到IoC技术。这里我就用一个例子来说明：如：程序中有 Mysql.calss 、Oracle.class 、SqlSe
高性能mysql 之选择存储引擎(一) annan211 mysql InnoDB MySQL引擎存储引擎
1 没有特殊情况，应尽可能使用InnoDB存储引擎。原因：InnoDB 和 MYIsAM 是mysql 最常用、使用最普遍的存储引擎。其中InnoDB是最重要、最广泛的存储引擎。她被设计用来处理大量的短期事务。短期事务大部分情况下是正常提交的，很少有回滚的情况。InnoDB的性能和自动崩溃恢复特性使得她在非事务型存储的需求中也非常流行，除非有非常
UDP网络编程百合不是茶 UDP编程局域网组播
UDP是基于无连接的,不可靠的传输与TCP/IP相反 UDP实现私聊,发送方式客户端,接受方式服务器 package netUDP_sc; import java.net.DatagramPacket; import java.net.DatagramSocket; import java.net.Ine
JQuery对象的val()方法执行结果分析 bijian1013 JavaScript js jquery
JavaScript中，如果id对应的标签不存在（同理JAVA中，如果对象不存在），则调用它的方法会报错或抛异常。在实际开发中，发现JQuery在id对应的标签不存在时，调其val()方法不会报错，结果是undefined。
http请求测试实例（采用json-lib解析） bijian1013 json http
由于fastjson只支持JDK1.5版本，因些对于JDK1.4的项目，可以采用json-lib来解析JSON数据。如下是http请求的另外一种写法，仅供参考。 package com; import java.util.HashMap; import java.util.Map; import
【RPC框架Hessian四】Hessian与Spring集成 bit1129 hessian
在【RPC框架Hessian二】Hessian 对象序列化和反序列化一文中介绍了基于Hessian的RPC服务的实现步骤，在那里使用Hessian提供的API完成基于Hessian的RPC服务开发和客户端调用，本文使用Spring对Hessian的集成来实现Hessian的RPC调用。定义模型、接口和服务器端代码 |---Model &nb
【Mahout三】基于Mahout CBayes算法的20newsgroup流程分析 bit1129 Mahout
1.Mahout环境搭建 1.下载Mahout http://mirror.bit.edu.cn/apache/mahout/0.10.0/mahout-distribution-0.10.0.tar.gz 2.解压Mahout 3. 配置环境变量 vim /etc/profile export HADOOP_HOME=/home
nginx负载tomcat遇非80时的转发问题 ronin47
　　nginx负载后端容器是tomcat（其它容器如WAS,JBOSS暂没发现这个问题）非８０端口，遇到跳转异常问题。解决的思路是：$host:port 详细如下：　　该问题是最先发现的，由于之前对nginx不是特别的熟悉所以该问题是个入门级别的： ? 1 2 3 4 5
java-17-在一个字符串中找到第一个只出现一次的字符 bylijinnan java
public class FirstShowOnlyOnceElement { /**Q17.在一个字符串中找到第一个只出现一次的字符。如输入abaccdeff，则输出b * 1.int[] count:count[i]表示i对应字符出现的次数 * 2.将26个英文字母映射：a-z <--> 0-25 * 3.假设全部字母都是小写 */ pu
mongoDB 复制集开窍的石头 mongodb
mongo的复制集就像mysql的主从数据库，当你往其中的主复制集(primary)写数据的时候，副复制集(secondary)会自动同步主复制集(Primary)的数据,当主复制集挂掉以后其中的一个副复制集会自动成为主复制集。提供服务器的可用性。和防止当机问题 mo
[宇宙与天文]宇宙时代的经济学 comsci 经济
宇宙尺度的交通工具一般都体型巨大，造价高昂。。。。。在宇宙中进行航行，近程采用反作用力类型的发动机，需要消耗少量矿石燃料，中远程航行要采用量子或者聚变反应堆发动机，进行超空间跳跃，要消耗大量高纯度水晶体能源以目前地球上国家的经济发展水平来讲，
Git忽略文件 Cwind git
有很多文件不必使用git管理。例如Eclipse或其他IDE生成的项目文件，编译生成的各种目标或临时文件等。使用git status时，会在Untracked files里面看到这些文件列表，在一次需要添加的文件比较多时（使用git add . / git add -u），会把这些所有的未跟踪文件添加进索引。 ==== ==== ==== 一些牢骚
MySQL连接数据库的必须配置 dashuaifu mysql 连接数据库配置
MySQL连接数据库的必须配置 1.driverClass：com.mysql.jdbc.Driver 2.jdbcUrl：jdbc:mysql://localhost:3306/dbname 3.user：username 4.password：password 其中1是驱动名；2是url，这里的‘dbna
一生要养成的60个习惯 dcj3sjt126com 习惯
一生要养成的60个习惯第1篇让你更受大家欢迎的习惯 1 守时，不准时赴约,让别人等,会失去很多机会。如何做到： ①该起床时就起床， ②养成任何事情都提前15分钟的习惯。 ③带本可以随时阅读的书，如果早了就拿出来读读。 ④有条理，生活没条理最容易耽误时间。 ⑤提前计划：将重要和不重要的事情岔开。 ⑥今天就准备好明天要穿的衣服。 ⑦按时睡觉，这会让按时起床更容易。 2 注重
[介绍]Yii 是什么 dcj3sjt126com PHP yii2
Yii 是一个高性能，基于组件的 PHP 框架，用于快速开发现代 Web 应用程序。名字 Yii （读作易）在中文里有“极致简单与不断演变”两重含义，也可看作 Yes It Is! 的缩写。 Yii 最适合做什么？ Yii 是一个通用的 Web 编程框架，即可以用于开发各种用 PHP 构建的 Web 应用。因为基于组件的框架结构和设计精巧的缓存支持，它特别适合开发大型应
Linux SSH常用总结 eksliang linux ssh SSHD
转载请出自出处：http://eksliang.iteye.com/blog/2186931 一、连接到远程主机格式： ssh name@remoteserver 例如： ssh [email protected] 二、连接到远程主机指定的端口格式： ssh name@remoteserver -p 22 例如： ssh i
快速上传头像到服务端工具类FaceUtil gundumw100 android
快速迭代用 import java.io.DataOutputStream; import java.io.File; import java.io.FileInputStream; import java.io.FileNotFoundException; import java.io.FileOutputStream; import java.io.IOExceptio
jQuery入门之怎么使用 ini JavaScript html jquery Web css
jQuery的强大我何问起（个人主页：hovertree.com）就不用多说了，那么怎么使用jQuery呢？首先，下载jquery。下载地址：http://hovertree.com/hvtart/bjae/b8627323101a4994.htm，一个是压缩版本，一个是未压缩版本，如果在开发测试阶段，可以使用未压缩版本，实际应用一般使用压缩版本(min)。然后就在页面上引用。
带filter的hbase查询优化 kane_xie 查询优化 hbase RandomRowFilter
问题描述 hbase scan数据缓慢，server端出现LeaseException。hbase写入缓慢。问题原因直接原因是： hbase client端每次和regionserver交互的时候，都会在服务器端生成一个Lease,Lease的有效期由参数hbase.regionserver.lease.period确定。如果hbase scan需
java设计模式-单例模式 men4661273 java 单例枚举反射 IOC
单例模式1，饿汉模式 //饿汉式单例类.在类初始化时，已经自行实例化 public class Singleton1 { //私有的默认构造函数 private Singleton1() {} //已经自行实例化 private static final Singleton1 singl
mongodb 查询某一天所有信息的3种方法，根据日期查询 qiaolevip 每天进步一点点学习永无止境 mongodb 纵观千象
// mongodb的查询真让人难以琢磨，就查询单天信息，都需要花费一番功夫才行。 // 第一种方式： coll.aggregate([ {$project:{sendDate: {$substr: ['$sendTime', 0, 10]}, sendTime: 1, content:1}}, {$match:{sendDate: '2015-
二维数组转换成JSON tangqi609567707 java 二维数组 json
原文出处：http://blog.csdn.net/springsen/article/details/7833596 public class Demo { public static void main(String[] args) { String[][] blogL
erlang supervisor wudixiaotie erlang
定义supervisor时，如果是监控celuesimple_one_for_one则删除children的时候就用supervisor:terminate_child (SupModuleName, ChildPid)，如果shutdown策略选择的是brutal_kill，那么supervisor会调用exit(ChildPid, kill)，这样的话如果Child的behavior是gen_