死亡叹息

Learning Opencv 3 —— 十二章图像分析

Opencv 图像分析

之前提到的图像变换都是将原图的某个像素点转换到目标图像的另一个位置，其结果本质上仍然是一幅图像。这里提到的图像分析则是将图像转换为另一种完全不同的形式，有可能是数组甚至是向量，比如离散傅立叶变换和 Hough 直线变换。最后将给出图像分割方法。

离散傅立叶变换

对于 N 个离散的点，一维离散傅立叶变换

而二维离散傅立叶变换

使用传统方法将需要，而如果使用快速傅立叶变换，复杂度将下降为

cv::dft(): The Discrete Fourier Transform

void cv::dft(
	cv::InputArray src, // Input array (real or complex)
	cv::OutputArray dst, // Output array
	int flags = 0, // for inverse, or other options
	int nonzeroRows = 0 // number of rows to not ignore
);

参数说明：

src：输入数组，必须为浮点数。如果为单通道则默认输入数据为实数，将使用一个名为 complex conjugate symmetrical (CCS) 的结构进行存储，从而节约存储空间。如果为双通道，则输入将直接理解为数据的实部和虚部，此时可能由于存在大量的零而浪费输入和输出数据的存储空间

单通道CCS的输出如下

flags：具体需要执行的操作
- 默认执行 forward transform
- cv::DFT_INVERSE 进行反变换
- cv::DFT_SCALE 对结果使用 $N^{-1}$ 或 $(N_xN_y)^{-1}$ 进行缩放
- cv::DFT_INV_SCALE 或者 cv::DFT_INVERSE_SCALE 直接执行翻转和缩放
- cv::DFT_ROWS 将数据的每一行独立处理，分别计算
- cv::DFT_COMPLEX_OUTPUT 以包含零，也就是不是 CCS 的形式给出计算结果
- cv::DFT_REAL_OUTPUT 对于满足复共轭对称性的输入，将产生维数小于输入数据的输出数据
nonzero_rows：在进行 DFT 时，由于Opencv算法倾向于处理长度的数据，因此通常 cv::getOptimalDFTSize() 使用零对输入数据进行填充。但在计算时却可以指定填充的零行从而节省运算时间

cv::idft(): The Inverse Discrete Fourier Transform

虽然 cv::dft() 可以实现傅立叶反变换，但是为了代码的可读性，还是建议使用独立的函数。

void cv::idft(
	cv::InputArray src, // Input array (real or complex)
	cv::OutputArray dst, // Output array
	int flags = 0, // for variations
	int nonzeroRows = 0 // number of rows to not ignore
);

其中参数与 cv::dft() 类似，其中如果 flags 设置为 cv::DFT_INVERSE，该函数将执行傅立叶变换

cv::mulSpectrums(): Spectrum Multiplication

其实现从 CCS 储存的数据中得到通常使用的数据

void cv::mulSpectrums(
	cv::InputArray src1, // Input array (ccs or complex)
	cv::InputArray src2, // Input array (ccs or complex)
	cv::OutputArray dst, // Result array
	int flags, // for row-by-row computation
	bool conj = false // true to conjugate src2
);

使用离散傅立叶变换进行卷积

由于时域系统的卷积等价于频域系统的乘积，因此可以通过分别对图像和系统进行傅立叶变换，在对变换结果的乘积进行反变换就能快速的得到卷积的结果。

// Example 12-1. Using cv::dft() and cv::idft() to accelerate
// the computation of convolutions 

#include 
#include 

using std::cout;
using std::endl;

int main(int argc, char** argv) {
    if (argc != 2) {
        cout    << "\nExample 12-1. Using cv::dft() and cv::idft() to accelerate the"
                << "\n computation of convolutions"
                << "\nFourier Transform\nUsage: "
                << argv[0] << " \n" << endl;
        return -1;
    }

    cv::Mat A = cv::imread(argv[1], 0);

    if (A.empty()) {
        cout << "Cannot load " << argv[1] << endl;
        return -1;
    }

    cv::Size patchSize(100, 100);
    cv::Point topleft(A.cols / 2, A.rows /2);
    cv::Rect roi(topleft.x, topleft.y, patchSize.width, patchSize.height);
    cv::Mat B = A(roi);

    int dft_M = cv::getOptimalDFTSize(A.rows + B.rows - 1);
    int dft_N = cv::getOptimalDFTSize(A.cols + B.cols - 1);

    cv::Mat dft_A = cv::Mat::zeros(dft_M, dft_N, CV_32F);
    cv::Mat dft_B = cv::Mat::zeros(dft_M, dft_N, CV_32F);

    cv::Mat dft_A_part = dft_A(cv::Rect(0, 0, A.cols, A.rows));
    cv::Mat dft_B_part = dft_B(cv::Rect(0, 0, B.cols, B.rows));

    A.convertTo(dft_A_part, dft_A_part.type(), 1, -mean(A)[0]);
    B.convertTo(dft_B_part, dft_B_part.type(), 1, -mean(B)[0]);

    cv::dft(dft_A, dft_A, 0, A.rows);
    cv::dft(dft_B, dft_B, 0, B.rows);

    // set the last parameter to false to compute convolution instead of correlation
    //
    cv::mulSpectrums(dft_A, dft_B, dft_A, 0, true);
    cv::idft(dft_A, dft_A, cv::DFT_SCALE, A.rows + B.rows - 1);

    cv::Mat corr = dft_A(cv::Rect(0, 0, A.cols + B.cols - 1, A.rows + B.rows - 1));
    cv::normalize(corr, corr, 0, 1, cv::NORM_MINMAX, corr.type());
    cv::pow(corr, 3.0, corr);

    B ^= cv::Scalar::all(255);

    cv::imshow("Image", A);
    cv::imshow("ROI", B);

    cv::imshow("Correlation", corr);
    cv::waitKey();

    return 0;
}

通过使用此技巧，图像匹配的计算量从下降到了

cv::dct(): The Discrete Cosine Transform

对于实数据，DFT 通过将数据分为两份分别赋值给假象数据的实部和虚部从而提高速度。离散余弦变换只处理实数据使用如下公式

其中其默认对计算结果进行归一化。

void cv::dct(
	cv::InputArray src, // Input array (even size)
	cv::OutputArray dst, // Output array
	int flags = 0 // for row-by-row or inverse
);

其参数与 DFT 函数基本类似，其中由于 DCT 在内部调用了 DFT，只是数据大小只是输入数据的一半，因此 DCT 的最佳数据长度

其中 N 是需要变换的数据长度

cv::idct(): The Inverse Discrete Cosine Transform

出于与 DFT 相同的原因，也存在反离散余弦变换

void cv::idct(
	cv::InputArray src, // Input array
	cv::OutputArray dst, // Output array
	int flags = 0, // for row-by-row computation
);

积分图像

Opencv 提供 cv::integral() 函数实现子区域图像的快速求和，其最突出的一个应用就是哈儿小波。而图像积分又分成求和、平方求和和斜和。

基于上述三个结果就可以组合出需要的结果，比如一块区域的和可以通过这下式计算

通过这种方式可以更快地进行平滑，近似梯度，计算均值、标准差以及针对不同的窗口大小进行 block correlations。

标准求和积分运算

void cv::integral(
	cv::InputArray image, // Input array, W x H
	cv::OutputArray sum, // Output sum results, (W + 1) x (H + 1)
	int sdepth = -1 // Results depth (e.g., cv::F32, cv::S32, cv::F64)
);

平方求和积分运算

void cv::integral(
	cv::InputArray image, // Input array
	cv::OutputArray sum, // Output sum results
	cv::OutputArray sqsum, // Output sum of squares results
	int sdepth = -1 // Results depth (e.g., cv::F32)
);

其中 sqsum 就是所需要的平方求和结果。

斜和积分运算

void cv::integral(
	cv::InputArray image, // Input array
	cv::OutputArray sum, // Output sum results
	cv::OutputArray sqsum, // Output sum of squares results
	cv::OutputArray tilted, // Output tilted sum results
	int sdepth = -1 // Results depth (e.g., cv::F32)
);

其中 tilted 就是所需要的斜和结果

Canny 边缘检测算子

void cv::Canny(
	cv::InputArray image, // Input single channel image
	cv::OutputArray edges, // Output edge image
	double threshold1, // "lower" threshold
	double threshold2, // "upper" threshold
	int apertureSize = 3, // Sobel aperture
	bool L2gradient = false // true=L2-norm (more accurate)
);

参数说明：

image：输入图像，必须是单通道
edges：输出的边缘图像，二值图像
threshold1, threshold2：低高阈值，大于高阈值确认为边缘，低于低阈值确认为非边缘，两者之间如果紧邻确认边缘则确认为边缘
apertureSize：算法内部 Sobel 微分算子的计算范围
L2gradient：选择是否使用更精确的 L2 范数还是更快的 L1 范数

霍夫变换

霍夫变换是一种从图像中找出直线，圆或者其他简单图像的方法。

霍夫线变换

基本原理是：针对每个点，对其斜率进行离散化，通常为 180，这样直线的斜率精度为 1，从而在斜率和截距的平面中绘制通过该直线的所有可能直线的图像（通常也为一条直线）。这样该直线就包含了所有通过该点的直线，之后对每个点进行相同的操作。接着在斜率截距平面上找出多条直线相交的点，即这几个点均在该交点所表示的直线上。最后通过设置阈值就可以找出图像中的直线了。同时，考虑斜率可能存在直线垂直的情况，因此通常不使用斜率截距而使用极坐标系的距离和方向角，不过这样转换之后的所有直线的轨迹将是一条曲线。

标准霍夫变换（standard hough transform，SHT）以及多尺度霍夫变换（multiscale Hough transform，MHT）

void cv::HoughLines(
	cv::InputArray image, // Input single channel image
	cv::OutputArray lines, // N-by-1 two-channel array
	double rho, // rho resolution (pixels)
	double theta, // theta resolution (radians)
	int threshold, // Unnormalized accumulator threshold
	double srn = 0, // rho refinement (for MHT)
	double stn = 0 // theta refinement (for MHT)
);

参数说明：

image：输入图像，必须为 8 为图像，不过算法将其作为二值图像进行处理（所有非零参数作为相同处理）
lines：N x 2 的二通道浮点数，其中 N 为检测到的直线数，而每一行分别给出了直线的距离（像素点）和方向角（弧度）
threshold：所找到的直线必须通过的点数
srn，stn：使用更高的分辨率求解直线，其中 MHT 最后的分辨率就是 rho = rho / srn 和 theta = theta / stn。如果设置为零，则进行 SHT

渐进概率霍夫变换

void cv::HoughLinesP(
	cv::InputArray image, // Input single channel image
	cv::OutputArray lines, // N-by-1 4-channel array
	double rho, // rho resolution (pixels)
	double theta, // theta resolution (radians)
	int threshold, // Unnormalized accumulator threshold
	double minLineLength = 0, // required line length
	double maxLineGap = 0 // required line separation
);

参数说明

lines：四通道 Vec4i 的数组，其中分别表示 x0, y0, x1, y1
minLineLength：返回的最短直线段长度
maxLineGap：共线线段能够被融合的最大距离

霍夫圆变换

霍夫圆变换可以使用与霍夫直线变换相同的思想，但由于表示圆需要三个值（圆心的横纵坐标和半径），因此也就需要更多的存储空间和更长的计算时间。而 Opencv 在实现时使用了霍夫梯度方法的技巧来提高效率。算法的基本流程如下：

使用比如 Canny 的边缘检测算子得到边缘信息
针对每个边缘点，使用 Sobel 计算 x 和 y 方向上的局部梯度
沿着梯度上升的方向移动，并记录所有经过的位置
在累加结果中选取超过阈值同时大于紧邻像素点的位置作为候选圆心
对这些候选中心进行降序排列
对每一个候选中心计算所有的边缘像素点到这个候选中心的距离，选择其中涵盖最多像素点的半径，并判断是否覆盖了足够的非零点
重复上一个操作，直至没有满足要求的圆心存在

不过这样虽然提高的效率，但是也带来一些问题：

其中使用了 Sobel 计算局部梯度来近似局部切线，这在绝大多数情况下是可行的。但是这可能使得结果中存在噪声
对于每个圆都遍历了所有的非零点，而如果阈值设置过低，算法可能花费很长时间
因为每个圆心只查找一个圆，因此如果存在同心圆将只返回一个
同时，由于更大的圆通常具有更多的点，因此算法倾向于寻找同心圆中较大的圆

void cv::HoughCircles(
	cv::InputArray image, // Input single channel image
	cv::OutputArray circles, // N-by-1 3-channel or vector of Vec3f
	int method, // Always cv::HOUGH_GRADIENT
	double dp, // Accumulator resolution (ratio)
	double minDist, // Required separation (between lines)
	double param1 = 100, // Upper Canny threshold
	double param2 = 100, // Unnormalized accumulator threshold
	int minRadius = 0, // Smallest radius to consider
	int maxRadius = 0 // Largest radius to consider
);

参数说明：

image：输入图像，8 位图片，其将在内部调用 Sobel；而霍夫直线必须要求二值图像。
circles：矩阵或者向量。如果传入的是矩阵，那么将输出格式为 CV::F32C3，其中三通道分别为圆心和半径。如果是一个向量，那么输出格式为 std::vector
method：一定要设置为 cv::HOUGH_GRADIENT
dp：累计图像的分辨率；如果设置为 1，将使用原始图像的分辨率；如果大于 1，将对原始图像进行缩小。dp 不能小于 1.
minDist：两个圆允许的最小距离
param1, param2：Canny 算法的上下阈值
minRadius, maxRadius：可接受圆的最小半径和最大半径。

// Example 12-2. Using cv::HoughCircles() to return a sequence of circles found in a
// grayscale image

#include 

#include 
#include 

#include 

using std::cout;
using std::endl;
using std::vector;

void help(char** argv) {
        cout  << "\nExample 12-1. Using cv::dft() and cv::idft() to accelerate the computation of convolutions"  
              << "\nHough Circle detect\nUsage: " << argv[0] <<" \n" 
              << "Example:\n" << argv[0] << " ../stuff.jpg\n" << endl;
}

int main(int argc, char** argv) {
	help(argv);
    if (argc != 2) {
        return -1;
    }

    cv::Mat src, image;

    src = cv::imread(argv[1], 1);
    if (src.empty()) {
        cout << "Cannot load " << argv[1] << endl;
        return -1;
    }

    cv::cvtColor(src, image, cv::COLOR_BGR2GRAY);
    cv::GaussianBlur(image, image, cv::Size(5, 5), 0, 0);

    vector circles;
    cv::HoughCircles(image, circles, cv::HOUGH_GRADIENT, 2, image.cols/4);

    for (size_t i = 0; i < circles.size(); ++i) {
        cv::circle(src,
            cv::Point(cvRound(circles[i][0]), cvRound(circles[i][1])),
            cvRound(circles[i][2]),
            cv::Scalar(0, 0, 255),
            2,
            cv::LINE_AA);
    }

    cv::imshow("Hough Circles", src);
    cv::waitKey(0);

    return 0;
}

距离变换

一副图像的距离变换被定义为一张新图，其中的每个点的像素值被设置为其原始图像对应点到最近的像素值零点的距离。其输入通常为边缘检测结果，这样所有边缘点的距离变换都为零，而非边缘的都为非零值。

非标记距离变换

void cv::distanceTransform(
	cv::InputArray src, // Input image
	cv::OutputArray dst, // Result image
	int distanceType, // Distance metric to use
	int maskSize // Mask to use (3, 5, or see below)
);

参数说明：

dst：输出图像为 32 位浮点数，CV::F32
distanceType：cv::DIST_C（4 连通），cv::DIST_L1（8 连通）， cv::DIST_L2（欧式距离）。
maskSize：3,5，cv::DIST_MASK_PRECISE。使用 cv::DIST_L1 或 cv::DIST_C 可以设置为 3。cv::DIST_L2 通常设置为 5 或者 cv::DIST_MASK_PRECISE

标记距离变换

void cv::distanceTransform(
	cv::InputArray src, // Input image
	cv::OutputArray dst, // Result image
	cv::OutputArray labels, // Connected component ids
	int distanceType, // Distance metric to use
	int maskSize, // (3, 5, or see below)
	int labelType = cv::DIST_LABEL_CCOMP // How to label
);

参数说明：

labels：和 dst 同维，同时对应非零像素点的 label 将被置为距离最近的 label。其将为典型的沃罗诺伊图
labelType：cv::DIST_LABEL_CCOMP（自动将连通的零区置为相同的 label）或者 cv::DIST_LABEL_PIXEL(为每一个零值设置一个不同的 label)

分割

漫水法

int cv::floodFill(
	cv::InputOutputArray image, // Input image, 1 or 3 channels
	cv::Point seed, // Start point for flood
	cv::Scalar newVal, // Value for painted pixels
	cv::Rect* rect, // Output bounds painted domain
	cv::Scalar lowDiff = cv::Scalar(),// Maximum down color distance
	cv::Scalar highDiff = cv::Scalar(),// Maximum up color distance
	int flags // Local/global, and mask-only
);
int cv::floodFill(
	cv::InputOutputArray image, // Input w-by-h, 1 or 3 channels
	cv::InputOutputArray mask, // 8-bit, w+2-by-h+2 (Nc=1)
	cv::Point seed, // Start point for flood
	cv::Scalar newVal, // Value for painted pixels
	cv::Rect* rect, // Output bounds painted domain
	cv::Scalar lowDiff = cv::Scalar(), // Maximum down color distance
	cv::Scalar highDiff = cv::Scalar(), // Maximum up color distance
	int flags // Local/global, and mask-only
);

参数说明：

image：输入图像，可以是 8 位或者浮点数，通道数可以是 1 或者 3
mask：作为输入，其零值像素点标记了不需要算法处理的区域，输出则是最后图像分割的结果
seed，newVal，loDiff，upDiff：算法将 seed 指定的颜色范围在 loDiff 和 upDiff 之间的像素点标记为 newVal
flags
- cv::FLOODFILL_FIXED_RANGE：每个像素点将于 seed 比较而不是其邻近的像素点
- cv::FLOODFILL_MASK_ONLY：只修改 mask 的值，而不改变 image
- 4，8：选择 4 连通还是 8 连通，比如 lags = 8 | cv::FLOODFILL_MASK_ONLY

具体 flags 的设置还比较复杂，其中低八位控制算法的连通性，而高八位设置填充的值。比如需要8连通，只填充固定距离，只修改 mask，使用 47 填充，flags 应该被设置为

flags = 8
	| cv::FLOODFILL_MASK_ONLY
	| cv::FLOODFILL_FIXED_RANGE
	| (47 << 8);

分水岭算法

在实际应用中，如果想要分割一幅图像但又没有任何分离背景的信息，就可以考虑分水岭算法。其首先检测图像的边缘并将其作为山峰，而将较为平坦的区域作为山谷，最后从山谷开始漫水实现图像分割。

void cv::watershed(
	cv::InputArray image, // Input 8-bit, three channels
	cv::InputOutputArray markers // 32-bit float, single channel
);

参数说明：

image：8 位或者三通道图像
makers：CV::S32 单通道整数图像。作为输入，非零位置表示了哪些像素点属于同一区域。作为输入，不同的区域将被赋值为正数，而边缘将被赋值为 -1。不过如果两个相邻的像素点被提前指定了类别，那边输出将不用 -1 进行分割

Grabcuts

Graphcuts 使用用户标记的前景和背景从而建立两类分布直方图，并假定未标记的前景和背景平滑且连通从而具有相似的分布，最终基于这些假设定义能量函数，算法最后的优化方向就是最小化指定的能量函数。

Grabcuts 是 Graphcuts 的改进，主要包括

使用高斯混合模型代替直方图模型是算法能够处理彩色图像的情况
使用迭代的方式最小化能量函数，使得计算结果更佳，同时用户自定义标记也更方便
Graphcuts 允许用户只指定前景和背景中的一项，而 Graphcuts 用户必须同时指定

void cv::grabCut(
	cv::InputArray img,
	cv::InputOutputArray mask,
	cv::Rect rect,
	cv::InputOutputArray bgdModel,
	cv::InputOutputArray fgdModel,
	int iterCount,
	int mode = cv::GC_EVAL
);

参数说明：

img：输入图像
mask：输出标示。如果作为输入，将基于 mode 的选择。如果 mode 包含 cv::GC_INIT_WITH_MASK，则算法将 mask 作为算法的初始值。其必须为一个单通道 cv::U8 数据。其中具体内容的意义如下表。

rect：只有当未使用 mask 作为初始值，同时设置 cv::GC_INIT_WITH_RECT 时，表示矩形外部确定为背景，而内部可能为前景
bgdModel，fgdModel：算法计算的中间值，如果用户希望从某个中间点继续进行计算，则可以将之前算法的结果直接传入
itercount：Grabcuts 本质上依旧调用 Graphcuts，只是在迭代过程中有时会重复计算混合模型。其通常被设置为 10 -12，虽然通常需要根据实际情况进行调整。

均值漂移分割

均值漂移分割——cv::pyrMeanShiftFiltering() 查找空间中颜色分布的极值。与此类似的均值漂移算法则被用于跟踪与运动，其主要用于处理序列图像的分布。

给定多维数据的集合，其中可能包含 x, y, blue, green, red，而均值漂移一个空间上的扫描窗得到数据密度最高的块。不过由于不同的维度尺度差别很大，因此通常需要针对不同的维度指定不同的窗口大小，至少也应该针对位置和颜色分别指定两个大小。而过程中，图像金字塔也将被使用，高层的结果将在低层继续优化。

void cv::pyrMeanShiftFiltering(
	cv::InputArray src, // 8-bit, Nc=3 image
	cv::OutputArray dst, // 8-bit, Nc=3, same size as src
	cv::double sp, // Spatial window radius
	cv::double sr, // Color window radius
	int maxLevel = 1, // Max pyramid level
	cv::TermCriteria termcrit = TermCriteria(
		cv::TermCriteria::MAX_ITER | cv::TermCriteria::EPS,
		5,
		1
	)
);

参数说明：

src，dst：输入输出图像，必须为 8 位三通道图像
spatialRadius，colorRadius：定义了空间和颜色窗口的大小。对于 640 * 480 的图像，通常 spatialRadius=20，而 colorRadius=40
max_level：多少图像金字塔需要被使用。对于 640 * 480 的图像，通常设置为 2 或者 3
cv::TermCriteria：迭代终止条件

你可能感兴趣的:(Opencv)

Linux下QT开发的动态库界面弹出操作（SDL2） 13jjyao QT类 qt 开发语言 sdl2 linux
需求：操作系统为linux，开发框架为qt，做成需带界面的qt动态库，调用方为java等非qt程序难点：调用方为java等非qt程序，也就是说调用方肯定不带QApplication::exec()，缺少了这个，QTimer等事件和QT创建的窗口将不能弹出(包括opencv也是不能弹出)；这与qt调用本身qt库是有本质的区别的思路：1.调用方缺QApplication::exec()，那么我们在接口
tiff批量转png 诺有缸的高飞鸟 opencv 图像处理 python opencv 图像处理
目录写在前面代码完写在前面1、本文内容tiff批量转png2、平台/环境opencv,python3、转载请注明出处：https://blog.csdn.net/qq_41102371/article/details/132975023代码importnumpyasnpimportcv2importosdeffindAllFile(base):file_list=[]forroot,ds,fsin
遥感影像的切片处理 sand&wich 计算机视觉 python 图像处理
在遥感影像分析中，经常需要将大尺寸的影像切分成小片段，以便于进行详细的分析和处理。这种方法特别适用于机器学习和图像处理任务，如对象检测、图像分类等。以下是如何使用Python和OpenCV库来实现这一过程，同时确保每个影像片段保留正确的地理信息。准备环境首先，确保安装了必要的Python库，包括numpy、opencv-python和xml.etree.ElementTree。这些库将用于图像处理
windows下python opencv ffmpeg读取摄像头实现rtsp推流拉流图像处理大大大大大牛啊 opencv实战代码讲解视觉图像项目 windows python opencv
windows下pythonopencvffmpeg读取摄像头实现rtsp推流拉流整体流程1.下载所需文件1.1下载rtsp推流服务器1.2下载ffmpeg2.开启RTSP服务器3.opencv读取摄像头并调用ffmpeg进行推流4.opencv进行拉流5.opencv异步拉流整体流程1.下载所需文件1.1下载rtsp推流服务器下载RTSP服务器下载页面https://github.com/blu
c++ opencv4.3 sift匹配图像处理大大大大大牛啊图像处理 opencv实战代码讲解 opencv sift c++opencv4 特征点
c++opencv4.3sift匹配main.cppintmain(){vectorkeypoints1,keypoints2;Matimg1,img2,descriptors1,descriptors2;intnumF
ubuntu安装opencv最快的方法 Derek重名了
最快方法，当然不能太多文字$sudoapt-getinstallpython-opencv借助python就可以把ubuntu的opencv环境搞起来，非常快非常容易参考：https://docs.opencv.org/trunk/d2/de6/tutorial_py_setup_in_ubuntu.html
使用Python和Playwright破解滑动验证码 asfdsgdf python 开发语言
滑动验证码是一种常见的验证码形式，通过拖动滑块将缺失的拼图块对准原图中的空缺位置来验证用户操作。本文将介绍如何使用Python中的OpenCV进行模板匹配，并结合Playwright实现自动化破解滑动验证码的过程。所需技术OpenCV模板匹配：用于识别滑块在背景图中的正确位置。Python：主要编程语言。Playwright：用于浏览器自动化，模拟用户操作。破解过程概述获取验证码图像：下载背景图和
OpenCV图像处理技术（Python）——入门森屿_ opencv
©FuXianjun.AllRightsReserved.OpenCV入门图像作为人类感知世界的视觉基础，是人类获取信息、表达信息的重要手段，OpenCV作为一个开源的计算机视觉库，它包括几百个易用的图像成像和视觉函数，既可以用于学术研究，也可用于工业邻域，它于1999年由因特尔的GaryBradski启动，OpenCV库主要由C和C++语言编写，它可以在多个操作系统上运行。1.1图像处理基本操作
opencv学习：图像旋转的两种方法，旋转后的图片进行模板匹配代码实现夜清寒风学习 opencv 机器学习人工智能计算机视觉
图像旋转在图像处理中，rotate和rot90是两种常见的图像旋转方法，它们在功能和使用上有一些区别。下面我将分别介绍这两种方法，并解释它们的主要区别rot90方法rot90方法是NumPy提供的一种数组旋转函数，它主要用于对二维数组（如图像）进行90度的旋转。这个方法比较简单，只支持90度的倍数旋转，不支持任意角度旋转。使用NumPy进行旋转使用NumPy的rot90函数对模板图像进行旋转操作。
Python OpenCV图像处理：从基础到高级的全方位指南极客代码玩转Python 开发语言 python opencv 图像处理计算机视觉
目录第一部分：PythonOpenCV图像处理基础1.1OpenCV简介1.2PythonOpenCV安装1.3实战案例：图像显示与保存1.4注意事项第二部分：PythonOpenCV图像处理高级技巧2.1图像变换2.2图像增强2.3图像复原第三部分：PythonOpenCV图像处理实战项目3.1图像滤波3.2图像分割3.3图像特征提取第四部分：PythonOpenCV图像处理注意事项与优化策略4
python图像匹配_opencvpython中的图像匹配 weixin_39585675 python图像匹配
我一直在做一个项目，用opencvpython识别相机中显示的标志。我已经尝试过使用surf、颜色直方图匹配和模板匹配。但在这3个问题中，它并不总是返回正确的答案。我现在想要的是，解决我这个问题的最好办法是什么。模板图像示例：以下是摄像头中显示的标志示例。如果这是我想要识别的图像，该怎么用？在更新matchTemplate中的代码flags=["Cambodia.jpg","Laos.jpg","
利用Python+OpenCV实现截图匹配图像，支持自适应缩放、灰度匹配、区域匹配、匹配多个结果 xu-jssy Python自动化脚本 python opencv 开发语言图像处理自动化
可以直接通过pip获取，无需手动安装其他依赖pipinstallxug示例：importxugxug.find_image_on_screen(,,,)=========================================================================一、依赖安装pipinstallopencv-pythonpipinstallpyautogui二、获
opencv 学习 1 木木ainiks opencv 计算机视觉 python
opencv学习的第一天#coding:utf-8importcv2ascv#首先读图片src=cv.imread(“img/1.jpg”)#设置图片的名字cv.namedWindow(“1”,cv.WINDOW_AUTOSIZE)#显示图片第一个参数设置图片名，第二个参数图片的地址cv.imshow(“1”,src)cv.waitKey(0)#将图片写入固定位置cv.imwrite(“img/2
OpenCV结构分析与形状描述符（24）检测两个旋转矩形之间是否相交的一个函数rotatedRectangleIntersection()的使用 jndingxin OpenCV opencv 人工智能计算机视觉
操作系统：ubuntu22.04OpenCV版本：OpenCV4.9IDE:VisualStudioCode编程语言：C++11算法描述测两个旋转矩形之间是否存在交集。如果存在交集，则还返回交集区域的顶点。下面是一些交集配置的例子。斜线图案表示交集区域，红色顶点是由函数返回的。rotatedRectangleIntersection()这个函数看起来像是用于检测两个旋转矩形之间是否相交的一个方法。
python-opencv cv2.findContours()函数 fjswcjswzy opencv python笔记 python opencv
示例代码：image,contours,hierarchy=cv2.findContours(contour,cv2.RETR_TREE,cv2.CHAIN_APPROX_SIMPLE)输入：contour：带有轮廓信息的图像；cv2.RETR_TREE：提取轮廓后，输出轮廓信息的组织形式，除了cv2.RETR_TREE还有以下几种选项：cv2.RETR_EXTERNAL：输出轮廓中只有外侧轮廓信
【Python】【Opencv】cv2.findContours()、cv2.drawContours()和cv2.contourArea()函数详解和运行示例木彳 Python学习和使用过程积累 python opencv 开发语言人工智能计算机视觉
为帮助大家理解和使用cv2.findContours()、cv2.drawContours()和cv2.contourArea()函数，本文通过对函数内容进行详解，并通过运行示例更直观表述。函数解析cv2.findContours()cv2.drawContours()cv2.contourArea()运行示例运行示例示例详解函数解析cv2.findContours()cv2.findContou
python如何判断NoneTpye #如花 opencv 人工智能计算机视觉 python
python如何判断NoneTpye最近用python-opencv解析多个视频文件，解析到第一个视频的最后一帧，出现了NoneTpye报错为了让循环继续，需要判断解析出来的图片是否为NoneType。试了几种方法#第一种方法img==None当img为空时，表达式为True。但是当img解析出了图片时，返回的是一个array，大小和img一致。正确写法imgisNone用isNone判断None
三点or多点的变换矩阵求解opencv & eigen 合工大机器人实验室 C++矩阵 opencv 线性代数
《Estimating3-DRigidBodyTransformations:AComparisonofFourMajorAlgorithms》，它使用SVD方法计算T和t。只要算出变换矩阵，就可以算出A坐标系的一个点P在坐标系B里的对应点坐标，即R为3x3的转换矩阵，t为3x1的位移变换向量，这里点坐标均为3x1的列向量（非齐次形式，齐次形式下为4x1列向量，多出的一个元素值补1而已）。理论上只
逆radon变换matlab,Radon变换及其Matlab代码实现少年商学院逆radon变换matlab
Radon变换和Hough变换类似，最初是用于检测图像中的直线(例如笔直的街道边沿、房屋的边沿、笔直的电线等)。关于Hough变换，可以参考OpenCV中的代码和示例(其实除了HoughLines还有HoughCircles等等变种)，此处不再赘述。关于Radon变换，可以参考wiki或者百科，或者网络上的其他资料介绍。这里做一个简单的总结。首先准备一张灰度化的图像，及黑白图像，然后检测图像的边缘
ubuntu opencv 安装科学的发展-只不过是读大自然写的代码 opencv基础 ubuntu opencv linux
1.ubuntuopencv安装在Ubuntu系统中安装OpenCV，可以通过多种方式进行，以下是一种常用的安装方法，包括从源代码编译安装。请注意，安装步骤可能会因OpenCV的版本和Ubuntu系统的具体版本而略有不同。一、安装准备更新系统（确保你的Ubuntu系统是最新的）：sudoaptupdatesudoaptupgrade安装必要的依赖项：sudoaptinstallbuild-esse
结合YOLOv8和OpenCV WeChat QRCode打造一款二维码识别器搜狐技术产品小编2023 YOLO opencv 微信人工智能计算机视觉
本文字数：3876字预计阅读时间：25分钟01引言二维码（QRCode）在现代生活中有广泛应用，从支付系统到信息传递，它们无处不在。本文提出了一种如何识别二维码的方法，主要贡献在于优化处理分辨率较高的图像时，由于二维码在整张图片中占据的比例较小，传统的OpenCVWeChatQRCode的识别方法表现不佳的问题。下面描述详细的优化过程。02OpenCVWeChatQRCodeWeChatQRCod
OpenCV高阶操作富士达幸运星 opencv 人工智能计算机视觉
在图像处理与计算机视觉领域，OpenCV（OpenSourceComputerVisionLibrary）无疑是最为强大且广泛使用的工具之一。从基础的图像读取、1.图片的上下，采样下采样（Downsampling）下采样通常用于减小图像的尺寸，从而减少图像中的像素数。这个过程可以通过多种方法实现，但最常见的是通过图像金字塔中的pyrDown函数（在OpenCV中）或其他类似的滤波器（如平均池化、最
Vue + Django的人脸识别系统 DXSsssss python DRF tensorflow 人脸识别
最近在研究机器学习，刚好最近看了vue+Djangodrf的一些课程，学以致用，做了一个人脸识别系统。项目前端使用Vue框架，用到了elementui组件，写起来真是方便。比之前传统的dtl方便了太多。后端使用了drf，识别知识刚开始打算使用opencv+tensorflow,但是发现吧识别以后的结果返回到浏览器当中时使用opencv比较麻烦（主要是我太菜，想不到比较好的方法），因此最终使用了tf
Django+Vue基于OpenCV的人脸识别系统的设计与实现赵广陆 project django vue.js opencv
目录1项目介绍2项目截图3核心代码3.1需要的环境3.2Django接口层3.3实体类3.4config.ini3.5启动类3.5Vue4数据库表设计5文档参考6计算机毕设选题推荐7源码获取1项目介绍博主个人介绍：CSDN认证博客专家，CSDN平台Java领域优质创作者，全网30w+粉丝，超300w访问量，专注于大学生项目实战开发、讲解和答疑辅导，对于专业性数据证明一切！主要项目：javaweb、
opencv 之实战项目识别银行卡上的数字 SEVEN-YEARS opencv 计算机视觉人工智能
OpenCV之实战项目：识别银行卡上的数字引言在日常生活中，银行卡的识别是一个常见的需求，特别是在金融领域。本实战项目旨在使用OpenCV库来识别银行卡上的数字。我们将通过模板匹配的方法，结合图像处理技术，来准确识别银行卡上的数字序列。项目准备本项目需要安装Python和OpenCV库。确保已经安装了必要的库，并准备好银行卡图像和数字模板图像。实验素材定义函数importcv2defsort_co
Python OpenCV精讲系列 - 高级图像处理技术（五）极客代码 Python OpenCV精讲 python opencv 图像处理开发语言人工智能计算机视觉
⚡️⚡️专栏：PythonOpenCV精讲⚡️⚡️本专栏聚焦于Python结合OpenCV库进行计算机视觉开发的专业教程。通过系统化的课程设计，从基础概念入手，逐步深入到图像处理、特征检测、物体识别等多个领域。适合希望在计算机视觉方向上建立坚实基础的技术人员及研究者。每一课不仅包含理论讲解，更有实战代码示例，助力读者快速将所学应用于实际项目中，提升解决复杂视觉问题的能力。无论是入门者还是寻求技能进
基于OpenCV和ROS节点的智能家居服务机器人设计流程极客小张 opencv 智能家居机器人物联网人工智能计算机视觉单片机
一、项目概述1.1项目目标和用途智能家居助手项目旨在开发一款高效、智能的服务机器人，能够在家庭环境中执行多种任务，如送餐、清洁和监控。该机器人将通过自主导航、任务调度和环境感知能力，提升家庭生活的便利性和安全性。项目的最终目标是为用户提供一个智能、可靠的家居助手，改善用户的生活质量。1.2技术栈关键词硬件：激光雷达（LiDAR）或超声波传感器（用于避障和地图构建）摄像头（用于视觉识别和监控）IMU
计算机视觉学习路线不会代码的小林计算机视觉
计算机视觉学习路线是一个系统而全面的过程，涵盖了从基础知识到高级应用的多个方面。以下是一个详细的计算机视觉学习路线，供您参考：一、基础知识学习编程语言与基础库学习Python语言，掌握基础语法、函数、面向对象编程等概念。Python是计算机视觉领域广泛使用的编程语言，因其简洁易读和丰富的库支持而受到青睐。学习Numpy库，用于科学计算和多维数组操作，这是计算机视觉中数据处理的基础。学习OpenCV
【Python第三方库】OpenCV库实用指南墨辰JC Python opencv python 人工智能学习
文章目录前言安装OpenCV读取图像图像基本操作获取图像信息裁剪图像图像缩放图像转换为灰度图图像模糊处理边缘检测图像翻转图像保存视频相关操作方法讲解读取视频从摄像头读取视频前言OpenCV（OpenSourceComputerVisionLibrary）作为一个强大的计算机视觉库，提供了丰富的图像处理和计算机视觉功能，尤其在图像识别、对象检测、视频分析等领域有着广泛的应用。本文将带领读者使用Pyt
OpenCV3最常用的基本操作 HeoLis
OpenCV介绍OpenCV的全称是OpenSourceComputerVisionLibrary，是一个跨平台的计算机视觉库。OpenCV是由英特尔公司发起并参与开发，以BSD许可证授权发行，可以在商业和研究领域中免费使用。OpenCV可用于开发实时的图像处理、计算机视觉以及模式识别程序。该程序库也可以使用英特尔公司的IPP进行加速处理。以上是维基百科关于OpenCV的介绍，简单来说它就是处理图
插入表主键冲突做更新 a-john
有以下场景：用户下了一个订单，订单内的内容较多，且来自多表，首次下单的时候，内容可能会不全（部分内容不是必须，出现有些表根本就没有没有该订单的值）。在以后更改订单时，有些内容会更改，有些内容会新增。问题：如果在sql语句中执行update操作，在没有数据的表中会出错。如果在逻辑代码中先做查询，查询结果有做更新，没有做插入，这样会将代码复杂化。解决： mysql中提供了一个sql语
Android xml资源文件中@、@android:type、@*、？、@+含义和区别 Cb123456 @+@?@*
一.@代表引用资源 1.引用自定义资源。格式：@[package:]type/name android：text="@string/hello" 2.引用系统资源。格式：@android:type/name android:textColor="@android:color/opaque_red"
数据结构的基本介绍天子之骄数据结构散列表树、图线性结构价格标签
数据结构的基本介绍数据结构就是数据的组织形式，用一种提前设计好的框架去存取数据，以便更方便，高效的对数据进行增删查改。正确选择合适的数据结构，对软件程序的高效执行的影响作用不亚于算法的设计。此外，在计算机系统中数据结构的作用也是非同小可。例如常常在编程语言中听到的栈，堆等，就是经典的数据结构。经典的数据结构大致如下：一：线性数据结构 (1)：列表 a
通过二维码开放平台的API快速生成二维码一炮送你回车库 api
现在很多网站都有通过扫二维码用手机连接的功能，联图网(http://www.liantu.com/pingtai/)的二维码开放平台开放了一个生成二维码图片的Api,挺方便使用的。闲着无聊，写了个前台快速生成二维码的方法。 html代码如下:(二维码将生成在这div下) ? 1 &nbs
ImageIO读取一张图片改变大小 3213213333332132 java IO image BufferedImage
package com.demo; import java.awt.image.BufferedImage; import java.io.File; import java.io.IOException; import javax.imageio.ImageIO; /** * @Description 读取一张图片改变大小 * @author FuJianyon
myeclipse集成svn（一针见血） 7454103 eclipse SVN MyEclipse
&n
装箱与拆箱----autoboxing和unboxing darkranger J2SE
4.2　自动装箱和拆箱基本数据(Primitive)类型的自动装箱(autoboxing)、拆箱(unboxing)是自J2SE 5.0开始提供的功能。虽然为您打包基本数据类型提供了方便，但提供方便的同时表示隐藏了细节，建议在能够区分基本数据类型与对象的差别时再使用。 4.2.1　autoboxing和unboxing 在Java中，所有要处理的东西几乎都是对象(Object)
ajax传统的方式制作ajax aijuans Ajax
//这是前台的代码 <%@ page language="java" import="java.util.*" pageEncoding="UTF-8"%> <% String path = request.getContextPath(); String basePath = request.getScheme()+
只用jre的eclipse是怎么编译java源文件的？ avords java eclipse jdk tomcat
eclipse只需要jre就可以运行开发java程序了，也能自动编译java源代码，但是jre不是java的运行环境么，难道jre中也带有编译工具？还是eclipse自己实现的？谁能给解释一下呢问题补充：假设系统中没有安装jdk or jre，只在eclipse的目录中有一个jre，那么eclipse会采用该jre，问题是eclipse照样可以编译java源文件，为什么呢？ &nb
前端模块化 bee1314 模块化
背景：前端JavaScript模块化，其实已经不是什么新鲜事了。但是很多的项目还没有真正的使用起来，还处于刀耕火种的野蛮生长阶段。 JavaScript一直缺乏有效的包管理机制，造成了大量的全局变量，大量的方法冲突。我们多么渴望有天能像Java（import），Python (import)，Ruby(require)那样写代码。在没有包管理机制的年代，我们是怎么避免所
处理百万级以上的数据处理 bijian1013 oracle sql 数据库大数据查询
一.处理百万级以上的数据提高查询速度的方法： 1.应尽量避免在 where 子句中使用!=或<>操作符，否则将引擎放弃使用索引而进行全表扫描。 2.对查询进行优化，应尽量避免全表扫描，首先应考虑在 where 及 o
mac 卸载 java 1.7 或更高版本征客丶 java OS
卸载 java 1.7 或更高 sudo rm -rf /Library/Internet\ Plug-Ins/JavaAppletPlugin.plugin 成功执行此命令后，还可以执行 java 与 javac 命令 sudo rm -rf /Library/PreferencePanes/JavaControlPanel.prefPane 成功执行此命令后，还可以执行 java
【Spark六十一】Spark Streaming结合Flume、Kafka进行日志分析 bit1129 Stream
第一步，Flume和Kakfa对接，Flume抓取日志，写到Kafka中第二部，Spark Streaming读取Kafka中的数据，进行实时分析本文首先使用Kakfa自带的消息处理（脚本）来获取消息，走通Flume和Kafka的对接 1. Flume配置 1. 下载Flume和Kafka集成的插件，下载地址：https://github.com/beyondj2ee/f
Erlang vs TNSDL bookjovi erlang
TNSDL是Nokia内部用于开发电信交换软件的私有语言，是在SDL语言的基础上加以修改而成，TNSDL需翻译成C语言得以编译执行，TNSDL语言中实现了异步并行的特点，当然要完整实现异步并行还需要运行时动态库的支持，异步并行类似于Erlang的process（轻量级进程），TNSDL中则称之为hand，Erlang是基于vm(beam)开发，
非常希望有一个预防疲劳的java软件, 预防过劳死和眼睛疲劳,大家一起努力搞一个 ljy325 企业应用
　非常希望有一个预防疲劳的java软件，我看新闻和网站，国防科技大学的科学家累死了，太疲劳，老是加班，不休息，经常吃药，吃药根本就没用，根本原因是疲劳过度。我以前做java,那会公司垃圾，老想赶快学习到东西跳槽离开，搞得超负荷，不明理。深圳做软件开发经常累死人，总有不明理的人，有个软件提醒限制很好，可以挽救很多人的生命。相关新闻：（1）IT行业成五大疾病重灾区：过劳死平均37.9岁
读《研磨设计模式》-代码笔记-原型模式 bylijinnan java 设计模式
声明：本文只为方便我个人查阅和理解，详细的分析以及源代码请移步原作者的博客http://chjavach.iteye.com/ /** * Effective Java 建议使用copy constructor or copy factory来代替clone()方法： * 1.public Product copy(Product p){} * 2.publi
配置管理---svn工具之权限配置 chenyu19891124 SVN
今天花了大半天的功夫，终于弄懂svn权限配置。下面是今天收获的战绩。安装完svn后就是在svn中建立版本库，比如我本地的是版本库路径是C:\Repositories\pepos。pepos是我的版本库。在pepos的目录结构 pepos component webapps 在conf里面的auth里赋予的权限配置为 [groups]
浅谈程序员的数学修养 comsci 设计模式编程算法面试招聘
浅谈程序员的数学修养
批量执行 bulk collect与forall用法 daizj oracle sql bulk collect forall
BULK COLLECT 子句会批量检索结果，即一次性将结果集绑定到一个集合变量中，并从SQL引擎发送到PL/SQL引擎。通常可以在SELECT INTO、 FETCH INTO以及RETURNING INTO子句中使用BULK COLLECT。本文将逐一描述BULK COLLECT在这几种情形下的用法。有关FORALL语句的用法请参考：批量SQL之 F
Linux下使用rsync最快速删除海量文件的方法 dongwei_6688 OS
1、先安装rsync：yum install rsync 2、建立一个空的文件夹：mkdir /tmp/test 3、用rsync删除目标目录：rsync --delete-before -a -H -v --progress --stats /tmp/test/ log/这样我们要删除的log目录就会被清空了，删除的速度会非常快。rsync实际上用的是替换原理，处理数十万个文件也是秒删。
Yii CModel中rules验证规格 dcj3sjt126com rules yii validate
Yii cValidator主要用法分析： yii验证rulesit 分类： Yii yii的rules验证 cValidator主要属性 attributes ,builtInValidators,enableClientValidation,message,on,safe,skipOnError
基于vagrant的redis主从实验 dcj3sjt126com vagrant
平台: Mac 工具: Vagrant 系统: Centos6.5 实验目的: Redis主从实现思路制作一个基于sentos6.5, 已经安装好reids的box, 添加一个脚本配置从机, 然后作为后面主机从机的基础box 制作sentos6.5+redis的box mkdir vagrant_redis cd vagrant_
Memcached(二)、Centos安装Memcached服务器 frank1234 centos memcached
一、安装gcc rpm和yum安装memcached服务器连接没有找到，所以我使用的是make的方式安装，由于make依赖于gcc，所以要先安装gcc 开始安装，命令如下，[color=red][b]顺序一定不能出错[/b][/color]：建议可以先切换到root用户，不然可能会遇到权限问题：su root 输入密码...... rpm -ivh kernel-head
Remove Duplicates from Sorted List hcx2013 remove
Given a sorted linked list, delete all duplicates such that each element appear only once. For example,Given 1->1->2, return 1->2.Given 1->1->2->3->3, return&
Spring4新特性——JSR310日期时间API的支持 jinnianshilongnian spring4
Spring4新特性——泛型限定式依赖注入 Spring4新特性——核心容器的其他改进 Spring4新特性——Web开发的增强 Spring4新特性——集成Bean Validation 1.1(JSR-349)到SpringMVC Spring4新特性——Groovy Bean定义DSL Spring4新特性——更好的Java泛型操作API Spring4新
浅谈enum与单例设计模式 247687009 java 单例
在JDK1.5之前的单例实现方式有两种(懒汉式和饿汉式并无设计上的区别故看做一种)，两者同是私有构造器，导出静态成员变量，以便调用者访问。第一种 package singleton; public class Singleton { //导出全局成员 public final static Singleton INSTANCE = new S
使用switch条件语句需要注意的几点 openwrt c break switch
1. 当满足条件的case中没有break，程序将依次执行其后的每种条件（包括default）直到遇到break跳出 int main() { int n = 1; switch(n) { case 1: printf("--1--\n"); default: printf("defa
配置Spring Mybatis JUnit测试环境的应用上下文 schnell18 spring mybatis JUnit
Spring-test模块中的应用上下文和web及spring boot的有很大差异。主要试下来差异有：单元测试的app context不支持从外部properties文件注入属性 @Value注解不能解析带通配符的路径字符串解决第一个问题可以配置一个PropertyPlaceholderConfigurer的bean。第二个问题的具体实例是：
Java 定时任务总结一 tuoni java spring timer quartz timertask
Java定时任务总结一.从技术上分类大概分为以下三种方式： 1.Java自带的java.util.Timer类，这个类允许你调度一个java.util.TimerTask任务; 说明： java.util.Timer定时器，实际上是个线程，定时执行TimerTask类 &
一种防止用户生成内容站点出现商业广告以及非法有害等垃圾信息的方法 yangshangchuan rank 相似度计算文本相似度词袋模型余弦相似度
本文描述了一种在ITEYE博客频道上面出现的新型的商业广告形式及其应对方法，对于其他的用户生成内容站点类型也具有同样的适用性。最近在ITEYE博客频道上面出现了一种新型的商业广告形式，方法如下： 1、注册多个账号（一般10个以上）。 2、从多个账号中选择一个账号，发表1-2篇博文

Learning Opencv 3 —— 十二章 图像分析

Opencv 图像分析

离散傅立叶变换

积分图像

Canny 边缘检测算子

霍夫变换

霍夫线变换

霍夫圆变换

距离变换

分割

你可能感兴趣的:(Opencv)

Learning Opencv 3 —— 十二章图像分析