死亡叹息

Learning Opencv 3 —— 十一章通用图像变换 General Image Transforms

Opencv 通用图像变换 General Image Transforms

相比于一类图像变换——卷积，其特点是图像中某个像素点的值只周围的几个像素点的值有关，而本文将介绍的图像变换并不属于此类。

拉伸、收缩、扭曲和旋转

Uniform Resize

void cv::resize(
	cv::InputArray src, // Input image
	cv::OutputArray dst, // Result image
	cv::Size dsize, // New size
	double fx = 0, // x-rescale
	double fy = 0, // y-rescale
	int interpolation = CV::INTER_LINEAR // interpolation method
);

参数说明：

src，dst：输入和输出图像
dsize：输出图像的目标大小
fx，fy：x 和 y 方向的缩放因子。这两个参数和 dsize 比有一个为零值
插值方法：可选参数如下

需要留意的是 cv::Mat::resize() 与该函数效果类似，但是并不进行内插和外推操作。

图像金字塔 Image Pyramids

cv::pyrDown() 首先使用高斯核对图像进行滤波，之后删除其中偶数行偶数列的。使得处理之后的图像变为原来大小的四分之一。

void cv::pyrDown(
	cv::InputArray src, // Input image
	cv::OutputArray dst, // Result image
	const cv::Size& dstsize = cv::Size() // Output image size
);

其中 dstsize 可以指定最后图像的大小，但是这个大小有个严格的限制。

其主要限制了最后的图像大小必须十分接近原图大小的一半。

cv::buildPyramid() 可以一次性产生一系列 cv::pyrDown() 的输出图像。

void cv::buildPyramid(
	cv::InputArray src, // Input image
	cv::OutputArrayOfArrays dst, // Output images from pyramid
	int maxlevel // Number of pyramid levels
);

其中 maxlevel 给出了金字塔的层数，必须大于等于 0。而最后的图像集将包含 maxlevel + 1，其中第一张图像将是原图。

如果你需要一个指定比例的缩放金字塔，而不是固定的2，比如 $\sqrt{2}$ ，一种可选的方式是通过 resize() 函数得到一个原图的 $\sqrt{2}$ 分之一的图像，再分别对原图和处理后的图像调用 cv::buildPyramid()，之后将结果进行组合得到最后的结果。

同理，cv::pyrUp() 转换原图为一个长宽均为两倍大的图像。这里，函数首先将长宽扩展一倍，并为偶数行赋值为 0，之后再使用高斯核得到丢失位置的像素值。

void cv::pyrUp(
	cv::InputArray src, // Input image
	cv::OutputArray dst, // Result image
	const cv::Size& dstsize = cv::Size() // Output image size
);

同理，dstsize 如果给出，必须满足如下限制。

从上面的操作可以看出，cv::pyrUp() 并不是 cv::pyrDown() 的逆操作，因为在 cv::pyrDown() 时一部分图像的信息已经丢失。为此，Opencv 特别引入一个拉普拉斯金字塔，其第 i 层可通过下式进行计算。

基于拉普拉斯金字塔中的图像信息，我们就能完整的恢复出经过 cv::pyrDown() 处理之后的图像。

非均匀映射

非均匀映射可以实现拉伸，收缩，扭曲和旋转，其主要分为两类：仿射变换（变换矩阵为 2 * 3）和透视变换或者被称为齐次变换（变换矩阵为 3 * 3）的。

仿射变换可以把一个平行四边形映射为任意其他的平行四边形。当我们已知多张图片是同一物体在稍微改变一点视角的情况下拍摄的，仿射变换通常被用来求解不同视图之间的变换矩阵。因为其相比于齐次变换具有更少的估计参数更容易被求解。不过，由于这种情况并不完全属于仿射变换，而属于齐次变换，因此这种简化通常只在视图变换较小的情况下才适用。

透视变换是相机拍摄所符合的变换，其能够将矩形变为任意的四边形。

仿射变换

cv::warpAffine() 提供了对于图像的仿射变换，由于存在扭曲，因此其中也使用插值。

void cv::warpAffine(
	cv::InputArray src, // Input image
	cv::OutputArray dst, // Result image
	cv::InputArray M, // 2-by-3 transform mtx
	cv::Size dsize, // Destination image size
	int flags = cv::INTER_LINEAR, // Interpolation, inverse
	int borderMode = cv::BORDER_CONSTANT, // Pixel extrapolation
	const cv::Scalar& borderValue = cv::Scalar() // For constant borders
);

参数说明：

src，dst：输入和输出图像
M：期望的仿射变换矩阵，其中的前两列给出了仿射变换矩阵，最后一列的两个元素给定了 x 和 y 方向上的平移变量。具体计算公式如下。
flags：选择插值方法，见上表。同时，增加 cv::WARP_INVERSE_MAP 使得可以方便地实现逆变换
borderMode，borderValue：给出了边界的填充方式

而 cv::getAffineTransform() 可以被用来求解映射矩阵。

cv::Mat cv::getAffineTransform( // Return 2-by-3 matrix
	const cv::Point2f* src, // Coordinates *three* of vertices
	const cv::Point2f* dst // Target coords, three vertices
);

其中 src 和 dst 通常包含 3 个 2 维的点。

另一种计算映射矩阵的方法是 cv::getRotationMatrix2D()。

cv::Mat cv::getRotationMatrix2D( // Return 2-by-3 matrix
	cv::Point2f center // Center of rotation
	double angle, // Angle of rotation
	double scale // Rescale after rotation
);

其虽然不如 cv::getAffineTransform() 通用，但其给出了一种常用变换的方式：通过给定旋转点，旋转角度和缩放大小来进行仿射变换。如果假定 α = scale * cos(angle)，β = scale * sin(angle) 可得仿射矩阵为

下面的例子综合了以上介绍的函数。

// Example 11-1. An affine transformation.
// Maps the 3 points (0, 0), (0, height-1), (width-1, 0) specified in srcTri[] to
// the specified points in array dstTri using a computed Affine Transform. 
#include 
#include 

using namespace std;

int main(int argc, char** argv) {

  if(argc != 2) {
    cout << "Warp affine\nUsage: " <\n" << endl;
    return -1;
  }

  cv::Mat src = cv::imread(argv[1],1);
  if( src.empty() ) { cout << "Can not load " << argv[1] << endl; return -1; }

  cv::Point2f srcTri[] = {
    cv::Point2f(0,0),           // src Top left
    cv::Point2f(src.cols-1, 0), // src Top right
    cv::Point2f(0, src.rows-1)  // src Bottom left
  };

  cv::Point2f dstTri[] = {
    cv::Point2f(src.cols*0.f, src.rows*0.33f),   // dst Top left
    cv::Point2f(src.cols*0.85f, src.rows*0.25f), // dst Top right
    cv::Point2f(src.cols*0.15f, src.rows*0.7f)   // dst Bottom left
  };

  // COMPUTE AFFINE MATRIX
  //
  cv::Mat warp_mat = cv::getAffineTransform(srcTri, dstTri);
  cv::Mat dst, dst2;
  cv::warpAffine(
    src,
    dst,
    warp_mat,
    src.size(),
    cv::INTER_LINEAR,
    cv::BORDER_CONSTANT,
    cv::Scalar()
  );
  for( int i = 0; i < 3; ++i )
    cv::circle(dst, dstTri[i], 5, cv::Scalar(255, 0, 255), -1, cv::LINE_AA);

  cv::imshow("Affine Transform Test", dst);
  cv::waitKey();

  for(int frame=0;;++frame) {

    // COMPUTE ROTATION MATRIX
    cv::Point2f center(src.cols*0.5f, src.rows*0.5f);
    double angle = frame*3 % 360, scale = (cos((angle - 60)* CV_PI/180) + 1.05)*0.8;

    cv::Mat rot_mat = cv::getRotationMatrix2D(center, angle, scale);

    cv::warpAffine(
      src,
      dst,
      rot_mat,
      src.size(),
      cv::INTER_LINEAR,
      cv::BORDER_CONSTANT,
      cv::Scalar()
    );
    cv::imshow("Rotated Image", dst);
    if(cv::waitKey(30) >= 0 )
      break;

  }

  return 0;
}

cv::transform() 给出了对于点的仿射函数。

void cv::transform(
	cv::InputArray src, // Input N-by-1 array (Ds channels)
	cv::OutputArray dst, // Output N-by-1 array (Dd channels)
	cv::InputArray mtx // Transform matrix (Ds-by-Dd)
);

其中 N 为点数，而点的维数分别为 Ds 和 Dd。

cv::invertAffineTransform() 实现了逆仿射变换，其通过给定仿射矩阵，给出其逆仿射矩阵。

void cv::invertAffineTransform(
	cv::InputArray M, // Input 2-by-3 matrix
	cv::OutputArray iM // Output also a 2-by-3 matrix
);

透视变换

首先必须注意的是透视变换虽然矩阵乘法实现，但由于其最后需要除以最后一维，因此其并不是一个线性变换。

cv::warpPerspective() 给出了透视变换函数

void cv::warpPerspective(
	cv::InputArray src, // Input image
	cv::OutputArray dst, // Result image
	cv::InputArray M, // 3-by-3 transform mtx
	cv::Size dsize, // Destination image size
	int flags = cv::INTER_LINEAR, // Interpolation, inverse
	int borderMode = cv::BORDER_CONSTANT, // Extrapolation method
	const cv::Scalar& borderValue = cv::Scalar() // For constant borders
);

其中目标图像的像素位置可按下式计算。

对比仿射变换的计算公式，可以得出矩阵第三行的前两列元素对应着透视变换部分，而 $M_{22}$ 通常通过变换保持为 1。这也再次印证了仿射变换时透视变换的一个特例。

cv::getPerspectiveTransform() 给出了计算透视变换矩阵的方法

cv::Mat cv::getPerspectiveTransform( // Return 3-by-3 matrix
	const cv::Point2f* src, // Coordinates of *four* vertices
	const cv::Point2f* dst // Target coords, four vertices
);

其中 src 和 dst 都是四个点的向量。

下面的例子给出了透视变换的具体使用方式

// Example 11-2. Code for perspective transformation
// Compute a perspective transformation between the 4 src control points
// in srcQuad to 4 dst control points in dstQuad and apply it the image.

#include 
#include 

using namespace std;

int main(int argc, char** argv) {

  if(argc != 2) {
    cout << "Perspective Warp\nUsage: " <\n" << endl;
    return -1;
  }

  cv::Mat src = cv::imread(argv[1],1);
  if( src.empty() ) { cout << "Can not load " << argv[1] << endl; return -1; }

  cv::Point2f srcQuad[] = {
    cv::Point2f(0, 0),                   // src Top left
    cv::Point2f(src.cols-1, 0),          // src Top right
    cv::Point2f(src.cols-1, src.rows-1), // src Bottom right
    cv::Point2f(0, src.rows-1)           // src Bottom left
  };

  cv::Point2f dstQuad[] = {
    cv::Point2f(src.cols*0.05f, src.rows*0.33f),
    cv::Point2f(src.cols*0.9f, src.rows*0.25f),
    cv::Point2f(src.cols*0.8f, src.rows*0.9f),
    cv::Point2f(src.cols*0.2f, src.rows*0.7f)
  };

  // COMPUTE PERSPECTIVE MATRIX
  //
  cv::Mat warp_mat = cv::getPerspectiveTransform(srcQuad, dstQuad);
  cv::Mat dst;
  cv::warpPerspective(src, dst, warp_mat, src.size(), cv::INTER_LINEAR,
                      cv::BORDER_CONSTANT, cv::Scalar());

  for( int i = 0; i < 4; i++ )
    cv::circle(dst, dstQuad[i], 5, cv::Scalar(255, 0, 255), -1, cv::LINE_AA);

  cv::imshow("Perspective Transform Test", dst);
  cv::waitKey();
  return 0;
}

cv::perspectiveTransform() 实现了对点的透视变换

void cv::perspectiveTransform(
	cv::InputArray src, // Input N-by-1 array (2 or 3 channels)
	cv::OutputArray dst, // Output N-by-1 array (2 or 3 channels)
	cv::InputArray mtx // Transform matrix (3-by-3 or 4-by-4)
);

这里由于透视变换是将在三维空间中的一个平面向另一个不同的二维子空间进行投影，因此如果图片是 2 维的，那么透视变换矩阵就应该是 3 维的；而如果图片是 3 维的，那么透视变换矩阵就应该是 4 维的。具体介绍可以参考：Opencv 摄像机模型与标定 Camera Models and Calibration

极坐标映射

cv::cartToPolar() 实现从直角坐标系向极坐标系之间的转变。

void cv::cartToPolar(
	cv::InputArray x, // Input single channel x-array
	cv::InputArray y, // Input single channel y-array
	cv::OutputArray magnitude, // Output single channel mag-array
	cv::OutputArray angle, // Output single channel angle-array
	bool angleInDegrees = false // Set true for degrees, else radians
);

如果 angleInDegrees 为真，angle 将以度给出；否则将以弧度给出。

这里有一个实用的例子，可能用到这个函数。当你通过 cv::Sobel() 或 cv::DFT() 或 cv::filter2D() 获得图像 x 和 y 方向的微分之后，可以使用 cartToPolar() 得到梯度的幅度和方向，从而根据幅度阈值筛选像素点，并给出梯度的方向。

相应的 cv::polarToCart() 实现从极坐标系向直角坐标系之间的转变。

void cv::polarToCart(
	cv::InputArray magnitude, // Output single channel mag-array
	cv::InputArray angle, // Output single channel angle-array
	cv::OutputArray x, // Input single channel x-array
	cv::OutputArray y, // Input single channel y-array
	bool angleInDegrees = false // Set true for degrees, else radians
);

对数极坐标系

对数极坐标系基于某个点按 $\rho = log(\sqrt{(x - x_c)^2 + (y - y_c)^2})$ ， $\theta = atan2(y - y_c, x - x_c)$ 进行变换.

void cv::logPolar(
	cv::InputArray src, // Input image
	cv::OutputArray dst, // Output image
	cv::Point2f center, // Center of transform
	double m, // Scale factor
	int flags = cv::INTER_LINEAR // interpolation and fill modes
			| cv::WARP_FILL_OUTLIERS
);

进行如此变换的主要原因是在固定中心点的情况，旋转和缩放的图像在变换到对数极坐标系下之后只表现为缩放和平移。

// Example 11-3. Log-polar transform example
// Log-polar transform example.
// This demonstrates the forward and backward (inverse) log-polar
// transform.

#include 
#include 

using namespace std;

int main(int argc, char** argv) {
  if(argc != 3) {
    cout << "LogPolar\nUsage: " < \n"
	 <<"~30 is usually good enough\n";
    return -1;
  }

  cv::Mat src = cv::imread(argv[1],1);

  if( src.empty() ) { cout << "Can not load " << argv[1] << endl; return -1; }

  double M = atof(argv[2]);
  cv::Mat dst(src.size(), src.type()), src2(src.size(), src.type());

  cv::logPolar(
    src,
    dst,
    cv::Point2f(src.cols*0.5f, src.rows*0.5f),
    M,
    cv::INTER_LINEAR | cv::WARP_FILL_OUTLIERS
  );
  cv::logPolar(
    dst,
    src2,
    cv::Point2f(src.cols*0.5f, src.rows*0.5f),
    M,
    cv::INTER_LINEAR | cv::WARP_INVERSE_MAP
  );
  cv::imshow( "log-polar", dst );
  cv::imshow( "inverse log-polar", src2 );

  cv::waitKey();

  return 0;
}

任意映射

void cv::remap(
	cv::InputArray src, // Input image
	cv::OutputArray dst, // Output image
	cv::InputArray map1, // target x for src pix
	cv::InputArray map2, // target y for src pix
	int interpolation = cv::INTER_LINEAR, // Interpolation, inverse
	int borderMode = cv::BORDER_CONSTANT, // Extrapolation method
	const cv::Scalar& borderValue = cv::Scalar() // For constant borders
);

该函数通过用户指定 x 和 y 方向上的映射函数，实现任意映射的功能。

图像修复

cv::inpaint() 可以实现图像的修复，但是图像中的修复位置不能太厚，即损坏部分周围必须包含足够的原始图片的纹理和色彩信息。

void cv::inpaint(
	cv::InputArray src, // Input image: 8-bit, 1 or 3 channels
	cv::InputArray inpaintMask, // 8-bit, 1 channel. Inpaint nonzeros
	cv::OutputArray dst, // Result image
	double inpaintRadius, // Range to consider around pixel
	int flags // Select NS or TELEA
);

参数说明：

src：包含损坏点的原始图像
inpaintMask：非零点标示了原始图像中破坏的位置
dst：修补后的图像
inpaintRadius：指定了使用周围多大范围内的像素来进行修补。同时，设置一个较小的，比如 3，否则将造成很明显的平滑的痕迹
flags：修补方法的选择，这里只给出两种方法——cv::INPAINT_NS (Navier-Stokes method) 和 cv::INPAINT_TELEA (A. Telea’s method)

去噪

在大多数场景下，噪声通常是由于低光照条件下，数字图像的增益必须加大，这也就造成噪声也被放大。Opencv 中实现的降噪算法被称为 Fast Non-Local Means Denoising (FNLMD)，其基本原理是寻找周围的相似像素，然后平均。这里的相似不是基于相似的色彩或者强度，而是基于相似的环境。其通过下式来计算两块区域的相似性

并通过下式来计算对应区域加权的权重

void cv::fastNlMeansDenoising(
	cv::InputArray src, // Input image
	cv::OutputArray dst, // Output image
	float h = 3, // Weight decay parameter
	int templateWindowSize = 7, // Size of patches used for comparison
	int searchWindowSize = 21 // Maximum patch distance to consider
);

其中 templateWindowSize 就是多大的窗口被用于比较，而 searchWindowSize 就是最远多远的窗口将参与加权。

下面这张表给出了以下可供参考的参数值

void cv::fastNlMeansDenoisingColored(
	cv::InputArray src, // Input image
	cv::OutputArray dst, // Output image
	float h = 3, // Luminosity weight decay parameter
	float hColor = 3, // Color weight decay parameter
	int templateWindowSize = 7, // Size of patches used for comparison
	int searchWindowSize = 21 // Maximum patch distance to consider
);

该算法首先将 RGB 图像转换到 LAB 颜色空间，使用 FNLMD 去除噪声之后，再将图像变换 RGB 空间。转换到 LAB 的原因是对于亮度可以设置一个不同的延迟参数。

void cv::fastNlMeansDenoisingMulti(
	cv::InputArrayOfArrays srcImgs, // Sequence of several images
	cv::OutputArray dst, // Output image
	int imgToDenoiseIndex, // Index of image to denoise
	int temporalWindowSize, // Num images to use (odd)
	float h = 3, // Weight decay parameter
	int templateWindowSize = 7, // Size of comparison patches
	int searchWindowSize = 21 // Maximum patch distance
);
void cv::fastNlMeansDenoisingColoredMulti(
	cv::InputArrayOfArrays srcImgs, // Sequence of several images
	cv::OutputArray dst, // Output image
	int imgToDenoiseIndex, // Index of image to denoise
	int temporalWindowSize, // Num images to use (odd)
	float h = 3, // Weight decay param
	float hColor = 3, // Weight decay param for color
	int templateWindowSize = 7, // Size of comparison patches
	int searchWindowSize = 21 // Maximum patch distance
);

这两个函数作用于序列图片，使用多帧图片来辅助进行去噪操作。其中 imgToDenoiseIndex 指定了需要去噪的图片；temporalWindowSize 指定了使用前后多少帧图片参与去噪，必须为奇数。

直方图均衡化

在标准的照相机中，通过设置快门和光圈的大小来控制获得不多也不少的曝光。然而对于每张照片对比度的范围通常大于相机的动态范围。因此必须在获取阴影部分的细节与避免图像饱和白花之间进行权衡。虽然一张照片在拍摄之后我们无法改变所记录的内容，但是仍然可以通过直方图均衡化来增加照片的对比度。

void cv::equalizeHist(
	const cv::InputArray src, // Input image
	cv::OutputArray dst // Result image
);

此函数只能处理单通道图像，即灰度图像。对于彩色图像，你可以对通道进行拆分之后分别处理，但这通常不能获得满意的效果。建议的做法是将 RGB 图像转换到 LAB 空间中，并只对亮度通道进行直方图均衡化操作。

HarmonyNext实战：基于ArkTS的高性能图像处理应用开发 harmonyos-next
HarmonyNext实战：基于ArkTS的高性能图像处理应用开发引言在HarmonyNext生态系统中，图像处理是一个重要且具有挑战性的领域。本文将深入探讨如何使用ArkTS构建一个高性能的图像处理应用，涵盖从基础图像操作到高级滤镜应用的完整开发流程。我们将通过一个实际的案例——实现一个实时图像滤镜应用，来展示ArkTS在HarmonyNext平台上的强大能力。环境准备在开始之前，确保你的开发环
HarmonyNext实战案例：基于ArkTS的高性能图像处理应用开发 harmonyos-next
HarmonyNext实战案例：基于ArkTS的高性能图像处理应用开发引言在HarmonyNext生态系统中，ArkTS作为新一代的编程语言，为开发者提供了强大的工具来构建高性能、跨平台的应用。本文将深入探讨如何使用ArkTS12+语法开发一个高性能的图像处理应用，涵盖从基础概念到高级技巧的全面讲解。通过本案例，您将学习到如何利用HarmonyNext的特性，结合ArkTS的强大功能，实现复杂的图
PyTorch实现CNN：CIFAR-10图像分类实战教程吴师兄大模型 PyTorch pytorch cnn CIFAR-10图像分类人工智能 python 卷积神经网络开发语言
Langchain系列文章目录01-玩转LangChain：从模型调用到Prompt模板与输出解析的完整指南02-玩转LangChainMemory模块：四种记忆类型详解及应用场景全覆盖03-全面掌握LangChain：从核心链条构建到动态任务分配的实战指南04-玩转LangChain：从文档加载到高效问答系统构建的全程实战05-玩转LangChain：深度评估问答系统的三种高效方法（示例生成、手
Python通过YOLO格式TXT标签文件在图像中画框 CHERISH_KDX python YOLO 人工智能
使用场景检测数据集标注是否有误：在目标检测算法中需要标注自己的数据集，为了更加方便的检查数据集标注是否有误，可以使用该工具将标注结果绘制在图像中并查看。美化识别结果中的检测框：在一些目标检测场景中，YOLO检测算法原始的检测框绘制会导致重叠、颜色冲突、字体过大等问题。可以使用该工具进行修改。代码importosimportcv2classcheck_label:def__init__(self,c
【漫话机器学习系列】130.主成分（Principal Components） IT古董漫话机器学习系列专辑机器学习人工智能 python
主成分（PrincipalComponents）详解1.什么是主成分？主成分（PrincipalComponents，PCs）是数据集中方差最大的线性组合，它是主成分分析（PrincipalComponentAnalysis，PCA）中的核心概念。主成分可以看作是对原始特征的新表述方式，它通过数学变换找到一组新的正交坐标轴，使得数据的主要变化方向与这些轴对齐。简单来说：主成分是数据集中信息量（方差
人脸识别，dlib优化，Dlib/OpenCV交叉编译 yiyayiya557 linux 嵌入式
参考文章：GitRepo镜像使用帮助https://mirrors.tuna.tsinghua.edu.cn/help/git-repo/交叉编译Dlib+OpenCV交叉编译移植到ARM64-v8平台（编译不通过，不可用）https://blog.csdn.net/kaychangeek/article/details/80365320Qt移植到ARM64-v8平台(NXPi.MX8M)笔记（未
一学就会的深度学习基础指令及操作步骤（6）迁移学习小圆圆666 深度学习迁移学习人工智能卷积神经网络
文章目录迁移学习模型准备数据增强模型训练模型微调和预测检查预测结果迁移学习迁移学习是将一个任务中学到的知识应用到另一个相关任务上，以提高新任务的学习效率和性能。优势：节省训练时间，提高模型性能，尤其在小数据场景下效果显著。核心是利用源域的知识来帮助目标域任务，比如在ImageNet上预训练的模型用于医疗影像分类。源域（SourceDomain）：已有知识的领域（如ImageNet图像库）。目标域（
YOLOv8制作自己的实例分割数据集保姆级教程（包含json转txt） Sir小珂 YOLO python 深度学习人工智能
1.数据准备首先对原始数据集进行整理，将标注好的图像和标签分别放在两个文件夹中，同时额外新建两个文件夹，用于存放转换完的标签与划分后的数据集。1.1将json格式文件转换为txt格式新建json2txt.py文件，将代码中的文件路径修改为自己的路径。❗❗❗代码中第43行的classes中存放的是自己数据集的分类标签，记得修改成自己的。importjsonimportosfromtqdmimport
【Python爬虫实战】从多类型网页数据到结构化JSON数据的高效提取策略易辰君 python爬虫 python 爬虫开发语言
个人主页：https://blog.csdn.net/2401_86688088?type=blog系列专栏：https://blog.csdn.net/2401_86688088/category_12797772.html目录前言一、数据类型及其对应的提取策略（一）文本数据（二）数值数据（三）链接（四）图像数据（五）表格数据（六）JSON数据（七）动态数据（八）元数据（九）总结二、结构化数据提
向量数据库简介 openwin_top python编程示例系列 python编程示例系列二数据库
向量数据库（VectorDatabase）是一种专门用于存储和查询向量数据的数据库系统。向量数据库通常使用高效的向量索引技术，支持基于向量相似度的查询和检索，可以应用于图像搜索、自然语言处理、推荐系统、机器学习等领域。与传统的关系型数据库不同，向量数据库通常使用基于向量的数据模型，将向量作为数据的核心表示形式。向量数据库可以存储和处理大量的向量数据，支持高效的向量相似度计算和查询。常见的向量索引技
开源向量数据库介绍说明 ❀͜͡傀儡师开源数据库
开源向量数据库Milvus特点：分布式、高性能，支持亿级向量检索。支持的数据类型：文本、图像、音频、视频等。使用场景：推荐系统、语义搜索、图像搜索。数据存储后端：支持多种后端，如SQLite、MySQL、PostgreSQL。Qdrant特点：高可用性、易用性，支持实时更新和过滤。编程接口：支持REST和gRPC。使用场景：个性化推荐、自然语言搜索、商品搜索。Weaviate特点：基于GraphQ
Permute 3 for Mac v3.11.10 全能媒体格式转换器明天会在哪 macos
Permute3软件是一款功能强大的媒体格式转换工具，它为用户提供了前所未有的便利性和灵活性，以处理各种音频、视频和图像文件。无论是在个人娱乐、专业制作还是跨平台兼容性的需求中，Permute3都能轻松应对，满足用户多样化的媒体格式转换需求。前往Mac粉笔下载Permute3forMacv3.11.10全能媒体格式转换器激活版-Mac粉笔网(macfb.com)首先，Permute3支持广泛的媒体
使用Activeloop Deep Lake构建深度学习数据仓库与向量存储 dgay_hua 深度学习人工智能 python
技术背景介绍随着深度学习技术的发展，数据的存储与管理成为了一个重要的问题。尤其是对于需要处理大量数据的应用，例如自然语言处理和图像识别，传统的数据存储方式已经无法满足需求。ActiveloopDeepLake是专为深度学习设计的数据仓库，可以作为向量存储使用，支持多模态数据的存储和处理，并且可以直接用于细调大型语言模型（LLMs）。此外，它还提供自动版本控制，无需依赖其他服务，兼容主要云服务提供商
Azure AI Document Intelligence 使用指南 scaFHIO azure 人工智能 flask python
AzureAIDocumentIntelligence使用指南AzureAIDocumentIntelligence（原名AzureFormRecognizer）是一项基于机器学习的服务，可以从数字或扫描PDF、图像、Office和HTML文件中提取文本（包括手写）、表格、文档结构（如标题、节标题等）和键值对。它支持多种格式，包括PDF、JPEG/JPG、PNG、BMP、TIFF、HEIF、DOC
大语言模型原理基础与前沿挑战与机遇 AI大模型应用之禅 DeepSeek R1 &AI大模型与大数据计算科学神经计算深度学习神经网络大数据人工智能大型语言模型 AI AGI LLM Java Python 架构设计 Agent RPA
大语言模型原理基础与前沿挑战与机遇1.背景介绍大语言模型（LargeLanguageModels,LLMs）是近年来人工智能领域的一个重要突破。它们通过深度学习技术，特别是基于变换器（Transformer）架构的模型，能够在自然语言处理（NLP）任务中表现出色。大语言模型的出现不仅推动了学术研究的发展，也在实际应用中展现了巨大的潜力。1.1大语言模型的起源大语言模型的起源可以追溯到早期的统计语言
three.js 在 webGL 添加纹理 belldeep javascript three.js javascript webgl three.js p5.js
在我们生成了3D设计之后，我们可以添加纹理使其更加吸引人。在webGL和p5.js中，可以使用gl.texImage2D()和texture()API来为形状应用纹理。使用webGL在webGL中，gl.texImage2D()函数用于从图像文件生成2D纹理。该函数接受许多参数，包括目标，细节级别，内部格式，图像的宽度和高度，以及图像数据的格式和类型。为了方便，我将使用vite搭建一个原生js项目
DeepSeek源码解析（2）白鹭凡 deepseek ai
Tensor（张量）的介绍在计算机科学和机器学习领域，“张量”（Tensor）是一个数学概念，它被用来表示多维数组。在大模型（如深度学习模型）中，张量扮演着核心角色，具体来说：数据表示：张量用于表示输入数据、模型参数和中间计算结果。例如，在图像处理中，一张图片可以被表示为一个三维张量（高度、宽度、颜色通道数），而在自然语言处理中，一段文本可以被编码为一系列词向量组成的二维张量（句子长度、词向量维度
Python编程案例教程PPT2022,Python编程案例教程答案 a1237567892 信息可视化
欢迎来到今天的讨论，我们将探讨，Python编程案例教程第2版航空工业出版社高登刘洋Python编程案例教程刘庆,姚丽娜,余美华电子版，一起探索吧！在接口自动化工作中,经常需要处理文字识别的任务,而OCR库能够帮助我们将图像中的文字提取出来,所以本文为大家整理了四个常用的OCR库以及它们的用法,需要的可以参考下Python客栈送红包、纸质书1、pyocr2、pytesseract3、python-
华为OD机试 -猜字谜（Java & Python& JS & C++ & C ）算法大师最新华为OD机试华为华为od python java javascript c++
最新华为OD机试真题目录：点击查看目录华为OD面试真题精选：点击立即查看题目描述小王设计了一个简单的猜字谜游戏，游戏的谜面是一个错误的单词，比如nesw，玩家需要猜出谜底库中正确的单词。猜中的要求如下：对于某个谜面和谜底单词，满足下面任一条件都表示猜中：变换顺序以后一样的，比如通过变换w和e的顺序，“nwes”跟“news”是可以完全对应的；字母去重以后是一样的，比如“woood”和“wood”是
华为OD机试E卷 -猜字谜（Java & Python& JS & C++ & C ）算法大师最新华为OD机试华为od java python c语言 javascript c++华为od机考e卷
最新华为OD机试真题目录：点击查看目录华为OD面试真题精选：点击立即查看题目描述小王设计了一个简单的猜字谜游戏，游戏的谜面是一个错误的单词，比如nesw，玩家需要猜出谜底库中正确的单词。猜中的要求如下：对于某个谜面和谜底单词，满足下面任一条件都表示猜中：变换顺序以后一样的，比如通过变换w和e的顺序，“nwes”跟“news”是可以完全对应的；字母去重以后是一样的，比如“woood”和“wood”是
Midjourney绘图参数详解：从基础到高级的全面指南码上飞扬 midjourney
引言Midjourney作为当前最受欢迎的AI绘图工具之一，其强大的参数系统为用户提供了丰富的创作可能性。本文将深入解析Midjourney的各项参数，帮助开发者更好地掌握这一工具，提升创作效率和质量。一、基本参数配置1.图像比例调整使用--ar参数可以设置图像的宽高比，例如--ar16:9将生成16:9的宽屏图像。2.提示权重控制--iw参数用于控制文本提示对图像的影响程度，默认值为0.25，可
【LeetCode系列】Google面试题烊萌 LeetCode经典题目讲解 LeetCode系列 Google面试题讲解
Google面试题目录Google面试题LeetCode14最长公共前缀1、分析2、代码LeetCode20有效的括号1、分析2、代码LeetCode43字符串相乘1、分析2、代码LeetCode48旋转图像1、分析2、代码LeetCode31下一个排列1、分析2、代码LeetCode23合并K个排序链表1、分析2、代码LeetCode33搜索旋转排序数组1、分析2、代码LeetCode11盛最多
学习总结项目苏小夕夕学习人工智能深度学习机器学习
近段时间学习了机器学习、线性回归和softmax回归、多层感知机、卷积神经网络、Pytorch神经网络工具箱、Python数据处理工具箱、图像分类等的知识，学习了利用神经网络实现cifar10的操作、手写图像识别项目以及其对应的实验项目报告总结。项目总结本次项目我使用了VGG19模型、AlexNet模型和已使用的VGG16模型进行对比，在已有的条件下，对代码进行更改是，结果展示中，VGG19模型的
【一文学会 HTML5】熬夜超级玩家前端 html 前端
目录HTML概述基本概念HTML发展历程HTML基本结构网页基本标签标题标签（``-``）段落标签（``）换行标签（``）水平线标签（``）注释（``）特殊符号图像标签基本语法主要属性图像的对齐和样式响应式图像链接标签基本语法重要属性`href`属性`target`属性`title`属性`rel`属性`download`属性链接样式示例代码特殊链接形式图像链接按钮链接块元素和行内元素块元素（Blo
智能遥感新质生产力：ChatGPT、Python和OpenCV强强联合；空天地遥感数据分析的全流程；地面数据、无人机数据、卫星数据、多源数据等处理小艳加油 DeepSeek ChatGPT 遥感遥感新质生产力 ChatGPT OpenCV 遥感数据处理
通过系统化的模块设计和丰富的实战案例，深入理解和掌握遥感数据的处理与计算。不仅涵盖了从零基础入门Python编程、OpenCV视觉处理的基础知识，还将借助ChatGPT智能支持，引导您掌握遥感影像识别和分析的进阶技术。更为重要的是，通过15个经过精心设计的真实案例，深度参与地质监测、城市规划、农业分析、生态评估等不同场景下的遥感应用实践。层层递进、结构严谨，帮助您系统性掌握从数据预处理、图像增强、
opencv cuda例程 OpenCV和Cuda结合编程 weixin_44602056 opencv C++
本文转载自：https://www.fuwuqizhijia.com/linux/201704/70863.html此网页，仅保存下来供随时查看一、利用OpenCV中提供的GPU模块目前，OpenCV中已提供了许多GPU函数，直接使用OpenCV提供的GPU模块，可以完成大部分图像处理的加速操作。该方法的优点是使用简单，利用GpuMat管理CPU与GPU之间的数据传输，而且不需要关注内核函数调用参
OpenCV连续数字识别—可运行验证正冬升 OpenCV opencv 人工智能计算机视觉
前言文章开始，瞎说一点其他的东西，真的是很离谱，找了至少两三个小时，就一个简单的需求：1、利用OpenCV在Windows进行抓图2、利用OpenCV进行连续数字的检测。3、使用C++，Qt3、将检测的结果显示出来就这么简单的需求，结果网上找了各种版本硬是找不到,要是代码可能没啥问题，但是运行不了，你这运行不了，我怎么知道你到底能不能用，我代码调半天能用了，结果你跟我说最后效果不好，为啥呢？因为图
H.264---序列参数集（SPS）---宽高获取 SXM19940913sxm H264
SequenceParamaterSet（NALUnit=7）SPS和PPS一般处于码流的起始位置，但也可能出现在码流中间，主要原因是：1、解码器需要在码流中间开始解码；2、编码器在编码的过程中改变了码流的参数（如图像分辨率等）；SPS结构（H264文档7.3.2.1）/**[email protected]*
利用CUDA与OpenCV实现高效图像处理：全面指南快撑死的鱼 C++（C语言）算法大揭秘 opencv 图像处理人工智能
利用CUDA与OpenCV实现高效图像处理：全面指南前言在现代计算机视觉领域，图像处理的需求日益增加。无论是自动驾驶、安防监控，还是医疗影像分析，图像处理技术都扮演着至关重要的角色。然而，图像处理的计算量非常大，往往需要强大的计算能力来保证实时性和高效性。幸运的是，CUDA和OpenCV为我们提供了一种高效的图像处理解决方案。本篇文章将详细介绍如何结合CUDA与OpenCV，利用GPU的强大计算能
深度学习 PyTorch 中 18 种数据增强策略与实现 @Mr_LiuYang 计算机视觉基础数据增强深度学习 torchvision transforms
深度学习pytorch之简单方法自定义9类卷积即插即用数据增强通过对训练数据进行多种变换，增加数据的多样性，它帮助我们提高模型的鲁棒性，并减少过拟合的风险。PyTorch提供torchvision.transforms模块丰富的数据增强操作，我们可以通过组合多种策略来实现复杂的增强效果。本文将介绍18种常用的图像数据增强策略，并展示如何使用PyTorch中的torchvision.transfor
Java 并发包之线程池和原子计数 lijingyao8206 Java计数 ThreadPool 并发包 java线程池
对于大数据量关联的业务处理逻辑，比较直接的想法就是用JDK提供的并发包去解决多线程情况下的业务数据处理。线程池可以提供很好的管理线程的方式，并且可以提高线程利用率，并发包中的原子计数在多线程的情况下可以让我们避免去写一些同步代码。这里就先把jdk并发包中的线程池处理器ThreadPoolExecutor 以原子计数类AomicInteger 和倒数计时锁C
java编程思想抽象类和接口百合不是茶 java 抽象类接口
接口c++对接口和内部类只有简介的支持,但在java中有队这些类的直接支持 1 ,抽象类 : 如果一个类包含一个或多个抽象方法,该类必须限定为抽象类(否者编译器报错) 抽象方法 : 在方法中仅有声明而没有方法体 package com.wj.Interface;
[房地产与大数据]房地产数据挖掘系统 comsci 数据挖掘
随着一个关键核心技术的突破,我们已经是独立自主的开发某些先进模块,但是要完全实现,还需要一定的时间... 所以,除了代码工作以外,我们还需要关心一下非技术领域的事件..比如说房地产 &nb
数组队列总结沐刃青蛟数组队列
数组队列是一种大小可以改变，类型没有定死的类似数组的工具。不过与数组相比，它更具有灵活性。因为它不但不用担心越界问题，而且因为泛型（类似c++中模板的东西）的存在而支持各种类型。以下是数组队列的功能实现代码： import List.Student; public class
Oracle存储过程无法编译的解决方法 IT独行者 oracle 存储过程　
今天同事修改Oracle存储过程又导致2个过程无法被编译，流程规范上的东西，Dave 这里不多说，看看怎么解决问题。 1. 查看无效对象 XEZF@xezf(qs-xezf-db1)> select object_name,object_type,status from all_objects where status='IN
重装系统之后oracle恢复文强chu oracle
前几天正在使用电脑，没有暂停oracle的各种服务。突然win8.1系统奔溃，无法修复，开机时系统提示正在搜集错误信息，然后再开机，再提示的无限循环中。无耐我拿出系统u盘准备重装系统，没想到竟然无法从u盘引导成功。晚上到外面早了一家修电脑店，让人家给装了个系统，并且那哥们在我没反应过来的时候，直接把我的c盘给格式化了并且清理了注册表，再装系统。然后的结果就是我的oracl
python学习二（一些基础语法）小桔子 pthon 基础语法
紧接着把！昨天没看继续看django 官方教程，学了下python的基本语法与c类语言还是有些小差别： 1.ptyhon的源文件以UTF-8编码格式 2. / 除结果浮点型 // 除结果整形 % 除取余数 * 乘 ** 乘方 eg 5**2 结果是5的2次方25 _&
svn 常用命令 aichenglong SVN 版本回退
1 svn回退版本 1)在window中选择log,根据想要回退的内容,选择revert this version或revert chanages from this version 两者的区别: revert this version:表示回退到当前版本(该版本后的版本全部作废) revert chanages from this versio
某小公司面试归来 alafqq 面试
先填单子，还要写笔试题，我以时间为急，拒绝了它。。时间宝贵。老拿这些对付毕业生的东东来吓唬我。。面试官很刁难，问了几个问题，记录下； 1，包的范围。。。public,private,protect. --悲剧了 2，hashcode方法和equals方法的区别。谁覆盖谁.结果，他说我说反了。 3，最恶心的一道题，抽象类继承抽象类吗？（察，一般它都是被继承的啊） 4，stru
动态数组的存储速度比较集合框架百合不是茶集合框架
集合框架：自定义数据结构(增删改查等) package 数组; /** * 创建动态数组 * @author 百合 * */ public class ArrayDemo{ //定义一个数组来存放数据 String[] src = new String[0]; /** * 增加元素加入容器 * @param s要加入容器
用JS实现一个JS对象，对象里有两个属性一个方法 bijian1013 js对象
<html> <head> </head> <body> 用js代码实现一个js对象，对象里有两个属性，一个方法 </body> <script> var obj={a:'1234567',b:'bbbbbbbbbb',c:function(x){
探索JUnit4扩展：使用Rule bijian1013 java 单元测试 JUnit Rule
在上一篇文章中，讨论了使用Runner扩展JUnit4的方式，即直接修改Test Runner的实现(BlockJUnit4ClassRunner)。但这种方法显然不便于灵活地添加或删除扩展功能。下面将使用JUnit4.7才开始引入的扩展方式——Rule来实现相同的扩展功能。 1. Rule &n
[Gson一]非泛型POJO对象的反序列化 bit1129 POJO
当要将JSON数据串反序列化自身为非泛型的POJO时，使用Gson.fromJson(String, Class)方法。自身为非泛型的POJO的包括两种： 1. POJO对象不包含任何泛型的字段 2. POJO对象包含泛型字段，例如泛型集合或者泛型类 Data类 a.不是泛型类， b.Data中的集合List和Map都是泛型的 c.Data中不包含其它的POJO
【Kakfa五】Kafka Producer和Consumer基本使用 bit1129 kafka
0.Kafka服务器的配置一个Broker，一个Topic Topic中只有一个Partition（） 1. Producer： package kafka.examples.producers; import kafka.producer.KeyedMessage; import kafka.javaapi.producer.Producer; impor
lsyncd实时同步搭建指南——取代rsync+inotify ronin47
1. 几大实时同步工具比较 1.1 inotify + rsync 最近一直在寻求生产服务服务器上的同步替代方案，原先使用的是 inotify + rsync，但随着文件数量的增大到100W+，目录下的文件列表就达20M，在网络状况不佳或者限速的情况下，变更的文件可能10来个才几M，却因此要发送的文件列表就达20M，严重减低的带宽的使用效率以及同步效率；更为要紧的是，加入inotify
java-9. 判断整数序列是不是二元查找树的后序遍历结果 bylijinnan java
public class IsBinTreePostTraverse{ static boolean isBSTPostOrder(int[] a){ if(a==null){ return false; } /*1.只有一个结点时，肯定是查找树 *2.只有两个结点时，肯定是查找树。例如{5,6}对应的BST是 6 {6,5}对应的BST是
MySQL的sum函数返回的类型 bylijinnan java spring sql mysql jdbc
今天项目切换数据库时，出错访问数据库的代码大概是这样： String sql = "select sum(number) as sumNumberOfOneDay from tableName"; List<Map> rows = getJdbcTemplate().queryForList(sql); for (Map row : rows
java设计模式之单例模式 chicony java设计模式
在阎宏博士的《JAVA与模式》一书中开头是这样描述单例模式的：　　作为对象的创建模式，单例模式确保某一个类只有一个实例，而且自行实例化并向整个系统提供这个实例。这个类称为单例类。单例模式的结构　　单例模式的特点：单例类只能有一个实例。单例类必须自己创建自己的唯一实例。单例类必须给所有其他对象提供这一实例。　　饿汉式单例类 publ
javascript取当月最后一天 ctrain JavaScript
 <script language=javascript> var current = new Date(); var year = current.getYear(); var month = current.getMonth(); showMonthLastDay(year, mont
linux tune2fs命令详解 daizj linux tune2fs 查看系统文件块信息
一.简介： tune2fs是调整和查看ext2/ext3文件系统的文件系统参数，Windows下面如果出现意外断电死机情况，下次开机一般都会出现系统自检。Linux系统下面也有文件系统自检，而且是可以通过tune2fs命令，自行定义自检周期及方式。二.用法： Usage: tune2fs [-c max_mounts_count] [-e errors_behavior] [-g grou
做有中国特色的程序员 dcj3sjt126com 程序员
从出版业说起网络作品排到靠前的，都不会太难看，一般人不爱看某部作品也是因为不喜欢这个类型，而此人也不会全不喜欢这些网络作品。究其原因，是因为网络作品都是让人先白看的，看的好了才出了头。而纸质作品就不一定了，排行榜靠前的，有好作品，也有垃圾。许多大牛都是写了博客，后来出了书。这些书也都不次，可能有人让为不好，是因为技术书不像小说，小说在读故事，技术书是在学知识或温习知识，有
Android：TextView属性大全 dcj3sjt126com textview
android:autoLink 设置是否当文本为URL链接/email/电话号码/map时，文本显示为可点击的链接。可选值(none/web/email/phone/map/all) android:autoText 如果设置，将自动执行输入值的拼写纠正。此处无效果，在显示输入法并输
tomcat虚拟目录安装及其配置 eksliang tomcat配置说明 tomca部署web应用 tomcat虚拟目录安装
转载请出自出处：http://eksliang.iteye.com/blog/2097184 1.-------------------------------------------tomcat 目录结构 config：存放tomcat的配置文件 temp ：存放tomcat跑起来后存放临时文件用的 work ：当第一次访问应用中的jsp
浅谈：APP有哪些常被黑客利用的安全漏洞 gg163 APP
首先，说到APP的安全漏洞，身为程序猿的大家应该不陌生；如果抛开安卓自身开源的问题的话，其主要产生的原因就是开发过程中疏忽或者代码不严谨引起的。但这些责任也不能怪在程序猿头上，有时会因为BOSS时间催得紧等很多可观原因。由国内移动应用安全检测团队爱内测（ineice.com）的CTO给我们浅谈关于Android 系统的开源设计以及生态环境。 1. 应用反编译漏洞：APK 包非常容易被反编译成可读
C#根据网址生成静态页面 hvt Web .net C#asp.net hovertree
HoverTree开源项目中HoverTreeWeb.HVTPanel的Index.aspx文件是后台管理的首页。包含生成留言板首页，以及显示用户名，退出等功能。根据网址生成页面的方法： bool CreateHtmlFile(string url, string path) { //http://keleyi.com/a/bjae/3d10wfax.htm stri
SVG 教程（一）天梯梦 svg
SVG 简介 SVG 是使用 XML 来描述二维图形和绘图程序的语言。学习之前应具备的基础知识：继续学习之前，你应该对以下内容有基本的了解： HTML XML 基础如果希望首先学习这些内容，请在本站的首页选择相应的教程。什么是SVG？ SVG 指可伸缩矢量图形 (Scalable Vector Graphics) SVG 用来定义用于网络的基于矢量
一个简单的java栈 luyulong java 数据结构栈
public class MyStack { private long[] arr; private int top; public MyStack() { arr = new long[10]; top = -1; } public MyStack(int maxsize) { arr = new long[maxsize]; top
基础数据结构和算法八：Binary search sunwinner Algorithm Binary search
Binary search needs an ordered array so that it can use array indexing to dramatically reduce the number of compares required for each search, using the classic and venerable binary search algori
12个C语言面试题，涉及指针、进程、运算、结构体、函数、内存，看看你能做出几个！刘星宇 c 面试
12个C语言面试题，涉及指针、进程、运算、结构体、函数、内存，看看你能做出几个！ 1.gets()函数问：请找出下面代码里的问题： #include<stdio.h> int main(void) { char buff[10]; memset(buff,0,sizeof(buff));
ITeye 7月技术图书有奖试读获奖名单公布 ITeye管理员活动 ITeye 试读
ITeye携手人民邮电出版社图灵教育共同举办的7月技术图书有奖试读活动已圆满结束，非常感谢广大用户对本次活动的关注与参与。 7月试读活动回顾： http://webmaster.iteye.com/blog/2092746 本次技术图书试读活动的优秀奖获奖名单及相应作品如下（优秀文章有很多，但名额有限，没获奖并不代表不优秀）：《Java性能优化权威指南》

Learning Opencv 3 —— 十一章 通用图像变换 General Image Transforms

Opencv 通用图像变换 General Image Transforms

拉伸、收缩、扭曲和旋转

非均匀映射

仿射变换

透视变换

极坐标映射

对数极坐标系

任意映射

图像修复

去噪

直方图均衡化

你可能感兴趣的:(Opencv,Opencv,图像变换)

Learning Opencv 3 —— 十一章通用图像变换 General Image Transforms