牛马程序员24

OpenCV计算机视觉学习（16）——仿射变换学习笔记

如果需要其他图像处理的文章及代码，请移步小编的GitHub地址

　　传送门：请点击我

　　如果点击有误：https://github.com/LeBron-Jian/ComputerVisionPractice

　　在计算机视觉和图像处理中，仿射变换是一种重要的几何变换方法。它可以通过线性变换和平移来改变图像的形状和位置，广泛应用与图像校正，对象识别以及增强现实等领域。

　　最近对OpenCV的仿射变换和逆仿射变换的算子使用较多，觉得有必要再整理一篇笔记，学习一下其原理，同时在一些实际场景的应用。下面首先学习一下其原理及其数学推导，然后我再试试在OpenCV中的应用。

1，仿射变换原理

　　毫无疑问，仿射变换（Affine Transformation）是线性代数和几何学中的一个重要概念。它是指在二维或三维空间中，通过线性变换和平移来改变对象的位置和形状，保持原有对象的直线性和平移性。即二维图形之间的相对位置保持不变，平行线依然是平行线，且直线上的点的位置顺序不变。一个任意的仿射变换都可以表示为乘以一个矩形再加上一个向量的形式。它可以实现平移（translation 向量加法）、旋转（rotation 线性变换）、缩放（scale 线性变换）和剪切（sheer )等操作。仿射变换通过对图像中的每个像素应用线性变换矩阵来实现，从而改变图像的位置、大小和方向。

　　以下是仿射变换的一般原理：在二维空间中，仿射变换是使用一个 2x3 的线性变换矩阵来描述变换操作。矩阵的前两列代表旋转、缩放和剪切操作，而最后一列代表平移操作。正如上面概念所说，矩阵的前两列是乘法，后一列是加法。

　　线性变换矩阵如下所示：

[ a b tx ]

[ c d ty ]

a和d控制缩放和旋转。

b和c控制剪切。

tx和ty控制平移。

　　如果说直接看上面变换矩阵有些抽象的话，我们可以推导一下其公式，做到知其然，知其所以然。

1.1 仿射变换的公式及其推导

　　假设我们有一个二维空间中的点 p=(x, y），并且我们想要应用一个仿射变换到这个点上。仿射变换通常可以表示为以下形式：

　　这里 P` = (x`, y`) 是变换后的点。A是一个 2*2 的矩阵，代表线性变换部分。b=(bx, by) 是一个平移向量。然后我们将仿射变换分为线性变换部分和平移部分。也就是上面的a,b,c,d和 tx, ty。下面先说线性变换部分：

线性变换部分

　　线性变换可以用一个 2*2 的矩阵来表示，该矩阵可以旋转，缩放或剪切一个图像。假设矩阵A为：

　　对于一个点 p=(x, y)，线性变换的结果为：

平移部分

　　平移操作是简单的坐标偏移，可以通过向量加法实现。如果我们要将一个点 p 平移到一个新的位置，只需要简单的加上一个平移向量 b：

合并线性变换和平移部分

　　要合并这两个操作，我们可以先进行线性变换，然后进行平移操作：

　　然后使用齐次坐标表示：

　　为了方便地用矩阵表示包含平移的仿射变换，我们使用齐次坐标系。齐次坐标系中，二维空间中的点 (x, y) 被表示为 (x, y, 1)形式的三元组。这样，我们可以将仿射变换写成一个 3*3 矩阵乘法的形式：

　　这种表示方法允许我们将线性变换和平移操作统一在一个矩阵运算中完成，简化了计算过程。

　　乘法结果为：

　　这意味着变换后的点的坐标为（ax + cy + bx, bx +dy +by)。

1.2 实际应用变换

　　下面看一个实际应用的示例。对于每个输入图像中的像素(x, y)，应用仿射变换矩阵可以得到变换后的像素(x', y')，计算如下：

x' = a * x + b * y + tx

y' = c * x + d * y + ty

　　这些计算会将输入图像中的每个像素映射到输出图像的相应位置。

　　下面我们仍然将其拆解开，假设我们有矩阵 A 和向量 b 如下：

　　线性变换可以通过矩阵 A 来表示，矩阵 A 可以实现各种操作，比如旋转，缩放，剪切等。矩阵A的选择具体取决于你想要实现的具体变换类型。例如上面矩阵A就是将实现一个缩放和平行四边形的变换。具体来说，它会使得 x 坐标翻倍，并且在 x方向上增加一半的 y 值。

　　而平移变换通过向量b来实现，它是一个简单的坐标便宜。如果 b=(3, 2), 那么所有点都会沿着 x 方向移动 3个单元，沿 y方向移动 2 个单位。

　　对于点 p=(1, 2) 应用仿射变换，我们将上述两部分结合在一起，实现一个完整的仿射变换。即应用上面提到的矩阵A和向量 b到这个点上。按照仿射变换的公式，我们有：

　　因此变换后的点坐标为 (7, 6)。所以这就是仿射变换。

　　所以说，仿射变换就是两幅图像之间的一种联系，关于这种联系的信息大致可以分为以下两种场景：

　　1，已知图像A和变换矩阵M，求图像B，只需要应用B=M*A即可，也就是上面的公式，只是我们只求了一个点而已。

　　2，已知图像A和图像B，而且已知他们是有联系的，接下来就是求出矩阵M。

1.3 仿射变换的插值问题

　　在图像进行仿射变换时，原图像的像素点可能不会精确对应到变换后图像的像素网格上。这就引入了插值的问题，因为我们需要确定变换后图像中每个像素的颜色值，即使这些像素可能位于原图像中像素点之间的位置。

　　在实际应用中，变换后的像素位置可能不是整数值，因此需要使用插值方法来获取非整数坐标上的像素值。插值是估算连续函数在已知数据点之间未知值的过程。

　　在图像变换中，常用的插值方法包括最近邻插值、双线性插值和三次样条插值。

最近邻插值（Nearest Neighbor Interpolation）：其选择最接近变换后坐标的原始像素值，它是最简单的插值方法，为每个目标像素分配最接近源像素的颜色值，这种方法计算效率高，但可能会导致变换后的图像出现明显的锯齿状边缘。

双线性插值(Bilinear Interpolation)：通过在四个最近的像素之间进行插值来计算像素值。根据目标像素与这四个源像素的相对距离来加权平均计算目标像素的颜色值。这种方法可以减少锯齿现象，使图像看起来更加平滑。

双三次样条插值（Bicubic Interpolation）：使用更复杂的插值算法，产生更平滑的结果。它考虑了更多的相邻像素，并使用三次多项式来估算目标像素的颜色值。这种方法可以产生更高质量的图像，但计算成本也更高。

　　在应用仿射变换时，插值的一般过程如下：

逆变换：应用仿射变换的逆变换，将目标图像的像素坐标映射回源图像的坐标系统中。这是因为我们需要根据源图像的像素值来确定目标图像的像素值。

查找源像素：对于目标图像中的每个像素，找到其在源图像中的对应未知。由于仿射变换可能产生非整数坐标，因此需要进行插值。

插值计算：根据选定的插值方法（如最近邻，双线性或双三次插值），计算目标像素的颜色值。这通常涉及到对周围像素颜色值的加权平均。

赋值：将计算得到的颜色值赋给目标图像的相应像素。

　　在进行插值时，需要注意边界条件。当源像素坐标落在原图像边界之外时，需要采取适当的处理措施，如使用边缘像素的重复、镜像或设置为特定颜色。

　　此外，插值算法的复杂度和计算成本也是选择插值方法时需要考虑的因素。通常，双线性插值是一个折衷的选择，它提供了较好的图像质量和合理的计算效率。

　　总之，插值是仿射变换中不可或缺的一部分，它确保了变换后的图像质量，避免了像素失真和锯齿效应。

1.4 仿射变换应用顺序

　　在进行多个仿射变换时，他们的顺序会影响最终结果。例如，先进行旋转再进行平移和先进行平移再进行旋转，可能会得到不同的结果，所以这点要注意。

　　仿射变换在计算机视觉和图像处理中具有广泛的应用，如图像校正，图像配准，图像扭曲和增强等。

　　总之，仿射变换是通过线性变换矩阵将图像进行平移、旋转、缩放和剪切等操作的技术，它可以在图像处理中实现多种形式的变换和调整。

2， OpenCV中的仿射变换实现

　　在OpenCV中，仿射变换的实现非常简单，我们可以使用 cv2.getAffineTransform()函数等获取仿射变换的矩阵，并通过 cv2.warpAffine()函数应用变换。

2.1 warpAffine()函数

　　warpAffine()函数的是OpenCV的一个函数，用于执行仿射变换。仿射变换是一种线性变换，正如上面所提到的，它包含旋转，缩放，错切和平移。warpAffine()函数接收一个输入图像和一个变换矩阵，然后应用这个变换矩阵来生成输出图像。

　　正如上面提到的，该变换矩阵是一个2*3的矩阵，由一个2*2的线性变换矩阵和一个2*1的平移向量组成，变换矩阵的形式如下（我知道我啰嗦了，但是我只是想让自己记下）：

　　操作的话，首先通过需要的变换类型（如旋转，缩放，平移等）来计算变换矩阵。OpenCV提供了getRotationMatrix2D()等函数来帮助我们计算这些矩阵。

　　然后使用wrapAffine()函数，将计算得到的变换矩阵应用于输入图像。我们可以选择输出的图像大小和插值方法。

　　warpAffine()函数的基本语法如下：

cv2.warpAffine(src, M, dsize[, dst[, flags[, borderMode[, borderValue]]]])

　　参数：

src：输入图像。

M：2×3 的仿射变换矩阵。

dsize：输出图像的大小，是一个二元组 (width, height)。

dst：可选参数，用于指定输出图像。

flags：插值方法，默认为 INTER_LINEAR。

borderMode：边界处理方法，默认为 BORDER_CONSTANT。

borderValue：边界填充值，默认为 0。

　　通过这个函数，你可以轻松地对图像进行各种仿射变换操作，如旋转、缩放、倾斜和位移等。

　　下面是一个使用warpAffine()的示例，演示如何旋转一张图像：

import cv2

import numpy as np

# 读取图片

img = cv2.imread('george.png')

# 图像中心

rows, cols = img.shape[:2]

center = (cols / 2, rows / 2)

# 计算旋转矩阵

angle = 45 # 旋转角度

scale = 1.0 # 缩放比例

M = cv2.getRotationMatrix2D(center, angle, scale)

# 应用仿射变换

dst = cv2.warpAffine(img, M, (cols, rows))

# 保存结果

# cv2.imwrite('output.jpg', dst)

# 显示结果

cv2.imshow('Rotated Image', dst)

cv2.waitKey(0)

cv2.destroyAllWindows()

　　结果如下：

2.2 getRotationMatrix2D()函数

　　getRotationMatrix2D是 OpenCV 库中的一个函数，用于计算围绕某个中心点的旋转矩阵。这个函数特别有用，当你需要在图像处理或计算机视觉任务中旋转图像时，例如为了校正倾斜的文本或调整视角。

　　函数的基本语法如下：

cv::Mat cv::getRotationMatrix2D(const Point2f& center, double angle, double scale);

　　参数解释：

center: 旋转中心的坐标，通常是一个 (x, y) 的二元组，表示图像中旋转轴的中心点。

angle: 旋转的角度，单位是度。正数表示逆时针方向旋转，负数表示顺时针方向旋转。

scale: 缩放因子。当 scale 等于 1 时，表示没有缩放，图像大小不变；大于 1 表示放大；小于 1 表示缩小。

　　返回值：函数返回一个 2x3 的仿射变换矩阵，该矩阵可以用于warpAffine或warpPerspective函数来对图像进行旋转。矩阵的形式如下：

　　其中 Θ 是旋转角度， tx 和 ty 是平移分量，，用于确保图像围绕指定的中心点旋转。

　　下面说一个使用示例。假设我们有一个图像，并且你想要围绕图像的中心点旋转 45 度，同时保持图像大小不变（即缩放因子为 1）。以下是使用 Python 和 OpenCV 的示例代码：

import cv2

import numpy as np

# 加载图像

image = cv2.imread('george.png')

# 获取图像尺寸

height, width = image.shape[:2]

# 计算旋转中心

center = (width / 2, height / 2)

# 定义旋转角度和缩放因子

angle = 45

scale = 1.0

# 获取旋转矩阵

rotation_matrix = cv2.getRotationMatrix2D(center, angle, scale)

　　在这个例子中，我们首先计算了图像的中心点，然后使用getRotationMatrix2D函数得到了旋转矩阵。我打印了以下其旋转矩阵如下：

[[ 0.70710678 0.70710678 -114.85921677]

[ -0.70710678 0.70710678 208.70532111]]

　　最后就是使用这个旋转矩阵在wrapAffine()函数中。

2.3 getAffineTransform()函数

　　cv2.getAffineTransform()是 OpenCV 中的一个函数，用于计算一个仿射变换矩阵，该矩阵可以将源图像中的一个三角形区域映射到目标图像中的另一个三角形区域。仿射变换可以包括旋转、缩放、错切（shear）和平移。

　　函数定义如下：

cv2.getAffineTransform(src, dst)

　　参数如下：

src: 这是一个 3x2 的浮点型 NumPy 数组，包含源图像中的三个点。这三个点定义了源三角形。

dst: 这也是一个 3x2 的浮点型 NumPy 数组，包含目标图像中的三个点，这些点与 src 中的点一一对应。

　　返回值如下：函数返回一个 2x3 的浮点型矩阵，这就是仿射变换矩阵，可以用于通过cv2.warpAffine()函数对图像应用仿射变换。

　　计算原理：仿射变换矩阵A由以下方程定义：

　　其中 tx, ty是平移向量，而 a, b, c, d定义了线性变换部分。

使用示例：假设我们有一张图像，并且我们想要通过仿射变换将图像中某一部分的三个角点映射到另一组三个角点上。以下是使用 Python 和 OpenCV 的示例代码：

import cv2

import numpy as np

# 加载图像

image = cv2.imread('george.png')

# 定义源三角形的三个角点

src_points = np.float32([[0, 0], [300, 0], [0, 300]])

# 定义目标三角形的三个角点

dst_points = np.float32([[150, 0], [450, 0], [150, 300]])

# 计算仿射变换矩阵

affine_matrix = cv2.getAffineTransform(src_points, dst_points)

print("affine_matrix is ", affine_matrix)

# 应用仿射变换

transformed_image = cv2.warpAffine(image, affine_matrix, (image.shape[1], image.shape[0]))

# 显示结果

cv2.imshow('origin Image', image)

cv2.imshow('Rotated Image', transformed_image)

cv2.waitKey(0)

cv2.destroyAllWindows()

　　在这个例子中，我们定义了源图像和目标图像中三角形的三个角点，然后使用cv2.getAffineTransform()函数计算仿射变换矩阵，最后使用cv2.warpAffine()函数将变换应用到整个图像上。　

　　我也打印了这个变换矩阵，很明显只是平移而已：

[[ 1. 0. 150.]

[ 0. 1. 0.]]

　　我们看看最终图像：

2.4 getAffineTransform和getRotationMatrix2D 的区别

　　看到上面两个函数及其用法，估计大家也可以出个七七八八，我就再啰嗦以下其区别。

　　cv2.getAffineTransform()和cv2.getRotationMatrix2D()都是 OpenCV 中用于计算变换矩阵的函数，但它们的目的和使用场景有所不同。下面是两者的主要区别：

cv2.getAffineTransform()

功能：getAffineTransform() 用于计算一个从源图像中的一个三角形到目标图像中另一个三角形的仿射变换矩阵。这个矩阵可以实现旋转、缩放、错切和/或平移的组合。

参数：函数接受两个参数，每个参数都是一个 3x2 的浮点型 NumPy 数组，分别表示源三角形和目标三角形的三个顶点坐标。

用途：通常用于矫正图像中特定区域的透视变形，比如将一个扭曲的矩形区域校正为标准矩形。

cv2.getRotationMatrix2D()

功能：getRotationMatrix2D() 主要用于计算围绕一个特定点的旋转矩阵，同时可以包含缩放操作。这个函数专注于旋转和缩放变换，不涉及错切。

参数：函数接受三个参数，分别是旋转中心的坐标（x, y）、旋转角度（以度为单位）和缩放因子。

用途：通常用于图像旋转，比如纠正图像中的倾斜角度，或为了改变图像视角而进行的旋转。

主要区别

变换类型：getRotationMatrix2D() 专注于旋转和缩放，而 getAffineTransform() 可以实现更复杂的仿射变换，包括错切。

参数输入：getRotationMatrix2D() 需要指定旋转中心、角度和缩放因子，而 getAffineTransform() 通过源三角形和目标三角形的顶点坐标来定义变换。

大神之路-起始篇 | 第13章.计算机科学导论之【文件结构】学习笔记全栈工程师修炼指南从业必看书籍专栏学习笔记
欢迎关注「WeiyiGeek」公众号点击下方卡片即可关注我哟!设为「星标⭐」每天带你基础入门到进阶实践再到放弃学习！涉及网络安全运维、应用开发、物联网IOT、学习路径、个人感悟等知识“花开堪折直须折，莫待无花空折枝。”作者主页：[https://www.weiyigeek.top]作者博客：[https://blog.weiyigeek.top]作者答疑学习交流群：
Redis学习总结（15）——Redis 基本数据类型使用场景一杯甜酒 Redis Redis基本数据类型使用场景
一、StringStrings数据结构是简单的key-value类型，value其实不仅是String，也可以是数字.常用命令:set,get,decr,incr,mget等。应用场景：String是最常用的一种数据类型，普通的key/value存储都可以归为此类.即可以完全实现目前Memcached的功能，并且效率更高。还可以享受Redis的定时持久化，操作日志及Replication等功能。除
Prompt 精通之路（四）- AI 赋能：10 个超实用的 Prompt 模板，覆盖写作、编程、学习和办公程序员阿超的博客 Prompt 精通之路：从零基础到 AI 高效玩家人工智能 prompt 学习 Prompt模板 AI工作流 ChatGPT应用生产力工具
Prompt精通之路：系列文章导航第一篇：[本文]AI时代的新语言：到底什么是Prompt？为什么它如此重要？第二篇：告别废话！掌握这4个黄金法则，让你的Prompt精准有效第三篇：像专业人士一样思考：Zero-Shot,Few-Shot和思维链（CoT）技巧详解第四篇：AI赋能：10个超实用的Prompt模板，覆盖写作、编程、学习和办公第五篇：构建你的“AI指令系统”：超越简单提问的CRISPE
微调 || RAG，项目落地怎么选？LLM应用选型指南，适用场景全解析认知超载 AI 人工智能
基本定义微调：是指利用更小、更具针对性的数据集对经过预先训练的大语言模型进一步训练的过程。在这个过程中，模型基于新数据集修改权重和参数，学习特定于任务的模式，同时保留来自最初预训练模型的知识。RAG：即检索增强生成，是将检索大量外部知识的过程与文本生成结合在一起的一种方法。它会从大型外部数据库中检索与输入问题相关的信息，将这些信息作为上下文提供给大语言模型，辅助其生成回答。微调适用场景1.特定领域
百度颠覆了自己，飞算JavaAI造福了中国程序员！飞算JavaAI开发助手百度
在当今这个科技日新月异的时代，企业纷纷寻求技术突破，以期在激烈的市场竞争中脱颖而出。百度，作为中国互联网行业的领军企业之一，凭借其强大的科技实力和创新能力，在人工智能等多个领域取得了显著成就，并正在逐步颠覆自身的传统形象。百度自成立之初，就将技术创新视为企业的生命线。从最初的搜索引擎技术，到如今的深度学习、自然语言处理、计算机视觉等前沿领域，百度始终走在技术革新的前沿。其自主研发的飞桨深度学习平台
Gartnet《Solution Path for Implementing Hybrid Cloud Applications With On-Premises Data》学习心得架构师学习成长之路大数据架构
一、引言随着企业数字化转型的深入，混合云架构逐渐成为一种中长期的现实选择。软件架构师们在将应用逻辑迁移到云端的同时，往往面临着数据层难以同步迁移的困境。Gartner的这份报告《SolutionPathforImplementingHybridCloudApplicationsWithOn-PremisesData》为我们提供了一条实施混合云应用的清晰路径，涵盖了从迁移策略的确定、应用与数据层的整
Prompt 精通之路（五）- 构建你的“AI 指令系统”：超越简单提问的 CRISPE 与 APE 框架
Prompt精通之路：系列文章导航第一篇：[本文]AI时代的新语言：到底什么是Prompt？为什么它如此重要？第二篇：告别废话！掌握这4个黄金法则，让你的Prompt精准有效第三篇：像专业人士一样思考：Zero-Shot,Few-Shot和思维链（CoT）技巧详解第四篇：AI赋能：10个超实用的Prompt模板，覆盖写作、编程、学习和办公第五篇：构建你的“AI指令系统”：超越简单提问的CRISPE
C#学习日志 future1412 c#学习 java
构造函数和析构函数知识点一构造函数基本概念在实例化对象时会调用的用于初始化的函数如果不写默认存在一个无参构造函数构造函数的写法1.没有返回值2.函数名和类名必须相同3.没有特殊需求时一般都是public的classPerson{publicstringname;publicintage;类中是允许自己申明无参构造函数的结构体是不允许publicPerson(){name="怪盗基德";age=18
【深度学习:进阶篇】--4.2.词嵌入和NLP 西柚小萌新吖(●ˇ∀ˇ●) #深度学习深度学习自然语言处理人工智能
在RNN中词使用one_hot表示的问题假设有10000个词每个词的向量长度都为10000，整体大小太大没能表示出词与词之间的关系例如Apple与Orange会更近一些，Man与Woman会近一些，取任意两个向量计算内积都为0目录1.词嵌入1.1.特点1.3.word2vec介绍1.3.Word2Vec案例1.3.1.训练语料1.3.2.步骤1.3.3.代码2.测试代码1.词嵌入定义：指把一个维数
【深度学习】卷积神经网络(CNN)原理 chaser&upper 深度学习神经网络卷积计算机视觉
【深度学习】卷积神经网络原理1.卷积神经网络的组成2.卷积层2.1卷积运算过程3.padding-零填充3.1ValidandSame卷积3.2奇数维度的过滤器4.stride-步长5.多通道卷积5.1多卷积核（多个Filter）6.卷积总结7.池化层(Pooling)8.全连接层9.总结1.卷积神经网络的组成定义卷积神经网络由一个或多个卷积层、池化层以及全连接层等组成。与其他深度学习结构相比，卷
深度学习学习经验——卷积神经网络（CNN） Linductor 深度学习学习经验深度学习学习 cnn
卷积神经网络卷积神经网络（CNN）1.卷积神经网络的基本组成2.卷积操作3.激活函数（ReLU）4.池化操作5.全连接层6.卷积神经网络的完整实现项目示例项目目标1.加载数据2.卷积层：图像的特征探测器2.1第一个卷积层3.激活函数：增加非线性4.池化层：信息压缩器5.多层卷积和池化：逐层提取更高层次的特征6.全连接层：分类器7.模型训练和测试完整的项目示例代码总结卷积神经网络（CNN）卷积神经网
LeetCode - #106 从中序与后序遍历序列构造二叉树网罗开发 Swift #LeetCode leetcode 算法职场和发展
文章目录前言1.描述2.示例3.答案关于我们前言我们社区陆续会将顾毅（Netflix增长黑客，《iOS面试之道》作者，ACE职业健身教练。）的Swift算法题题解整理为文字版以方便大家学习与阅读。LeetCode算法到目前我们已经更新到105期，我们会保持更新时间和进度（周一、周三、周五早上9:00发布），每期的内容不多，我们希望大家可以在上班路上阅读，长久积累会有很大提升。不积跬步，无以至千里；
LeetCode - #144 二叉树的前序遍历网罗开发 Swift leetcode 算法职场和发展
文章目录前言1.描述2.示例3.答案关于我们前言我们社区陆续会将顾毅（Netflix增长黑客，《iOS面试之道》作者，ACE职业健身教练。）的Swift算法题题解整理为文字版以方便大家学习与阅读。LeetCode算法到目前我们已经更新到143期，我们会保持更新时间和进度（周一、周三、周五早上9:00发布），每期的内容不多，我们希望大家可以在上班路上阅读，长久积累会有很大提升。不积跬步，无以至千里；
【V5.0 - 视觉篇】AI的“火眼金睛”：用OpenCV量化“第一眼缘”，并用SHAP验证它的“审美” 爱分享的飘哥 AI 人工智能 opencv 计算机视觉
系列回顾：在上一篇《给AI装上“写轮眼”：用SHAP看穿模型决策的每一个细节》中，我们成功地为AI装上了“透视眼镜”，看穿了它基于数字决策的内心世界。但一个巨大的问题暴露了：它的世界里，还只有数字。它能理解“时长60秒”，却无法感受画面的震撼。它是一个强大的“盲人数学家”。计算机视觉我们没有必要为每个视频进行切帧，可以针对开头的视频或者中间关键点视频进行切帧，让计算机识别。承上启下：“现在，我们来
计算机视觉 OpenCV Android | Mat像素操作（图像像素的读写、均值方差、算术、逻辑等运算、权重叠加、归一化等操作）... 凌川江雪
本文目录1.像素读写2.图像通道与均值方差计算3.算术操作与调整图像的亮度和对比度4.基于权重的图像叠加5.Mat的其他各种像素操作1.像素读写Mat作为图像容器，其数据部分存储了图像的像素数据，我们可以通过相关的API来获取图像数据部分；在获取图像数据的时候，知道Mat的类型与通道数目关重要，根据Mat的类型与通道数目，开辟适当大小的内存空间，然后通过get方法就可以循环实现每个像素点值的读取、
Ubuntu22+ROS2+QtCreator+Ros_Qtc_Plugin开发环境搭建 ZPC8210 ROS python github git
Ubuntu22+ROS2+QtCreator+Ros_Qtc_Plugin开发环境搭建1.写在前面最近重装了ubuntu22.04，被告知ubuntu22已经不支持ROS1了，想着ROS2毕竟是大势所趋，所以安装了ROS2准备进行相应的学习开发。折腾了两天，没发现一款好用的、适合ROS2开发的IDE。之前开发ROS1程序时一直用的QTC，我本以为QTC应该还没有对应的ROS2插件，没想到网上查找
opencv入门(6) TrackBar调整图片和键盘响应千殃sama opencv 学习笔记
文章目录1创建trackbar2使用userdata传入函数3键盘响应1创建trackbar1.trackbar名称2.创建在哪个窗口上3.拖动trackbar改变的值4.trackBar的最大值5.trackbar改变时的回调函数6.带入回调函数的数据，可以不用带,是一个void指针createTrackbar(“Valuebar”,“亮度调整”,&lightness,max_value,on_
Python Day44 别勉. python机器学习 python 开发语言
Task：1.预训练的概念2.常见的分类预训练模型3.图像预训练模型的发展史4.预训练的策略5.预训练代码实战：resnet181.预训练的概念预训练（Pre-training）是指在大规模数据集上，先训练模型以学习通用的特征表示，然后将其用于特定任务的微调。这种方法可以显著提高模型在目标任务上的性能，减少训练时间和所需数据量。核心思想：在大规模、通用的数据（如ImageNet）上训练模型，学习丰
WebGIS开发系列教程（5）：Openlayers高级功能 WebGIS开发 GIS开发 javascript 开发语言 webgis openlayers
本系列教程为webgis二维开发入门openlayers零基础小白学习教程，本篇为第五篇。完整版可以查看文末链接下载。1.地图标注功能地图标注是将空间位置信息点与地图关联，通过图标、窗口等形式把相关的信息展现到地图上。地图标注也是WebGIS中比较重要的功能之一，在大众应用中较为常见。地图标注的基本原理：获取标注点的空间位置(X、Y逻辑坐标)，在该位置上叠加显示图标(或包含信息的小图片)，必要时以
我的创作纪念日勤勉螺丝钉学习
手指轻敲键盘，一下又一下，思绪如潮水般涌来。我写了很多字，又反复斟酌，最终一个个删除。不是无话可说，而是想表达的太多，怕言语不够真挚，怕文字不够动人。官方提供的模板固然规范，但总觉得少了些属于自己的温度与风格。于是，我选择放下模板，回归内心，用最真诚的方式写下这段话。从开始创作至今，已经整整512天了。这五百多个日夜，有过迷茫、有过坚持、也有过收获。一路走来，我在CSDN这个知识平台上不断学习、不
数据结构学习之栈楼田莉子数据结构学习笔记算法数据结构 c语言
本篇博客我们将深入学习数据结构中栈与队列相关的内容作者的个人gitee：楼田莉子(riko-lou-tian)-Gitee.com目录概念栈的实现初始化销毁入栈判空出栈获取栈顶元素栈的有效元素个数源代码与栈相关的算法题（力扣）有效的括号编辑概念栈是一种特殊的线性表，只允许在固定的一端进行插入删除元素的操作。进行数据插入和删除操作的一端叫栈顶，另一端叫栈底。遵循“后进先出”的原则。下图就是对栈后进先
Instrct-GPT 强化学习奖励模型 Reward modeling 的训练过程原理实例化详解 John_今天务必休息一天 2_大语言模型基础 #2.2 生成式预训练语言模型GPT gpt log4j 语言模型人工智能自然语言处理算法
Instrct-GPT强化学习奖励模型Rewardmodeling的训练过程原理实例化详解一、批次处理的本质：共享上下文的比较对捆绑（1）为什么同一prompt的比较对必须捆绑？（2）InstructGPT的优化方案二、输入输出与损失函数的具体构造（1）输入输出示例（2）人工标注数据的处理（3）损失函数的计算过程（4）反向传播的核心逻辑三、为什么不需要人工标注分值？（1）排序数据的天然属性（2）避
基于土壤湿度信息的智能农田灌溉系统设计
自己淋过雨，想为你撑把伞之所以会把自己三年前的本科毕业设计发布至平台上，其主要原因是对自己以前的过往再做个总结。人生嘛，只有一路走来回头再看的时候，才会感慨万千，触目良多，时不时会想，到底什么样的结局才配得上我这二十几年的颠沛流离（狗头^_^）。个人强烈建议高中学弟学妹们一定要好好学习，考上一个都是传道授业()的好大学（表达的可能有些不妥，但懂得都懂……）。本文为2021年本人本科毕业设计。时间跨
Android学习笔记 LXR小朋友 android 学习笔记
一、Android四大组件精要1.Activity生命周期：onCreate()→onStart()→onResume()→onPause()→onStop()→onDestroy()重点场景：屏幕旋转：onSaveInstanceState()保存临时数据返回栈管理：launchMode（standard/singleTop/singleTask/singleInstance）页面跳转：Inte
成为高级Python开发人员的完整学习路线与核心知识体系
引言Python已成为全球最受欢迎的编程语言之一，其简洁的语法和强大的生态系统使其在数据科学、Web开发、自动化、人工智能等领域占据重要地位。然而，从初级Python程序员到真正的高级开发人员，需要掌握一系列深入的知识点和实践经验。本文将详细介绍成为高级Python开发人员必备的核心知识体系，并提供系统化的学习资源，帮助你规划专业发展路径。第一部分：Python语言基础进阶1.Python语言特性
【AI】闭环反馈：构建从用户处学习的人工智能秋说 AI广延人工智能 AI
文章目录前言AI产品性能的双重视角：模型指标vs用户信号模型指标：AI系统的“内部视角”用户信号：AI产品的“外部视角”用户信号类型用户信号的价值模型指标为何难以独立支撑产品成功如何设计AI产品的全面反馈闭环一、统一成功标准：模型指标+用户价值二、用户信号的数据采集策略三、整合多源数据流四、分析与洞察从反馈到改进：迭代驱动的闭环循环一、识别并优先解决核心问题二、将用户信号转化为模型改进方向三、产品
AppML 案例简介沐知全栈开发开发语言
AppML案例简介引言AppML，全称为“应用程序机器学习”，是一种将机器学习技术与移动应用开发相结合的技术框架。它旨在简化移动应用的机器学习功能集成，使得开发者无需深入了解复杂的机器学习算法，即可将强大的AI功能引入他们的应用中。本文将简要介绍AppML的一些成功案例，展示其在不同领域的应用和价值。AppML案例一：健康监测应用案例概述：一款名为“HealthMate”的健康监测应用利用AppM
PL-SLAM: Real-Time Monocular Visual SLAM with Points and Lines
PL-SLAM文章目录PL-SLAM摘要系统介绍综述方法综述LINE-BASEDSLAM一、基于线的SLAM二、基于线和点的BA三、全局重定位使用线条初始化地图实验结果说明位姿求解三角化LSD直线检测算法**一、核心原理**⚙️**二、实现方法****三、应用场景**⚖️**四、优缺点与优化****优缺点对比****总结**End摘要译文——众所周知，低纹理场景是依赖点对应的几何计算机视觉算法的主
【数据标注师】事件标注2 试着数据标注师数据标注师事件标注
目录一、**深入理解事件标注的核心架构**1.**事件五要素（标注核心对象）**2.**三大项目特性**二、**四阶段系统学习法**▶**阶段1：掌握标注指南（20%理论+80%案例）**▶**阶段2：触发词精准识别训练**▶**阶段3：要素抽取实战技巧**▶**阶段4：复杂场景突破三、**高效标注工具使用指南**1.**快捷键流操作（以主流工具为例）**2.**颜色编码法**四、**错误防御体系
广州华锐互动：以创新科技赋能教育，开启沉浸式学习广州华锐视点 VR ar 虚拟现实
在教育领域，广州华锐互动致力于打破传统教学的局限性，为师生们带来全新的沉浸式学习体验。广州华锐互动通过开发VR虚拟教学课件，将抽象的知识转化为生动、逼真的虚拟场景，让学生能够身临其境地感受知识的魅力。比如在历史课上，学生可以借助VR设备穿越时空，来到古代的战场、宫殿，亲身体验历史事件的发生；在地理课上，学生可以“置身”于世界各地的名胜古迹、自然奇观，直观地了解地理环境的特点。互动学习平台也是广州华
java责任链模式 3213213333332132 java 责任链模式村民告县长
责任链模式，通常就是一个请求从最低级开始往上层层的请求，当在某一层满足条件时，请求将被处理，当请求到最高层仍未满足时，则请求不会被处理。就是一个请求在这个链条的责任范围内，会被相应的处理，如果超出链条的责任范围外，请求不会被相应的处理。下面代码模拟这样的效果：创建一个政府抽象类,方便所有的具体政府部门继承它。 package 责任链模式; /** *
linux、mysql、nginx、tomcat 性能参数优化 ronin47
一、linux 系统内核参数 /etc/sysctl.conf文件常用参数 net.core.netdev_max_backlog = 32768 #允许送到队列的数据包的最大数目 net.core.rmem_max = 8388608 #SOCKET读缓存区大小 net.core.wmem_max = 8388608 #SOCKET写缓存区大
php命令行界面 dcj3sjt126com PHP cli
常用选项 php -v php -i PHP安装的有关信息 php -h 访问帮助文件 php -m 列出编译到当前PHP安装的所有模块执行一段代码 php -r 'echo "hello, world!";' php -r 'echo "Hello, World!\n";' php -r '$ts = filemtime("
Filter&Session 171815164 session
Filter HttpServletRequest requ = (HttpServletRequest) req; HttpSession session = requ.getSession(); if (session.getAttribute("admin") == null) { PrintWriter out = res.ge
连接池与Spring,Hibernate结合 g21121 Hibernate
前几篇关于Java连接池的介绍都是基于Java应用的，而我们常用的场景是与Spring和ORM框架结合，下面就利用实例学习一下这方面的配置。 1.下载相关内容： &nb
[简单]mybatis判断数字类型 53873039oycg mybatis
昨天同事反馈mybatis保存不了int类型的属性,一直报错，错误信息如下: Caused by: java.lang.NumberFormatException: For input string: "null" at sun.mis
项目启动时或者启动后ava.lang.OutOfMemoryError: PermGen space 程序员是怎么炼成的 eclipse jvm tomcat catalina.sh eclipse.ini
在启动比较大的项目时，因为存在大量的jsp页面，所以在编译的时候会生成很多的.class文件，.class文件是都会被加载到jvm的方法区中，如果要加载的class文件很多，就会出现方法区溢出异常 java.lang.OutOfMemoryError: PermGen space. 解决办法是点击eclipse里的tomcat，在
我的crm小结 aijuans crm
各种原因吧，crm今天才完了。主要是接触了几个新技术： Struts2、poi、ibatis这几个都是以前的项目中用过的。 Jsf、tapestry是这次新接触的，都是界面层的框架，用起来也不难。思路和struts不太一样，传说比较简单方便。不过个人感觉还是struts用着顺手啊，当然springmvc也很顺手，不知道是因为习惯还是什么。jsf和tapestry应用的时候需要知道他们的标签、主
spring里配置使用hibernate的二级缓存几步 antonyup_2006 java spring Hibernate xml cache
．在spring的配置文件中 applicationContent.xml，hibernate部分加入 xml 代码 <prop key="hibernate.cache.provider_class">org.hibernate.cache.EhCacheProvider</prop> <prop key="hi
JAVA基础面试题百合不是茶抽象实现接口 String类接口继承抽象类继承实体类自定义异常
/* * 栈（stack）：主要保存基本类型（或者叫内置类型）（char、byte、short、 *int、long、 float、double、boolean）和对象的引用，数据可以共享，速度仅次于 * 寄存器（register），快于堆。堆（heap）：用于存储对象。 */ &
让sqlmap文件 "继承" 起来 bijian1013 java ibatis sqlmap
多个项目中使用ibatis , 和数据库表对应的 sqlmap文件（增删改查等基本语句)，dao, pojo 都是由工具自动生成的, 现在将这些自动生成的文件放在一个单独的工程中，其它项目工程中通过jar包来引用，并通过"继承"为基础的sqlmap文件，dao,pojo 添加新的方法来满足项
精通Oracle10编程SQL(13)开发触发器 bijian1013 oracle 数据库 plsql
/* *开发触发器 */ --得到日期是周几 select to_char(sysdate+4,'DY','nls_date_language=AMERICAN') from dual; select to_char(sysdate,'DY','nls_date_language=AMERICAN') from dual; --建立BEFORE语句触发器 CREATE O
【EhCache三】EhCache查询 bit1129 ehcache
本文介绍EhCache查询缓存中数据，EhCache提供了类似Hibernate的查询API，可以按照给定的条件进行查询。要对EhCache进行查询，需要在ehcache.xml中设定要查询的属性数据准备 @Before public void setUp() { //加载EhCache配置文件 Inpu
CXF框架入门实例白糖_ spring Web 框架 webservice servlet
CXF是apache旗下的开源框架，由Celtix + XFire这两门经典的框架合成，是一套非常流行的web service框架。它提供了JAX-WS的全面支持，并且可以根据实际项目的需要，采用代码优先（Code First）或者 WSDL 优先（WSDL First）来轻松地实现 Web Services 的发布和使用，同时它能与spring进行完美结合。在apache cxf官网提供
angular.equals boyitech AngularJS AngularJS API AnguarJS 中文API angular.equals
angular.equals 描述: 比较两个值或者两个对象是不是相等。还支持值的类型，正则表达式和数组的比较。两个值或对象被认为是相等的前提条件是以下的情况至少能满足一项：两个值或者对象能通过=== （恒等）的比较两个值或者对象是同样类型，并且他们的属性都能通过angular
java-腾讯暑期实习生-输入一个数组A[1,2,...n]，求输入B，使得数组B中的第i个数字B[i]=A[0]*A[1]*...*A[i-1]*A[i+1] bylijinnan java
这道题的具体思路请参看何海涛的微博：http://weibo.com/zhedahht import java.math.BigInteger; import java.util.Arrays; public class CreateBFromATencent { /** * 题目：输入一个数组A[1,2,...n]，求输入B，使得数组B中的第i个数字B[i]=A
FastDFS 的安装和配置修订版 Chen.H linux fastDFS 分布式文件系统
FastDFS Home:http://code.google.com/p/fastdfs/ 1. 安装 http://code.google.com/p/fastdfs/wiki/Setup http://hi.baidu.com/leolance/blog/item/3c273327978ae55f93580703.html 安装libevent (对libevent的版本要求为1.4.
[强人工智能]拓扑扫描与自适应构造器 comsci 人工智能
当我们面对一个有限拓扑网络的时候,在对已知的拓扑结构进行分析之后,发现在连通点之后,还存在若干个子网络,且这些网络的结构是未知的,数据库中并未存在这些网络的拓扑结构数据....这个时候,我们该怎么办呢? 那么,现在我们必须设计新的模块和代码包来处理上面的问题
oracle merge into的用法 daizj oracle sql merget into
Oracle中merge into的使用 http://blog.csdn.net/yuzhic/article/details/1896878 http://blog.csdn.net/macle2010/article/details/5980965 该命令使用一条语句从一个或者多个数据源中完成对表的更新和插入数据. ORACLE 9i 中，使用此命令必须同时指定UPDATE 和INSE
不适合使用Hadoop的场景 datamachine hadoop
转自：http://dev.yesky.com/296/35381296.shtml。　　Hadoop通常被认定是能够帮助你解决所有问题的唯一方案。当人们提到“大数据”或是“数据分析”等相关问题的时候，会听到脱口而出的回答：Hadoop! 实际上Hadoop被设计和建造出来，是用来解决一系列特定问题的。对某些问题来说，Hadoop至多算是一个不好的选择，对另一些问题来说，选择Ha
YII findAll的用法 dcj3sjt126com yii
看文档比较糊涂，其实挺简单的： $predictions=Prediction::model()->findAll("uid=:uid",array(":uid"=>10)); 第一个参数是选择条件：”uid=10″。其中:uid是一个占位符，在后面的array(“:uid”=>10)对齐进行了赋值；更完善的查询需要
vim 常用 NERDTree 快捷键 dcj3sjt126com vim
下面给大家整理了一些vim NERDTree的常用快捷键了，这里几乎包括了所有的快捷键了，希望文章对各位会带来帮助。切换工作台和目录 ctrl + w + h 光标 focus 左侧树形目录ctrl + w + l 光标 focus 右侧文件显示窗口ctrl + w + w 光标自动在左右侧窗口切换ctrl + w + r 移动当前窗口的布局位置 o 在已有窗口中打开文件、目录或书签，并跳
Java把目录下的文件打印出来蕃薯耀列出目录下的文件文件夹下面的文件目录下的文件
Java把目录下的文件打印出来 >>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>> 蕃薯耀 2015年7月11日 11:02:
linux远程桌面----VNCServer与rdesktop hanqunfeng Desktop
windows远程桌面到linux，需要在linux上安装vncserver，并开启vnc服务，同时需要在windows下使用vnc-viewer访问Linux。vncserver同时支持linux远程桌面到linux。 linux远程桌面到windows，需要在linux上安装rdesktop，同时开启windows的远程桌面访问。下面分别介绍，以windo
guava中的join和split功能 jackyrong java
guava库中，包含了很好的join和split的功能，例子如下： 1）将LIST转换为使用字符串连接的字符串 List<String> names = Lists.newArrayList("John", "Jane", "Adam", "Tom");
Web开发技术十年发展历程 lampcy android Web 浏览器 html5
回顾web开发技术这十年发展历程： Ajax 03年的时候我上六年级，那时候网吧刚在小县城的角落萌生。传奇，大话西游第一代网游一时风靡。我抱着试一试的心态给了网吧老板两块钱想申请个号玩玩，然后接下来的一个小时我一直在，注，册，账，号。彼时网吧用的512k的带宽，注册的时候，填了一堆信息，提交，页面跳转，嘣，”您填写的信息有误，请重填”。然后跳转回注册页面，以此循环。我现在时常想，如果当时a
架构师之mima-----------------mina的非NIO控制IOBuffer(说得比较好) nannan408 buffer
1.前言。如题。 2.代码。 IoService IoService是一个接口，有两种实现：IoAcceptor和IoConnector；其中IoAcceptor是针对Server端的实现，IoConnector是针对Client端的实现；IoService的职责包括： 1、监听器管理 2、IoHandler 3、IoSession
ORA-00054:resource busy and acquire with NOWAIT specified Everyday都不同 oracle session Lock
[Oracle] 今天对一个数据量很大的表进行操作时，出现如题所示的异常。此时表明数据库的事务处于“忙”的状态，而且被lock了，所以必须先关闭占用的session。 step1，查看被lock的session： select t2.username, t2.sid, t2.serial#, t2.logon_time from v$locked_obj
javascript学习笔记 tntxia JavaScript
javascript里面有6种基本类型的值:number、string、boolean、object、function和undefined。number：就是数字值，包括整数、小数、NaN、正负无穷。string:字符串类型、单双引号引起来的内容。boolean:true、false object:表示所有的javascript对象，不用多说function:我们熟悉的方法，也就是
Java enum的用法详解 xieke90 enum 枚举
Java中枚举实现的分析：示例： public static enum SEVERITY{ INFO,WARN,ERROR } enum很像特殊的class，实际上enum声明定义的类型就是一个类。而这些类都是类库中Enum类的子类 (java.l

OpenCV计算机视觉学习（16）——仿射变换学习笔记

你可能感兴趣的:(计算机视觉,opencv,学习)