基于python的OpenCV快速入门——几何变换

基于python的OpenCV快速入门——几何变换

1、缩放

  • 在OpenCV中,使用函数cv2.resize()实现对图像的缩放
  • 语法格式为
dst = cv2.resize( src, dsize[ ,fx[, fy[ ,interpolation]]])
  • dst代表输出目标图像,该图像的类型与src相同,大小为dsize
  • src代表需要缩放的原始图像
  • dsize表示输出图像大小
  • fx代表水平方向的缩放比例
  • fy代表竖直方向的缩放比例
  • interpolation代表插值方式,具体如表
    基于python的OpenCV快速入门——几何变换_第1张图片

在cv2.resize()函数中,目标图像大小既可以由dsize来表示,也可以由参数fx和fy表示

  • 情况一:

    • 如果指定参数dsize,则只靠dsize来决定目标图像大小
    • 需要注意的是dsize内的第一个参数对应缩放后图像的宽度(width,即参数cols,与参数fx相关),第2个参数对应缩放后图像的高度(height,即行数rows,与参数fy相关)
    • 指定参数dsize的值时,x方向的缩放大小(参数fx)为:
    (double)dsize.width/src.cols
    • 同时,y方向的缩放大小(参数fy)为:
    (double)dsize.height/src.rows
  • 情况二

    • 如果参数dsize的值是None,那么目标图像的大小通过参数fx和fy来决定。

      dsize = Size(round(fx*src.cols),round(fy*src.row))

2、翻转

  • 在OpenCV中,图像的反转采用函数cv2.flip()实现
  • 语法结构为
dst = cv2.flip(src , flipCode)
  • dst代表和原始图像具有相同大小类型的目标图像
  • src代表要处理的原始图像
  • flipCode代表旋转类型。该参数意义如图:
    在这里插入图片描述

3、仿射

  • 仿射变换是指图像可以通过一系列的几何变换来实现平移、旋转等多种操作。

  • OpenCV中的仿射函数为cv2.warpAffine(),其通过一个变换矩阵(映射矩阵)M实现变换,具体为

    • dst(x, y)=src(M11x+M12y+M13, M21x+M22y+M23)
  • 函数语法格式为:

    • dst = cv2.warpAffine( src, M, dsize [,flags[ ,borderMode[ ,bordeValue]]])
  • dst代表仿射后输出的图像,图像类型与原图像相同
  • dsize决定输出的大小
  • src代表要仿射的原图像
  • M代表一个2x3的变换矩阵。使用不同矩阵就可以实现不同的变换。
  • flags代表插值方式,默认为INTER_LINEAR。当该值是WARP_INVERSE_MAP时,意味着M是逆变换类型,实现从目标图像srt逆变换类型,实现从目标图像dst到原始图像src的逆变换。
  • borderMode代表类型,默认为BORDER_CONSTANT。当该值为BORDER_TRANSPARENT时,意味着目标图像内的值不做改变,这些值对应原始图像内的异常值。
  • borderValue代表边界值,默认为0.

该函数忽略其可选参数后的语法格式为:

dst = cv2.warpAffine( src, M ,dsize)

故其只与M有关,现在介绍通过不同的M实现不同的仿射矩阵转换

3.1平移

通过转换矩阵M实现将原始图像src转换为目标图像dst:
dst(x, y)=src(M11x+M12y+M13, M21x+M22y+M23)
将原始图像src向右侧移动100个像素、向下方移动200个像素,则其对应关系为:
dst (x, y)=src (x+ 100, y+ 200)
将上述表达式补充完整,即:
dst (x, y)=src (1·x+ 0·y+ 100, 0·x+ 1·y+ 200)
根据上述表达式,可以确定对应的转换矩阵M中各个元素的值为:

  • M11=1
  • M12=0
  • M13=100
  • M21=0
  • M22=1
  • M23=200
    将上述值代入转换矩阵M,得到:

基于python的OpenCV快速入门——几何变换_第2张图片

具体代码为:

import cv2
import numpy as np
img = cv2.imread("Third.jpg")
height ,width = img.shape[:2]
x=100
y=200
M = np.float32([[1 , 0 ,x],[0 ,1 ,y]])
move = cv2.warpAffine(img , M ,(width,height))
cv2.imshow("original",img)
cv2.imshow("move",move)
cv2.waitKey()
cv2.destroyAllWindows()

3.2旋转

  • 可以通过cv2.getRotationMatrix2D()来获取旋转矩阵。

  • 该函数的语法格式为:

  • retavl = cv2.getRotationMatrix2D(center , angle , scale)
  • center为旋转中心
  • angle为旋转角度,正数表示逆时针旋转,负数表示顺时针旋转
  • scale为变换尺寸(缩放大小)

3.3更复杂的仿射变换

  • OpenCV提供了函数cv2.getAffineTransform()来生成仿射函数cv2.warpAffine()所使用的转换矩阵M。

  • 该函数的语法格式为:

  • retval = cv2.getAffineTransform(src ,dst)
    • src代表输入图像的三个点坐标
    • dst代表输出图像的三个点坐标

4、透视

第三节所讲的仿射变换可以将矩形映射为任意平行四边形,透视变换则可以将矩形映射为任意四边形。

  • 透视变换通过函数cv2.warpPerspective()实现
  • 该函数的语法是:
dst = cv2.warpPerspective( src, M, dsize[, flags[, borderMode[, borderValue]]] )
  • dst代表透视处理后的输出图像,该图像和原始图像具有相同的类型。dsize决定输出图像的实际大小。
  • src代表要透视的图像。
  • M代表一个3×3的变换矩阵。
  • dsize代表输出图像的尺寸大小。
  • flags代表插值方法,默认为INTER_LINEAR。当该值为WARP_INVERSE_MAP时,意味着M是逆变换类型,能实现从目标图像dst到原始图像src的逆变换。
  • borderMode代表边类型,默认为BORDER_CONSTANT。当该值为BORDER_TRANSPARENT时,意味着目标图像内的值不做改变,这些值对应原始图像内的异常值。
  • borderValue代表边界值,默认是0。

与仿射变换一样,同样可以使用一个函数来生成函数cv2.warpPerspective()所使用的转换矩阵。该函数是cv2.getPerspectiveTransform(),其语法格式为:

retval = cv2.getPerspectiveTransform( src, dst )
  • src代表输入图像的四个顶点的坐标。
  • dst代表输出图像的四个顶点的坐标。
  • 需要注意的是,src参数和dst参数是包含四个点的数组,与仿射变换函数cv2.getAffineTransform()中的三个点是不同的。实际使用中,我们可以根据需要控制src中的四个点映射到dst中的四个点。

你可能感兴趣的:(笔记)