图像的基本信息有:行、列、通道、像素数目和图像数据类型
示例代码:
import cv2
img = cv2.imread('Rachel.jpg')
color_img = cv2.imread("Rachel.jpg", cv2.IMREAD_COLOR)
gray_img = cv2.imread("Rachel.jpg", cv2.IMREAD_GRAYSCALE)
# 获取信息
# 图像的信息包括:行、列、通道、像素数目、图像数据类型
print(color_img.shape, color_img.size, color_img.dtype)
print(gray_img.shape, gray_img.size, gray_img.dtype)
(400, 600, 3) 720000 uint8
(400, 600) 240000 uint8
在处理图片的时候,我们经常会需要把一些信息直接以文字的形式输出在图片上,我们可以用cv2.putText函数实现
函数原型:putText(img, text, org, fontFace, fontScale, color[, thickness[, lineType[, bottomLeftOrigin]]])
参数依次是:图像、文本信息、位置、字体、颜色(RGB)、线粗(缺省值为1)、等等
实例代码:
import cv2
img = cv2.imread('Rachel.jpg')
cv2.putText(img, 'Hello World', (500, 350), 0, 0.5, (255, 255, 255), 1, 100) # 最后一个参数是100,让字体更平滑
cv2.imshow('Rachel', img)
k = cv2.waitKey(0)
if k == ord('s'):
cv2.imwrite('Rachel3.jpg', img)
cv2.destroyAllWindows()
说明一下,字体参数那里有2个数字,分别代表了字体和字号,自己试验选择合适的参数即可
图像的平移其实就是仿射变换的特殊形式,下一节会仔细讲仿射变换。
示例代码(将图像平移到到点(200,100)处):
import cv2
import numpy as np
img = cv2.imread('Rachel.jpg', 0)
rows, cols = img.shape
M = np.float32([[1, 0, 200], [0, 1, 100]])
dst = cv2.warpAffine(img, M, (cols, rows))
cv2.imshow('img', dst)
k = cv2.waitKey(0)
if k == ord('s'):
cv2.imwrite('Rachel3.jpg', dst)
cv2.destroyAllWindows()
结果:
有时需要将图像对R、G、B三个通道分别进行操作
示例代码:
import cv2
img = cv2.imread('Rachel.jpg')
img2 = cv2.resize(img, None, fx=0.5, fy=0.5, interpolation=cv2.INTER_CUBIC)
b, g, r = cv2.split(img2)
cv2.imshow('Rachel0', img2)
cv2.imshow('Rachel_b', b)
cv2.imshow('Rachel_g', g)
cv2.imshow('Rachel_r', r)
cv2.waitKey(0)