Python opencv操作图像

安装

pip install opencv-python
# 基于numpy

导入模块

import cv2

实际上所有图像都可以被看作一个个矩阵数组（数据类型为：np.uint8，别问我为什么...我就直接跟你说了吧...图片的像素在0~255，和uint8范围刚好一样，所以才需要设置这个数据类型，以保证数据都是合理的...详细可以看下面的踩坑记录），里面存放着一堆分布在0~255的像素点，而opencv就是将这些像素点的色调显示出来，从而形成一个图像

常用操作

读取图像

基于文件名读取：
imread，第一个参数为图像路径，第二个参数可选，意思是通过几个通道数读取图像，1个通道数则是黑白图片，3个则是基于RGB色调的彩色图片，举例：

import numpy as np
import cv2
img = np.array()
# 图像本质就是一个矩阵
cv2.imread(img, 1)
# 以黑白方式读取图片

# 展示图片
from matplotlib import pyplot as plt
plt.imshow(img, cmap='gray')
# img是一个图像矩阵，cmap为显示类型，这里通过灰阶显示
plt.show()

基于二进制流读取：
使用cv2.imdecode(np.frombuffer(img, np.uint8), cv2.IMREAD_COLOR)读取

修改形状

resize，举例：

>>> img = cv2.imread("1.jpg")
>>> img.shape
(661, 659, 3)
>>> cv2.resize(img, (80, 120)).shape
# 将图片转成120*80的图片，注意这里宽高是反过来的
(120, 80, 3)
>>> cv2.resize(img, (-1, -1), fx=0.5, fy=0.2).shape
# 将图片宽高缩放成0.5和0.2
(132, 330, 3)

更多参考：https://blog.csdn.net/li_l_il/article/details/83218838

显示图像

imshow，但是会打开一个新的程序窗口查看图像，不太适合用在像jupyter notebook这样的环境，因此更推荐使用matplotlib.pyplot下的imshow和show方法，举例：

import cv2
cv2.imshow("image",img)
# 打开图像窗口
cv2.waitKey(0)
# 按下0键前一直显示
cv2.destroyAllWindows()
# 关闭图像窗口
# 不太推荐使用，推荐下面的那种

from matplotlib import pyplot as plt
plt.imshow(img, cmap='gray')
# img是一个图像矩阵，cmap为显示类型，这里通过灰阶显示
plt.show()

保存图像

imwrite，举例：

>>> img = cv2.imread("1.jpg")
>>> cv2.imwrite("test.jpg", img)
# 保存图像，第一个参数是保存的路径，第二个是图像的数组
True

这里有一个坑：由于jpg是有损压缩，而png是无损压缩，所以在保存时如果希望保持像素值完全不变的话，一定要保存成png格式，举例：

>>> x = cv2.imread("1.jpg")
# 读取图片
>>> cv2.imwrite("2.jpg", x)
# 保存一份jpg格式
True
>>> cv2.imwrite("2.png", x)
# 保存一份png格式
True
>>> y = cv2.imread("2.jpg")
# 读取保存后的jpg格式
>>> z = cv2.imread("2.png")
# 读取保存后的png格式
>>> np.all(x == y)
# 可以看出保存的jpg和原图是不同的
False
>>> np.all(x == z)
# 保存的png和原图是相同的
True

base64/二进制/矩阵格式转换

参考：
https://blog.csdn.net/cnmnui/article/details/105831908
https://blog.csdn.net/qian1122221/article/details/84567715

画图

矩形

rectangle，依次传入图片数组、左上角坐标、右下角坐标、颜色元组和线的粗细程度，举例：

import cv2
img = cv2.imread("1.jpg")
cv2.rectangle(img, (10, 10), (200, 200), (0, 255, 0), 1)
# 画一个框，左上角坐标为(10, 10)，右下角坐标为(200, 200)，颜色为绿色，线的粗细为1
cv2.imshow("image",img)
cv2.waitKey(0)
cv2.destroyAllWindows()

直线

line，使用方法和矩形一样，传入的两个坐标分别为头和尾坐标

圆

circle，依次传入图片数组、圆心坐标、半径、颜色元组和线的粗细程度，举例：

import cv2
img = cv2.imread("1.jpg")
cv2.circle(img, (200, 200), 30, (0, 255, 0),  10)
cv2.imshow("image",img)
cv2.waitKey(0)
cv2.destroyAllWindows()

多边形

polylines，依次传入图片数组、每个角的坐标（需要传入一个列表，列表里面是numpy数组）、是否封闭、颜色元组和线的粗细程度，举例：

import cv2
import numpy as np
img = cv2.imread("1.jpg")
cv2.polylines(img,[np.array([[100,100],[200,100],[100,200]])],True,(0,255,255),2)
cv2.imshow("image",img)
cv2.waitKey(0)
cv2.destroyAllWindows()

文字

putText，依次传入图片数组、文本内容、坐标、字体、尺寸大小、颜色元组和线的粗细程度，举例：

import cv2
img = cv2.imread("1.jpg")
cv2.putText(img, "hello", (500, 200), cv2.FONT_HERSHEY_SIMPLEX, 1, (255, 255, 0),  1)
cv2.imshow("image",img)
cv2.waitKey(0)
cv2.destroyAllWindows()

教程参考

https://www.kancloud.cn/aollo/aolloopencv/269602

图像模糊判断

可以通过内置的拉普拉斯算法进行计算，一般情况下计算出的值越小，代表清晰度越低，代码很简单，举例：

>>> img = cv2.imread('xxx.png')
>>> cv2.Laplacian(img, cv2.CV_64F).var()
1787.805508284248

使用拉普拉斯算法注意参考：https://www.jianshu.com/p/60ac53013be4

其他参考

opencv下还提供了如人脸识别功能等，可以参考别的博客，如：
https://blog.csdn.net/luanpeng825485697/article/details/79509870
https://www.cnblogs.com/hanson1/p/7105265.html
https://www.cnblogs.com/traditional/p/9043931.html

踩坑记录

中文问题

使用cv2的时候一定要注意：读取的文件路径一定不能含有中文，日文等，包括打算给图片加上中文等字符，都会失败，如果一定要使用中文的话，建议使用PIL模块

数组无法用opencv操作

理论上来说，图像都是一堆数组，所以我们生成一个相同尺寸的数组，应该也能够被默认当做图像来操作才对，于是我偶然试试生成一个随机数组，想对其进行resize操作，发现竟然报错了？就像下面这样：

import numpy as np
import cv2

img = np.random.randint(0, 255, (100, 100))
cv2.resize(img, (120, 80))

# 报错：
# error: OpenCV(4.1.0) C:\projects\opencv-python\opencv\modules\imgproc\src\resize.cpp:3596: error: (-215:Assertion failed) func != 0 in function 'cv::hal::resize'

？？？啥玩意儿，明明我的数都在0~255之间，却还是不行，后来读了个图像，发现了区别：

import numpy as np
import cv2

img = np.random.randint(0, 255, (100, 100))
# 随机生成的图片
img1 = cv2.imread("xxx.jpg", 0)
# 用单通道读取图片，显示内容少点好对比
img, img1

# 结果：
# (array([[ 30,  31, 151, ..., 212, 205,  81],
#         [110, 202, 127, ..., 239,  72, 171],
#         [109, 228,  87, ..., 231,  65, 250],
#         ...,
#         [ 22,  66,   4, ..., 104, 198,  67],
#         [163, 121, 109, ..., 247, 129, 157],
#         [141, 133,  50, ...,  44,  50, 124]]),
#  array([[ 80,  80,  80, ...,  73,  75,  74],
#         [ 81,  81,  81, ...,  73,  75,  75],
#         [ 82,  82,  82, ...,  73,  75,  76],
#         ...,
#         [133, 151, 158, ..., 127, 114, 116],
#         [147, 127, 126, ..., 119, 113,  92],
#         [136, 122, 118, ..., 127, 107,  96]], dtype=uint8))

可以发现最后一行有个微妙的差别...那就是需要设置数据类型，因此将随机生成的数组的数据类型转成uint8就行了，就像下面这样：

import numpy as np
import cv2

img = np.random.randint(0, 255, (100, 100)).astype(np.uint8)
img1 = cv2.resize(img, (120, 80))
img1.shape
# (80, 120)，可以看出裁剪成功