安装
pip install opencv-python
# 基于numpy
导入模块
import cv2
实际上所有图像都可以被看作一个个矩阵数组(数据类型为:np.uint8
,别问我为什么...我就直接跟你说了吧...图片的像素在0~255,和uint8范围刚好一样,所以才需要设置这个数据类型,以保证数据都是合理的...详细可以看下面的踩坑记录),里面存放着一堆分布在0~255
的像素点,而opencv就是将这些像素点的色调显示出来,从而形成一个图像
常用操作
读取图像
- 基于文件名读取:
imread
,第一个参数为图像路径,第二个参数可选,意思是通过几个通道数读取图像,1
个通道数则是黑白图片,3
个则是基于RGB色调的彩色图片,举例:
import numpy as np
import cv2
img = np.array()
# 图像本质就是一个矩阵
cv2.imread(img, 1)
# 以黑白方式读取图片
# 展示图片
from matplotlib import pyplot as plt
plt.imshow(img, cmap='gray')
# img是一个图像矩阵,cmap为显示类型,这里通过灰阶显示
plt.show()
- 基于二进制流读取:
使用cv2.imdecode(np.frombuffer(img, np.uint8), cv2.IMREAD_COLOR)
读取
修改形状
resize
,举例:
>>> img = cv2.imread("1.jpg")
>>> img.shape
(661, 659, 3)
>>> cv2.resize(img, (80, 120)).shape
# 将图片转成120*80的图片,注意这里宽高是反过来的
(120, 80, 3)
>>> cv2.resize(img, (-1, -1), fx=0.5, fy=0.2).shape
# 将图片宽高缩放成0.5和0.2
(132, 330, 3)
更多参考:https://blog.csdn.net/li_l_il/article/details/83218838
显示图像
imshow
,但是会打开一个新的程序窗口查看图像,不太适合用在像jupyter notebook这样的环境,因此更推荐使用matplotlib.pyplot
下的imshow
和show
方法,举例:
import cv2
cv2.imshow("image",img)
# 打开图像窗口
cv2.waitKey(0)
# 按下0键前一直显示
cv2.destroyAllWindows()
# 关闭图像窗口
# 不太推荐使用,推荐下面的那种
from matplotlib import pyplot as plt
plt.imshow(img, cmap='gray')
# img是一个图像矩阵,cmap为显示类型,这里通过灰阶显示
plt.show()
保存图像
imwrite
,举例:
>>> img = cv2.imread("1.jpg")
>>> cv2.imwrite("test.jpg", img)
# 保存图像,第一个参数是保存的路径,第二个是图像的数组
True
这里有一个坑:由于jpg是有损压缩,而png是无损压缩,所以在保存时如果希望保持像素值完全不变的话,一定要保存成png格式,举例:
>>> x = cv2.imread("1.jpg")
# 读取图片
>>> cv2.imwrite("2.jpg", x)
# 保存一份jpg格式
True
>>> cv2.imwrite("2.png", x)
# 保存一份png格式
True
>>> y = cv2.imread("2.jpg")
# 读取保存后的jpg格式
>>> z = cv2.imread("2.png")
# 读取保存后的png格式
>>> np.all(x == y)
# 可以看出保存的jpg和原图是不同的
False
>>> np.all(x == z)
# 保存的png和原图是相同的
True
base64/二进制/矩阵格式转换
参考:
https://blog.csdn.net/cnmnui/article/details/105831908
https://blog.csdn.net/qian1122221/article/details/84567715
画图
矩形
rectangle
,依次传入图片数组、左上角坐标、右下角坐标、颜色元组和线的粗细程度,举例:
import cv2
img = cv2.imread("1.jpg")
cv2.rectangle(img, (10, 10), (200, 200), (0, 255, 0), 1)
# 画一个框,左上角坐标为(10, 10),右下角坐标为(200, 200),颜色为绿色,线的粗细为1
cv2.imshow("image",img)
cv2.waitKey(0)
cv2.destroyAllWindows()
直线
line
,使用方法和矩形一样,传入的两个坐标分别为头和尾坐标
圆
circle
,依次传入图片数组、圆心坐标、半径、颜色元组和线的粗细程度,举例:
import cv2
img = cv2.imread("1.jpg")
cv2.circle(img, (200, 200), 30, (0, 255, 0), 10)
cv2.imshow("image",img)
cv2.waitKey(0)
cv2.destroyAllWindows()
多边形
polylines
,依次传入图片数组、每个角的坐标(需要传入一个列表,列表里面是numpy数组)、是否封闭、颜色元组和线的粗细程度,举例:
import cv2
import numpy as np
img = cv2.imread("1.jpg")
cv2.polylines(img,[np.array([[100,100],[200,100],[100,200]])],True,(0,255,255),2)
cv2.imshow("image",img)
cv2.waitKey(0)
cv2.destroyAllWindows()
文字
putText
,依次传入图片数组、文本内容、坐标、字体、尺寸大小、颜色元组和线的粗细程度,举例:
import cv2
img = cv2.imread("1.jpg")
cv2.putText(img, "hello", (500, 200), cv2.FONT_HERSHEY_SIMPLEX, 1, (255, 255, 0), 1)
cv2.imshow("image",img)
cv2.waitKey(0)
cv2.destroyAllWindows()
教程参考
https://www.kancloud.cn/aollo/aolloopencv/269602
图像模糊判断
可以通过内置的拉普拉斯算法进行计算,一般情况下计算出的值越小,代表清晰度越低,代码很简单,举例:
>>> img = cv2.imread('xxx.png')
>>> cv2.Laplacian(img, cv2.CV_64F).var()
1787.805508284248
使用拉普拉斯算法注意参考:https://www.jianshu.com/p/60ac53013be4
其他参考
opencv下还提供了如人脸识别功能等,可以参考别的博客,如:
https://blog.csdn.net/luanpeng825485697/article/details/79509870
https://www.cnblogs.com/hanson1/p/7105265.html
https://www.cnblogs.com/traditional/p/9043931.html
踩坑记录
中文问题
使用cv2的时候一定要注意:读取的文件路径一定不能含有中文,日文等,包括打算给图片加上中文等字符,都会失败,如果一定要使用中文的话,建议使用PIL
模块
数组无法用opencv操作
理论上来说,图像都是一堆数组,所以我们生成一个相同尺寸的数组,应该也能够被默认当做图像来操作才对,于是我偶然试试生成一个随机数组,想对其进行resize
操作,发现竟然报错了?就像下面这样:
import numpy as np
import cv2
img = np.random.randint(0, 255, (100, 100))
cv2.resize(img, (120, 80))
# 报错:
# error: OpenCV(4.1.0) C:\projects\opencv-python\opencv\modules\imgproc\src\resize.cpp:3596: error: (-215:Assertion failed) func != 0 in function 'cv::hal::resize'
???啥玩意儿,明明我的数都在0~255之间,却还是不行,后来读了个图像,发现了区别:
import numpy as np
import cv2
img = np.random.randint(0, 255, (100, 100))
# 随机生成的图片
img1 = cv2.imread("xxx.jpg", 0)
# 用单通道读取图片,显示内容少点好对比
img, img1
# 结果:
# (array([[ 30, 31, 151, ..., 212, 205, 81],
# [110, 202, 127, ..., 239, 72, 171],
# [109, 228, 87, ..., 231, 65, 250],
# ...,
# [ 22, 66, 4, ..., 104, 198, 67],
# [163, 121, 109, ..., 247, 129, 157],
# [141, 133, 50, ..., 44, 50, 124]]),
# array([[ 80, 80, 80, ..., 73, 75, 74],
# [ 81, 81, 81, ..., 73, 75, 75],
# [ 82, 82, 82, ..., 73, 75, 76],
# ...,
# [133, 151, 158, ..., 127, 114, 116],
# [147, 127, 126, ..., 119, 113, 92],
# [136, 122, 118, ..., 127, 107, 96]], dtype=uint8))
可以发现最后一行有个微妙的差别...那就是需要设置数据类型,因此将随机生成的数组的数据类型转成uint8
就行了,就像下面这样:
import numpy as np
import cv2
img = np.random.randint(0, 255, (100, 100)).astype(np.uint8)
img1 = cv2.resize(img, (120, 80))
img1.shape
# (80, 120),可以看出裁剪成功