Python opencv操作图像

安装

pip install opencv-python
# 基于numpy

导入模块

import cv2

实际上所有图像都可以被看作一个个矩阵数组(数据类型为:np.uint8,别问我为什么...我就直接跟你说了吧...图片的像素在0~255,和uint8范围刚好一样,所以才需要设置这个数据类型,以保证数据都是合理的...详细可以看下面的踩坑记录),里面存放着一堆分布在0~255的像素点,而opencv就是将这些像素点的色调显示出来,从而形成一个图像

常用操作

读取图像
  • 基于文件名读取:
    imread,第一个参数为图像路径,第二个参数可选,意思是通过几个通道数读取图像,1个通道数则是黑白图片,3个则是基于RGB色调的彩色图片,举例:
import numpy as np
import cv2
img = np.array()
# 图像本质就是一个矩阵
cv2.imread(img, 1)
# 以黑白方式读取图片

# 展示图片
from matplotlib import pyplot as plt
plt.imshow(img, cmap='gray')
# img是一个图像矩阵,cmap为显示类型,这里通过灰阶显示
plt.show()
  • 基于二进制流读取:
    使用cv2.imdecode(np.frombuffer(img, np.uint8), cv2.IMREAD_COLOR)读取
修改形状

resize,举例:

>>> img = cv2.imread("1.jpg")
>>> img.shape
(661, 659, 3)
>>> cv2.resize(img, (80, 120)).shape
# 将图片转成120*80的图片,注意这里宽高是反过来的
(120, 80, 3)
>>> cv2.resize(img, (-1, -1), fx=0.5, fy=0.2).shape
# 将图片宽高缩放成0.5和0.2
(132, 330, 3)

更多参考:https://blog.csdn.net/li_l_il/article/details/83218838

显示图像

imshow,但是会打开一个新的程序窗口查看图像,不太适合用在像jupyter notebook这样的环境,因此更推荐使用matplotlib.pyplot下的imshowshow方法,举例:

import cv2
cv2.imshow("image",img)
# 打开图像窗口
cv2.waitKey(0)
# 按下0键前一直显示
cv2.destroyAllWindows()
# 关闭图像窗口
# 不太推荐使用,推荐下面的那种

from matplotlib import pyplot as plt
plt.imshow(img, cmap='gray')
# img是一个图像矩阵,cmap为显示类型,这里通过灰阶显示
plt.show()
保存图像

imwrite,举例:

>>> img = cv2.imread("1.jpg")
>>> cv2.imwrite("test.jpg", img)
# 保存图像,第一个参数是保存的路径,第二个是图像的数组
True

这里有一个坑:由于jpg是有损压缩,而png是无损压缩,所以在保存时如果希望保持像素值完全不变的话,一定要保存成png格式,举例:

>>> x = cv2.imread("1.jpg")
# 读取图片
>>> cv2.imwrite("2.jpg", x)
# 保存一份jpg格式
True
>>> cv2.imwrite("2.png", x)
# 保存一份png格式
True
>>> y = cv2.imread("2.jpg")
# 读取保存后的jpg格式
>>> z = cv2.imread("2.png")
# 读取保存后的png格式
>>> np.all(x == y)
# 可以看出保存的jpg和原图是不同的
False
>>> np.all(x == z)
# 保存的png和原图是相同的
True
base64/二进制/矩阵格式转换

参考:
https://blog.csdn.net/cnmnui/article/details/105831908
https://blog.csdn.net/qian1122221/article/details/84567715

画图
矩形

rectangle,依次传入图片数组、左上角坐标、右下角坐标、颜色元组和线的粗细程度,举例:

import cv2
img = cv2.imread("1.jpg")
cv2.rectangle(img, (10, 10), (200, 200), (0, 255, 0), 1)
# 画一个框,左上角坐标为(10, 10),右下角坐标为(200, 200),颜色为绿色,线的粗细为1
cv2.imshow("image",img)
cv2.waitKey(0)
cv2.destroyAllWindows()
直线

line,使用方法和矩形一样,传入的两个坐标分别为头和尾坐标

circle,依次传入图片数组、圆心坐标、半径、颜色元组和线的粗细程度,举例:

import cv2
img = cv2.imread("1.jpg")
cv2.circle(img, (200, 200), 30, (0, 255, 0),  10)
cv2.imshow("image",img)
cv2.waitKey(0)
cv2.destroyAllWindows()
多边形

polylines,依次传入图片数组、每个角的坐标(需要传入一个列表,列表里面是numpy数组)、是否封闭、颜色元组和线的粗细程度,举例:

import cv2
import numpy as np
img = cv2.imread("1.jpg")
cv2.polylines(img,[np.array([[100,100],[200,100],[100,200]])],True,(0,255,255),2)
cv2.imshow("image",img)
cv2.waitKey(0)
cv2.destroyAllWindows()
文字

putText,依次传入图片数组、文本内容、坐标、字体、尺寸大小、颜色元组和线的粗细程度,举例:

import cv2
img = cv2.imread("1.jpg")
cv2.putText(img, "hello", (500, 200), cv2.FONT_HERSHEY_SIMPLEX, 1, (255, 255, 0),  1)
cv2.imshow("image",img)
cv2.waitKey(0)
cv2.destroyAllWindows()
教程参考

https://www.kancloud.cn/aollo/aolloopencv/269602

图像模糊判断

可以通过内置的拉普拉斯算法进行计算,一般情况下计算出的值越小,代表清晰度越低,代码很简单,举例:

>>> img = cv2.imread('xxx.png')
>>> cv2.Laplacian(img, cv2.CV_64F).var()
1787.805508284248

使用拉普拉斯算法注意参考:https://www.jianshu.com/p/60ac53013be4

其他参考

opencv下还提供了如人脸识别功能等,可以参考别的博客,如:
https://blog.csdn.net/luanpeng825485697/article/details/79509870
https://www.cnblogs.com/hanson1/p/7105265.html
https://www.cnblogs.com/traditional/p/9043931.html

踩坑记录

中文问题

使用cv2的时候一定要注意:读取的文件路径一定不能含有中文,日文等,包括打算给图片加上中文等字符,都会失败,如果一定要使用中文的话,建议使用PIL模块

数组无法用opencv操作

理论上来说,图像都是一堆数组,所以我们生成一个相同尺寸的数组,应该也能够被默认当做图像来操作才对,于是我偶然试试生成一个随机数组,想对其进行resize操作,发现竟然报错了?就像下面这样:

import numpy as np
import cv2

img = np.random.randint(0, 255, (100, 100))
cv2.resize(img, (120, 80))

# 报错:
# error: OpenCV(4.1.0) C:\projects\opencv-python\opencv\modules\imgproc\src\resize.cpp:3596: error: (-215:Assertion failed) func != 0 in function 'cv::hal::resize'

???啥玩意儿,明明我的数都在0~255之间,却还是不行,后来读了个图像,发现了区别:

import numpy as np
import cv2

img = np.random.randint(0, 255, (100, 100))
# 随机生成的图片
img1 = cv2.imread("xxx.jpg", 0)
# 用单通道读取图片,显示内容少点好对比
img, img1

# 结果:
# (array([[ 30,  31, 151, ..., 212, 205,  81],
#         [110, 202, 127, ..., 239,  72, 171],
#         [109, 228,  87, ..., 231,  65, 250],
#         ...,
#         [ 22,  66,   4, ..., 104, 198,  67],
#         [163, 121, 109, ..., 247, 129, 157],
#         [141, 133,  50, ...,  44,  50, 124]]),
#  array([[ 80,  80,  80, ...,  73,  75,  74],
#         [ 81,  81,  81, ...,  73,  75,  75],
#         [ 82,  82,  82, ...,  73,  75,  76],
#         ...,
#         [133, 151, 158, ..., 127, 114, 116],
#         [147, 127, 126, ..., 119, 113,  92],
#         [136, 122, 118, ..., 127, 107,  96]], dtype=uint8))

可以发现最后一行有个微妙的差别...那就是需要设置数据类型,因此将随机生成的数组的数据类型转成uint8就行了,就像下面这样:

import numpy as np
import cv2

img = np.random.randint(0, 255, (100, 100)).astype(np.uint8)
img1 = cv2.resize(img, (120, 80))
img1.shape
# (80, 120),可以看出裁剪成功

你可能感兴趣的:(Python opencv操作图像)