OpenCV计算机视觉实战 | 第2章 图像的基本操作

本文为《OpenCV计算机视觉实战》课程的笔记。

1 图像的基本概念

  • 图像的表示:计算机中,图像由像素点组成。
  • 像素点取值:[0, 255] 数值表示图像的亮度,数值越大越亮
  • 彩色图像颜色通道:RGB,每个通道上都有一个亮度值

​ 注:灰度图只有一个通道

  • 图像的表示:图像的每个通道都由亮度值的矩阵组成

2 图像的基本操作

2.1 图像的读取

  • 彩色图像:cv2.IMREAD_COLOR,读取后得到的是一个三维矩阵
  • 灰度图像:cv2.IMREAD_GRAYSCALE,读取后得到一个二维矩阵
import cv2

path = './img/green.jpg'
img = cv2.imread(path)

img_gray =cv2.imread(path, cv2.IMREAD_GREAYSCALE)

注意,这里读取路径中不能有中文!如果文件位于当前路径下可使用./xxx,否则img将为空。

读入后img的数据类型是uint8的矩阵。

图像可以使用opencv自带工具包或matplotlib进行展示。注意,opencv的通道顺序是BGR,而matplotlib是RGB。

2.2 图像的显示

# 创建一个窗口进行显示
cv2.imshow('image',img)

# 设置一个等待时间,单位毫秒,使窗口不自动关闭
cv2.waitKey(0) # 按任意键关闭窗口。若将0改成1000,则表示等待1s后窗口自动关闭
cv2.destroyAllWindows()

2.3 查看图像的基本信息

# 图像的尺寸(h,w,c)
img.shape

# 查看数据结构类型
type(img) # numpy.ndarray

# 查看数据类型
img.dtype # dtype('uint8')

# 查看像素点个数
img.size

typedtype的区别:[链接](python 中的 type(), dtype(), astype()的区别_Strive_For_Future的博客-CSDN博客)

函数 说明
type() 返回数据结构类型(list、dict、numpy.ndarray 等)
dtype() 返回数据元素的数据类型(int、float等)
备注:1)由于 list、dict 等可以包含不同的数据类型,因此不可调用dtype()函数 2)np.array 中要求所有元素属于同一数据类型,因此可调用dtype()函数
astype() 改变np.array中所有数据元素的数据类型。备注:能用dtype() 才能用 astype()

2.4 图像的保存

cv2.imwrite('./img/green_gray.jpg',img_gray)

2.5 边界填充

top_size, bottom_size, left_size, right_size = (50,50,50,50)

replicate = cv2.copyMakeBorder(img_cat, top_size, bottom_size, left_size, right_size, borderType = cv2.BORDER_REPLICATE)
reflect = cv2.copyMakeBorder(img_cat, top_size, bottom_size, left_size, right_size, borderType = cv2.BORDER_REFLECT)
reflect101 = cv2.copyMakeBorder(img_cat, top_size, bottom_size, left_size, right_size, borderType = cv2.BORDER_REFLECT_101)
wrap = cv2.copyMakeBorder(img_cat, top_size, bottom_size, left_size, right_size, borderType = cv2.BORDER_WRAP)
constant = cv2.copyMakeBorder(img_cat, top_size, bottom_size, left_size, right_size, borderType = cv2.BORDER_CONSTANT, value=0)

plt.subplot(231), plt.imshow(img_cat, 'gray'),plt.title('ORINGINAL')
plt.subplot(232), plt.imshow(replicate, 'gray'),plt.title('REPLICATE')
plt.subplot(233), plt.imshow(reflect, 'gray'),plt.title('REFLECT')
plt.subplot(234), plt.imshow(reflect101, 'gray'),plt.title('REFLECT_101')
plt.subplot(235), plt.imshow(wrap, 'gray'),plt.title('WRAP')
plt.subplot(236), plt.imshow(constant, 'gray'),plt.title('CONSTANT')

plt.show()
image-20220210230052869

3 视频的读取和处理

3.1 视频的读取

cv2.VideoCaputre可用于捕获指定摄像头,用数字来控制不同的设备,如0、1

若是调用视频文件, 则直接指定路径即可。

# 读入视频
vc = cv2.VideoCapture('./img/wzry.mp4')

# 检查是否打开正确
if vc.isOpened():
    open, frame = vc.read() 
    # 每次调用read(),都读取一个帧。若读取成功,open标志为True
else:
    open = Flase
    
while open:
    ret,frame =vc.read()
    if frame is None:
        break
    if  ret == True:
        vc_gray = cv2.cvtColor(frame, cv2.COLOR_BGR2GRAY) #将每一帧都转换为灰度图
        cv2.imshow('result', vc_gray)
        if cv2.waitKey(10) & 0xFF == 27:
            # 按退出键后退出
            # 这边的cv2.waitKey(10)表示每帧之间间隔10ms
            break
            
vc.release()
cv2.destroyAllWindows()

4ROI区域

ROI:感兴趣的区域

4.1 截取部分图像数据

本质上是数组的切片。

img = cv2.imread('./img/green.jpg')
img_roi = img[:50, :200]
cv_show('img_roi',img_roi)

4.2 颜色通道提取

b,g,r = cv2.split(img)

b g r的矩阵值不同,但三者的shape是一样的。

4.3 通道合并

本质上是矩阵的合并。

img = cv2.merge((b,g,r))
img.shape # (1362, 2560, 3)

注意,要按BGR通道顺序进行合并。

4.4 只保留某一个通道

# 只保留R,即G和B都为0
cur_img = img.copy()
cur_img[:,:,0] = 0
cur_img[:,:,1] = 0
cv_show('r',cur_img)

# 只保留B
cur_img = img.copy()
cur_img[:,:,2] = 0
cur_img[:,:,1] = 0
cv_show('b',cur_img)

# 只保留g
cur_img = img.copy()
cur_img[:,:,0] = 0
cur_img[:,:,2] = 0
cv_show('g',cur_img)

5 数值计算

5.1 图像叠加

5.1.1 对单张图做加法

img2 = img + 10
# 每一个元素都+10
image-20220210225314608 image-20220210225401101

5.1.2 两张图相加

==注意:==图像大小得一样

1、用“+”计算:计算结果自动对256取模

(img + img2)[:5,:,0]
image-20220210225621083

2、用cv自带方法计算:若越界,则取255

cv2.add(img,img2)[:5,:,0]
image-20220210225642331

5.2 图像融合

前提:融合的两张图像尺寸要相同

img_cat = cv2.imread('./img/cat.jpg')
img_dog = cv2.imread('./img/dog.jpg')

图像缩放:

# 图像缩放
img_cat = cv2.resize(img_cat,(500,500))
img_dog = cv2.resize(img_dog,(500,500))

# 图像按倍数缩放
res = cv2.resize(img_cat, (0,0), fx=3, fy=1)
plt.imshow(res)

图像融合:cv2.addWeighted()

# 按权重融合
res = cv2.addWeighted(img_cat, 0.6, img_dog, 0.4, 0)
plt.imshow(res)
# cv_show('comb',res)

你可能感兴趣的:(计算机视觉,计算机视觉,opencv,python)