opencv 读取图片详解

最近在做深度学习目标检测中,用opencv读图,做翻转等等操作,发现自己之前对于opencv读取图片的数据存储理解不够全面,现在特做总结如下:
opencv读取图片是从左边第一个像素点开始读取,由于是彩色RGB图片,所以每个像素点处会有三个值,(opencv是按照 BRG 的顺序读取像素值),依次遍历每一行,每一行都分别是一个 (width, 3) 的numpy格式的二维数组,最后将每一行的这个二维数组都添加到一个大数组中,形成一个三个数组,也就会最后 img.shape 输出的 (height, width, 3) 这么一个三维数组

将opencv读取的图片转为正常的 RGB 模式:

img_path = '000001.jpg'
img = cv2.imread(img_path)

# opencv自带的 imshow 函数可以正常显示 BGR 格式的图像
cv2.imshow('res', img)
cv2.waitKey(0)

# 将 BGR 转成 RGB,用 plt 显示
img_rgb = img[:, :, ::-1]	# 用numpy数组将最后一维进行转换
img_rgb = cv2.cvtColor(img, cv2.COLOR_BGR2RGB)	# 用cv自带的转换函数

plt.imshow(img_rgb)
plt.show()

水平镜像翻转

img_flip = cv2.flip(img, 1)
img_flip = img[:, ::-1, :]
img_combine = np.hstack((img, img_flip))

cv2.imshow('res', img_combine)
cv2.waitKey(0)

垂直镜像翻转

img_flip = cv2.flip(img, 0)
img_flip = img[::-1, :, :]
img_combine = np.hstack((img, img_flip))

cv2.imshow('res', img_combine)
cv2.waitKey(0)

你可能感兴趣的:(opencv,opencv,python,计算机视觉)