4 图像处理基础知识

1 图像格式

1.1 通道数与像素深度

灰度图的通道数为1,RGB图片的通道数为3。对于灰度图,使用一个8位的数字就可以表示对应的黑白程度,因此像素深度为8。

以OpenCV为例介绍图像的通道数和像素深度的概念,首先我们读取并显示图片:

import cv2
from matplotlib import pyplot as plt 

img=cv2.imread("../picture/pig.jpg")
show_img = cv2.cvtColor(img, cv2.COLOR_BGR2RGB) 
plt.imshow(show_img) 
plt.show() 

由于使用jupyter notebook,开发环境是IPython,因此无法直接使用OpenCV展示图片,需要使用matplotlib帮助展现。OpenCV默认格式为BGR,因此需要转换为RGB格式后再展现。显示结果如下:

4 图像处理基础知识_第1张图片
打印原始图片,其形状为:

print(img.shape)
# (300, 300, 3)

接下来我们设置参数cv2.COLOR_BGR2GRAY,将原始图片转化为灰度图片:

img=cv2.imread("../picture/pig.jpg")
show_img=cv2.cvtColor(img, cv2.COLOR_BGR2GRAY)
plt.imshow(show_img,cmap=plt.cm.gray) 
plt.show() 

显示结果如下:
4 图像处理基础知识_第2张图片
打印图片形状:

print(img.shape)
# (300, 300)

还有一类特殊的图像,只有黑色和白色,称为二值图,像素深度是1位:

img=cv2.imread("../picture/pig.jpg")
show_img=cv2.cvtColor(img, cv2.COLOR_BGR2GRAY)
ret, show_img = cv2.threshold(show_img, 220, 255,cv2.THRESH_BINARY)

plt.imshow(show_img,cmap=plt.cm.gray) 
plt.show()

4 图像处理基础知识_第3张图片
转换成二值图像时核心代码为cv2.threshold,通过它可以把超过阈值的像素点设置为新值。

2 图像转换

2.1 仿射变换

仿射变换(Affine Transformation)是空间直角坐标系的变换,从一个二维坐标变换到另一个二维坐标。仿射变换是线性变换,它保持了图像的“平行性”和“平直性”,即图像中原来的直线和平行线,变换后仍然保持原来的直线和平行线。仿射变换比较常用的变换有缩放、旋转、平移、剪切和翻转。

假设某点变换前的坐标为(x,y),变换后的坐标为(x’,y’),那么仿射变换可以表示为:

待补充 82页

你可能感兴趣的:(对抗样本入门,图像处理,opencv,计算机视觉)