【前情提要】
需要将一张RGB图片转化为一维的灰度图,再进行增强和滤波。
【问题】
通过百度找到了python中RGB到灰度图的转换函数,PIL库中的convert函数,但是通过matplotlib的plt发现,通过convert转化出来的灰度图中每个像素点是四维的。不符合后续网络的输入要求,于是一场大冒险就开始了。
【解决尝试】
1、使用Matlab中的rgb2gray()函数,对图像进行处理,发现输出的矩阵确实是一维的,这验证了rgb图转化为gray图的原理:
L = R * 299/1000 + G * 587/1000 + B * 114/1000
rgb图中每个像素点的是(1, 4)大小的矩阵,而通过上述公式,可以将4维的像素点转化维1维的像素点,达到转化维灰度图的效果。
2、在此基础上,尝试通过python把图像读取为矩阵,通过矩阵来寻找原因,通过搜索发现np.array()可以将Image读取的对象转化为numpy的矩阵类型,通过print将矩阵的维度(matrix.shape)打印出来,却发现矩阵是2维的,也就是说通过convert转化出来的矩阵确实是一维的,但为什么通过imshow看到每个像素点确实4维的呢?(虽然,前三维相同,最后一维都是255)
3、在此基础上,尝试通过矩阵来显示图片,可以直接用imshow(),看到结果是每个像素点是1维的。说明不是imshow()的问题,另外从这个imshow的显示,又引出一个问题,如果不加cmap参数cmap=plt.get_cmap('gray'),那么显示出来的图片并不是灰度图,但是直接imshow()而不经过矩阵转换,不用加cmap参数也可以正确显示灰度图。
4、在此基础上,猜想是不是这另外三维的信息包含的是指示灰度图的信息?但为什么通过矩阵来存储Image对象,得到的像素点是一维的呢?其他三维的信息舍弃了吗?([107, 107, 107, 255]与[107])
【收获】
cmap(colormap)的设置方式
1、plt.imshow(image, cmap=plt.get_cmap('gray_r'))
2、 plt.imshow(image, cmap='gray_r')
3、 plt.imshow(image, cmap=plt.cm.binary)
python读取图片的方式
1、PIL Image.open
2、pyplot plt.imread()
3、matplotlib.image as mpimg mping.imread()
Image.fromarray可以将矩阵转化为图片
【疑惑】
Image对象与numpy,imshow()的交互方式