深度学习-卷积神经网络池化到图像压缩解压的假想

这是博主的第二篇博文,经验非常有限,所以写的水平很低,下面是我学习卷积神经网络中的一些见解。本人未学习到机器视觉与图像有关的任何知识,只是从池化中假想到一种图片压缩方法。如果假想中的图像内容与知识正确,那么将无比幸运。本文除了两幅图片摘抄,其余都是原创,由于属于假想,未经过证实,不得转载。

好了,废话不多说。我们从池化中开始讲,

池化层:对输入的特征图进行压缩,一方面使特征图变小,简化网络计算复杂度;一方面进行特征压缩,提取主要特征,如下:

深度学习-卷积神经网络池化到图像压缩解压的假想_第1张图片

从黑色图224x224池化到112x112中发现像素变低,现在假想一张图片由一个mxn阶矩阵组成,每个元素0~9,假设0是白色,9是黑色,1-8是各种颜色,那么一张图片由很多个颜色凑成,也就是说mxn矩阵里的元素全为0时就是一张白纸,全为9时就是一张墨纸,矩阵中元素错杂交乱的混合时就是一张色彩图片。

好了我们来讲讲压缩

深度学习-卷积神经网络池化到图像压缩解压的假想_第2张图片

池化有两种:最大池化和平均池化。上图是最大池化,很简单,就是把矩阵等分平均分,然后选出最大的作为最终池化结果。平均池化不言而喻就是求等份小矩阵中的平均值,例如上图平均池化的结果应该是3.25 5.25 2 1.75。

先就最大池化法来假想图像压缩,一张图片看做由4x4矩阵,最大池化后得上图的6 8 3 4,储存量减小图片大小变成1/4,属于压缩,那么我解压后这些数值该怎么办?假想解决:对于红色2x2块,由于最大是6,我压缩后不知道其余3块是多少,数值是0-6的可能,有可能6 6 6 6 ,也可能0 0 0 6,还有1  1 1 6, 1 2 3 6,5 5 5 6等等,为了让误差最可能小,选出中间值3,,令其为3 3 3 6,使得各种可能值里误差最小,颜色不会偏的很大,所以居中是最好的方法;同理,绿色2x2中,8最大,选4 4 4 8作为解压的结果最好,黄色那块1.5 1.5 1.5 3,蓝色那块为2 2 2 4,最终得到压缩后又解压的结果为下图A

深度学习-卷积神经网络池化到图像压缩解压的假想_第3张图片

平均池化后是3.25 5.25 2 1.75 ,所以解压后为下图B

深度学习-卷积神经网络池化到图像压缩解压的假想_第4张图片

如果需要比较哪个解压得到的图片更好,我觉得把A再平均化得到A2

深度学习-卷积神经网络池化到图像压缩解压的假想_第5张图片

貌似两种解压都各有千秋,但是不知道实际效果怎样。

所以以上就是我从池化到图像压缩和解压的假想。

你可能感兴趣的:(深度学习)