卷积神经网络中各个层对数据形状的改变

        一般卷积神经网络的输入是一个四维张量,NCHW 或 NHWC 格式的 4-D Tensor,N是batch_size白话就是一个批次有几张图片,C是通道数,彩色图片是3,黑白是1,H是高度,W是图片宽度,然后卷积层的参数一般有必选的两个个,一个是input_channel,输入通道,output_channel,输出通道,这两个参数在计算时会改变数据的形状,具体表现为改变数据的前两个维度,更具体的其实就是图片的通道数维度。

        然后还有一个层,池化层,Pool2D,这个层也会改变数据形状,具体改变数据的高和宽,一般而言,它的参数设为2*2,最后的结果高度和宽度变为原来的一半,以手写字数据为例,比如输入的数据是N*1*28*28,经过一个卷积层(参数为输入通道1,输出通道32),那么输出结果就是N*32*28*28,再经过一个池化层(参数为2*2),那么输出结果为N*32*14*14。

        本文主要记录下近期研究的关键点,这块开始学的时候有点懵逼。

你可能感兴趣的:(python,工作日志,cnn,深度学习,神经网络)