批量归一化(Batch Normalization,BN)层是神经网络中常用的一种层,它可以缩放和平移每个输入通道的值,使得输出的均值接近0,方差接近1。这样可以稳定神经网络的训练,加速收敛,同时也有一定的正则化效果。
给定输入的维度是(N, C, H, W),其中N是批量大小(batch size),C是通道数(channels),H是高度(height),W是宽度(width)。
BN层的输出的维度应该与输入的维度相同,也是(N, C, H, W)。这是因为BN层对每个通道独立进行归一化,不改变通道数,也不改变每个通道的空间尺寸。
具体地,BN层首先计算每个通道的均值和方差,然后用每个通道的值减去均值并除以标准差,得到归一化的值。然后,BN层再用学习到的缩放参数和平移参数对归一化的值进行缩放和平移,得到最终的输出。这些操作都是逐元素进行的,所以不会改变输入的维度。
需要注意的是,以上是在训练阶段的操作。在推理阶段,BN层通常使用移动平均和移动方差代替每个批次的均值和方差。