残差网络(ResNet) -深度学习(Residual Networks (ResNet) – Deep Learning)
在第一个基于cnn的架构(AlexNet)赢得ImageNet2012比赛之后,每个随后的获胜架构都在深度神经网络中使用更多的层来降低错误率。这适用于较少的层数,但当我们增加层数时,深度学习中会出现一个常见的问题,称为消失/爆炸梯度。这会导致梯度变为0或太大。因此,当我们增加层数时,训练和测试错误率也会增加。在上图中,我们可以观察到56层的CNN在训练和测试数据集上的错误率都高于20层的CNN架构