卷积神经网络在计算机视觉领域大放异彩的原因

本文重点

卷积神经网络(Convolutional Neural Network, CNN)是一种专门用于处理图像数据的深度学习模型,其在图像识别、物体检测、人脸识别等领域取得了非常好的效果。

简单的神经网络为什么不好处理图片数据?

计算机视觉处理的是图片,那么就会面临数据非常大的情况。比如一张图片如果是64*64的,那么它的数据量就是64×64×3,因为每张图片都有 3 个颜色通道。那么图片的特征向量维度为 12288。

64×64还是比较小的,如果操作更大的图片,比如一张 1000×1000 的图片,那么特征向量的维度达到了 1000×1000×3,因为有 3 个 RGB 通道,所以数字将会是 300 万。

如果特征维度为300万,那么我们的神经网络需要300万个输入,如果神经网络的隐藏层有1000个隐藏单元,那么输入层和第一个隐藏层之间的参数矩阵的大小是会有 30亿个参数,仅仅输入层和隐藏层之间就有30亿个参数。在参数如此大量的情况下,难以获得足够的数据来防止神经网络发生过拟合,而且还存在巨大的内存压力。卷积神经网络在计算机视觉领域大放异彩的原因_第1张图片

 

卷积神经网络

针对于传统神经网络处理图片数据的不足之处,卷积神经网络进行了如下进化:

1、 局部连接和权值共享

卷积神经网络的核心是卷积层,卷积层通过局部连接和权值共享的方式,实现了对图像的特征提取。在传统的神经网络中,每个神经元都与上一层的所有神经元相连,这样的连接方式会导

你可能感兴趣的:(计算机视觉,深度学习,计算机视觉,神经网络,卷积神经网络,人工智能)