卷积神经网络之计算机视觉

注: 本文是学习吴恩达的网易公开课的学习笔记

深度学习给机器视觉带来了巨大的进步。

深度学习和机器视觉能够帮助机器分清汽车和周围的行人,并且帮助汽车避开他们。机器视觉而且能够使得人脸识别更加高效和精准。计算机视觉标志着新兴应用的产生。通过这些工具,你能产生新的产品和应用。其次即使你未在机器视觉上有所建树,但是机器视觉是如此的富有想象力和创造力,由此衍生的新的神经网络和算法,由此启发人们去创造出计算机视觉和其它领域的交叉成果,例如在语音识别中就经常借鉴借鉴计算机视觉的灵感。所以即使你在计算机视觉上没有成果,但是你可以将所学知识应用到其它的算法和结构。

机器视觉解决的问题:

1. 图片分类,比如是猫还不是猫。

2. 目标检测,例如检测目标图片中哪些是车,哪些不是车。

3. 图片风格的转换。

大图片上的深度学习的挑战:

当你有一张1000x1000x3 这么大的图片输入时,那么特征向量的维度就是3百万,那么第一个隐藏层的维度僵尸1000,那么第一层的W的维度就是(1000,3million),在参数如此大的情况下,难以获得足够数据来防止神经网络过拟合和竞争需求,要处理包含30亿的参数,内存也是一个问题。

结论:

为此需要进行卷积运算,它是卷积神经网络非常重要的一块。

你可能感兴趣的:(卷积神经网络之计算机视觉)