CNN第一篇

     研究生的第一篇Paper是关于CNN的,为了能够理解这篇paper,在网上找了很多关于CNN的文章:

  1. Stanford的CNN介绍:斯坦福cs231的CNN课程、
  2. C3D:http://vlg.cs.dartmouth.edu/c3d/、
  3. Medium论坛:medium上的CNN基础架构理解、
  4. stack问答:filter数量与什么有关 、
  5. IEEE Paper:3D卷积,人体姿态检测……等等。

      找的这些东西虽然确实也挺有帮助,但是我发现,就一个2-D CNN来说里面都有太多概念:receptive fileld、filter、weight、depth、channel、input feature map、pooling、FV……;另外还有,常见的网络结构:AlexNet,ResNet,FCN,MXnet,Faster-RCNN、计算机视觉的顶级会议:CVPR、ECCV、ICCV(计算机视觉顶级会议和期刊)、以及增加时间维度用于视频中动作识别的3-D卷积……等等。

       真的太多东西,也太多细节。

       虽然看CNN的论文和网上资源也很长时间了,但是由于掌握的知识不系统,层面很小,掌握的很少。这就直接导致在查找问题时,没有什么头绪,搜索一个问题时就很佛系,本着愿者上钩的状态,能找到什么是什么(emmm……)

        概念模糊、知识不系统的话,在对该项知识的使用、应用以及研究上面,它的弊端会逐渐显露并逐步扩大。

        所以,最开始,还是希望能有一个介绍的教材(例如各种导论),或者偏认知型的CNN书籍或者期刊等等。当然,我并不否定在网上学到的这些东西,以及网络的便利性,我觉得这只是一个趋势,当你要认知更多的时候,你需要找到一些切实的办法。

你可能感兴趣的:(computer,vision)