小白学习Yolo笔记,并不断补充(个人学习用)

一.目标检测技术综述:

小白学习Yolo笔记,并不断补充(个人学习用)_第1张图片

该图出处链接:https://zhuanlan.zhihu.com/p/40047760

该文章为目标检测综述,值得反复去看

 

     Yolo的发展历程如下:

小白学习Yolo笔记,并不断补充(个人学习用)_第2张图片

该图出处链接:https://zhuanlan.zhihu.com/p/70387154

二.CNN是什么 

所以我需要先了解RCNN到底是什么————好吧我先了解啥是CNN

https://www.bilibili.com/video/BV1Fx41177ws/?spm_id_from=333.788.videocard.0

https://www.bilibili.com/video/BV1nk4y1271L/?spm_id_from=333.788.videocard.6

这两个视频认真看完后记下笔记:

1.卷积(Convolution)

小白学习Yolo笔记,并不断补充(个人学习用)_第3张图片

2.填充(Padding)

小白学习Yolo笔记,并不断补充(个人学习用)_第4张图片

3.步长(Stride)

小白学习Yolo笔记,并不断补充(个人学习用)_第5张图片

小白学习Yolo笔记,并不断补充(个人学习用)_第6张图片

注意此例中步长为2

4.通道(Channel)

小白学习Yolo笔记,并不断补充(个人学习用)_第7张图片

 

小白学习Yolo笔记,并不断补充(个人学习用)_第8张图片

                    filter与R-channel卷积=4;

                    filter与G-channel卷积=0;

                    filter与B-channel卷积=5;

                                                \sum =9

                最终输出结果只有一层(3*3*1

5.多过滤器(MF)

小白学习Yolo笔记,并不断补充(个人学习用)_第9张图片

注意:

1.一个(3*3*3)的过滤器的三层是一样的矩阵

2.有多少个过滤器输出结果就有多少层

6.单层完整CNN

小白学习Yolo笔记,并不断补充(个人学习用)_第10张图片

7.池化(Pooling)

小白学习Yolo笔记,并不断补充(个人学习用)_第11张图片

8.Dropout

小白学习Yolo笔记,并不断补充(个人学习用)_第12张图片

9.CNN

小白学习Yolo笔记,并不断补充(个人学习用)_第13张图片

补充视频:李宏毅讲解卷积神经网络(带字幕)

https://www.bilibili.com/video/BV1Lb411b7BS/?spm_id_from=333.788.videocard.3

这里插个分支:

1.听完李宏毅老师的卷积神经网络,收获很大。决定要在未来某个时间将李老师的机器学习课程学完,并把课堂作业做一下

2.机器学习西瓜书要研究一番

3.实现我的斗地主预测对手牌的项目

三.继续yolo的学习:

参考博文:https://blog.csdn.net/weixin_44222014/article/details/103300617?utm_medium=distribute.pc_relevant.none-task-blog-OPENSEARCH-1.control&depth_1-utm_source=distribute.pc_relevant.none-task-blog-OPENSEARCH-1.control

声明:以下直接摘抄与引用该作者文章内容(from quotation to ...completed)

#quotation

2. YOLO简介

人类视觉系统快速且精准,只需瞄一眼(You Only Look Once)即可识别图像中物品及其位置。作者用了You Only Look Once的首字母YOLO来表示其算法,相当有趣。YOLO为一种新的目标检测方法,该方法的特点是实现快速检测的同时还达到较高的准确率。作者将目标检测任务看作目标区域预测和类别预测的回归问题。该方法采用单个神经网络直接预测物体边界和类别概率,实现端到端(end to end)的物体检测。同时,该方法检测速非常快,基础版可以达到45帧/s的实时检测;Fast YOLO可以达到155帧/s。与当前最好系统相比,YOLO目标区域定位误差更大,但是背景预测的准确性优于当前最好的方法。

小白学习Yolo笔记,并不断补充(个人学习用)_第14张图片

YOLO的网络结构:模型采用卷积神经网络结构。开始的卷积层提取图像特征,全连接层预测输出概率。模型结构类似于GoogleNet,如图3所示。作者还训练了YOLO的快速版本(fast YOLO)。Fast YOLO模型卷积层和filter更少。最终输出为7×7×30的tensor。

小白学习Yolo笔记,并不断补充(个人学习用)_第15张图片

YOLO主要特点

  1. 速度快,能够达到实时的要求。在 Titan X 的 GPU 上 能够达到 45 帧每秒。
  2. 使用全图作为 Context 信息,背景错误(把背景错认为物体)比较少。
  3. 泛化能力强。

小白学习Yolo笔记,并不断补充(个人学习用)_第16张图片
YOLO的核心思想

  1. YOLO的核心思想就是利用整张图作为网络的输入,直接在输出层回归bounding box的位置和bounding box所属的类别。
  2. faster RCNN中也直接用整张图作为输入,但是faster-RCNN整体还是采用了RCNN那种 proposal+classifier的思想,只不过是将提取proposal的步骤放在CNN中实现了。

#quotation_completed

对yolo网络的理解

https://blog.csdn.net/u014380165/article/details/72616238

https://blog.csdn.net/briblue/article/details/103149407

https://blog.csdn.net/weixin_44222014/article/details/103300617?utm_medium=distribute.pc_relevant.none-task-blog-OPENSEARCH-1.control&depth_1-utm_source=distribute.pc_relevant.none-task-blog-OPENSEARCH-1.control

四.yolo的CPU实现

五.yolo移植到fpga

附录

1.faster rcnn 中mAP、ap、precision和recall解析(多类平均正确率、平均正确率、精确率和召回率)

链接:https://blog.csdn.net/qq_35196207/article/details/80322354

 

 

你可能感兴趣的:(yolo,神经网络)