Faster R-CNN: Towards Real-Time Object Detection with Region Proposal Networks 精读 (Faster R-CNN准备)

目录

  • 前期准备
    • 名词解释
      • 目标检测
      • 非极大值抑制(Non-Maximum-Suppression,NMS)
      • RNN神经网络 (循环神经网络Recurrent Neural Network)
      • 注意力机制
      • 鲁棒性
      • IOU
    • 拟复现代码

前期准备

名词解释

目标检测

输入图像中往往有很多物体,目的是判断出物体出现的位置与类别https://blog.csdn.net/weixin_43336281/article/details/113059311
https://blog.csdn.net/AugustMe/article/details/107778518

非极大值抑制(Non-Maximum-Suppression,NMS)

在模型预测阶段,我们先为图像生成多个锚框,并为这些锚框一一预测类别和偏移量。随后,我们根据锚框及其预测偏移量得到预测边界框。当锚框数量较多时,同一个目标上可能会输出较多相似的预测边界框。为了使结果更加简洁,我们可以移除相似的预测边界框。常用的方法叫作非极大值抑制(non-maximum suppression,NMS)。
https://blog.csdn.net/weixin_43336281/article/details/113059311

RNN神经网络 (循环神经网络Recurrent Neural Network)

RNN(Recurrent Neural Network)是一类用于处理序列数据的神经网络。首先我们要明确什么是序列数据,摘取百度百科词条:时间序列数据是指在不同时间点上收集到的数据,这类数据反映了某一事物、现象等随时间的变化状态或程度。这是时间序列数据的定义,当然这里也可以不是时间,比如文字序列,但总归序列数据有一个特点——后面的数据跟前面的数据有关系。
https://blog.csdn.net/zhaojc1995/article/details/80572098

注意力机制

在神经网络模型处理大量输入信息的过程中,利用注意力机制,可以做到只选择一些关键的的输入信息进行处理,来提高神经网络的效率,比如在机器阅读理解任务中,给定一篇很长的文章,然后就文章的内容进行提问。提出的问题只和段落中一两个句子有关,其余部分都是无关的,那么只需要把相关的片段挑出来让神经网络进行处理,而不需要把所有文章内容都输入到神经网络中。
https://blog.csdn.net/qq_37492509/article/details/114991482

鲁棒性

在机器学习,训练模型时,工程师可能会向算法内添加噪声(如对抗训练),以便测试算法的「鲁棒性」。可以将此处的鲁棒性理解述算法对数据变化的容忍度有多高。

https://blog.csdn.net/The_Time_Runner/article/details/89643644

IOU

目标检测中预测框与真实框的重叠程度

拟复现代码

https://github.com/facebookresearch/detectron2

你可能感兴趣的:(目标检测,目标检测,cnn)