object detection basic Q&A - 草稿

----* YoloX -------------------------------------

  • yolox解读
  • YOLOX-L: COCO上AP: 50.0% -比 Yolov5-L高出1.8%的AP,Tesla V100 68.9 FPS
  • YOLOX-Tiny(0.91M参数) 比 YOLOv4-Tiny 高10% AP
  • YOLOX-Nano (1.08G) 比
  • 网络结构,head,数据增强,学习率方面都有哪些设计?--yolov3spp-----spp组件是什么?
  • IoU-aware 分支是什么。
  • decoupled head是什么? 解耦提升了多少AP
  • 哪些数据增强在最后多少epochs被关闭?
  • 预训练的模型是否会失效?
  • 训练小的YOLO-x模型的时候有哪些特性需要关闭?
  • YOLOX 是anchor based 还是 anchor free的
  • 正样本的选择方式:中心点,Multi positives, simOTA. 每个导致了多少的长点?
  • OTA: Optimal Transport Assignment
  • SimOTA 是如何自动决定特征图的?
  • SimOTA讲解
    ----* YOLOX 原始论文----------
  • anchor free ---* decoupled head---* SimOTA: a label assignment strategy,---* YOLOXDarknet53对标YOlov3-SPP, YOLOX-L对比YOLOv5-L,两者都有CSPNet---* 300epochs,5 epochs 为warmup----* SGD,lr=0.01,cos方式减小lr, weight decay0.0005,momentum=0.9----* 测试速度用的是FP16,-----* IOU aware branch, EMA weights updating---* Mosaic, MixUp,导致ImageNet pretrain失效---* 本文列举anchor based两个问题:一是cluster出来的anchor与数据集相关不能泛化; 二是anchor带来大量的数据需要从NPU拷贝到CPU,端侧部署延迟大。---* 本文列举anchor free的2条优点: 参数少,不用调试;简化了训练过程-----* YOLOX 怎么做到anchor free 的?每个location不再预测三个而是预测1个;预测bbox 中心到grid左上角的偏移+bbox的height,width;像FCOS 一样设置positive sample----* Multi positives ,物体中心的3x3作为pos,这个技巧在FCOS里面叫做 center sampling-----* SimOTA: 4个主要思想是什么?loss/quality aware; center prior; dynamic number of pos anchors; global view. 而YOLOX里面用的不是OTA,而是用dynamic top-k 策略,来得到一个近似的最优分配----* OT 是什么Optimal Tranport ----* SimOTA 计算过程:pair-wise matching(就是每个pred-gt算cost,cost包括cls和reg两种loss),选择综合loss最小的top-k个pred
    ----* YOLOX 在mmdetection中复现全流程解析----------------------------------
  • anchor free, 更少先验,减少复杂的超参数,推理高效 -----* decoupled head. 参考了FCOS,增加了Objectness--* Simota 和 Multi positives能加快收敛----nesterov
    ----
    些介绍SGD, momentum, NAG的文章-----------
  • Momentum的公式-------* NAG的公式,收敛速度比Momentum快,NAG公式的等效形式
    ----* YOLO系列-----------------------
  • yolo系列
    *yolov3的网络结构是什么样的呢?------
  • Yolov4 在back bone和head中各使用什么激活函数?---5个基本组件的结构--CSP Darknet53--- * CSP 模块: cross stage partial network, 使用的原因(v3会有梯度信息重复,而加入了CSP之后就没有了) ---* Mish 函数的公式。 曲线像leaky_relu------* Top-1,Top-5 ----- * Dropblock功能是什么?解决了conv与全连接的什么不同导致的什么模块不好使的问题? ---- * cutout --- * Neck里用的SPP模块和 FPN+PAN ---- * SPP模块的框图,四条分支,卷积核是什么?SPP在框图上的位置。好的原因(与单纯的maxpooling比保留了更多的上下文)---* PAN 与 PANet, * 608,76,38,19 尺度 -----* PAN 加在 FPN 的什么地方?怎么加入强语义特征?怎么加入强定位特征?Yolov4的PAN用的是shortcut还是concat?-- * Bounding box regression loss 的发展过程是什么?每种loss的问题是什么?每种IOU的公式是什么?每种IOU的loss的公式是什么?每种IOU的值域是什么?不相交的时候IOU的值是什么?对NMS过程有什么改进 --- * cmBN是什么呢?----SAT自对抗训练---Masaicb:小目标
  • 某个微信公众号讲解YOLOX代码及使用心得
  • 如何更好的设置学习率?
  • [anchor free 有什么缺点]https://www.zhihu.com/question/364639597)
  • Faster Rcnn的RPN是用来做什么的?--* 正负样本不平衡.哪些网络有这个问题----语义模糊性---- focal loss----* anchor based 和 anchor free 都有正负样本不均衡的问题,---* FCOS结构是anchor free的#---划分正负样本的方法,最少4种--- 网格与OHEM,focal loss----哪些模型有objectness的预测,哪些没有,它有什么好处?----- 也提到了随机采样----什么样的anchor是比较好的呢?与GT的IOU在0.5以上----单尺度的anchor free 与多尺度的anchor free 解决问题是什么?----* anchor free与anchor based 比较,其的 recall 高.precision低,解空间大,但效果不稳定,得到的框置信度都偏低,对backbone的要求较大,没有那么好train,-----* keypoint based 算法举例2个, pixel wise的方法举例一个*----
  • ------KLDiv Loss---------
    cross entropy + NLLLoss + KLDivloss
    • 贝努利分布的公式, 投硬币的公式---* 什么是似然函数?需要最大化还是最小化?----* 累乘的结构,通常都要对数化变成累加 ---* 为什么很多loss函数都有log? ---* KL DivLoss 的公式?----* 信息熵公式是什么?意义是什么?-----* 交叉熵的意义是什么?

你可能感兴趣的:(object detection basic Q&A - 草稿)