计算机视觉:maskrcnn-benchmark学习笔记

1.关于深度学习中的batch_size
batch_size可以理解为批处理参数,它的极限值为训练集样本总数,当数据量比较少时,可以将batch_size值设置为全数据集(Full batch cearning)。
实际上,在深度学习中所涉及到的数据都是比较多的,一般都采用小批量数据处理原则。
2.滑动平均可以看作是变量的过去一段时间取值的均值,相比对变量直接赋值而言,滑动平均得到的值在图像上更加平缓光滑,抖动性更小,不会因为某次的异常取值而使得滑动平均值波动很大
3.给深度学习入门者的Python快速教程 - numpy和Matplotlib篇
https://zhuanlan.zhihu.com/p/24309547
4.给深度学习入门者的Python快速教程 - 基础篇
https://zhuanlan.zhihu.com/p/24162430
5.fps:帧
6.鲁棒性:健壮
7.ResNets:特征图集:{P2,P3,P4,P5}
空间尺寸:{C2,C3,C4,C5}
8.feature map的理解
在cnn的每个卷积层,数据都是以三维形式存在的。你可以把它看成许多个二维图片叠在一起(像豆腐皮竖直的贴成豆腐块一样),其中每一个称为一个feature map。
9.图像掩模是用选定的图像、图形或物体、对待处理的图像(全部或局部)进行遮挡来控制图像处理的区域或处理过程。
10.torch.nn.Module 是所有神经网络单元的基类
11.
计算机视觉:maskrcnn-benchmark学习笔记_第1张图片
12.过拟合:根本原因是特征维度过多,模型假设过于复杂,参数过多,训练数据过少,噪声过多,导致拟合的函数完美的预测训练集,但对新数据的测试集预测结果差。 过度的拟合了训练数据,而没有考虑到泛化能力。
      解决方法:(1)减少特征维度;(2)正则化,降低参数值。
13.降采样指的是成比例缩小特征图宽和高的过程,比如从(W,H)变为(W/2,H/2)。深度卷积神经网络中降采样的方法主要有三种:
1、stride大于1的pooling
2、stride大于1的conv
3、stride大于1的reorg(在YOLOv2的论文里叫passthrough layer)
13.提议(proposals,即有可能包含一个目标的区域)
14.RPN 扫描的区域被称为 anchor,这是在图像区域上分布的矩形
15
计算机视觉:maskrcnn-benchmark学习笔记_第2张图片
16
计算机视觉:maskrcnn-benchmark学习笔记_第3张图片
17.volatile
用来防止优化。
易变的,因为访问寄存器要比访问内存单元快的多,所以编译器一般都会作减少存取内存的优化,但有可能会读脏数据。
当要求使用volatile声明变量值的时候,系统总是重新从它所在的内存读取数据,即使它前面的指令刚刚从该处读取过数据,编译器对访问该变量的代码就不再进行优化,从而可以提供对特殊地址的稳定访问。
如果不使用volatile,则编译器将对所声明的语句进行优化。
18.RPN网络
计算机视觉:maskrcnn-benchmark学习笔记_第4张图片
19.Faster流程图:
计算机视觉:maskrcnn-benchmark学习笔记_第5张图片

20.ResNet-FPN网络结构:

计算机视觉:maskrcnn-benchmark学习笔记_第6张图片
21.Mask RCNN:
计算机视觉:maskrcnn-benchmark学习笔记_第7张图片

22.总结一下Mask RCNN的网络:
骨干网络ResNet-FPN,用于特征提取,另外,ResNet还可以是:ResNet-50,ResNet-101,ResNeXt-50,ResNeXt-101;
头部网络,包括边界框识别(分类和回归)+mask预测。头部结构见下图:
计算机视觉:maskrcnn-benchmark学习笔记_第8张图片
23.RoiPool:

计算机视觉:maskrcnn-benchmark学习笔记_第9张图片
24.RoiAlign:
计算机视觉:maskrcnn-benchmark学习笔记_第10张图片

25.一文让你彻底了解卷积神经网络
https://blog.csdn.net/weixin_42451919/article/details/81381294
26.残差块
计算机视觉:maskrcnn-benchmark学习笔记_第11张图片
计算机视觉:maskrcnn-benchmark学习笔记_第12张图片

27.残差神经网络中的残差:
计算机视觉:maskrcnn-benchmark学习笔记_第13张图片
28.ResNet:


29.
计算机视觉:maskrcnn-benchmark学习笔记_第14张图片

你可能感兴趣的:(计算机视觉)