Lightweight and Progressively-Scalable Networks for Semantic Segmentation简记

1.介绍

  • 贡献:可行的轻量网络设计和路径交互方法,扩展到所需准确率和速度平衡的方法
  • https://github.com/YihengZhang-CV/LPS-Net

2.相关工作

3.LPS-Net

3.1 宏观结构

  • 多路处理输入图像的不同尺度,每路的网络结构相同
  • 每路有5组stage。
    • 1到4组的第一个卷积步长是2,其他是1。
    • 3到5组后路径交互,看代码第五组后是torch.cat
  • 每组的通道数相同,有若干卷积块

3.2 卷积块

  • 类型:标准卷积,FLOPs忽略了命中内存的代价,使用FLOPs-efficiency更合理,需要实际运行确定
  • 通道数:2^n的倍数,n越大越好
  • 一个卷积块包括3*3的卷积层,BN层和ReLU层,预测时没有BN层

3.3 路径交互

  • 直接采样相加最高效

3.4 可扩展结构

  • 参数
    • B:每组stage的卷积块数(深度,高级语意)
    • C:通道数(宽度,卷积的学习能力)
    • R:输入放缩比例
  • 从B0 = {1, 1, 1, 1, 1}, C0 = {4, 8, 16, 32, 32}, R0 = {1/2, 0, 0}开始

4.实验

4.1 数据库:Cityscapes, BDD100K, CamVid

4.2 细节

  • PyTorch
  • SGD
  • cross-entropy loss
  • momentum 0.9
  • weight decay 0.0005
  • “Poly” policy with power 0.9 is adopted with initial learning rate 0.01(Cityscapes)
  • crop,color-jittering, random horizontal flip and random scaling (0.5× ∼ 2.0×)
  • Model re-parameterization

4.3 评估轻量设计:卷积块和交互方式

4.4 评估逐步扩展

  • 得到LPS-Net-S, LPSNet-M, and LPS-Net-L,都是两路
  • M比S提高了输入大小
  • L比M提高了通道数

4.5 和其他方法比较

4.6 LPS-Net-S在嵌入式设备上的表现

5.结论

参考文献

你可能感兴趣的:(semantic,LPS-Net)