线段检测:Towards Light-weight and Real-time Line Segment Detection Towards Light-weight and Real【方法解读】

目录

    • 摘要
    • 1 引言
    • 2 相关工作
      • 深度线段检测
      • 实时目标检测
    • 3 用于线段检测的M-LSD
      • 3.1 网络架构
        • (a) TP表示法
        • (b) SoL增广
      • 总结
      • 3.2 线段表示
      • 详细解析
        • 1. 线段表示的重要性
        • 2. TP表示法
        • 3. 位移向量
        • 4. 坐标表示
        • 5. 训练过程
        • 6. 非极大值抑制
        • 7. 简单算术操作
      • 总结
      • 图5:匹配损失和几何损失
      • 图5 标题内容解析
      • 3.3 匹配损失
      • 3.3 匹配损失解析
        • 1. 背景和动机
        • 2. 中心损失和位移损失
        • 3. 匹配损失的引入
        • 4. 匹配损失的计算步骤
        • 5. 总损失函数
      • 详细解析
      • 总结
      • 3.4 SoL增广
      • 3.4 SoL增广解析
        • 1. 背景和动机
        • 2. SoL增广的实现
        • 3. 计算公式
        • 4. 参数设置
        • 5. 损失函数
        • 6. 注意事项
      • 总结
      • SoL增广应用示例
        • 示例背景
        • 计算内部划分点
        • 划分线段
        • 子部分训练
        • 损失函数
      • 示例总结
      • 3.5 利用几何信息进行学习
        • 交点和线段分割
        • 长度和角度回归
      • 3.5 利用几何信息进行学习解析
        • 1. 背景和动机
        • 2. 交点和线段分割
        • 3. 长度和角度回归
      • 总结
      • 3.6 最终损失函数
    • 4 实验
      • 4.1 实验设置
        • 数据集和评估指标
        • 优化
      • 图6:从TP中心图生成的显著图。模型编号(M1~4)来源于表1。
      • 图6 标题内容解析
      • 4.2 消融研究和解释性
        • 匹配损失
        • 几何损失
        • SoL增广
      • 4.3 与其他方法的比较
        • 现有方法与M-LSD训练方案
        • M-LSD和M-LSD-tiny
      • 4.4 可视化
      • 4.5 移动设备上的部署
    • 5 结论
  • Towards Light-weight and Real-time Line Segment Detection
    • Supplementary Material
    • 目录
    • 参考文献
      • A 额外的相关工作
      • A 其他相关工作
        • 手工特征方法
      • B M-LSD的细节
        • B.1 网络架构
        • B.2 特征图和损失
      • B.3 使用最终特征图
  • C 扩展实验
    • C.1 架构消融研究
    • C.2 偏移映射的需求
    • C.3 SoL 增广的影响
    • C.4 匹配损失的阈值
    • C.5 几何损失的消融研究
      • 线段和连接点分割
      • 长度和角度回归
      • 每种训练方案的性能
    • C.6 HAWP 线段表示
    • C.7 应用
    • C.8 精确率和召回率曲线
    • C.9 可视化

摘要

以前的基于深度学习的线段检测(LSD)在线段预测上存在巨大模型规模和高计算成本的问题。这限制了它们在计算资源受限的环境中实时推理的能力。在这篇论文中,我们提出了一种名为Mobile LSD (M-LSD)的实时轻量级线段检测器,专为资源受限的环境设计。我们通过最小化骨干网络并去除以往方法中的典型多模块处理过程,设计了一种极其高效的LSD架构。为了在保持竞争性能的同时实现轻量级网络,我们提出了新颖的训练方案:线段分割(SoL)增强、匹配和几何损失。SoL增强将线段分割成多个子部分,这些子部分在训练过程中用来提供辅助线数据。此外,匹配和几何损失使模型能够捕捉额外的几何线索。与之前最佳的实时LSD方法TP-LSD-Lite相比,我们的模型(M-LSD-tiny)在模型大小仅为其2.5%的情况下,实现了推理速度提升130.5%。此外,我们的模型在最新的Android和iPhone移动设备上分别运行于56.8 FPS和48.6 FPS。据我们所知,这是首个在移动设备上可用的实时深度LSD。我们的代码可以在以下地址获得。

code

1 引言

线段和交点是低层视觉中关键的视觉特征,为姿态估计(Přibyl, Zemčı́k, and Ča

你可能感兴趣的:(AI与SLAM论文解析,人工智能,线段检测,论文阅读,检测)