【2019-TGRS】Aerial LaneNet: Lane-Marking Semantic Segmentation in Aerial Imagery Using Wavelet-Enhanc

概述

针对航空影像的车道线分割,提出了一种基于小波变换增强的对称全卷积网络(FCN)。使用定制的损失函数和新的数据增强步骤,来解决车道标志像素数量与背景像素数量不平衡的问题。发布了自己的航空影像路面标志检测数据集。

  • Paper
  • Code

总结

  • 创新点:
    • 1.建立了航片路面标志数据集
    • 2.使用小波变换保留全频域信息,使用敏感交叉熵函数调节前景与背景像素的不平衡性
  • 不足:阴影区域分割不理想,以及wash out markings不理想
  • 分析:
  • 结论:end-to-end,小目标分割,精度高且鲁棒

1. Introdution

高精地图引入,内容较多,写论文时可以借鉴些。自动驾驶、车道级交通监测、城市管理、城市规划。现有数据采集方式移动测量车,一次只能覆盖一小部分区域,航空相片可解决这个问题。
挑战:航空相片数据两个挑战:遮挡与阴影。车道线分割任务中的挑战:

  • 不同的类别
  • 小尺寸
  • 洗出的样品
  • 罕见案例
  • 复杂的背景

相关研究:#P2B
本文研究:与已有研究不同的是:1)第一个针对遥感数据航空相片,而非地面数据先取路面再检测分割;2)在不同过程中将输入图像的离散小波变换(DWTs)插入到FCNNs中来保存高频信息,以此来专注于小尺寸标记。本文方法选择FCN32s网络并用VGG16作为backbone,因为它简单且准确。CNN在空间域和部分光谱域处理图像,DWT允许从全光谱域分析图像。集成DWT可使网络能够访问在卷积和平均池化层中丢失的强度频率信息,强度频率信息位于像素强度频率变化的频域中,而不在不同的图像波段中。

文章中使用了不同的DWT分解组合进行了实验,这些组合被用作FCN32s的改进版本的输入,最终结果为车道标志的像素语义分割。为了解决车道像素和背景像素数量不平衡问题,应用成本敏感损失函数,将车道标志错误分类作为次要类别强加比背景的错误分类损失更高的损失。

2. Aerial LaneNet

整体架构
【2019-TGRS】Aerial LaneNet: Lane-Marking Semantic Segmentation in Aerial Imagery Using Wavelet-Enhanc_第1张图片
【2019-TGRS】Aerial LaneNet: Lane-Marking Semantic Segmentation in Aerial Imagery Using Wavelet-Enhanc_第2张图片
【2019-TGRS】Aerial LaneNet: Lane-Marking Semantic Segmentation in Aerial Imagery Using Wavelet-Enhanc_第3张图片
小波变换的下采样可以看成是另一种形式的池化,文章中将输入的小波变换信息同传统的FCNNs以及池化层进行合并,为了保留多尺度信息,在数据的不同分辨率下均应用小波变换分解,以此实现低频高频域信息分析和不同分辨率的分析。
离散小波变换 #PA。最后文中是在池化之后再fuse
【2019-TGRS】Aerial LaneNet: Lane-Marking Semantic Segmentation in Aerial Imagery Using Wavelet-Enhanc_第4张图片
细节架构
【2019-TGRS】Aerial LaneNet: Lane-Marking Semantic Segmentation in Aerial Imagery Using Wavelet-Enhanc_第5张图片
【2019-TGRS】Aerial LaneNet: Lane-Marking Semantic Segmentation in Aerial Imagery Using Wavelet-Enhanc_第6张图片

3. Experiments

评价标准
【2019-TGRS】Aerial LaneNet: Lane-Marking Semantic Segmentation in Aerial Imagery Using Wavelet-Enhanc_第7张图片

1不同base
【2019-TGRS】Aerial LaneNet: Lane-Marking Semantic Segmentation in Aerial Imagery Using Wavelet-Enhanc_第8张图片
2像素权重比例
在这里插入图片描述
【2019-TGRS】Aerial LaneNet: Lane-Marking Semantic Segmentation in Aerial Imagery Using Wavelet-Enhanc_第9张图片
3对称FCNN的重要性

【2019-TGRS】Aerial LaneNet: Lane-Marking Semantic Segmentation in Aerial Imagery Using Wavelet-Enhanc_第10张图片
4DWT的重要性
【2019-TGRS】Aerial LaneNet: Lane-Marking Semantic Segmentation in Aerial Imagery Using Wavelet-Enhanc_第11张图片
5DWT分量影响
【2019-TGRS】Aerial LaneNet: Lane-Marking Semantic Segmentation in Aerial Imagery Using Wavelet-Enhanc_第12张图片
6不同的融合可能性(DWT与卷积Fig.8)
【2019-TGRS】Aerial LaneNet: Lane-Marking Semantic Segmentation in Aerial Imagery Using Wavelet-Enhanc_第13张图片
7混淆矩阵
【2019-TGRS】Aerial LaneNet: Lane-Marking Semantic Segmentation in Aerial Imagery Using Wavelet-Enhanc_第14张图片
8与SOTA比较
【2019-TGRS】Aerial LaneNet: Lane-Marking Semantic Segmentation in Aerial Imagery Using Wavelet-Enhanc_第15张图片
【2019-TGRS】Aerial LaneNet: Lane-Marking Semantic Segmentation in Aerial Imagery Using Wavelet-Enhanc_第16张图片

4. Conclusion

航空相片分割小目标,高精度且鲁棒,提出了Aerial LaneNet,基于FCNN附加小波变换,将丢失的频率域信息得到保留并学习,普通CNN因为卷积池化大多只分析了低频信息。

你可能感兴趣的:(星夜鱼塘,深度学习,神经网络,人工智能)