LaneATT

Abstract

作者提出了一个实时、高性能的车道线检测算法,将其命名为LaneATT。
该方法基于anchor实现,且应用了注意力机制,轻量级版本的推理速度达到
250FPS全局信息可能对推断其位置至关重要,特别是在遮挡、缺失车道标记等情
况下。因此,这项工作提出了一种新的基于锚定的注意机制来聚合全局信息。

在这里插入图片描述

2. Related work

Segmentation-based methods.
Row-wise classifification methods.
前人不足:牺牲精度换取速度,还有的代码不公开
我们提出了一种比现有的最先进的方法更快、更准确的方法。此外还公布完整代码
LaneATT_第1张图片

3. Proposed method

LaneATT:单阶段的model
从上图中可以看出,该算法将backbone的输出结果进行池化操作,以提取每个anchor的特征;将提取
到的特征与注意力模块产生的全局特征进行融合,以解决遮挡、光照等原因导致车道线检测不到的问
题;融合后的特征
作为全连接层的输入,全连接层输出车道线的置信度和相关参数。

3.1. Lane and anchor representation

LaneATT_第2张图片
Lane的anchor表征方式与Line-CNN的方式一致。如上图所示,首先将特征图均分为一定大小的网格。
然后,一条lane由起始点s和结束点e,以及方向a组成。也就是一条lane由起始点按照一定方向到结
束点的所有2d坐标组成。
LaneATT_第3张图片
式子中,x_orig,y_orig是起始点的坐标,θ 、是线的角度方向。这个公式的意思也比较好理解,就是
按照网格y坐标找出line上的对应x坐标,这样就可以
挑出固定长度的特征出来,长度为特征图F的高度。如果出现了y对应的x点坐标在特征图外,就采用0
padding的方式补齐。
LaneATT_第4张图片

4. Experiments

LaneATT_第5张图片
在[20]中提出的方法是唯一能与我们的速度相媲美的方法。由于FDR和FNR的指标在他们的工作中没有
被报告,所以我们使用已发布的代码来计算它们,并报告了这些指标。虽然他们达到了很高的准确
性,但FDR明显地很高。例如,我们最高的FDR是5.64%(ResNet-122),而最低的是18.91%,几乎是它的4倍。
LaneATT_第6张图片
与[20]相比,我们最轻量级的型号(ResNet-18)比它们最大的(ResNet-34)多出F1的3%,同时要快得多(在
同一台机器上250vs175FPS)
LaneATT_第7张图片
LaneATT_第8张图片
第一行包含了标准LaneATT的结果,而下面的行显示了略微修改的版本的结果。
在第二行中,删除基于锚的pooling,使用选择Line-CNN[13]特征的相同过程(即每个锚只使用特征图
中单个点的特征)。
在第三种方法中,不是使用一对全连接层(Lreg和Lcls)进行最终预测,而是使用了三对(六层),每个
边界使用一对(左、下或右)。
第四个是用交叉熵代替焦点损失,最后一个是去除注意机制。
当删除基于锚点的池化过程时,性能的大量下降显示了它的重要性。

你可能感兴趣的:(深度学习,深度学习,机器学习,算法)