Radar-based Feature Design and Multiclass Classification for Road User Recognition

摘要

对单个样本的分类是一项复杂的任务,尤其是对于同一场景下有多个类或恶劣天气条件的挑战性场景。相对于完善的摄像系统,雷达传感器提供了一种正交的方式来测量此类场景。为了获得准确的分类结果,从测量数据中提取了50种不同的特征并对其性能进行了测试。从这些特征中,选择合适的子集并将其传递给随机森林和长短期记忆(LSTM)分类器,以获得雷达输入的类别预测。而且,表明了当数据集不够大时,为什么数据不平衡是汽车雷达分类中固有的问题。为了克服这个问题,在其他技术中使用了分类器二值化,以便更好地说明代表性不足的类。提出了一种耦合结果概率的新方法,并将其与其他方法进行了比较,取得了巨大成功。与普通的多类分类相比,最终结果显示出实质性的改进。

1.介绍

自主运输是当前汽车研究的驱动力之一。一个主要主题是遵守安全标准。出色的环境感知对于此任务是必不可少的,因此对传感器及其处理算法的要求非常高。传感器系统的冗余度和正交性可确保防止故障发生,例如由于硬件缺陷或不利的测量条件。在这种情况下,典型的传感器包括摄像头,雷达,激光雷达,声纳等,所有感知系统都有其优点和缺点。为了利用系统的所有不同优势,对传感器输出进行了融合。传感器融合可以在不同的阶段发生,并产生不同的效果。粗略地说:低级融合可以减少丢失的信息,从而提高准确性。另一方面,高级传感器融合提高了针对单个传感器故障的鲁棒性,因为处理更加独立。

这项工作是后一种方法的一部分,即道路用户分类仅基于雷达数据。雷达的主要优点如下:首先,雷达是唯一可以在远距离直接测量高精度径向物体(Doppler)速度的汽车传感器。对于线性调频雷达,通过评估特定范围内连续频率线性调频之间的相移来获得速度。如[1]和[2]中所述,这使得无需跟踪和微多普勒分析就可以进行单发估计。其次,用于汽车系统的雷达波通常在24-29 GHz或76-81 GHz的频带上运行[3]。在一定程度上,这些频带允许波传播通过许多障碍,这些障碍将限制光波的传播,从而使它们对下雨或有雾的环境有吸引力。汽车雷达的弱点是其低角度分辨率。由于这个原因,必须在距离或多普勒频率上区分距离较远的物体。

对汽车雷达数据进行分类是一个即将到来的研究主题。许多最流行和性能最好的算法都起源于图像识别领域。原因之一是,诸如卷积神经网络[4]之类的结构允许使用有关输入数据的领域知识,以实现可自行发现重要特征的网络结构,从而省去了特征工程的任务。随着计算资源的增加,诸如“ AlexNet” [5]或“ VGG” [6]的深度学习架构变得适用。不幸的是,这些技术输入均为图像数据

在[7]和[8]中,展示了如何将此类方法用于静态雷达数据,即建筑物或停放的汽车等不移动的物体。对于移动目标,这些工作中的网格映射过程将需要更长的采集时间。其他出版物,例如[9],[10]或[11],都使用基于特征的模型进行分类。尽管取得了令人鼓舞的结果,但他们仅考虑简单的动态情况,例如对行人和静态物体或车辆的区分。高级自动驾驶需要了解复杂的场景。为此,[12]使用随机森林和长短期记忆(LSTM)单元检查了几种动态对象类别的分类。两种方法都具有良好的性能,但是分类结果偏向于那些在训练集中占比大的类

这项工作的目的是通过从雷达数据中提取各种特征并将适当的子集提供给分类器,从而全面改善分类结果。因此,将来自多个出版物的特征进行合并并分析了一些新的变体。使用特征选择算法来确定合适的子集,此外,还展示了如何使用不同的重采样方法和多类二值化技术(例如一对一(OVO)和一对多(OVA))来缓解特定于数据集的不平衡问题。通过使用这些方法,可以训练出更专业的模型,这些模型可以获得更好的类识别分数,这主要是由于对少数类的改进所致。为此,提出了一种耦合概率的新方法,并将其与其他现有方法进行了比较。

https://blog.csdn.net/alw_123/article/details/98869193

本文的组织方式如下:在第二部分中,对数据预处理进行了描述,并对现有数据集进行了概述。第三部分的第一部分说明了如何从手头的数据中提取特征以及如何选择合适的子集。第二部分介绍数据重新采样和多类二值化技术。第四节介绍了结果,第五节总结了本主题并给出了未来工作的前景。

数据采集

这项工作的所有数据都是通过分布在测试车辆侧面和前角的四个雷达传感器获取的。传感器的规格显示在表格中,第一行分别表示载波频率f和范围(距离)r,方位角和径向(多普勒)速度v_r的工作频带。第二行给出了时间∆t以及r,φ和v_r的分辨率。

Radar-based Feature Design and Multiclass Classification for Road User Recognition_第1张图片

A.分类处理过程

雷达传感器提供的目标已经在范围,角度和径向多普勒速度中得到解决。内部恒定误报率(CFAR)[13]检测器仅返回超过自适应幅度阈值的目标。在所有其他处理步骤之前,所有传感器数据都将在公共坐标系中进行转换,并将自我运动补偿应用于多普勒速度。然后,使用DBSCAN [14]算法将数据聚集在空间,时间和多普勒中。由于传感器朝向其相应视场边缘的角度分辨率变差,因此重叠的传感器区域的处理方式与其他区域相同。此时,每个对象实例都由唯一的集群ID描述,并传递给人类专家进行标记。标记过程还包括手动聚类校正,以确保考虑所有对象目标。未经校正的群集和其中40%的目标被随机丢弃的数据集也将传递到下一个处理阶段,以进行数据增强。对于特征提取,首先使用150 ms的窗口对所有标记的簇序列进行及时采样。然后,从每个聚类样本中提取特征。最后,为分类器提供结果特征向量,并相应地拟合其模型参数。简化的数据流水线总结在图1中。在测试过程中,遵循相同的步骤,只是不进行数据扩充,并且仅对后续结果评估(即在分类器评估类成员身份之后)提供标签。

DBSCAN(Density-Based Spatial Clustering of Applications with Noise)是一个比较有代表性的基于密度的聚类算法。与划分和层次聚类方法不同,它将簇定义为密度相连的点的最大集合,能够把具有足够高密度的区域划分为簇,并可在噪声的空间数据库中发现任意形状的聚类。

 Radar-based Feature Design and Multiclass Classification for Road User Recognition_第2张图片

B.数据集

为这项工作而检查的数据集包含略一千一百万个对象目标,这些目标对应于略超过三千个现实世界对象的大约一百万个非增强群集样本。对象目标是从雷达返回的所有目标,在标记过程中为其分配了标签。因此,不是雷达看到的每个反射都在数据集中,而是仅通过CFAR检测器和标记过程的反射。结果分为六类:汽车,步行者,步行者团体,自行车,卡车/公共汽车和无意义点。无意义点分类由错误检测和聚集的测量工件组成。关于类分布的概述可以在图2中找到。

Radar-based Feature Design and Multiclass Classification for Road User Recognition_第3张图片

清晰可见,图2中两个图的类分布是不均匀的。原则上,比较每个类别影响的最公平方法是检查每个对象类别的测量时间,这反映在群集样本分布中。此外,每个类的平均测量持续时间应相等,因为对同一对象实例的连续测量通常会暗示相应特征向量之间的高度相关性。尽管所描述的方法有利于处理分类器中的不平衡问题,但由于对小尺寸对象进行评估的特征在不同情况之间的差异较大,因此该方法还存在一个缺点。造成这种情况的原因是,在一个群集样本的时间范围内,针对诸如行人或自行车之类的对象获得的目标总量发生微小变化的巨大影响。当目标总数很小时,几乎没有目标能够完全改变特征向量中的值。对于足够大的数据集,此影响可以忽略不计,但对于当前大小,针对目标级别上的相似类别分布也将是有益的。这使完美的平衡具有挑战性。通常可以获取更多数据,但也非常昂贵且耗时。因此,本文仅关注现有数据。

三,方法

在几个分类器中,随机森林[15]已被证明是针对当前问题的非常可靠且可快速训练的分类器。使用具有50棵树的配置,Gini impurity作为分割质量的度量,考虑用于分割的最大特征(特征总数的平方根)以及单个树的深度没有最大值的配置,可以获得良好的结果。在进行这项工作之前,已经进行了更多树木的实验,但是将其应用于最大特征集并没有带来实质性的改进。对多类分类技术的首次评估仅使用随机森林来识别有益的配置。为了进行最终比较,仅使用了由该首次评估确定的部分允许技术,并且还在长期短期记忆(LSTM)分类器上进行了测试[16]。LSTM模型基于[12],在非常相似的数据上取得了良好的结果。该模型包括一个由80个LSTM单元构成的简单层,其后是一个softmax层,用于估计所有时间步长的类后验概率。作为输入序列,以滑动窗口的方式收集八个连续时间步长的特征向量。LSTM的使用带来了进一步的改进,但是训练时间大大延长,限制了进行昂贵的网格搜索的可能性。

随机森林https://blog.csdn.net/qq_34106574/article/details/82016442

Gini impurityhttps://blog.csdn.net/lanchunhui/article/details/51140053

LSTMhttps://blog.csdn.net/zhangbaoanhadoop/article/details/81952284

A.特征提取

特征提取对于任何分类任务都是必不可少的步骤。如引言中所述,卷积神经网络取得了巨大的成功,该卷积神经网络学习了如何在训练过程中提取有意义的特征。但是,用于这项工作的随机森林和LSTM从良好的功能中受益匪浅。因此,本节概述了几种出版物中的特征提取方法,提出了一些变体,并说明了如何将所得的特征集合有效地修剪为紧凑的特征集。

无需进一步处理,雷达传感器就可以返回每个目标的范围,角度,幅度(考虑对自由空间路径损耗的补偿)和径向速度的值。如前所述,在聚类算法将属于同一对象实例的目标关联之前,所有值都将转换为公共坐标系。然后从这些聚类的样本中生成特征。
图3描绘了农村环境中行人和汽车的典型场景。与城市场景相比,目标的稀疏性使代表两个物体的两个群集具有良好的视野。

Radar-based Feature Design and Multiclass Classification for Road User Recognition_第4张图片Radar-based Feature Design and Multiclass Classification for Road User Recognition_第5张图片

从每个群集样本中得出的第一个特征集从四个基本测量值(最大值,最小值和平均值),标准偏差以及群集中最大值和最小值之间的范围中提取。根据[12]中的工作,还可以计算每个样本中所有x和y坐标的协方差矩阵的两个特征值及其目标总数。还以其范围补偿的形式评估目标的数量和角度扩展,即乘以平均范围,以抵消高距离目标识别的恶化。为了进一步改善分类,计算了固定目标与移动目标的比率。

除了生成的特征集外,本文还包含一些有关[17]中描述的时间范围内聚类目标的形状和分布的特征。已针对其中使用的多个功能进行了实验,详细地包括:计算x / y平面上所有目标的凸包及其面积,周长和目标密度。凸包的等商数用作圆度的度量,还计算了最小拟合圆的半径。此外,凸包可以很容易地扩展到最小边界矩形,再次具有:面积,周长和目标密度。为了更好地说明簇中的离群值,包括了95%置信椭圆的长轴和短轴。另一个有趣的功能是在[17]中引入的关键点描述符,即累积二进制占有率(CBO),它在同心区域中将簇样本中心(最初是中位数目标)周围的区域分开,如图4所示。三个箱由八个分段组成,每个分段检查二进制占用率,即该分段是否被至少一个目标占据。然后,对于三个仓中的每个仓,占用段的数量会被统计到三个最终的CBO值。此外,评估了所有目标到连接簇样本的两个最远目标的直线的平均距离以及所有目标的x和y坐标的线性相关性。到聚类中心的平均平均距离用于指示聚类样本的紧密度。
Radar-based Feature Design and Multiclass Classification for Road User Recognition_第6张图片

除了几何特征外,[11]还证明了距离和速度(多普勒)剖面在区分汽车和行人时的有用性。所得的距离多普勒扩展可以描述为距离扩展与多普勒扩展的比率。类似于该度量,可以计算范围和速度分布的线性相关关系。
对于旋转的对象,当扩展和相关基于方位角和多普勒时,相同的过程可能会很有利。为了更不依赖于对象的旋转,本文提出了第三个变体,该变体在置信椭圆的短轴和长轴方向上而不是范围或角度范围内评估目标范围(和线性相关性)。

为了避免过度拟合如此获得的总共50个特征的特征集,通常只使用一个特征子集,该子集应不包含冗余,但仍保留重要信息。特征选择是一项计算昂贵的任务。穷举搜索仅适用于小特征向量,因为问题很难解决。对于这项工作,使用了向后消除算法来找到合适的特征集。向后消除是一种包装器方法,它训练多个分类器以递归消除将其遗漏后产生性能最佳的分类器的功能[18]。消除是用贪婪的方式完成的,因此,一旦某个功能消失,它将不再在算法的后续迭代中可用。与类似的前向选择方法相比,后向消除具有更高的计算成本,后者从训练数据集中所有单个特征的分类器开始,然后一次添加一个特征。尽管增加了计算复杂度,但还是选择了向后选择,因为它可以更好地保留不同功能之间的相互信息。

B.数据集失衡

如上一部分所示,用于手头任务的数据遭受类分配不平衡的困扰。更具体地说,它仅包含很少的单个行人,自行车和卡车。
少数目标通常反映在少数族裔分类得分明显较差的情况下。本文旨在通过训练更专业的二元分类器并结合其结果来解决不平衡问题。此外,分类器与各种不同的重采样技术结合在一起,这些技术也旨在减轻数据中的不平衡偏移。在[19]中已经成功地将训练多个二进制分类器而不是具有两个以上输出的单个二进制分类器应用于不平衡数据。它允许每个分类器更多地专注于其单独的任务。同时,这提供了减少某些阶级失衡的自然方法。具有挑战性的一步是将多个分类器输出组合成一个有意义的结果。两种最突出的二值化技术是“一对多”(OVA)和“一对多一”(OVO)分类[20]。OVA训练K个分类器而不是一个分类器,其中K是数据集中不同类别的数量。每个分类器都适合于从其余分类器中分离出一个单一的分类,因此,对象ID id(x)的最终决定由所有分类器结果中的最大概率pi,OVA(x)决定,其中x是分类器的特征向量 调查的集群:

\mathrm{id}(\boldsymbol{x})=\underset{i \in\{1, \ldots, K\}}{\arg \max } \quad p_{i, \mathrm{ovA}}(\boldsymbol{x})

另一方面,OVO会训练K(K K 1)/ 2个分类器,每个分类对一个。已经提出了几种技术来根据输出概率pij(x)计算最终结果。
弗里德曼(Friedman)等人。[21]引入了最大投票,该投票决定了分类器中投票数最多的类别。如果是平局,则随机选择类别:

\begin{aligned} \mathrm{id}(\boldsymbol{x})=& \underset{i \in\{1, \ldots, K\}}{\arg \max } \sum_{j=1, j \neq i}^{K} \delta\left(p_{i j}(\boldsymbol{x})\right) \\ & \text { with } \quad \delta(p)=\epsilon(p-0.5) \end{aligned}

\epsilon(p)表示Heaviside阶跃函数。如[22]中所述,δ(p)还可以采用许多其他形式,以执行概率的4个成对耦合(PWC)。根据这项工作,相应的方法称为PWC-x。PWC-1等于(2)中的最大投票,PWC-2及更高版本使用以下δ(p):

\begin{array}{ll}{\mathrm{PWC}-2} & {\delta(p)=p} \\ {\mathrm{PWC}-3} & {\delta(p)=\left(1+e^{-12(p-0.5)}\right)-1} \\ {\mathrm{PWC}-4} & {\delta(p)=p \cdot \epsilon(0.5-p)+\epsilon(p-0.5)} \\ {\mathrm{PWC}-5} & {\delta(p)=p \cdot \epsilon(p-0.5)}\end{array}

由于在最高投票程序中经常会随机选择平局,因此PWC-1引入了许多不确定的决定。此项工作使用的是经过改动的版本,如果发生故障,该版本会切换为PWC-2。两个非常复杂的ap方法引入了校正分类器qij(x),以最大程度地减少未针对测试对象类型优化的分类器的影响。当针对对象ID为1到3训练的模型带有对象ID为2的样本:

\mathrm{id}(\boldsymbol{x})=\underset{i \in\{1, \ldots, K\}}{\arg \max } \sum_{j=1, j \neq i}^{K} p_{i j}(\boldsymbol{x}) \cdot q_{i j}(\boldsymbol{x})

qij(x)可以由针对类别i和j的样本(相对于其余样本)进行训练的其他分类器来传递。类似但更有效,它们可以是添加单独训练的OVA分类器q_{i j}(\boldsymbol{x})=p_{i, \text { ova }}(\boldsymbol{x})+p_{j, \text { ova }}(\boldsymbol{x})(\mathrm{PWC}-\mathrm{OVA})[22]的相应概率的结果[22]。
测试了所有提到的算法,包括新提议的PWC-OVA版本,该版本不通过(4)中的qij(x)而是在使用PWC-2进行预选择之后应用OVA校正。这将称为PWC OVA2: 

\mathrm{id}(\boldsymbol{x})=\underset{i \in\{1, \ldots, K\}}{\arg \max } p_{i, \mathrm{ova}}(\boldsymbol{x}) \cdot \sum_{j=1, i \neq j}^{K} p_{i j}(\boldsymbol{x})

除了使用不同的集成技术来处理平衡问题外,还研究了其他一些更经典的方法,即类加权,欠采样和过采样。与二值化技术相反,这些方法仅在训练时才应用。类别权重用于使训练样本的影响与其在样本总数中所占份额的影响成反比。欠采样会丢弃大多数类别的样本,直到达到平衡库为止。样品滴落可随机发生或使用固定模式,例如 通过移除决策边界附近的潜在噪声多数类样本(参见 Tomek链接)。过采样可以复制现有数据以平衡数据集,也可以使用SMOTE,ADASYN或这些算法的变体从现有数据中合成新数据样本。这些技术的总结可以在[23]中找到。在下一部分中,将对结果的类加权和所有提及的重采样技术(单独执行或与不同的二值化方法结合执行)进行比较。

IV.结果

在这项工作中使用的数据集包含各个类出现之间的严重不平衡。由于算法的最终应用(如此处介绍的算法)直接影响道路使用者的安全,因此所有类别对评估指标应具有相同的影响。因此,所有分类得分均报告为宏观平均F1得分。F1score定义为精度和查全率的调和平均值,因此将弃真和证伪都考虑在内。宏平均通过首先获取每个单独类别的F1-分数,然后使用所有K类 F1-分数的平均值F 1_{\text {macroavg }}=\frac{1}{K} \sum_{i=1}^{K} F 1_{i}作为最终度量来解决不平衡类别分布的问题。同样受到所有K类的影响。

A.特征提取

通过两个步骤选择合适的特征子集:首先,使用特征选择来计算特征等级。分别使用随机森林和LSTM的反向消除法计算了两个等级。正常的多类模型用于后向消除算法。将数据分为80%的训练数据和20%的测试数据,并确保属于同一聚类ID的样本在两组中都不会出现。对于完整排名,向后消除具有50个功能已经需要训练1000多个模型,因此80/20拆分比昂贵的交叉验证更可取。通常,两个排名非常相似,因此这里仅讨论LSTM情况。相应的功能等级可在选项卡中找到。二。根据向后消除,排名最高的四个特征是95%置信椭圆的主轴线长度-本质上是x和y坐标之间协方差的最高特征值的非线性映射-最大径向速度和集群内固定目标的比率。这些结果与[12]中的结果非常吻合,其中发现这三个特征(特征值而不是长椭圆轴)是三个最重要的特征。但是,本文中使用的向后消除方法包括幅度平均值和在等级3和等级6处的扩展,这表明该出版物的优先级要高得多。最大的差异很可能是由用于特征排名的不同方法引起的。随机森林特征等级可以很好地用于单个特征重要性评估,但是诸如后向消除之类的包装方法通常会找到更好的特征集,因为它们还考虑了其​​他特征对被评估者的影响。除了对四个测量值(范围,角度,速度和幅度)的那些基本推导之外,前十个特征还包括最小边界矩形的周长和沿置信椭圆轴分布的两个新的空间速度变体。排名中的这一特征和连续特征清楚地表明了从空间拟合和多普勒分布获得的收益。

其次,使用10倍交叉验证来评估每个数据子集的分类性能。这些子集从排名靠前的十个特征开始,然后连续添加次佳的特征,第一次进行初步搜索则一次添加五个。在此粗略搜索之后,仅使用一个功能的较细步长就可以搜索性能最佳的初步设置周围的最终设置。将结果平均所有倍数,并为每种方法选择得分最高的子集。重复此过程两次,一次使用普通的多类模型,第二次使用PWC-OVA方法,因为这在所有二值化技术中产生了最好的结果。这些实验表明,二值化分类器模型可以更好地利用大量特征。这种行为的自然原因是构成PWC或OVA模型的树木或LSTM单元的数量大大增加,但是如果树木或单元的数量和多类分类器数量增加,则无法重现相似的结果。向后消除和随机森林由多类的22个特征(F1:88.40%)和PWC-OVA的31个特征(F1:88.74%)组成。LSTM还使用22个特征(F1:89.21%)和36个PWC-OVA特征(F1:90.24%)实现了最佳的向后消除结果。与[12]中的结果相比,这两个结果都清楚地证明了附加功能的优势,在多类情况下,34个功能导致F1得分分别为87.1%(随机森林)和88.4%(LSTM)。

B.针对数据不平衡的处理方式

为了抵消数据集中的平衡问题,对第三节中描述的所有二值化技术都进行了测试,包括经典的多类方法。使用带有随机森林的网格搜索来测试多类分类方法以及上述重采样和加权技术的所有组合。使用10x10倍的嵌套交叉验证收集了结果。这可能是因为许多PWC技术都使用相同的二进制分类器,因此所有这些模型每次仅需训练一次。为了获得公正的结果,必须进行嵌套的交叉验证,即,如果一部分数据被用来决定几种分类技术中的最佳方法,则不应将相同的数据用作最终性能评分的基础。可以在图5中找到在随机森林网格搜索过程中具有有益结果的方法的决策得分。由于这些方法不会提高分类得分,因此不会显示类别加权和使用ADASYN的过度采样。

Radar-based Feature Design and Multiclass Classification for Road User Recognition_第7张图片

总体而言,对随机森林网格搜索的评估表明,涉及一对多分类器(即OVA,PWC-OVA和PWC-OVA2)的技术具有相似的高分。
在没有校正分类器的不同PWC-x加权技术中,PWC-2给出了最佳结果(除了没有重新采样的组合之外),紧随其后的是 PWC-3和PWC-1的改编版本。最重要的是,与普通多类案例相比,所有二值化技术的总分都有所提高。在样本平衡方法中,使用欠采样和Tomek链接删除的SMOTE和SMOTE变体对于所有多类方法始终表现良好。此外,对于某些组合(欠采样(随机和使用Tomek链接)和随机过采样),可以看到一些好处。使用带有SMOTE和Tomek链接删除的PWC OVA2可获得最佳结果。

由于LSTM培训需要大量时间,因此仅使用10倍交叉验证,随后每折叠一次进行80/20拆分,以获取独立的测试和验证集。对于LSTM,仅测试了类别权重以及随机欠采样和过采样,因为更专业的技术(例如合成样本设计)无法轻松地应用于时间序列,并且超出了本文的范围。过度采样或欠采样的标准实现会导致分类评分急剧下降,因此,这些技术未纳入最终的网格搜索中。
利用自定义的欠采样率,该采样率仅将样本下降到最小类大小的至少五倍,对于所有PWC-x方法,可以将F1分数提高大约0.2个百分点,甚至在与类加权结合时,甚至可以进一步提高。即使使用此自定义比率,对于涉及OVA分类器的任何技术,欠采样仍然会导致较差的结果。如图5所示,可以通过应用类加权来获得所有二值化方法的最佳LSTM性能。与PWC-OVA组合可获得最佳的总体效果。通常,对于LSTM分类器而言,多类二值化的潜力要明显得多,这些LSTM分类器通常将F1分数提高0.8个百分点以上,除了OVA和欠采样的组合。
可以在选项卡中找到所选方法测试集的最终分数。三,该列表包含针对随机森林和LSTM分开的最佳设置的F1得分(以粗体显示)。每个分类器均使用上一小节中确定的最佳功能集进行评估。为了进行比较,还列出了从普通多类分类和PWC-OVA2获得的结果。
本文的最初主张是,使用二值化技术代替经典的多类方法将有助于解决类不平衡问题,特别是通过提高少数族裔的分数。为此,图6描绘了从该工作中发现的最佳配置获得的结果的混淆矩阵,即使用类加权PWC-OVA方法的LSTM。为了使结果具有可比性,该图还显示了与多类LSTM方法的区别。

Radar-based Feature Design and Multiclass Classification for Road User Recognition_第8张图片

正如预期的那样,如图6所示,PWC-OVA的最大改进是在两个少数族裔的自行车和pedes trian上实现的,但除卡车/客车类之外,其他所有类别的改进都沿主要路线进行。混淆矩阵的对角线。卡车识别性可能会下降,因为从雷达的角度来看,卡车和公共汽车在总体上看起来很像汽车。这是由于以下事实造成的:传感器通常仅捕获车辆的前边缘或后边缘,从而导致两个较小的群集。没有高度信息,很难区分这些物体。结果,许多将汽车与卡车以外的任何其他物体区分开的二元分类器现在确实可以很好地表明汽车的类别,而重要的汽车与卡车/公共汽车的分类器可能没有足够的影响力来决定转向卡车。该知识实际上可以用于在第一阶段使用PWC-OVA的两阶段分类算法。当在第一阶段确定汽车时,分类器然后在ptruck / bus,car(x)> thr时使用耦合概率ptruck / bus,car(x)将最终输出切换到卡车,其中thr是可变阈值 水平。使用这种设置的实验表明,根据thr的调整,实际上可以将图6所示对汽车类别的积极影响交换为卡车/公共汽车识别的损失。当thr = 0.75时,总体测试结果的F1分数为90.57%,比纯PWC-OVA的F1分数稍差,但是作为结果,卡车的准确度为85.95%,这表明所有少数民族等级的分数都可以提高。

五,结论

在本文中,给出了用汽车雷达对目标物体进行分类的动机。描述了用于实验的数据集,并显示了如何为后续的分类任务构造数据和提取特征。结果表明,几何拟合(如最小矩形边界框)或微多普勒特征(如距离多普勒扩展)是对标准传感器输出描述符的良好补充。缩小提取的特征集的大小,即评估合适的特征子集并将其传递给随机森林和LSTM算法。由于数据遭受不平衡问题的困扰,因此应用了分类器二值化来增强分类性能,尤其是针对少数群体的分类。类加权和不同的过采样和欠采样方法进一步支持了这一点,这些方法旨在在训练时恢复二进制模型的数据平衡。除了特殊组合的少数例外,使用任何二值化技术时,最终结果均显示出了显着改善。计划对未来的工作进行统计意义上的深入测试,并计划对可公开获得的数据集进行性能评估,但遗憾的是,目前该数据对汽车雷达数据尚不存在。通过使用新提出的PWC-OVA2方法,本文中使用的随机林产生了最佳效果。使用具有类权重的LSTM分类器和普通PWC-OVA可获得最佳的总体结果,因此,与从单人对所有训练中获得的校正分类器成对耦合。取得的结果具有很高的竞争力。移动交通参与者的汽车雷达分类主要集中在较少的对象类别上,或在少数群体上取得较差的结果。与传统的基于图像的方法相比,少量的训练样本仍然限制了分类的潜力。但是,可以预料,采用拟议的处理方法,雷达系统可以使传感器融合大有裨益。在将来的工作中,计划使用雷达传感器和适当的信号处理技术来增强当前的结果,这些信号处理技术可以提高范围,角度,多普勒和时间的分辨率。随着检测到的雷达目标数量的增加,有望获得更好的分类结果。这主要是由于观察到,行人之类的空间较小的对象通常一次只能反映为一个或两个目标,因此在这些情况下,很难为这些对象计算出准确的特征。
 

你可能感兴趣的:(python,算法相关,论文手册学习)