学一点@

Point-cloud based 3D object detection and classification methods for self-driving applications

说明

仅个人总结
原文下载链接

一、摘要

由深度学习技术提供的自动驾驶系统正成为未来移动出行的中心。自动驾驶的性能高度依赖于预测任务的质量。传感技术的发展引领了3D扫描仪可用性的增长。例如LiDAR，从而可以更精确地表示车辆周围环境实现更安全的系统。自从2010年初以来，围绕自动驾驶系统的研究迅速发展和随之而来的兴起，导致目标检测方法的数量和创新上一个急剧的增长。在第一波基础上试图从图像中的物体检测扩展已知技术的作品之后，最近在更新和更适合LiDAR数据的作品方面有了显著的发展。本文探讨了在自动驾驶范围内使用LiDAR数据进行目标检测的部分文献，并提出了系统的分析方法。不像一般目标检测综述，本文聚焦于具有高纬度和稀疏性的点云数据。本文引入了一种常用的目标检测通道和分类方法，以促使不同技术之间的全面比较并从他们出发，这项工作将批判性的检测数据的表示（对于降低复杂性至关重要），特征提取，最后是物体检测模型。包括不同模型之间的性能比较，与一些未来的研究挑战。
关键词：自动驾驶、计算机视觉、深度学习、3D目标检测

二、引言

研究界和工业界都将自动驾驶汽车视为减少当前交通死亡人数的重要战略。
由于3D传感技术的迅速发展，被称为LiDAR的代表光探测并包括距离，使用遥感、脉冲、激光方法形成光束的3D传感设备来测量地球范围，变得越来越可用和负担得起。
一些因素使得在点云上的感知任务具有挑战性：①环境的多样性。②目标被遮挡或截断。③由于对象的大小不同，不同类的物体的不同表示，对于相同对象的表示也是如此。④具有不同结构和类的整个驱动领域的性能可靠性。

为了克服一些传感技术的缺点，因为不同传感器在不同程度上反映环境的变化并提供不同的传感优势。所以将不同传感技术进行结合。采用最多的多传感器设置架构是将LiDAR与单目摄像机结合。
LiDAR获取深度信息和超远距离甚至恶劣光照条件下，单目相机提供更丰富的纹理信息。

除了LiDAR扫描仪施加的限制外，应用于点云的深度学习还面临着如下挑战：
① 点云的本质，稀疏、非结构化和高纬度
② 在性能上需求高，自动驾驶车辆经过检测，可以从点云中提取特征，并实时检测和分类物体，通常场景以10Hz扫描，这意味着模型有0.1s的间隔来处理每一帧并可靠且健壮的输出模型的预测。
③ 设置限制，装备在车辆上的处理单元资源有限，表明模型必须通过有效的计算模型确定用于提取局部几何特征的点的关系。
2.1通道架构和分类
提出的通道结构分为以下三块：（1）数据表示（2）特征提取（3）检测网络模型

（1）中，将点云分成体素、视锥体或2D投影视图、或者只是原始点云
（2）负责提取不同类型的特征，即来自点云的低维和高维要素，已生成将转发到下一个块的要素图。
（3）是一个多任务模块，以提供3D目标检测，即目标类别预测，被检测物体周围边界框回归，对象定位确定，有时候推测目标速度。此外，改模块在执行3D目标检测之前，从（2）输出的特征图中实现另一组用于特征提取的图层。
2.2数据表示方式
随着基于CNN的神经网络目标检测方法的流行，点云表示自然需要一个能够有效应用卷及操作的结构
2.2.1基于点
基于点的方法，直接处理输入的点云产生一个稀疏的表示，然后，他们对每个点通过聚集他们的邻居特征提取一个特征点。设计的模型首先从每个点独立地提取低维特征来处理点云，然后通过聚合那些低维特征得到高维特征。
2.2.2基于体素
在3D空间中，一个体素表示一个特定网格体的体积元素。
基于体素的方式，把点云划分成三维笛卡尔坐标系中等间距的3D体素。
然后特征学习可以应用于提取每个体素中一组点的特征。
这种表示导致点云的维数点减小，节省内存资源。
基于体素的表示有助于特征外部网络在计算上更有效率并减少内存需求，因为局部/低维和全局/高维特征视为一组点(这里成为体素)提取的，而不是维每个点单独提取这些特征。
2.2.3基于视锥体
通过2D模型通过图像生成2D的bounding box，再通过frustum（平截头体）的方式去映射成一个3D的候选区域。

2.2.4基于柱体
基于柱体的方法，在从中提取特征之前，将点云组织在垂直列中，成为柱体。
如何把3D特征转化为2D图片呢？
（1）分柱子。把俯视图分成H × W个小方格子，再沿着z轴向上拉就成了柱体。
（2）提特征。每个柱体中的点作为一个集合，采用和voxel一样的方式提取特征，最后采用最大池化为[ T , 1 , C ]
（3）转化为二维。因为T = H × W，所以我们最后可以变化成[ H , W , C ]，这是啥，这不就是2D卷积的东西了吗。
2.2.5基于投影
将信息压缩成2D投影，意味着减少表示和处理3D LiDAR数据的高计算消耗。
用2D表示3D数据的集中投影方式：前景图（FV）、范围视图(RV)、鸟瞰图（BEV）
在FV的角度看，数据延Z轴压缩，在RV的情况下，数据以360°全景视图投影，因此数据延X轴压缩。
投影方案的目标是满足自动驾驶固有的实时要求。
作为2D LiDAR数据表示方面最后欢迎的选择，BEV与前平面视图相比具有一些优势：首先，遮挡问题被解决，因为BEV中的对象保持标准空间，不同的对象占据不同的空间域，并且彼此不重叠。其次，目标保留其物理大小，具有很小的方差。
2.3数据特征提取方法
通过一个特征提取器提取的特征类型可以分为：（1）局部（2）全局（3）纹理特征
（1）局部特征：也指定为低维特征，具有丰富的关于一个点定位信息的详细信息，并通常在模型通道的最早期阶段获得。
（2）全局特征：也被称为高层特征，对于点和他对应的邻居点云的集合结构进行编码，一个单独的或多于一个网络的组合网络被采用与获取全局上下文信息。
（3）纹理信息在通道的最后截断能被提取，并且希望在定位和语义信息方面具有丰富的内容，这是提供给模型最终任务的特征类型。
2.3.1逐点特征提取器
逐点分类是指将整个点云视为输入的方法分析和标记每个点。PointNet和PointNet++

2.3.2逐部分特征提取器
由于逐点的方案增加了目标检测的运行时间，已经引入了减少它的替代方案。
逐部分特征提取首先把点云分割成多个体积尺度场景，然后将逐点分类模型应用于相应的段（每个点）以提取体积特征。

分段是指直接应用于点云的特征表示的特征提取器，如体素、柱体或视锥体。（VoxelNet、Second、Voxel-FPN和HVNet）

一个VFE网络把一个体素的点作为输入并使用FCN（由线性层、批量归一层和ReLU层）对点之间交互进行编码，以提取特征并获得特征表示。
元素最大池化用于获取每个体素的局部聚和特征，最后逐点和逐元素特征连接起来，并受到第二个VFE层的影响，以获得体素方面的特征。
当应用于体积点云表示时，分割解决方案往往会提高整个3D目标检测模型的效率和推理时间，因为数据量的减小，此外，从一个包含几个点的段中提取的特征比单个点更具有健壮性。
为了减伤处理时间和体素中点之间的不的不平衡性（从而减少抽样偏差，并为训练增加更多变化），在特征提取之前，当体素中包含的点超过预定义数量的点时，模型进行随机采样。当体素中限制点的数量多于预定义限制点时会形成损失，因此模型的预测行为可能会受到不稳定的影响。当体素中限制点的数量少于预定义限制点时会应用零填充，这增加了所需的计算和记忆资源，从而影响模型的推理时间。
另一个需要平衡的参数是体素大小，因为他会影响特征图的大小，从而影响计算和存储消耗和模型性能。
体素大小的增长导致更小的特征图，以牺牲准确性指标为代价来改进推理时间指标，而较小的体素可以提取更精细的几何特征，这有助于目标定位，但会惩罚推理时间。

2.3.3逐目标特征提取器
以前的方法侧重于直接从点区域的点中提取特征，而无需事先知道该点或区域是否属于对象，而逐目标的方法利用成熟的2D目标检测器来过滤点云并检测图像中的目标的解决方案，然后将2D边界框拉伸到3D目标边界框。减少了处理的点的数量。

2.3.4卷积神经网络

2D主干网目标检测的一般通道依赖于主干网络的使用主干网络充当提取特征的基本元素。
大多数目标检测模型采用基于CNN的架构，因为他允许自适应提取特征。而无需应用手工过程。
基于CNN的目标检测模型都有一个相似结构，更深的网络被实现用于提取更复杂和自适应特征。
VGG模型用较小的过滤器取代了AlexNet使用的大型过滤器。此模型通过堆叠一组卷积层来增加网络深度可以提高模型的表达能力。但是，他在模型训练阶段存在导致优化问题的缺点。随着网络深度的增加，由于梯度消失问题，精度饱和并迅速下降。
ResNet通过使用跳过连接（也称为快捷方式连接和残差）来确定解决前面提到的限制，同时构建更深层次的模型，从而不影响模型的泛化性能。

其中Xl是l层的输出特征图，Fl+1是输入Xl的运算，例如卷积，标准化或非线性激活。
Fl+1（Xl，θ）表示输入Xl的残差函数，深层的每个特征图是浅层和残差函数的总和。

3D主干网
在3D空间中直接应用卷积会使得计算效率低下，并且会严重增加模型的推理时间。
3.稀疏卷积网络
卷积神经网络依然是理解时空数据的强大工具。
考虑到点云是高度稀疏的数据结构，可以包含准确的空间和分类信息，因此，利用其稀疏性来加速特征提取，同时最大限度的减少处理的点数，减少假算时间和资源。
为了在保持更大程度的稀疏性的同时有效地处理系数数据，作者提出了两种不同的稀疏卷积操作。

SC操作以与常规卷积相同的方式计算活动站点集，但丢弃非活动站点的基态。在更深层次的网络上表现不佳。
改进：首先对输入进行填充，以便输出保持与输入相同的维度，然后当且仅当其在接受字段中的中心站点处于活跃状态时，才会将输出限制为活动状态。

4.基于CNN网络的投票方式
处理空间稀疏性的替代方法，其中指出了以特征为中心的投票方案，以从3D空间中提取特征，同时与标准3D卷积相比减少点的运算的数量。
首先点云被离散化成稀疏的3D网格，然后为每个占用的单元提取一个固定维特征向量，其中包含二进制占用值的平均值和方差以及三个形状因子和反射。
由于不存储空白空间中的单元格，这会导致3D空间的稀疏表示。
为了通过投票来执行稀疏卷积，每个非零向量将一组投票（按滤波器权重加权）投给输出层中的周围单元（由滤波器的接受字段定义）
投票权重是通过沿每个维度对卷积滤波进行旋转而获得的，此操作的结果是落在输出的每个单元格中的投票总和。

5.图卷积网络
被认为是不规则或非欧几里得结构化数据的CNN扩展，这允许点云表示方法的一些局限性。
通过检测相邻节点来学习特征，GCN通过将点定义为节点并指定他们之间的连接（此处指定为边）将点转换为图形。
为了基于每个节点提取特征，GCN应用图卷积操作来聚合来自指定节点邻域的一组节点的特征。
GCN的最新发展使得能够引入一组功能：
（1）残差跳过连接，从而允许实现更深层次的网络，这有助于层之间的梯度下降。
（2）动态感受野，其中边缘连接在连接层之间动态更新，从而产生不同的关系。
（3）膨胀，使感受野增加到最佳大小，通过跳过邻居而不增加模型的参数数量，更好的收集特征信息。
无人驾驶中，LiDAR点云的图表示分为（1）每个提案的图表示（2）每一帧的图表示
前一种解决方案中包括一个提案中几何信息的点用一个图的形式表示，并通过基于GCN的每个提案要素聚合提取上下文要素。
后面一个类别中，帧中所有被预测/检测到的对象都表示在图中，其中每个提案/对象对应于GCN节点，节点之间的边缘被解释。
然后利用这些边缘来提取所有提案的上下文信息，从而完善所有提案。

2.3.5在3D目标检测模型中特征提取范例
由于对象（即点云所谓的前景对象）在比例和纵横比方面有很大的差异，因此实现能够学习分层特征的网络的需求增加。
浅层通常在检测小物体时更健壮，它的特征提供丰富的信息，有较小的感受野从而有更高的分辨率。而深层更适合检测大目标，具有语义丰富的特征层，已知对照明和平移更稳健，具有更大的感受野，但分辨率低。

金字塔解决方案的主要优点是能够检测不同大小的物体，而无需执行点云裁剪。
多尺度特征学习模式可以根据其同道中存在或不存在横向连接进行分类。
图7中引用具有单个路径的特征提取器，可分为：
（1）感知金字塔，其中预测是在单个特征图上进行的，该特征图是在金字塔结构的最优层上经过基层特征提取得到的。
（2）多重预测金字塔，其中预测是从多个层（每一层负责一定的尺度）进行的，从而导致大量的总体输出（最终预测是通过合并来自不同特征图的所有检测结果而进行的），这导致计算成本昂贵
（3）集成功能，也称为深层集成，其中仅对最终特征图执行预测，此方法利用跳过连接的概念将来自浅层的空间丰富特征和来自深层特征的语义丰富的特征组合在一起。

多预测编码-解码金字塔
这种融合方案采用横向连接来合并自下而上的特征。
每个横向连接将相同空间大小的要素图自下而上传输到自上而下的路径，以丰富比例不变要素的自上而下路径。
多输入特征金字塔
实现金字塔结构，探索先前多尺度特征学习带来的优势。但是该方案需要多个输入
编码-解码金字塔
类似于方案1，但是在这些特征金字塔上只能学习一个分类器，以改善方案的推理时间。
融合上的融合
将编码-解码特征金字塔方案和集成特征方案结构相结合，以融合多个比例的特征并连接每个自上而下的路径层的所有这些特征（在确保其大小通过反卷积是均匀的之后）

2.4检测和预测优化网络

2.4.1检测器网络架构
关于检测器网络架构，解决方案可以分为两类
（1）双极检测器
使用一个提案生成器产生一个区域提案集合。提案生成器标识一组要进一步分类和定位的区域。因此RPN后面跟着一个多任务头，以对每一个类的区域进行评分，从而阻止哪些区域包含对象，因此被设置为模型的最终输出。
（2）单级检测器
不会将区域提案与分类边界框回归块分开
它将所有这些过程即成为一组连接层，直接对特征图的每个位置进行目标分类和最终边界框预测，而不需要级联区域分类步骤和边界框细化。
单级检测器通常更省时，因此对实时物体检测具有更大的适用性，而两级检测器往往能够实现更高的模型精度。

2.4.2检测设置
目标定位是使用矩形长方体或分割任务完成的。
边界框级定位：依赖于在提案区域步骤中设置的边界框的预定义大小，然后进一步优化其大小和方向。
分割掩码定位：模型旨在学习将点分类为前景点或者背景点。因此，此模型的结果是按像素蒙版（或作为热点/体素蒙版）分割的目标，而不是不太精确的粗边界框。

2.4.3检测器模型技术
1.Region proposal-based frameworks
R-CNN是第一个在两将诶检测通道中使用区域提案处理检测任务的模型。
他使用成为选择性搜索的低级算法生成感兴趣区域（ROI）以为每个图像生成2K个区域提案。
缺点:
（1）无法正确处理复杂的上下文信息，因为它依赖于低级视觉线索。
（2）区域生成是一项非常耗时的任务（提取区域提案大约2s）并且效率低下（大多数区域都是冗余的）
（3）训练此网络是一项非常耗时的任务，因为每个映像需要对2000个区域进行分类（每个测试映像的模型运行时间超过40s）
（4）不能采用GPU加速
（5）训练过程在空间方面也很昂贵，因为从区域提案中提取的特征保存在内存中
Fast R-CNN
他没有将每个区域提案输入到CNN模型，相反，整个输入图像输送到CNN以产生特征图，因此将其设置为选择性搜索算法的输入。
提案的区域将经历特征生成阶段，以获得可能对象的特征，使用ROI池对其进行重塑，以便他们可以馈送到完全连接网络。
此网络包含两层：分类层以预测区域可能属于的类别，回归层以确定边界框偏移值。
使用一个RPN的网络产生区域提案。本模块旨在通过求助于锚点来学习每个特征映射，对象是否存在与其响应位置。
与之前的方案相比，这种方法显著减少了锚点的数量，其中在3D空间中直接应用2D目标检测器的检测模块技术是不切实际的
RPN被广泛的应用于性能最佳框架的目标检测任务，用于 RGB图像或点云中的目标检测。
优点：
（1）经济高效的解决方案，应为他可以处理具有多个比例的物体，依赖于单个尺度的图像或点云
（2） RPN中所有过滤器都具有相同的大小，因此无需创建图像金字塔或者点云（为每个缩放图像提取特征图）或具有多个比例的过滤器金字塔
（3）他是平移不变的因为计算区域提案的算法遵循完全卷积网络，这确保了这一属性
（4）如之前总结由于锚点的数量减少了，因此采用这种技术来检测点云中的对象的解决方案会减少模型的大小和推理时间。

2.基于滑动窗口

滑动窗口的方法在计算机视觉物体检测的发展中被广泛的应用。
但是这种方法很少应用于点云中的目标检测
3D的窗口搜索是一项非常详尽的任务（因为需要大量的候选窗口—其中很多都是冗余的），导致极其繁重的计算，因此，非常耗时。

2.4.4无锚点检测器
无锚点检测器本质上是遵循掩摸级检测设置的解决方案。
该解决方案是为RGB图像上的目标检测而开发的，他以多尺度方式输出目标或对象部分的多个掩码，然后通过简单的边界框推理生成提案，也称为逐提案。
前面的解决方案中发现目标之间存在重叠。
为了克服区域提案框架的缺点，Hot-SpotNet引入了一个名为HotSpot-as-Object的检测编码器，他将体素网格化的特征图作为输入，并将点云中的任何对象截石位一组体素样本，形成热点提案。
PointRCNN引入了一种成为自下而上的3D提案生成的检测编码器，表明无锚点解决方案也可以遵循类似于区域提案的方案，即执行分割任务以生成区域，以便通过ROI池进一步细化。
PointRGCN实现了一个与PointRCNN非常相似的模型，但盒子细化被基于GCN的方案取代。
Point A2受到PointRCNN的启发，利用基于体素的特征学习方法，比基于点的学习模型具有更好的召回率，受SECOND骨干网络启发通过一个3DVoxelCNN骨干网络代替PointNet++骨干网络。
2.4.5混合检测器
引入了一个双阶段模型，通过称为提案生成模块的自上而下的提案生成网络获得区域提案

2.4.6Prediction refinement network（RPN）预测优化网络
由于单级网络通常提供较低的精度和更好的推理时间，一些研究工作在其末尾添加了一个预测细化网络，以克服这一局限。
然而，连续的卷积核缩减采样阻碍了最初存在于点云中的精确定位信号，而这正是确保最佳对象定位的基础。
细化过程可以描述为一个四重过程：
（1）随机选择ROI的内部点，并将坐标转换为规范坐标，以确保平移和旋转不变性以及适当的局部空间特征学习。
（2）可以包括其他信息，例如PointRCNN,PointRGCN和Part A2Net还包括点到传感器的距离，以及一些额外的特征（激光再切强度和点分割掩摸）和局部特征点的过饭坐标，以改善局部特征学习。
（3）局部和全局特征被串联并馈送到上下文特征网络
（4）最后全局特征和ROI的局部特征被连接起来。
总而言之，细化子网旨在以较低的信息丢失来捕获每个上下文信息，这可以通过结合局部和全局要素的优势来实现。

2.5目标检测模型的开发方法

介绍一些可以作为模型开发方法的一部分来提高其有效性的方法

2.5.1基准

2.5.2学习策略
1.数据增强
讨论在训练阶段进行数据增强的策略，通用于获得更平衡的数据集，这有助于提高目标检测性能并防止过度拟合。
数据增强可以按照两种策略应用，
（1） On-the-fly增强训练数据，其中数据不需要保存到磁盘上
（2）或将车辆类别的地面实况框中的点从外部点云提取到另一个点云
2.不平衡采样
在训练一个检测器时，通常会提出大量ROI以生成最终的边框预测，但是，大多数ROI只是背景图像（负样本）。在两级检测器中，许多阴性样本被过滤掉并使用级联分类器进行还原。另一方面，单级检测器不包括滤波器策略，也不提供级联分类器，这会在前景（正）和背景（负）样本之间引入高度不平衡。
因此，在训练期间，主导梯度的背景样本将更容易分类，而对象将更难分类。
3.精确定位
2018年之后解决的目标检测模型专注于显著提高检测效率，有时候会牺牲推理时间。
对象定位的不良结果—边界框回归和方向中的残差误差是模型深度的结果。因为应用了几个层来提取特征，这削弱了几何结构定位。
因此，一些解决方案选择将每个内部点的坐标与上一个阶段的全局特征融合起来。

2.5.3评估标准
目标检测指标（特别是应用于自动驾驶中的）

检测指标
为了确定检测过程的质量，引入了
TP（True Positives）：正样例，属于基本属实的预测对象
TN（True Negatives）：正负例，描述缺乏对不存在的物体的检测
FP（False Positives）：假正例，指对基本真理中不存在的物体的检测
FN（False Negatives）：假负例，模型为检测到基本实况中存在的对象的情况
精度Precision=TP/(TP+FP)
召回率Recall=TP/(TP+FN)
定位指标
例如IOU
Nuscenes基准采用了三个不同的指标：平均转换误差（ATE），平均尺度误差（ASE），平均方向误差（AOE）
分类指标
平均精度（mAP）使用精度-召回率曲线获得的
推理时间指标
考虑模型完成检测任务所需的时间的一个指标，通常用ms或者Hz单位

2.6目标检测模型比较
2.6.1基于融合的解决方案
相机提供密集的像素信息和比LiDAR多一个数量级的测量值，但没有提供深度信息，这使得从长距离2D图像进行3D预测的任务变得非常具有挑战性。
基于融合的模型通过LiDAR传感器提供的丰富深度物体形成来补充来自相机的信息。
根据所执行的数据融合类型讲这些研究项目分为三类：
（1）决策级融合：涉及通常执行独立检测的模型，然后将两个输入组合在一起以生成一组出色的输出去切除。
（2）特征层融合：将LiDAR数据投影到2D空间中然后用一个特征提取器处理RGB图像和LidAR投影输入。之后，他们将这两个功能组合在一起，以补充方案的表示形式
（3）决策特征级融合：其中图像检测器用于分割3D搜索空间并从LiDAR点云创建检测，该方法结合使用LiDAR数据和图像检测，一提供丰富的3D检测
2.6.2基于LiDAR的解决方案

三、研究机遇与挑战

3.1稀疏数据提取特征
LiDARD点云本质上是稀疏的，虽然自动驾驶追求快速的方法，但使用标准卷积方法处理这种稀疏性已被证明在计算效率上最低效。
最近的主干网络利用了子流形和空间稀疏卷积的优势
GCN的最新发展代表了一条新的探索之路
投票的基于CNN的解决方案并没有得到研究界的太多关注，尽管他在计算上比传统的卷积解决方案更有效。
新的卷积方法—深度分离卷积核，为了加快卷积操作的速度并帮助满足实时的目的，同时还有助于在低计算边缘设备中集成模型。
基于自注意力机制的模型，将成熟的基于ConvNet的主干网络与注意力机制结合。

3.2数据表示
目前为止，数据表示方式是处理数据以加快整个过程的方式，要么将其“压缩”成2D，要么考虑跟粗糙的表示（例如体素，柱体），数据表示尚未得到充分探索。

3.3关于遮挡和截断
基于融合的解决方案具有利用RGB数据来检测此类条件下的目标的优势，但是，在基于LiDAR的解决方案中，解决此问题的研究很少。
如HotSpotNet实现了一个网络，称为基于本部分的模型，旨在学习确定一个区域（称为热点）是否是对象的一部分。因此，及时对象的大部分被遮挡或者部分截断，一些热点仍然能够指示对象的存在并有助于3D几何信息。
但是大多数项目都遵循边界框界别检测设置。
3.4模型训练
监督学习的一个特点是需要大量带有注释的数据，对于计算机视觉，尤其是激光雷达点云，这些数据不容易获得。
此外，拥有涵盖所有相关场景的庞大数据集是实现安全关键操作（例如自动驾驶）所隐含的准确性的关键。
现有的公开数据集，没有提供足够多的真是世界边缘场景实例，目前的模型缺乏在具有挑战性的条件下的测试。
数据增强可有助于克服这个问题，以及使用迁移学习，但此路径尚未适应并应用于有点晕组成的数据集。
主动学习是一种强大的技术，用于通过允许机器学习算法选择从中学习的数据来提高数据效率。
3.5多模态感知的演变
LiDAR测量的语义信息比RGB相机少，数据本质上是稀疏的，传感器范围限制在50-100m之间，相比之下，RGB传感器提供了更大范围，还提供了更丰富的语义信息，在图像平面上具有更好的定位。
因此，多模态设置是互补的，而且提供冗余解决方案来克服故障并处理不利条件和盲点施加的限制。
多模态解决方案带来了与所用多个传感器的校准和同步相关的挑战。
3.6运动信息集成的可能性
整合运动（和跟踪）信息，可以进一步加速模型并增强其鲁棒性和准确性，尤其是针对由于截断和遮挡引起的问题
3.7模型的透明度和可解释性
深度学习方法进行目标检测阻碍了对底层模型和相应的内部决策序列的充分解释。深度学习模型被视为黑盒方法。

你可能感兴趣的:(目标检测,3d,计算机视觉)

5大核心技术+3大交互革命！Java如何让虚拟世界‘活过来’？——附代码实战+防坑指南！墨瑾轩 Java乐园交互 java 开发语言
关注墨瑾轩，带你探索编程的奥秘！超萌技术攻略，轻松晋级编程高手技术宝库已备好，就等你来挖掘订阅墨瑾轩，智趣学习不孤单即刻启航，编程之旅更有趣从“木头人”到“交互大师”的Java魔法之旅一、Java的“五大核心技术”——虚拟世界的“五感开关”1.1核心技术1：JOGL渲染引擎——“视觉中枢”作用：用OpenGL实现3D场景渲染代码示例：//JOGL渲染循环：画一个旋转的立方体importjavax.
PyTorch & TensorFlow速成复习：从基础语法到模型部署实战（附FPGA移植衔接）阿牛的药铺算法移植部署 pytorch tensorflow fpga开发
PyTorch&TensorFlow速成复习：从基础语法到模型部署实战（附FPGA移植衔接）引言：为什么算法移植工程师必须掌握框架基础？针对光学类产品算法FPGA移植岗位需求（如可见光/红外图像处理），深度学习框架是算法落地的"桥梁"——既要用PyTorch/TensorFlow验证算法可行性，又要将训练好的模型（如CNN、目标检测）转换为FPGA可部署的格式（ONNX、TFLite）。本文采用"
霍夫变换（Hough Transform）算法原来详解和纯C++代码实现以及OpenCV中的使用示例点云SLAM 算法图形图像处理算法 opencv 图像处理与计算机视觉算法直线提取检测目标检测霍夫变换算法
霍夫变换（HoughTransform）是一种经典的图像处理与计算机视觉算法，广泛用于检测图像中的几何形状，例如直线、圆、椭圆等。其核心思想是将图像空间中的“点”映射到参数空间中的“曲线”，从而将形状检测问题转化为参数空间中的峰值检测问题。一、霍夫变换基本思想输入：边缘图像（如经过Canny边缘检测）输出：一组满足几何模型的形状（如直线、圆）关键思想：图像空间中的一个点→参数空间中的一个曲线参数空
【目标检测】机场内部目标检测数据集4106张YOLO+VOC格式
数据集格式：VOC格式+YOLO格式压缩包内含：3个文件夹，分别存储图片、xml、txt文件JPEGImages文件夹中jpg图片总计：4106Annotations文件夹中xml文件总计：4106labels文件夹中txt文件总计：4106标签种类数：7标签名称:["Ground_vehicles","Horizontal_sign","Runaway_limit","Taxiway","Ver
数字孪生技术为UI前端注入新活力：实现产品设计的沉浸式体验 ui设计前端开发老司机 ui
hello宝子们...我们是艾斯视觉擅长ui设计、前端开发、数字孪生、大数据、三维建模、三维动画10年+经验!希望我的分享能帮助到您!如需帮助可以评论关注私信我们一起探讨!致敬感谢感恩!一、引言：从“平面交互”到“沉浸体验”的UI革命当用户在电商APP中翻看3D家具模型却无法感知其与自家客厅的匹配度，当设计师在2D屏幕上绘制汽车内饰却难以预判实际乘坐体验——传统UI设计的“平面化、静态化、割裂感”
传统检测响应慢？陌讯多模态引擎提速90+FPS实战 2501_92473147 算法计算机视觉目标检测
开篇痛点：实时目标检测在安防监控中的核心挑战在安防监控领域，实时目标检测是保障公共安全的关键技术。然而，传统算法如YOLOv5或开源框架MMDetection常面临两大痛点：误报率高（复杂光照或遮挡场景下检测不稳定）和响应延迟（高分辨率视频流处理FPS低于30）。实测数据显示，城市交通监控系统误报率达15%，导致安保资源浪费；客户反馈表明，延迟超100ms时，目标跟踪可能失效。这些问题源于算法泛化
目标检测（object detection）加油吧zkf 目标检测目标检测人工智能计算机视觉
目标检测作为计算机视觉的核心技术，在自动驾驶、安防监控、医疗影像等领域发挥着不可替代的作用。本文将系统讲解目标检测的概念、原理、主流模型、常见数据集及应用场景，帮助读者构建对这一技术的完整认知。一、目标检测的核心概念目标检测（ObjectDetection）是指在图像或视频中自动定位并识别出所有感兴趣的目标的技术。它需要解决两个核心问题：分类（Classification）：确定图像中每个目标的类
Android 系统默认代码，如何屏蔽相册分享功能
Android系统默认代码，如何屏蔽相册分享功能开发云-一站式云服务平台diff--gita/packages/apps/Gallery2/src/com/android/gallery3d/app/GalleryActionBar.javab/packages/apps/Gallery2/src/com/android/gallery3d/app/GalleryActionBar.javaind
使用NVIDIA NeRF将2D图像转换为逼真的3D模型（Python） ByteWhiz 3d python 计算机视觉 Python
使用NVIDIANeRF将2D图像转换为逼真的3D模型（Python）NeuralRadianceFields（NeRF）是一种强大的方法，可以将2D图像转换为逼真的3D模型。它使用神经网络来建模场景的辐射场，并通过渲染多个视角的图像来重建3D模型。在本文中，我们将使用Python和NVIDIANeRF库来实现这一过程。首先，我们需要安装所需的库。我们可以通过以下命令使用pip安装NVIDIANe
微算法科技的前沿探索：量子机器学习算法在视觉任务中的革新应用 MicroTech2025 量子计算算法
在信息技术飞速发展的今天，计算机视觉作为人工智能领域的重要分支，正逐步渗透到我们生活的方方面面。从自动驾驶到人脸识别，从医疗影像分析到安防监控，计算机视觉技术展现了巨大的应用潜力。然而，随着视觉任务复杂度的不断提升，传统机器学习算法在处理大规模、高维度数据时遇到了计算瓶颈。在此背景下，量子计算作为一种颠覆性的计算模式，以其独特的并行处理能力和指数级增长的计算空间，为解决这一难题提供了新的思路。微算
目标检测中的NMS算法详解
好的，我们来详细解释一下目标检测中非极大值抑制（Non-MaximumSuppression,NMS）的相关概念和计算过程。1.为什么需要NMS？问题：目标检测模型（如FasterR-CNN,YOLO,SSD等）在推理时，对于同一个目标物体，通常会预测出多个重叠的、不同置信度（confidencescore）的候选边界框（BoundingBoxes）。直接输出所有这些框会导致：结果冗余：同一个物体
fps透视基础-d3d绘制-绘制文字-绘制方框-绘制连线程序员陈子青逆向工程 DirectX fps透视画方框画文字
↓↓↓↓↓↓↓↓↓↓↓↓↓↓↓↓↓#include#include#pragmacomment(lib,"d3d9.lib")#pragmacomment(lib,"d3dx9.lib")staticLPDIRECT3D9g_pD3D=NULL;staticD3DPRESENT_PARAMETERSg_d3dpp={};staticLPDIRECT3DDEVICE9g_pd3dDevice=NUL
任鸟飞FPS类型游戏绘制,骨骼,u3d,UE4和游戏安全,反外挂研究 (三) 任鸟飞逆向~ FPS C语言网络安全 3d 游戏 ue4
书接上文,我们非矩阵的方式绘制是没有那么的精确的在学习矩阵之前,我们先来了解下绘制的几种方法绘制的几种方法和反外挂建议第一种hookd3d/opengl优点:不闪,代码简单缺点:非常容易被检测第二种窗口上自行绘制,但是会闪优缺点适中第三种自建透明窗口,覆盖游戏窗口,透明窗口上绘制优点:稳定确定:代码复杂,会闪反外挂:无非就是针对外挂使用的函数进行检测深入学习矩阵对象的世界坐标列向量xyzw(w为了
资源分享-FPS, 矩阵, 骨骼, 绘制, 自瞄, U3D, UE4逆向辅助实战视频教程小零羊矩阵 3d ue4
文章底部获取资源教程概述本视频教程专为游戏开发者和安全研究人员设计，涵盖FPS游戏设计、矩阵运算、骨骼绘制、自瞄算法、U3D和UE4逆向辅助等实战内容。通过102节详细视频教程，您将掌握从基础到高级的游戏开发与安全防护技能。教程内容1.FPS类型游戏的设计研究和游戏安全,反外挂研究2.二维向量和平面距离3.atan2和tan4.三维向量和空间距离5.补充向量乘法6.矩阵和矩阵的运算7.矩阵的特性8
Python 取证学习指南第二版（一）绝不原创的飞龙默认分类默认分类
原文：annas-archive.org/md5/46c71d4b3d6fceaba506eebc55284aa5译者：飞龙协议：CCBY-NC-SA4.0前言在编写《学习Python取证》一书时，我们有一个目标：以一种方式教授Python在取证中的应用，使得没有编程经验的读者可以立即跟随并开发出可以用于案件工作中的实用代码。但这并不意味着本书仅适合Python新手；在整个过程中，我们会逐步让读者
Python 取证学习指南第二版（三）
原文：annas-archive.org/md5/46c71d4b3d6fceaba506eebc55284aa5译者：飞龙协议：CCBY-NC-SA4.0第七章：模糊哈希哈希是DFIR中最常见的处理过程之一。这个过程允许我们总结文件内容，并分配一个代表文件内容的独特且可重复的签名。我们通常使用MD5、SHA1和SHA256等算法对文件和内容进行哈希。这些哈希算法非常有价值，因为我们可以用它们进行
shell脚本实现Hive库表迁移 docsz hive Linux shell
1、获取hive所有库的建表语句#获取hive所有库的建表语句#!/bin/bashmkdir-p~/hive/tables/tablesDDL#获取库名hive-e"showdatabases;">~/hive/databases.txtsed-i'1,3d'~/hive/databases.txtsed-i'$d'~/hive/databases.txtcat~/hive/databases.
【EGSR2025】材质+扩散模型+神经网络相关论文整理随笔（四） Superstarimage 文献随笔材质神经网络人工智能扩散模型
AnevaluationofSVBRDFPredictionfromGenerativeImageModelsforAppearanceModelingof3DScenes输入3D场景的几何和一张参考图像，通过扩散模型和SVBRDF预测器获取多视角的材质maps，这些maps最终合并成场景的纹理地图集，并支持在任意视角、任意光照条件下进行重新渲染。样例图如下：在当前时代的技术背景下，生成与几何匹配
从原理到实战：ISP（图像信号处理器）深度解析与应用指南
从原理到实战：ISP（图像信号处理器）深度解析与应用指南摘要本文系统解析ISP（ImageSignalProcessor，图像信号处理器）的核心功能，详细拆解其工作流程（RAW处理→黑电平校正→AWB→3DNR→Defog→Gamma），深入解读关键参数（吞吐量、WDR类型、低照度性能）的技术意义，并详解寄存器表与在线调试工具的配置方法。通过表格对比、分点解析等方式，从基础原理到工程实践，覆盖IS
YOLOv11 技术详解：架构优化与性能提升代码老y YOLO 架构目标跟踪
YOLOv11是目标检测领域中一个备受瞩目的新版本，它在保持实时性的同时，显著提升了检测的准确性和效率。本文将深入探讨YOLOv11的架构改进、性能优化以及它在不同应用场景中的表现。一、架构改进（一）C3K2块YOLOv11引入了C3K2块，这是对之前版本中CSP（CrossStagePartial）块的增强。C3K2块使用不同的核大小（例如3x3或5x5）和通道分离策略来优化更复杂特征的提取。这
OpenCV图片操作100例：从入门到精通指南（1）总有刁民想爱朕ha opencv 计算机视觉人工智能
OpenCV图片操作100例：从入门到精通指南本文整理了100个OpenCV实用技巧，涵盖图像处理各个领域，助你轻松掌握计算机视觉核心技能！一、入门必备：基础操作1.图像读写与显示importcv2#读取图像（BGR格式）img=cv2.imread('image.jpg')#显示图像cv2.imshow('示例图片',img)cv2.waitKey(0)#按任意键退出cv2.destroyAll
OpenCV图片操作100例：从入门到精通指南（3）总有刁民想爱朕ha opencv 人工智能计算机视觉
高效学习路径：1️⃣分阶段学习：入门：1-20例（基础操作）进阶：21-50例（图像处理）高级：51-100例（计算机视觉）2️⃣项目驱动学习：证件照背景替换（1-15例）停车场车位检测（30-45例）视频运动追踪（70-85例）3️⃣性能优化技巧：#使用UMat加速图像处理umat_img=cv2.UMat(img)processed=cv2.GaussianBlur(umat_img,(5,5
YOLO11 目标检测从安装到实战
前言YOLO（YouOnlyLookOnce）系列是目标检测领域的经典算法，凭借速度快、精度高的特点被广泛应用。最新的YOLO11在模型结构和性能上进一步优化，本文将从环境搭建到实战应用，详细讲解YOLO11的使用方法，适合新手快速上手。一、环境准备1.系统要求操作系统：Windows10/11、Ubuntu20.04+、欧拉系统等硬件：CPU可运行，GPU（NVIDIA）可加速（推荐，需支持CU
OpenCV入门到精通：AI视觉处理的完整指南 AI云原生与云计算技术学院人工智能 opencv 计算机视觉 ai
OpenCV入门到精通：AI视觉处理的完整指南关键词：OpenCV、计算机视觉、图像预处理、目标检测、AI视觉应用摘要：本文是一份面向AI视觉爱好者的OpenCV完整学习指南。从OpenCV的核心概念讲起，结合生活案例、代码示例和项目实战，逐步拆解图像读取/显示、灰度化、边缘检测、目标检测等关键技术。无论你是想入门计算机视觉的新手，还是希望用OpenCV解决实际问题的开发者，都能通过本文掌握从理论
CNN 猫狗识别：从理论到实战的深度解析爱熬夜的小古 cnn 深度学习人工智能
在计算机视觉领域，卷积神经网络（ConvolutionalNeuralNetwork，CNN）凭借其强大的特征提取和模式识别能力，成为图像分类任务的主流技术。猫狗识别作为经典的图像分类问题，不仅能帮助我们理解CNN的工作原理，还能为实际应用提供技术支持。本文将深入探讨CNN在猫狗识别中的应用，从理论基础到实战代码，带你全面掌握这项技术。一、CNN基础理论概述（一）CNN的核心组件卷积层：是CNN的
OpenCV入门到精通：从基础到实战的全面指南
摘要：本文旨在为初学者和有一定经验的开发者提供OpenCV从入门到精通的全面指南。文章首先介绍了OpenCV的基本概念和安装方法，然后深入讲解了图像处理基础、特征检测与匹配、视频处理与分析等核心内容，最后通过实战案例展示了OpenCV在计算机视觉任务中的应用。关键词：OpenCV；图像处理；特征检测；视频分析；实战案例引言OpenCV（OpenSourceComputerVisionLibrary
目前主流图像分类模型的详细对比分析 @comefly 闲聊 linux 运维服务器
以下是目前主流图像分类模型的详细对比分析，结合性能、架构特点及应用场景进行整理：一、主流模型架构分类与定量对比模型名称架构类型核心特点ImageNetTop-1准确率参数量（百万）计算效率典型应用场景ResNetCNN残差连接解决梯度消失，支持超深网络（如ResNet-152）76.1%25.6中等通用分类、目标检测ViTTransformer将图像分割为patches，用标准Transforme
使用python的open3d库读取Bin格式点云并可视化
Python有很多库都可以处理点云，比如Python-PCL、Open3D等等。Python-PCL库已经很久没有维护了，而且安装极其麻烦！Open3D是由intel发布的3D点云可视化库，点云可视化和渲染都很方便，重要的是安装方便！！！1.安装PythonOpen3D环境：Ubuntu16.04pipinstallopen3d==0.9.0.0注意：open3d0.9.0.0只支持python2
目标检测之数据增强
数据翻转，需要把bbox相应的坐标值也进行交换代码：importrandomfromtorchvision.transformsimportfunctionalasFclassCompose(object):"""组合多个transform函数"""def__init__(self,transforms):self.transforms=transformsdef__call__(self,ima
window显示驱动开发—XR 格式的强制转换功能程序员王马 windows图形显示驱动开发 xr
DXGI_FORMAT_R10G10B10_XR_BIAS_A2_UNORM格式是DXGI_FORMAT_R10G10B10A2_TYPELESS系列的成员。因此，应用程序可以通过API级别的“视图”概念将DXGI_FORMAT_R10G10B10_XR_BIAS_A2_UNORM格式强制转换为该系列的任何其他成员。此过程是应用程序呈现到资源的预期方式。具体而言，Direct3D运行时只能通过驱动
apache ftpserver-CentOS config gengzg apache
<server xmlns="http://mina.apache.org/ftpserver/spring/v1" xmlns:xsi="http://www.w3.org/2001/XMLSchema-instance" xsi:schemaLocation=" http://mina.apache.o
优化MySQL数据库性能的八种方法 AILIKES sql mysql
1、选取最适用的字段属性　　MySQL可以很好的支持大数据量的存取，但是一般说来，数据库中的表越小，在它上面执行的查询也就会越快。因此，在创建表的时候，为了获得更好的性能，我们可以将表中字段的宽度设得尽可能小。例如，在定义邮政编码这个字段时，如果将其设置为CHAR(255),显然给数据库增加了不必要的空间，甚至使用VARCHAR这种类型也是多余的，因为CHAR(6)就可以很
JeeSite 企业信息化快速开发平台 Kai_Ge JeeSite
JeeSite 企业信息化快速开发平台平台简介 JeeSite是基于多个优秀的开源项目，高度整合封装而成的高效，高性能，强安全性的开源Java EE快速开发平台。 JeeSite本身是以Spring Framework为核心容器，Spring MVC为模型视图控制器，MyBatis为数据访问层， Apache Shiro为权限授权层，Ehcahe对常用数据进行缓存，Activit为工作流
通过Spring Mail Api发送邮件 120153216 邮件 main
原文地址：http://www.open-open.com/lib/view/open1346857871615.html 使用Java Mail API来发送邮件也很容易实现，但是最近公司一个同事封装的邮件API实在让我无法接受，于是便打算改用Spring Mail API来发送邮件，顺便记录下这篇文章。【Spring Mail API】 Spring Mail API都在org.spri
Pysvn 程序员使用指南 2002wmj SVN
源文件:http://ju.outofmemory.cn/entry/35762 这是一篇关于pysvn模块的指南. 完整和详细的API请参考 http://pysvn.tigris.org/docs/pysvn_prog_ref.html. pysvn是操作Subversion版本控制的Python接口模块. 这个API接口可以管理一个工作副本, 查询档案库, 和同步两个. 该
在SQLSERVER中查找被阻塞和正在被阻塞的SQL 357029540 SQL Server
SELECT R.session_id AS BlockedSessionID , S.session_id AS BlockingSessionID , Q1.text AS Block
Intent 常用的用法备忘 7454103 .net android Google Blog F#
Intent 应该算是Android中特有的东西。你可以在Intent中指定程序要执行的动作（比如：view,edit,dial），以及程序执行到该动作时所需要的资料。都指定好后，只要调用startActivity()，Android系统会自动寻找最符合你指定要求的应用程序，并执行该程序。下面列出几种Intent 的用法显示网页:
Spring定时器时间配置 adminjun spring 时间配置定时器
红圈中的值由6个数字组成，中间用空格分隔。第一个数字表示定时任务执行时间的秒，第二个数字表示分钟，第三个数字表示小时，后面三个数字表示日，月，年，< xmlnamespace prefix ="o" ns ="urn:schemas-microsoft-com:office:office" /> 测试的时候，由于是每天定时执行，所以后面三个数
POJ 2421 Constructing Roads 最小生成树 aijuans 最小生成树
来源：http://poj.org/problem?id=2421 题意：还是给你n个点，然后求最小生成树。特殊之处在于有一些点之间已经连上了边。思路：对于已经有边的点，特殊标记一下，加边的时候把这些边的权值赋值为0即可。这样就可以既保证这些边一定存在，又保证了所求的结果正确。代码： #include <iostream> #include <cstdio>
重构笔记——提取方法（Extract Method） ayaoxinchao java 重构提炼函数局部变量提取方法
提取方法（Extract Method）是最常用的重构手法之一。当看到一个方法过长或者方法很难让人理解其意图的时候，这时候就可以用提取方法这种重构手法。下面是我学习这个重构手法的笔记：提取方法看起来好像仅仅是将被提取方法中的一段代码，放到目标方法中。其实，当方法足够复杂的时候，提取方法也会变得复杂。当然，如果提取方法这种重构手法无法进行时，就可能需要选择其他
为UILabel添加点击事件 bewithme UILabel
默认情况下UILabel是不支持点击事件的，网上查了查居然没有一个是完整的答案，现在我提供一个完整的代码。 UILabel *l = [[UILabel alloc] initWithFrame:CGRectMake(60, 0, listV.frame.size.width - 60, listV.frame.size.height)]
NoSQL数据库之Redis数据库管理(PHP-REDIS实例) bijian1013 redis 数据库 NoSQL
一.redis.php <?php //实例化 $redis = new Redis(); //连接服务器 $redis->connect("localhost"); //授权 $redis->auth("lamplijie"); //相关操
SecureCRT使用备注 bingyingao secureCRT 每页行数
SecureCRT日志和卷屏行数设置一、使用securecrt时，设置自动日志记录功能。 1、在C:\Program Files\SecureCRT\下新建一个文件夹(也就是你的CRT可执行文件的路径），命名为Logs； 2、点击Options -> Global Options -> Default Session -> Edite Default Sett
【Scala九】Scala核心三：泛型 bit1129 scala
泛型类 package spark.examples.scala.generics class GenericClass[K, V](val k: K, val v: V) { def print() { println(k + "," + v) } } object GenericClass { def main(args: Arr
素数与音乐 bookjovi 素数数学 haskell
由于一直在看haskell，不可避免的接触到了很多数学知识，其中数论最多，如素数，斐波那契数列等，很多在学生时代无法理解的数学现在似乎也能领悟到那么一点。闲暇之余，从图书馆找了<<The music of primes>>和<<世界数学通史>>读了几遍。其中素数的音乐这本书与软件界熟知的&l
Java-Collections Framework学习与总结-IdentityHashMap BrokenDreams Collections
这篇总结一下java.util.IdentityHashMap。从类名上可以猜到，这个类本质应该还是一个散列表，只是前面有Identity修饰，是一种特殊的HashMap。简单的说，IdentityHashMap和HashM
读《研磨设计模式》-代码笔记-享元模式-Flyweight bylijinnan java 设计模式
声明：本文只为方便我个人查阅和理解，详细的分析以及源代码请移步原作者的博客http://chjavach.iteye.com/ import java.util.ArrayList; import java.util.Collection; import java.util.HashMap; import java.util.List; import java
PS人像润饰&调色教程集锦 cherishLC PS
1、仿制图章沿轮廓润饰——柔化图像，凸显轮廓 http://www.howzhi.com/course/retouching/ 新建一个透明图层，使用仿制图章不断Alt+鼠标左键选点，设置透明度为21%，大小为修饰区域的1/3左右（比如胳膊宽度的1/3），再沿纹理方向（比如胳膊方向）进行修饰。所有修饰完成后，对该润饰图层添加噪声，噪声大小应该和
更新多个字段的UPDATE语句 crabdave update
更新多个字段的UPDATE语句 update tableA a set (a.v1, a.v2, a.v3, a.v4) = --使用括号确定更新的字段范围
hive实例讲解实现in和not in子句 daizj hive not in in
本文转自：http://www.cnblogs.com/ggjucheng/archive/2013/01/03/2842855.html 当前hive不支持 in或not in 中包含查询子句的语法，所以只能通过left join实现。假设有一个登陆表login(当天登陆记录,只有一个uid),和一个用户注册表regusers(当天注册用户，字段只有一个uid)，这两个表都包含
一道24点的10+种非人类解法（2,3,10,10） dsjt 算法
这是人类算24点的方法？！！！事件缘由：今天晚上突然看到一条24点状态，当时惊为天人，这NM叫人啊？以下是那条状态朱明西 : 24点，算2 3 10 10，我LX炮狗等面对四张牌痛不欲生，结果跑跑同学扫了一眼说，算出来了，2的10次方减10的3次方。。我草这是人类的算24点啊。。然后么。。。我就在深夜很得瑟的问室友求室友算刚出完题，文哥的暴走之旅开始了 5秒后
关于YII的菜单插件 CMenu和面包末breadcrumbs路径管理插件的一些使用问题 dcj3sjt126com yii framework
在使用 YIi的路径管理工具时，发现了一个问题。 <?php
对象与关系之间的矛盾：“阻抗失配”效应[转] come_for_dream 对象
概述 “阻抗失配”这一词组通常用来描述面向对象应用向传统的关系数据库（RDBMS）存放数据时所遇到的数据表述不一致问题。C++程序员已经被这个问题困扰了好多年，而现在的Java程序员和其它面向对象开发人员也对这个问题深感头痛。 “阻抗失配”产生的原因是因为对象模型与关系模型之间缺乏固有的亲合力。“阻抗失配”所带来的问题包括：类的层次关系必须绑定为关系模式（将对象
学习编程那点事 gcq511120594 编程互联网
一年前的夏天，我还在纠结要不要改行，要不要去学php？能学到真本事吗？改行能成功吗？太多的问题，我终于不顾一切，下定决心，辞去了工作，来到传说中的帝都。老师给的乘车方式还算有效，很顺利的就到了学校，赶巧了，正好学校搬到了新校区。先安顿了下来，过了个轻松的周末，第一次到帝都，逛逛吧！接下来的周一，是我噩梦的开始，学习内容对我这个零基础的人来说，除了勉强完成老师布置的作业外，我已经没有时间和精力去
Reverse Linked List II hcx2013 list
Reverse a linked list from position m to n. Do it in-place and in one-pass. For example:Given 1->2->3->4->5->NULL, m = 2 and n = 4, return
Spring4.1新特性——页面自动化测试框架Spring MVC Test HtmlUnit简介 jinnianshilongnian spring 4.1
目录 Spring4.1新特性——综述 Spring4.1新特性——Spring核心部分及其他 Spring4.1新特性——Spring缓存框架增强 Spring4.1新特性——异步调用和事件机制的异常处理 Spring4.1新特性——数据库集成测试脚本初始化 Spring4.1新特性——Spring MVC增强 Spring4.1新特性——页面自动化测试框架Spring MVC T
Hadoop集群工具distcp liyonghui160com
1. 环境描述两个集群：rock 和 stone rock无kerberos权限认证，stone有要求认证。 1. 从rock复制到stone，采用hdfs Hadoop distcp -i hdfs://rock-nn:8020/user/cxz/input hdfs://stone-nn:8020/user/cxz/运行在rock端，即源端问题：报版本
一个备份MySQL数据库的简单Shell脚本 pda158 mysql 脚本
　　主脚本（用于备份mysql数据库）：　　该Shell脚本可以自动备份数据库。只要复制粘贴本脚本到文本编辑器中，输入数据库用户名、密码以及数据库名即可。我备份数据库使用的是mysqlump 命令。后面会对每行脚本命令进行说明。　　 1. 分别建立目录“backup”和“oldbackup” 　　#mkdir /backup 　　#mkdir /oldbackup 　
300个涵盖IT各方面的免费资源（中）——设计与编码篇 shoothao IT资源图标库图片库色彩板字体
A. 免费的设计资源 Freebbble:来自于Dribbble的免费的高质量作品。 Dribbble:Dribbble上“免费”的搜索结果——这是巨大的宝藏。 Graphic Burger:每个像素点都做得很细的绝佳的设计资源。 Pixel Buddha:免费和优质资源的专业社区。 Premium Pixels:为那些有创意的人提供免费的素材。
thrift总结 - 跨语言服务开发 uule thrift
官网官网JAVA例子 thrift入门介绍 IBM-Apache Thrift - 可伸缩的跨语言服务开发框架 Thrift入门及Java实例演示 thrift的使用介绍 RPC POM： <dependency> <groupId>org.apache.thrift</groupId>

Point-cloud based 3D object detection and classification methods for self-driving applications

说明

一、 摘要

二、 引言

三、研究机遇与挑战

你可能感兴趣的:(目标检测,3d,计算机视觉)

一、摘要

二、引言