一颗小树x

单目3D目标检测方法综述——直接回归方法、基于深度信息方法、基于点云信息方法

本文综合整理单目3D目标检测的方法模型，包括：基于几何约束的直接回归方法，基于深度信息的方法，基于点云信息的方法。万字长文，慢慢阅读~

直接回归方法 涉及到模型包括：MonoCon、MonoDLE、MonoFlex、CUPNet、SMOKE等。

基于深度信息的方法 涉及到模型包括：MF3D、MonoGRNet、D4LCN、MonoPSR等。

基于点云信息的方法 涉及到模型包括：Pseudo lidar、DD3D、CaDDN等。

一、单目3D目标检测概述

1.1 简介

1.2 单目相机特征

1.3 为什么用单目做3D目标检测

1.4 3D边框表示方式

1.5 挑战

二、直接回归的方法

2.1 SMOKE【CVPR2020】

2.2 MonoDLE（CVPR2021）

2.3 MonoCon（AAAI2022）

2.4 CUPNet（ICCV 2021）

2.5 MonoFlex（CVPR 2021）

三、基于深度信息方法

四、基于点云信息方法

一、单目3D目标检测概述

1.1 简介

3D目标检测，只用一个相机实现。输入是图像数据，输出是物体的三维尺寸、三维位置、朝向等3D信息。

1.2 单目相机特征

通过传感器采样和量化，将3D世界中的物体变换到2D空间，用单个或多个通道的二维图像来描绘物体的形状、颜色、纹理和轮廓等信息，这些信息可用于检测物体。

1.3 为什么用单目做3D目标检测

由于2D相机比复杂的3D采集传感器更便宜且更灵活，基于单目图像的方法已得到广泛研究。二维图像以像素的形式提供了对象丰富的颜色和纹理信息。

激光雷达相对高昂的造价和对各种复杂天气情况的敏感性，推动着研究人员开始更多地探索基于视觉的3D目标检测，其在近几年成为越来越热门的研究方向。

基于单目视觉的方法则要求更加严苛，即只有单个相机的图像作为输入，结合相机标定得到物体的三维检测。

这类方法难度较大，但成本极低、便于推广使用，一旦攻克此问题，将彻底颠覆自动驾驶行业的格局。因此，研究此类问题是极具应用价值和学术挑战性的。

1.4 3D边框表示方式

3D边框表示目标的位置、尺寸和方向，是3D目标检测算法的输出。物体是否被遮挡、截断或具有不规则的形状，都用一个紧密边界的立方体包围住被检测到的目标。

3D边框编码方式主要有3种，分别是8角点法、4角2高法、7参数法（常用），如下图所示。

7参数法：由7个坐标参数来表示。它包括边框的中心位置(x, y, z)，边框在三维空间中的尺寸(l, w, h)以及表示角度的偏航角θ。

8角点法：8角点法将3D边框通过连接8个角点(c1, c2, . . . , c8)来形成。每一个角点由三维坐标(x, y, z)表示,总计24维向量。

4角2高法：为了保持地面目标的物理约束，3D框的上角需要保持与下角对齐，提出了一种4角2高编码的方法。

4 个角点 (c1, c2, c3, c4) 表示3D边框底面的4个顶点，每个角点用2D坐标(x, y)表示。

两个高度值(h1, h2)表示从地平面到底部和顶部角的偏移量。根据4个角点计算出4个可能的方向，并选择最近的一个作为方向向量。

1.5 挑战

由于是单张图像，是2D维度的，没有深度信息；3D框的中心点在图像中位置，模型难以精准预测出来。

2D图像的缺点是缺乏深度信息，这对于准确的物体大小和位置估计(尤其是在弱光条件下)以及检测远处和被遮挡的物体，难以检测。

二、直接回归的方法

基于直接回归的方法。主要有MonoCon、MonoDLE、MonoFlex、CUPNet、SMOKE、 MonoPair、 DEVIANT等算法。

这些算法主要利用几何先验知识，和深度估计的不确定性建模来提高算法性能。

Anchor based（基于锚框）

Deep3Dbbox算法，利用2D检测框和几何投影，并预测物体3D位姿和尺寸，通过求解目标中心到相机中心的平移矩阵，使预测的3D检测框重投影中心坐标与2D检测框中心坐标的误差最小。

MonoDIS算法，利用解耦的回归损失代替之前同时回归中心点、尺寸和角度的损失函数，该损失函数将回归部分分成K 组，通过单独回归参数组来解决不同参数之间的依赖关系，有效避免了各参数间误差传递的干扰，使得训练更加稳定。

预先对全部场景给出了各类目标的锚框，即Anchor-based。这种方法在一定程度上能够解决目标尺度不一和遮挡问题，提高检测精度，但缺乏效率性且很难枚举所有的方向，或为旋转的目标拟合一个轴对齐的包围框，泛化能力欠缺些。

Anchor free（不用锚框）

Anchor free 抛弃了需要生成的复杂锚框, 而是通过直接预测目标的角点或中心点等方法来形成检测框。

RTM3D算法，直接预测3D框的8个顶点和1个中心点，然后通过使用透视投影的几何约束估计3D边框。

SMOKE算法，舍弃了对2D边界框的回归，通过将单个关键点估计与回归的三维变量，来预测每个检测目标的3D框。设计了基于关键点的3D检测分支并去除了2D检测分支。

MonoFlex算法，设计了解耦截断目标和正常目标的预测方法，通过组合基于关键点的深度和直接回归深度进行精确的实例度估计。

GUPNet算法，利用几何不确定性投影模块解决几何投影过程的误差放大问题，并提出了分层任务学习来解决多任务下参数的学习问题。

MonoDLE算法，进行了一系列的实验，发现了定位误差是影响单目3D目标检测模型性能的关键因素。因此，MonoDLE改进了中心点的取法，采用了从3D投影中心而不是2D边界框中心获取中心点的方法，以提高模型性能。此外，在实例深度估计任务上，MonoDLE采用了不确定性原理对实例深度进行估计。

MonoCon算法，在MonoDLE算法的基础上添加了辅助学习模块,提升了模型的泛化能力。

DEVIANT算法，提出深度等变性网络来解决现有神经网络模块在处理3D空间中的任意平移时缺乏等变性的问题。

这一类基于直接回归的方法，仅使用单目图像完成模型训练与推理。

下面选一些实时性好的模型，进行详细讲解。

2.1 SMOKE【CVPR2020】

SMOKE是一种实时单目 3D 物体检测器，它提出了一个基于关键点预测的，一阶段单目3D检测框架，去掉了2D框预测部分，直接预测目标的3D属性信息。

输入单张图像。

输出其中每个目标的类别、3D边界框用7个参数表示（h、w、l、x、y、z、θ）

(h、w、l) 表示目标的高度、宽度和长度；
(x、y、z) 表示目标中心点在相机坐标系下的坐标；
θ 表示目标的航向角。

论文名称：SMOKE: Single-Stage Monocular 3D Object Detection via Keypoint Estimation

论文地址：https://arxiv.org/pdf/2002.10111.pdf

开源地址：GitHub - lzccccc/SMOKE: SMOKE: Single-Stage Monocular 3D Object Detection via Keypoint Estimation

SMOKE 整体框架，如下图所示。输入图像经过DLA-34 Backbone进行特征提取。检测头主要包含两个分支：关键点分支和3D边界框回归分支。

SMOKE的Backbone（主干网络）：

Deep Layer Aggregation，DLA-34网络（基础）
Deformable Convolutional ，可变形卷积（改进点）
Group Normbalization，组归一化（改进点）

检测头部分：

关键点检测分支
3D边界框回归分支

在关键点分支中，图像中的每一个目标用一个关键点进行表示。这里的关键点被定义为目标3D框的中心点在图像平面上的投影点，而不是目标的2D框中心点。

3D边界框回归分支中，

在Kitti 数据集Test中测试，Car类别的模型精度。

模型效果：

这里只是简单讲了一下，详细讲解看我这篇博客：

【论文解读】SMOKE 单目相机 3D目标检测（CVPR2020）_相机smoke-CSDN博客

环境搭建和模型训练参考这篇博客：单目3D目标检测——SMOKE 环境搭建|模型训练_一颗小树x的博客-CSDN博客

模型推理和可视化参考这篇博客：单目3D目标检测——SMOKE 模型推理 | 可视化结果-CSDN博客

2.2 MonoDLE（CVPR2021）

MonoDLE作为一个延续CenterNet框架的单目3d检测器，在不依赖dcn的情况下获得了较好的性能，可以作为baseline。

MonoDLE和SMOKE有些像，都是单目实现3D目标检测，通过几何约束和回归3D框信息，得到3D框的中心点、尺寸、朝向，但是它反驳了SMOKE提出的2D检测对3D检测没有帮助的论点。

开源地址：https://github.com/xinzhuma/monodle

论文地址：【CVPR2021】Delving into Localization Errors for Monocular 3D Object Detection

论文核心观点，主要包括为三点：

2d box中心点与投影下来的3d box中心点，存在不可忽视的差异，优先使用3d box投影下来的中心点。
较远目标，会带偏模型训练；在训练时，可以过滤这些过远的物体标签。
提出了一种面向 3D IoU 的损失，用于对象的大小估计，不受“定位误差”的影响。

MonoDLE是基于CenterNet框架，实现单目3d检测的。模型结构如下：

Backbone：DLA34

Neck：DLAUp

2D 框检测：3个分支

分支一通过输出heatmap，预测2D框中心点的粗略坐标，以及类别分数。（CenterNet用的是标签中2D框中心作为GT值来监督，MonoDLE采用了3D投影坐标作为粗坐标的监督）
分支二预测的2D框中心点粗坐标与真实坐标之间的偏移。
分支三预测2D框的size。

3D Detection：4个分支

分支一预测2D框中心点粗坐标的深度值。
分支二预测2D框中心点粗坐标与真实的3D投影坐标之间的偏移。
分支三预测3D框的size。
分支四预测偏航角。

模型结构如下图所示：

MonoDLE的损失由7部分组成，

分类损失：Focal Loss
2D 中心点损失：L1 Loss
2D size损失：L1 Loss
3D 深度估计损失：
3D 中心点损失：L1 Loss
3D heading angle：multi-bin Loss
3D size：普通的L1 Loss & MonoDLE提出的 IoU Loss

在Kitti验证集做实验，评价指标为Car类别的AP40（BEV / 3D）

p 表示使用3D 投影中心作为粗中心坐标的监督
I 表示使用对3D size估计的IOU oriented optimization
s 表示忽略远距离目标

模型预测效果：

用蓝色、绿色和红色的方框来表示汽车、行人和骑自行车的人。激光雷达信号仅用于可视化。

这里只是简单讲了一下，详细讲解看我这篇博客：【论文解读】单目3D目标检测 MonoDLE（CVPR2021）-CSDN博客

MonoDLE 模型训练 | 模型推理参考这篇博客：

单目3D目标检测——MonoDLE 模型训练 | 模型推理-CSDN博客

2.3 MonoCon（AAAI2022）

MonoCon是一个延续CenterNet框架的单目3d检测器，在不依赖dcn的情况下获得了较好的性能，并且融入了辅助学习，提升模型性能。

曾经在Kitti 单目3D目标检测上，霸榜了一段时间。

MonoCon和MonoDLE很像，在它基础上添加了一些辅助分支检测头，促进网络学习特征的能力。

MonoCon = MonoDLE + 辅助学习

辅助学习：训练阶段增加一些网络分支，对其计算loss项，而在推理阶段完全忽略掉它们，以期得到更好的特征表示。

开源地址（官方）：https://github.com/Xianpeng919/MonoCon

开源地址（pytorhc）：https://github.com/2gunsu/monocon-pytorch

论文地址：Learning Auxiliary Monocular Contexts Helps Monocular 3D Object Detection

论文核心观点，主要包括为两点：

带注释的3D 边界框，可以产生大量可用的良好投影的 2D 监督信号。
使用辅助学习，促进网络学习特征的能力。

MonoCon是基于CenterNet框架，实现单目3d检测的。模型结构如下：

Backbone：DLA34

Neck：DLAUp

常规3D框检测头：5个分支

分支一通过输出heatmap，预测2D框中心点的粗略坐标，以及类别分数。
分支二预测2D框中心点粗坐标与真实的3D投影坐标之间的偏移。
分支三预测2D框中心点粗坐标的深度值，和其不确定性。
分支四预测3D框的尺寸。
分支五预测观测角。

辅助训练头：5个分支

分支一 8个投影角点和3D框的投影中心。
分支二 8个投影角点到2D框中心的offsets。
分支三 2D框的尺寸。
分支四 2D框中心量化误差建模。
分支五 8个投影角点量化误差建模。

模型结构如下图所示：

MonoCon的损失由10部分组成，

常规3D框检测头：5个分支

分支一 heatmap 类别分数，使用FocalLoss。2D 中心点损失，使用L1 Loss。
分支二 2D框中心点粗坐标与真实的3D投影坐标之间的偏移，使用L1 Loss。
分支三 2D框中心点粗坐标的深度值，和其不确定性，使用Laplacian Aleatoric Uncertainty Loss。（MonoPair & MonoDLE & MonoFlex & GUPNet）
分支四预测3D框的尺寸，使用Dimension-Aware L1 Loss（MonoDLE）。
分支五预测观测角，multi-bin Loss，其中分类部分使用 CrossEntropyLoss，回归部分使用 L1 Loss。

辅助训练头：5个分支

分支一 8个投影角点和3D框的投影中心，使用FocalLoss。
分支二 8个投影角点到2D框中心的offsets，使用L1 Loss。
分支三 2D框的尺寸，使用L1 Loss。
分支四 2D框中心量化误差建模。
分支五 8个投影角点量化误差建模。

论文于KITTI 官方测试集中“汽车类别”的最先进方法进行比较，使用单个2080Ti GPU显卡测试的。

下表中由BEV和3D的测试结果，MonoCon运行时间和精度都是Top 级别的。

作者基于MonoDLE进行了对比实验，分析5个辅助训练分支，和把BN归一化换为AN归一化，对模型精度的影响。

模型预测效果：

下面是单目3D目标检测的效果，激光雷达点云数据仅用于可视化。

在前视图图像中，预测结果以蓝色显示，而地面实况以橙色显示。

分别显示2D框、3D框、BEV的检测效果：

这里只是简单讲了一下，详细讲解看我这篇博客：【论文解读】单目3D目标检测 MonoCon（AAAI2022）-CSDN博客

MonoCon 模型训练和模型推理参考这篇博客：单目3D目标检测——MonoCon 模型训练 | 模型推理-CSDN博客

2.4 CUPNet（ICCV 2021）

CUPNet是基于几何约束和回归方式输出3D框信息，在不依赖dcn的情况下获得了较好的性能。

它也是一款两阶段的单目3d检测器，先回归2D框信息，在ROI区域进一步提取特征，生成3D框信息。

开源地址：GitHub - SuperMHP/GUPNet

论文地址：Geometry Uncertainty Projection Network for Monocular 3D Object Detection

论文核心观点，主要包括为两点：

1、物体高度估计误差，对深度计算有着较大的影响。
2、模型训练的稳定性。在模型训练初期，物体高度的预测往往存在较大偏差，也因此导致了深度估算偏差较大。较大误差往往导致网络训练困难，从而影响整体网络性能。
3、推断可靠性问题。如果物体的高度预测存在较大偏差，相应计算出的深度值也会存在较大误差。

CUPNet是一个两阶段的框架，实现单目3d检测的。模型结构如下：

Backbone：DLA34

Neck：DLAUp

第一部分 2D 检测：3个分支

分支一通过输出heatmap，预测所有类别的中心点（默认类别为3）。
分支二预测的2D框中心点的偏移。
分支三预测2D框的size。

第二部分 3D 检测：4个分支

分支一预测偏航角。
分支二预测3D框的size。
分支三预测中心点的深度值，和和其不确定性（深度学习偏差）。
分支四预测2D框中心点与真实的3D投影坐标之间的偏移。

模型结构如下图所示：（基于CenterNet的2D检测+ROI特征提取+基础3D检测头）

整体的模型结构，可分为4步：

输入图像，经过主干网络提取特征。
基于CenterNet的2D框预测部分，用于输出热力图，信息包括：2D中心点、偏移量、2D框的尺寸。
提取出ROI的特征。
利用所提取的ROI特征，输入到不同的网络头，以获得物体3D框信息，包括：偏转角度、尺寸、深度值、物体3d框中心在图像投影点的偏移量。

在第四步时，首先估计出3D框除了“深度值”以外的所有参数，然后2D框与3D框的高度将被输入到GUP模块中，提取出最终的depth。

CUPNet 的损失由7部分组成，

2D 框检测损失：3部分

分支一通过输出heatmap，预测所有类别的中心点；使用 Focal Loss 函数。
分支二预测的2D框中心点的偏移；使用 L1 Loss 函数。
分支三预测2D框的size；使用 L1 Loss 函数。

3D Detection损失：4部分

分支一预测偏航角。类别使用交叉熵损失，偏航角使用L1 Loss。
分支二预测3D框的size。长和宽为L1 Loss，权重占2/3，3D 高使用laplacian_aleatoric_uncertainty_loss() 函数，权重占1/3。
分支三预测中心点的深度值，和和其不确定性；使用 laplacian_aleatoric_uncertainty_loss() 函数。
分支四预测2D框中心点与真实的3D投影坐标之间的偏移；使用 L1 Loss 函数。

在KITTI 测试集上的 3D物体检测，用以粗体突出显示最佳结果

在KITTI 验证集，汽车类别，进行消融实验：

模型效果：

这里只是简单讲了一下，详细讲解看我这篇博客：【论文解读】单目3D目标检测 CUPNet（ICCV 2021）-CSDN博客

2.5 MonoFlex（CVPR 2021）

MonoFlex是一种端到端、单阶段的单目3D目标检测方法，它基于CenterNet框架结合几何约束，回归方式输出3D框信息。

它优化了被截断物体的3D检测，同时优化了中心点的深度估计，检测速度也比较快。

开源地址：GitHub - zhangyp15/MonoFlex: Released code for Objects are Different: Flexible Monocular 3D Object Detection, CVPR21

论文地址：Objects are Different: Flexible Monocular 3D Object Detection

论文核心观点，主要有3点组成：

1、有截断的物体和正常的物体要分开处理，提出了截断目标预测的解耦方法。主要体现在：截断的中心点选取差异。
2、深度估计中同时考虑：关键点估计的几何深度、直接回归深度，然后两者做加权结合。
3、边缘特征提取和融合，单独把边沿的像素拿出来做注意力特征提取，提高offset和heat map的精度。

MonoFlex是一个单阶段的框架，实现单目3d检测的模型结构如下：

Backbone：DLA34

Neck：FPN

Head：由四部分组成

第一部分，预测2D框中心点。

通过输出heatmap，预测所有类别的中心点（默认类别为3）。
这部分加入了Edge Fusion，增强边缘的中心点预测。

第二部分，预测中心点的偏差。

对于正常物体，预测2D框中心点与3D框投影坐标之间的偏差。
对于截断物体，预测2D框中心，和3D框中心投影点与图像边沿之间交点的偏差。（下面详细讲）

第三部分，预测常规的信息。

2D框宽高。
3D方向。
3D尺寸。

第四部分，预测深度信息。

深度信息1：模型直接归回的深度信息。
深度信息2：通过关键点和几何约束，计算出来的深度信息。估计一共10个关键点：3D框8个顶点和上框面、下框面在图片中的投影到x_r的offset；然后通过相机模型计算深度。
深度信息融合，把几何深度、直接回归深度，然后两者做加权结合。

模型结构如下图所示：

补充一下Edge Fusion模块：

为了提高截断物体的中心点检测，提出了边缘特征提取和融合，单独把边沿的像素拿出来做注意力特征提取，提高offset和heat map的精度。

模块首先提取特征映射的四个边界，将其连接到边缘特征向量中。
然后由两个1*1 conv处理，以学习截断对象的唯一特征。
最后，将处理的向量重新映射到四个边界，并添加到输入特征图。

在热图预测中，边缘特征可以专门用于预测外部对象的边缘热图，从而使内部对象的位置不被混淆。

MonoFlex 的损失由6部分组成：

2D框中心点损失，通过输出heatmap，预测所有类别的中心点；使用 Focal Loss 函数。
2D框尺寸损失，使用 L1 Loss 函数。
3D框中心点与2D框中心点的偏差损失，使用 L1 Loss 函数。
3D朝向角损失，使用MultiBin 函数。
3D尺寸损失，使用 L1 Loss 函数。
深度信息损失，包括直接回归损失和关键点损失。

在KITTI 验证/测试集上的实验，选择Car类别。模型精度高，实时性好。

模型检测效果：

在截断物体的检测效果：

这里只是简单讲了一下，详细讲解看我这篇博客：【论文解读】单目3D目标检测 MonoFlex（CVPR 2021）-CSDN博客

三、基于深度信息方法

基于深度信息引导的方法。这类算法利用单目深度估计模型预先得到像素级深度图，将深度图与单目图像结合后输入检测器。

这类方法依赖于预先得到的像素级深度图，受限于深度估计模型的准确性，其预测误差会进一步引入到单目3D目标检测模型中。

考虑工程落地和模型精度速度，这类方法不会细讲~

MF3D算法，通过子网络生成深度图，并将目标感兴趣区域与深度图进行融合以回归目标3D位置信息。

MonoGRNet算法，引入一种全新的实例深度估计算法，利用稀疏监督预测目标3D边框中心的深度。不同于MF3D生成整个输入图像的深度图方法，该方法只对目标区域进行深度估计，避免了额外的计算量。

D4LCN算法，一种局部卷积神经网络，通过自动学习基于深度图中的卷积核及其接受域，克服了传统二维卷积无法捕获物体多尺度信息的问题。

MonoPSR算法，用相机成像原理计算图像中像素尺寸，与3D空间之间的比例关系，估计目标的深度位置信息。

许多单目3D目标检测算法将这些深度估计算法视为其自身网络的子模块。深度估计可以弥补单目视觉的不足，更准确地检测物体的三维信息。

四、基于点云信息方法

虽然深度信息有助于3D场景的理解，但简单地将其作为RGB 图像的额外通道，并不能弥补基于单目图像的方法和基于点云的方法之间的性能差异。

基于点云信息引导的方法。这类算法借助激光的雷达点云信息作为辅助监督进行模型训练，在推理时只需输入图像和单目相机信息。

Pseudo lidar算法，采用单目深度估计算法DORN进行深度估计, 将得到的像素深度反投影为3D点云, 从而形成了伪激光点云数据。最后利用已有的基于点云的检测算法Frustum

PointNets进行3D框检测。

Pseudo-lidar++算法，在初始深度估计的指导下，将测量数据分散到整个深度图中以提高检测精度。并利用更加便宜的4线激光雷达来代替64线激光雷达以微调检测结果。

CaDDN算法，通过将深度分类来生成视锥特征，并通过相机参数进一步转化为体素特征，并完成BEV特征生成和3D检测。由于CaDDN使用多个输入转换分支完成3D检测，导致其模型推理速度缓慢，不适用于实时场景。

补充一下，引入Transformer的模型：

MonoDTR算法，则将Transformer引入单目3D目标检测领域，通过深度感知特征增强模块和深度感知Transformer模块，实现全局上下文和深度感知特征的综合，将使用深度位置编码向Transformer注入深度位置提示，可以更好地将Transformer应用于单目3D目标检测领域。但 MonoDTR使用的自注意力机制难以处理多尺度目标，表现为对远端目标的检测能力下降。

现有方法通常会考虑利用预训练的深度模型，或是激光雷达方法的检测器来辅助完成检测，并且在最近几年中许多直接回归三维参数的方法也涌现了出来。

本文会持续更新~

单目3D目标检测专栏，大家可以参考一下

【数据集】单目3D目标检测：

3D目标检测数据集 KITTI（标签格式解析、3D框可视化、点云转图像、BEV鸟瞰图）_kitti标签_一颗小树x的博客-CSDN博客

3D目标检测数据集 DAIR-V2X-V_一颗小树x的博客-CSDN博客

【论文解读】单目3D目标检测：

【论文解读】SMOKE 单目相机 3D目标检测（CVPR2020）_相机smoke-CSDN博客

【论文解读】单目3D目标检测 CUPNet（ICCV 2021）-CSDN博客

【论文解读】单目3D目标检测 DD3D（ICCV 2021）-CSDN博客

【论文解读】单目3D目标检测 MonoDLE（CVPR2021）_一颗小树x的博客-CSDN博客

【论文解读】单目3D目标检测 MonoFlex（CVPR 2021）-CSDN博客

【论文解读】单目3D目标检测 MonoCon（AAAI2022）_一颗小树x的博客-CSDN博客

【实践应用】

单目3D目标检测——SMOKE 环境搭建|模型训练_一颗小树x的博客-CSDN博客

单目3D目标检测——SMOKE 模型推理 | 可视化结果-CSDN博客

单目3D目标检测——MonoDLE 模型训练 | 模型推理_一颗小树x的博客-CSDN博客

单目3D目标检测——MonoCon 模型训练 | 模型推理-CSDN博客

你可能感兴趣的:(单目3D目标检测,单目3D目标检测,综述,直接回归方法,基于深度信息方法,基于点云信息方法)

C++11堆操作深度解析：std::is_heap与std::is_heap_until原理解析与实践
文章目录堆结构基础与函数接口堆的核心性质函数签名与核心接口std::is_heapstd::is_heap_until实现原理深度剖析std::is_heap的验证逻辑std::is_heap_until的定位策略算法优化细节代码实践与案例分析基础用法演示自定义比较器实现最小堆检查边缘情况处理性能分析与实际应用时间复杂度对比典型应用场景与手动实现的对比注意事项与最佳实践迭代器要求比较器设计C++标
为什么会出现“与此站点的连接不安全”警告？
当浏览器弹出“与此站点的连接不安全”的红色警告时，不仅会让访客感到不安，还可能直接导致用户流失、品牌信誉受损，甚至引发数据泄露风险。作为网站运营者，如何快速解决这一问题？一、为什么会出现“与此站点的连接不安全”警告？浏览器提示“不安全连接”，本质上是检测到当前网站与用户之间的数据传输未经过加密保护。以下是触发警告的常见原因：1.未安装SSL证书SSL（SecureSocketsLayer）证书是网
上位机知识篇---SD卡&U盘镜像
常用的镜像烧录软件balenaEtcherbalenaEtcher是一个开源的、跨平台的工具，用于将操作系统镜像文件（如ISO和IMG文件）烧录到SD卡和USB驱动器中。以下是其使用方法、使用场景和使用注意事项的介绍：使用方法下载安装：根据自己的操作系统，从官方网站下载对应的安装包。Windows系统下载.exe文件后双击安装；Linux系统若下载的是.deb文件，可在终端执行“sudodpkg-
Guava LoadingCache sqyaa. java并发编程 Java知识 jvm 缓存 guava
LoadingCache是GoogleGuava库提供的一个高级缓存实现，它通过自动加载机制简化了缓存使用模式。核心特性自动加载机制当缓存未命中时，自动调用指定的CacheLoader加载数据线程安全：并发请求下，相同key只会加载一次灵活的过期策略支持基于写入时间(expireAfterWrite)和访问时间(expireAfterAccess)的过期可设置最大缓存大小，基于LRU策略淘汰丰富的
JavaScript 树形菜单总结 Auscy microsoft
树形菜单是前端开发中常见的交互组件，用于展示具有层级关系的数据（如文件目录、分类列表、组织架构等）。以下从核心概念、实现方式、常见功能及优化方向等方面进行总结。一、核心概念层级结构：数据以父子嵌套形式存在，如{id:1,children:[{id:2}]}。节点：树形结构的基本单元，包含自身信息及子节点（若有）。展开/折叠：子节点的显示与隐藏切换，是树形菜单的核心交互。递归渲染：因数据层级不固定，
基于定制开发开源AI智能名片S2B2C商城小程序的社群游戏定制策略研究说私域人工智能小程序游戏
摘要：本文聚焦社群游戏定制领域，深入探讨以社群文化和用户偏好为导向的定制策略。通过分析互动游戏活动、社群文化塑造等关键要素，结合定制开发开源AI智能名片S2B2C商城小程序的技术特性，提出针对性游戏定制方案。研究旨在提升社群用户参与度与游戏体验，为社群游戏发展提供理论支持与实践指导。关键词：社群游戏定制；定制开发开源AI智能名片S2B2C商城小程序；社群文化；用户偏好一、引言在数字化社交蓬勃发展的
冒泡、选择、插入排序：三大基础排序算法深度解析（C语言实现） xienda 算法排序算法数据结构
在算法学习道路上，排序算法是每位程序员必须掌握的基石。本文将深入解析冒泡排序、选择排序和插入排序这三种基础排序算法，通过C语言代码实现和对比分析，帮助读者彻底理解它们的差异与应用场景。算法原理与代码实现1.冒泡排序（BubbleSort）工作原理：通过重复比较相邻元素，将较大元素逐步"冒泡"到数组末尾。voidbubbleSort(intarr[],intn){ for(inti=0;iarr[
Leetcode 148. 排序链表
文章目录前引题目代码（首刷看题解）代码（8.9二刷部分看解析）代码（9.15三刷部分看解析）前引综合性比较强的一道题，要求时间复杂度必须O(logn)才能通过，最适合链表的排序算法就是归并。这里采用自顶向下的方法步骤：找到链表中点（双指针）对两个子链表排序(递归，直到只有一个结点，记得将子链表最后指向nullptr）归并（引入dummy结点）题目Leetcode148.排序链表代码（首刷看题解）c
全面触摸屏输入法设计与实现长野君
本文还有配套的精品资源，点击获取简介：触摸屏输入法是针对触摸设备优化的文字输入方案，包括虚拟键盘、手写、语音识别和手势等多种输入方式。本方案通过提供主程序文件、用户手册、界面截图、示例图、说明文本和音效文件，旨在为用户提供一个完整的、多样的文字输入体验。开发者通过持续优化算法和用户界面，使用户在无物理键盘环境下也能高效准确地进行文字输入。1.触摸屏输入法概述简介在现代信息技术飞速发展的今天，触摸屏
LeetCode 148. 排序链表：归并排序的细节解析进击的小白菜 2025 Top100 详解 leetcode 链表算法
文章目录题目描述一、方法思路：归并排序的核心步骤二、关键实现细节：快慢指针分割链表1.快慢指针的初始化问题2.为什么选择`fast=head.next`？示例1：链表长度为偶数（`1->2->3->4`）三、完整代码实现四、复杂度分析五、总结题目描述LeetCode148题要求对链表进行排序，时间复杂度需为O(nlogn)，且空间复杂度为O(logn)。由于链表的特殊结构（无法随机访问），归并排序
高效批量单词翻译工具的设计与应用
本文还有配套的精品资源，点击获取简介：在信息技术飞速发展的今天，批量单词翻译工具通过计算机的数据处理能力，大大提高了语言学习和文字处理的效率。用户通过简单输入单词列表到一个文本文件，并运行翻译程序，即可获得翻译结果并保存至指定文件。该工具集成了内置或外部翻译引擎，利用自然语言处理技术实现快速准确的翻译，并可能提供词性识别等附加功能。尽管机器翻译无法完全取代人工校对，但它为用户提供了一种高效的翻译解
嵌入式系统LCD显示模块编程实践
本文还有配套的精品资源，点击获取简介：本文档提供了一个具有800x480分辨率的3.5英寸液晶显示模块LW350AC9001的驱动程序代码，以及嵌入式系统中使用C/C++语言进行硬件编程的实践指南。该模块的2mm厚度使其适用于空间受限的便携式设备。内容包括驱动程序源代码、硬件控制接口使用方法，以及如何在嵌入式系统中进行图形处理、电源管理与性能优化。1.嵌入式系统原理1.1嵌入式系统概念嵌入式系统是
PyTorch & TensorFlow速成复习：从基础语法到模型部署实战（附FPGA移植衔接）阿牛的药铺算法移植部署 pytorch tensorflow fpga开发
PyTorch&TensorFlow速成复习：从基础语法到模型部署实战（附FPGA移植衔接）引言：为什么算法移植工程师必须掌握框架基础？针对光学类产品算法FPGA移植岗位需求（如可见光/红外图像处理），深度学习框架是算法落地的"桥梁"——既要用PyTorch/TensorFlow验证算法可行性，又要将训练好的模型（如CNN、目标检测）转换为FPGA可部署的格式（ONNX、TFLite）。本文采用"
22、文档：Google Docs的强大与易用性 pear55 探索云技术的无限可能 Google Docs 云端文档语音输入
文档：GoogleDocs的强大与易用性1.GoogleDocs简介GoogleDocs是Google提供的在线办公套件的一部分，它是一个基于云端的文字处
Android ViewBinding 使用与封装教程积跬步DEV Android 开发实战大全 android
AndroidViewBinding使用与封装教程：一、ViewBinding是什么？核心功能：为每个XML布局文件自动生成一个绑定类（如ActivityMainBinding），直接暴露所有带ID的视图引用。优点：避免繁琐的findViewById()，类型安全且编译时检查。对比DataBinding：ViewBinding仅处理视图引用，无数据绑定功能。DataBinding支持双向数据绑定，
基于链家网的二手房数据采集清洗与可视化分析 Mint_Datazzh 项目 selenium 网络爬虫
个人学习内容笔记，仅供参考。项目链接：https://gitee.com/rongwu651/lianjia原文链接：基于链家网的二手房数据采集清洗与可视化分析–笔墨云烟研究内容该课题的主要目的是通过将二手房网站上的存量与已销售房源，构建一个二手房市场行情情况与房源特点的可视化平台。该平台通过HTML架构和Echarts完成可视化的搭建。因此，该课题的主要研究内容就是如何利用相关技术设计并实现这样
【超硬核】JVM源码解读：Java方法main在虚拟机上解释执行 HeapDump性能社区 java 开发语言后端 jvm
本文由HeapDump性能社区首席讲师鸠摩（马智）授权整理发布第1篇-关于Java虚拟机HotSpot，开篇说的简单点开讲Java运行时，这一篇讲一些简单的内容。我们写的主类中的main()方法是如何被Java虚拟机调用到的？在Java类中的一些方法会被由C/C++编写的HotSpot虚拟机的C/C++函数调用，不过由于Java方法与C/C++函数的调用约定不同，所以并不能直接调用，需要JavaC
Python 脚本最佳实践2025版
前文可以直接把这篇文章喂给AI,可以放到AI角色设定里,也可以直接作为提示词.这样,你只管提需求,写脚本就让AI来.概述追求简洁和清晰：脚本应简单明了。使用函数(functions)、常量(constants)和适当的导入(import)实践来有逻辑地组织你的Python脚本。使用枚举(enumerations)和数据类(dataclasses)等数据结构高效管理脚本状态。通过命令行参数增强交互性
（Python基础篇）了解和使用分支结构 EternityArt 基础篇 python
目录一、引言二、Python分支结构的类型与语法（一）if语句（单分支）（二）if-else语句（双分支）（三）if-elif-else语句（多分支）三、分支结构的应用场景（一）提示用户输入用户名，然后再提示输入密码，如果用户名是“admin”并且密码是“88888”则提示正确，否则，如果用户名不是admin还提示用户用户名不存在,（二）提示用户输入用户名，然后再提示输入密码，如果用户名是“adm
（Python基础篇）字典的操作 EternityArt 基础篇 python 开发语言
一、引言在Python编程中，字典（Dictionary）是一种极具灵活性的数据结构，它通过“键-值对”（key-valuepair）的形式存储数据，如同现实生活中的字典——通过“词语（键）”快速查找“释义（值）”。相较于列表和元组的有序索引访问，字典的优势在于基于键的快速查找，这使得它在处理需要频繁通过唯一标识获取数据的场景中极为高效。掌握字典的操作，能让我们更高效地组织和管理复杂数据，是Pyt
基于开源AI智能名片链动2+1模式与S2B2C商城小程序的渠道选择策略研究说私域人工智能小程序
摘要：在数字化商业环境下，品牌与产品的渠道选择对其市场推广和运营成功至关重要。本文聚焦于如何依据自身品牌和产品特性，结合开源AI智能名片链动2+1模式与S2B2C商城小程序，运用科学的渠道选择方法，慎重挑选1-2个适宜平台，集中资源发力并取得成绩后再拓展其他渠道。通过理论分析与案例研究，探讨该策略的有效性和可行性，为企业渠道布局提供参考。关键词：渠道选择；开源AI智能名片；链动2+1模式；S2B2
基于架构的软件设计（Architecture-Based Software Design，ABSD）是一种以架构为核心的软件开发方法
ABSD方法与生命周期基于架构的软件设计（Architecture-BasedSoftwareDesign，ABSD）是一种以架构为核心的软件开发方法，强调在开发的各个阶段都要以架构为中心，确保系统的整体结构和质量属性得到有效管理。ABSD方法是一个自顶向下、递归细化的过程，软件系统的架构通过该方法得到细化，直到能产生软件构件和类。ABSD方法的三个基础功能的分解：使用基于模块的内聚和耦合技术，将
Java大厂面试故事：谢飞机的互联网音视频场景技术面试全纪录（Spring Boot、MyBatis、Kafka、Redis、AI等）来旺 Java场景面试宝典 Java Spring Boot MyBatis Kafka Redis 微服务 AI
Java大厂面试故事：谢飞机的互联网音视频场景技术面试全纪录（SpringBoot、MyBatis、Kafka、Redis、AI等）互联网大厂技术面试不仅考察技术深度，更注重业务场景与系统设计能力。本篇以严肃面试官与“水货”程序员谢飞机的对话，带你体验音视频业务场景下的Java面试全过程，涵盖主流技术栈，并附详细答案解析，助你面试无忧。故事场景设定谢飞机是一名有趣但技术基础略显薄弱的程序员，这次应
洛谷 P11120 [ROIR 2024 Day 1] 登机题解殇之夜洛谷 c++c语言算法
Part0前言这种题一看就是签到题，也是特水，建议评红或橙。Part1思路就是先将已有位置先填对称，然后将剩余还未添加的乘客以对称方式填入。首先可以特判掉需要的位置大于空位的情况，直接输出Impossible。然后用数组记录.和X的位置，先遍历所有X的位置，然后看他的对称位置是否为空，若为空，则填入X，然后m--。最后若musingnamespacestd;chara[1010][10];stru
【前端】jQuery数组合并去重方法总结
在jQuery中合并多个数组并去重，推荐使用原生JavaScript的Set对象（高效简单）或$.unique()（仅适用于DOM元素，不适用于普通数组）。以下是完整解决方案：方法1：使用ES6Set（推荐）//定义多个数组constarr1=[1,2,3];constarr2=[2,3,4];constarr3=[3,4,5];//合并数组并用Set去重constmergedArray=[...
C++ 设计模式：抽象工厂（Abstract Factory）冀晓武 C++设计模式 c++设计模式抽象工厂模式
链接：C++设计模式链接：C++设计模式-工厂方法链接：C++设计模式-原型模式链接：C++设计模式-建造者模式抽象工厂（AbstractFactory）是一种创建型设计模式，它提供一个接口，用于创建一系列相关或相互依赖的对象，而无需指定它们的具体类。抽象工厂模式通常用于创建一组相关的产品对象，例如不同类型的机器人和它们的配件。1.问题分析在某些情况下，我们需要创建一组相关或相互依赖的对象，但我们
Redis Sentinel（哨兵）和 Redis Cluster（集群） G丶AEOM 八股普通学习区 Redis redis 数据库缓存
哨兵机制和集群有什么区别Redis集群主要有两种，一种是RedisSentinel哨兵集群，一种是RedisCluster。主从集群，包括一个Master和多个Slave节点，Master负责数据的读写，Slave负责数据的读取，Master上收到的数据变更会同步到Slave节点上实现数据同步，但不提供容错和恢复，在Master宕机时不会选出新的Master，导致后续客户端所有写请求直接失败。所以
用OpenCV标定相机内参应用示例（C++和Python）
下面是一个完整的使用OpenCV进行相机内参标定（CameraCalibration）的示例，包括C++和Python两个版本，基于棋盘格图案标定。一、目标：相机标定通过拍摄多张带有棋盘格图案的图像，估计相机的内参：相机矩阵（内参）K畸变系数distCoeffs可选外参（R,T）标定精度指标（如重投影误差）二、棋盘格参数设置（根据自己的棋盘格设置）：棋盘格角点数：9x6（内角点，9列×6行）；每个
EMQX 社区版单机和集群部署 pcj_888 MQTT MQTT EMQ
EMQ支持Docker，宿主机，k8s部署；支持单机或集群部署。以下给出EMQX社区版单机和集群部署方法1.Docker单机部署官方推荐最小配置：2核4G下载容器镜像dockerpullemqx/emqx:5.3.2启动容器dockerrun-d--nameemqx\-p1883:1883\-p8083:8083\-p8883:8883\-p8084:8084\-p18083:18083\emqx
C++设计模式：简单工厂、工厂方法、抽象工厂起个别名 C++算法 c++
1.工厂模式的特点在我们现实生活中，买馒头和自己蒸馒头、去饭店点一份大盘鸡和自己养鸡，杀鸡，做大盘鸡，这是全然不同的两种体验：自己做麻烦，而且有失败的风险，需要自己承担后果。买现成的，可以忽略制作细节，方便快捷并且无风险，得到的肯定是美味的食物。对于后者，就相当于是一个加工厂，通过这个工厂我们就可以得到想要的东西，在程序设计中，这种模式就叫做工厂模式，工厂生成出的产品就是某个类的实例，也就是对象。
多线程编程之存钱与取钱周凡杨 java thread 多线程存钱取钱
生活费问题是这样的：学生每月都需要生活费，家长一次预存一段时间的生活费，家长和学生使用统一的一个帐号，在学生每次取帐号中一部分钱，直到帐号中没钱时通知家长存钱，而家长看到帐户还有钱则不存钱，直到帐户没钱时才存钱。问题分析：首先问题中有三个实体，学生、家长、银行账户，所以设计程序时就要设计三个类。其中银行账户只有一个，学生和家长操作的是同一个银行账户，学生的行为是
java中数组与List相互转换的方法征客丶 JavaScript java jsonp
1.List转换成为数组。（这里的List是实体是ArrayList) 　　调用ArrayList的toArray方法。　　toArray 　　public T[] toArray(T[] a)返回一个按照正确的顺序包含此列表中所有元素的数组；返回数组的运行时类型就是指定数组的运行时类型。如果列表能放入指定的数组，则返回放入此列表元素的数组。否则，将根据指定数组的运行时类型和此列表的大小分
Shell 流程控制 daizj 流程控制 if else while case shell
Shell 流程控制和Java、PHP等语言不一样，sh的流程控制不可为空，如(以下为PHP流程控制写法)： <?php if(isset($_GET["q"])){ search(q);}else{// 不做任何事情} 在sh/bash里可不能这么写，如果else分支没有语句执行，就不要写这个else，就像这样 if else if if 语句语
Linux服务器新手操作之二周凡杨 Linux 简单操作
1.利用关键字搜寻Man Pages man -k keyword 其中-k 是选项，keyword是要搜寻的关键字如果现在想使用whoami命令，但是只记住了前3个字符who，就可以使用 man -k who来搜寻关键字who的man命令 [haself@HA5-DZ26 ~]$ man -k
socket聊天室之服务器搭建朱辉辉33 socket
因为我们做的是聊天室，所以会有多个客户端，每个客户端我们用一个线程去实现，通过搭建一个服务器来实现从每个客户端来读取信息和发送信息。我们先写客户端的线程。 public class ChatSocket extends Thread{ Socket socket; public ChatSocket(Socket socket){ this.sock
利用finereport建设保险公司决策分析系统的思路和方法老A不折腾 finereport 金融保险分析系统报表系统项目开发
决策分析系统呈现的是数据页面，也就是俗称的报表，报表与报表间、数据与数据间都按照一定的逻辑设定，是业务人员查看、分析数据的平台，更是辅助领导们运营决策的平台。底层数据决定上层分析，所以建设决策分析系统一般包括数据层处理（数据仓库建设）。项目背景介绍通常，保险公司信息化程度很高，基本上都有业务处理系统（像集团业务处理系统、老业务处理系统、个人代理人系统等）、数据服务系统（通过
始终要页面在ifream的最顶层林鹤霄
index.jsp中有ifream，但是session消失后要让login.jsp始终显示到ifream的最顶层。。。始终没搞定，后来反复琢磨之后，得到了解决办法，在这儿给大家分享下。。 index.jsp--->主要是加了颜色的那一句 <html> <iframe name="top" ></iframe> <ifram
MySQL binlog恢复数据 aigo mysql
1，先确保my.ini已经配置了binlog： # binlog log_bin = D:/mysql-5.6.21-winx64/log/binlog/mysql-bin.log log_bin_index = D:/mysql-5.6.21-winx64/log/binlog/mysql-bin.index log_error = D:/mysql-5.6.21-win
OCX打成CBA包并实现自动安装与自动升级 alxw4616 ocx cab
近来手上有个项目,需要使用ocx控件 (ocx是什么? http://baike.baidu.com/view/393671.htm) 在生产过程中我遇到了如下问题. 1. 如何让 ocx 自动安装? a) 如何签名? b) 如何打包? c) 如何安装到指定目录? 2.
Hashmap队列和PriorityQueue队列的应用百合不是茶 Hashmap队列 PriorityQueue队列
HashMap队列已经是学过了的,但是最近在用的时候不是很熟悉,刚刚重新看以一次, HashMap是K,v键 ,值 put()添加元素 //下面试HashMap去掉重复的 package com.hashMapandPriorityQueue; import java.util.H
JDK1.5 returnvalue实例 bijian1013 java thread java多线程 returnvalue
Callable接口：返回结果并且可能抛出异常的任务。实现者定义了一个不带任何参数的叫做 call 的方法。 Callable 接口类似于 Runnable，两者都是为那些其实例可能被另一个线程执行的类设计的。但是 Runnable 不会返回结果，并且无法抛出经过检查的异常。 ExecutorService接口方
angularjs指令中动态编译的方法(适用于有异步请求的情况) 内嵌指令无效 bijian1013 JavaScript AngularJS
在directive的link中有一个$http请求，当请求完成后根据返回的值动态做element.append('......');这个操作，能显示没问题，可问题是我动态组的HTML里面有ng-click，发现显示出来的内容根本不执行ng-click绑定的方法！
【Java范型二】Java范型详解之extend限定范型参数的类型 bit1129 extend
在第一篇中，定义范型类时，使用如下的方式： public class Generics<M, S, N> { //M,S,N是范型参数 } 这种方式定义的范型类有两个基本的问题： 1. 范型参数定义的实例字段，如private M m = null;由于M的类型在运行时才能确定，那么我们在类的方法中，无法使用m，这跟定义pri
【HBase十三】HBase知识点总结 bit1129 hbase
1. 数据从MemStore flush到磁盘的触发条件有哪些？ a.显式调用flush，比如flush 'mytable' b.MemStore中的数据容量超过flush的指定容量，hbase.hregion.memstore.flush.size,默认值是64M 2. Region的构成是怎么样？ 1个Region由若干个Store组成
服务器被DDOS攻击防御的SHELL脚本 ronin47
mkdir /root/bin vi /root/bin/dropip.sh #!/bin/bash/bin/netstat -na|grep ESTABLISHED|awk ‘{print $5}’|awk -F:‘{print $1}’|sort|uniq -c|sort -rn|head -10|grep -v -E ’192.168|127.0′|awk ‘{if($2!=null&a
java程序员生存手册-craps 游戏-一个简单的游戏 bylijinnan java
import java.util.Random; public class CrapsGame { /** * *一个简单的赌*博游戏，游戏规则如下： *玩家掷两个骰子，点数为1到6，如果第一次点数和为7或11，则玩家胜， *如果点数和为2、3或12，则玩家输， *如果和为其它点数，则记录第一次的点数和，然后继续掷骰，直至点数和等于第一次掷出的点
TOMCAT启动提示NB: JAVA_HOME should point to a JDK not a JRE解决开窍的石头 JAVA_HOME
当tomcat是解压的时候，用eclipse启动正常，点击startup.bat的时候启动报错; 报错如下： The JAVA_HOME environment variable is not defined correctly This environment variable is needed to run this program NB: JAVA_HOME shou
[操作系统内核]操作系统与互联网 comsci 操作系统
我首先申明：我这里所说的问题并不是针对哪个厂商的，仅仅是描述我对操作系统技术的一些看法操作系统是一种与硬件层关系非常密切的系统软件，按理说，这种系统软件应该是由设计CPU和硬件板卡的厂商开发的，和软件公司没有直接的关系，也就是说，操作系统应该由做硬件的厂商来设计和开发
富文本框ckeditor_4.4.7 文本框的简单使用支持IE11 cuityang 富文本框
<html xmlns="http://www.w3.org/1999/xhtml"> <head> <meta http-equiv="Content-Type" content="text/html; charset=UTF-8" /> <title>知识库内容编辑</tit
Property null not found darrenzhu datagrid Flex Advanced propery null
When you got error message like "Property null not found ***", try to fix it by the following way: 1)if you are using AdvancedDatagrid, make sure you only update the data in the data prov
MySQl数据库字符串替换函数使用 dcj3sjt126com mysql 函数替换
需求：需要将数据表中一个字段的值里面的所有的 . 替换成 _ 原来的数据是 site.title site.keywords .... 替换后要为 site_title site_keywords 使用的SQL语句如下： updat
mac上终端起动MySQL的方法 dcj3sjt126com mysql mac
首先去官网下载: http://www.mysql.com/downloads/ 我下载了5.6.11的dmg然后安装,安装完成之后..如果要用终端去玩SQL.那么一开始要输入很长的:/usr/local/mysql/bin/mysql 这不方便啊,好想像windows下的cmd里面一样输入mysql -uroot -p1这样...上网查了下..可以实现滴. 打开终端,输入: 1
Gson使用一（Gson） eksliang json gson
转载请出自出处：http://eksliang.iteye.com/blog/2175401 一.概述从结构上看Json，所有的数据（data）最终都可以分解成三种类型：第一种类型是标量（scalar），也就是一个单独的字符串（string）或数字（numbers），比如"ickes"这个字符串。第二种类型是序列（sequence），又叫做数组（array）
android点滴4 gundumw100 android
Android 47个小知识 http://www.open-open.com/lib/view/open1422676091314.html Android实用代码七段（一） http://www.cnblogs.com/over140/archive/2012/09/26/2611999.html http://www.cnblogs.com/over140/arch
JavaWeb之JSP基本语法 ihuning javaweb
目录 JSP模版元素 JSP表达式 JSP脚本片断 EL表达式 JSP注释特殊字符序列的转义处理如何查找JSP页面中的错误 JSP模版元素 JSP页面中的静态HTML内容称之为JSP模版元素，在静态的HTML内容之中可以嵌套JSP
App Extension编程指南（iOS8/OS X v10.10）中文版啸笑天 ext
当iOS 8.0和OS X v10.10发布后，一个全新的概念出现在我们眼前，那就是应用扩展。顾名思义，应用扩展允许开发者扩展应用的自定义功能和内容，能够让用户在使用其他app时使用该项功能。你可以开发一个应用扩展来执行某些特定的任务，用户使用该扩展后就可以在多个上下文环境中执行该任务。比如说，你提供了一个能让用户把内容分
SQLServer实现无限级树结构 macroli oracle sql SQL Server
表结构如下：数据库id path titlesort 排序 1 0 首页 0 2 0,1 新闻 1 3 0,2 JAVA 2 4 0,3 JSP 3 5 0,2,3 业界动态 2 6 0,2,3 国内新闻 1 创建一个存储过程来实现，如果要在页面上使用可以设置一个返回变量将至传过去 create procedure test as begin decla
Css居中div，Css居中img，Css居中文本，Css垂直居中div qiaolevip 众观千象学习永无止境每天进步一点点 css
/**********Css居中Div**********/ div.center { width: 100px; margin: 0 auto; } /**********Css居中img**********/ img.center { display: block; margin-left: auto; margin-right: auto; }
Oracle 常用操作(实用) 吃猫的鱼 oracle
SQL>select text from all_source where owner=user and name=upper('&plsql_name'); SQL>select * from user_ind_columns where index_name=upper('&index_name'); 将表记录恢复到指定时间段以前
iOS中使用RSA对数据进行加密解密 witcheryne ios rsa iPhone objective c
RSA算法是一种非对称加密算法,常被用于加密数据传输.如果配合上数字摘要算法, 也可以用于文件签名. 本文将讨论如何在iOS中使用RSA传输加密数据. 本文环境 mac os openssl-1.0.1j, openssl需要使用1.x版本, 推荐使用[homebrew](http://brew.sh/)安装. Java 8 RSA基本原理 RS

单目3D目标检测 方法综述——直接回归方法、基于深度信息方法、基于点云信息方法

一、单目3D目标检测概述

1.1 简介

1.2 单目相机特征

1.3 为什么用单目做3D目标检测

1.4 3D边框表示方式

1.5 挑战

二、直接回归的方法

2.1 SMOKE【CVPR2020】

2.2 MonoDLE（CVPR2021）

2.3 MonoCon（AAAI2022）

2.4 CUPNet（ICCV 2021）

2.5 MonoFlex（CVPR 2021）

三、基于深度信息方法

四、基于点云信息方法

你可能感兴趣的:(单目3D目标检测,单目3D目标检测,综述,直接回归方法,基于深度信息方法,基于点云信息方法)

单目3D目标检测方法综述——直接回归方法、基于深度信息方法、基于点云信息方法