byzy

3D Object Detection for Autonomous Driving: A Survey（自动驾驶中的3D目标检测综述）论文阅读笔记

原文链接：https://arxiv.org/pdf/2106.10823.pdf

II.传感器

分为被动传感器（如摄像机）和主动传感器（如激光雷达）。优缺点如下：

传感器	优点		缺点
单目摄像机	提供色彩和纹理信息	成本低	对光照条件敏感	不提供深度信息
立体摄像机		提供深度信息		计算复杂；视野有限
激光雷达	受光照影响小；360°视野		无纹理色彩；稀疏不规则；贵
固态激光雷达	比普通激光雷达可靠；成本低		视野有限

关于摄像机-激光雷达融合可以提高检测精度和预测确定性，可靠性通过传感器校准和系统冗余保证。

III. 基本概念

A. 问题描述

目标检测问题可描述为

$\{\{B_i,C_i\}=\Phi(D_i;\Theta):i=1,\cdots ,M\}$

其中为3D边界框（使用7个参数描述，即中心点坐标、长宽高和朝向角；假定边界框紧贴地面），为类别，为点集； $\Phi(D,\Theta)$ 表示参数为 $\Theta$ 的可训练模型。

B. 坐标变换

激光雷达坐标系：朝前，朝左，朝上；摄像机坐标系：朝右，朝下，朝前。

$\bold{y}=P_{rect}^{(i)}R_{rect}^{(0)}T_{velo}^{cam}p$

$p=[x,y,z,1]^\mathrm{T}$ 是点在激光雷达坐标系下的坐标； $\bold{y}=[u,v,1]^{\mathrm{T}}$ 是对应第个摄像机图像中像素坐标。是激光雷达坐标系到摄像机坐标系的坐标变换矩阵；是旋转矩阵（摄像机坐标系相对于参考摄像机的角度；假定所有摄像机的-平面都在同一平面上），是投影矩阵（与摄像机的内部参数以及相对参考摄像机的基线相关）。

IV. 3D目标检测方法

分类：基于图像的3D目标检测；基于点云的3D目标检测；基于多模态融合的3D目标检测。

基于点云的3D目标检测进一步可分为基于多视图的、基于体素的、基于点的、以及基于点和体素的方法。

A.基于图像的方法

可分为基于模板匹配的方法和基于几何属性的方法。

对于前者而言，区域提案是关键，提出区域提案的方法包括传统的手工分组、窗口评分以及后来的区域提案网络（RPN）。

后者可以简化为透视点问题（PnP），通过几何特性和经验观测粗略估计物体的3D姿态，通过2D检测头提供精确的2D边界框。

此外，最近还有一种方法，通过计算视差将图像投影回3D空间模拟激光雷达点（称为基于伪激光雷达的方法）。

（1）基于模板匹配的方法

通过对3D提案采样和打分，并将其作为代表性模板进行2D/3D匹配。

3DOP，它通过一对立体图像计算深度，将图像投影回3D空间成为点云；通过带有potential（如物体大小先验、地平面、点云密度）的马尔可夫随机场的能量最小化来生成目标提案，然后使用FastR-CNN来回归得到物体位置。

Mono3D用于使单目图像达到同样性能。它假设地平面垂直于图像所在平面，物体均位于地平面上，使用滑动窗口直接从3D空间采样候选目标，而不必计算深度。使用potential（如语义信息，实例级信息、位置先验等）为候选目标评分，选择最可能的一个通过FastR-CNN检测。

3DOP和Mono3D都输出针对类别的提案，所以potential需要针对每个类别设计。但它们过度依赖专业知识，无法泛化到复杂场景。

Deep MANTA：使用定制的2D检测头，输出2D边界框，以及部分2D坐标、部分可见性、3D模板相似度（由大型3D模型数据库监督）。选择3D模板中相似度最高的进行2D/3D匹配，以恢复几何信息。缺点是需要大型3D数据库，且无法识别数据库中不存在的物体。

（2）基于几何属性的方法

Deep3DBox：利用“3D角的透视投影至少应该紧贴2D边界框的一侧”这一几何信息。

GS3D：使用单目图像，在FastR-CNN上加入额外的方向预测分支，预测2D边界框和观测方向，称为2D+O子网络。然后根据自动驾驶的经验，认为3D边界框的顶部中心与2D边界框的顶部中心接近，来生成粗略的3D边界框。从2D边界框和3D边界框的3个可见表面提取特征进行融合，输入到3D子网络进行细化。此方法效果比其他基于单目图像的效果好得多，但从经验知识得到的假设不准确。

Stereo R-CNN：充分利用立体图像的语义属性和密集约束。分别使用共享权重的两个网络（ResNet-101+FPN）处理左右图像，再进行感兴趣区域（RoI）对齐和裁剪操作。RoI特征被拼接，输入到立体回归分支；通过模拟MaskR-CNN，使用RoI特征预测4个语义关键点。最后3D边界框可以通过几何约束（即3D角和2D框之间的投影关系以及关键点）估计。

（3）基于伪激光雷达的方法

首先进行深度估计，再用基于点云的方法处理。这种方法大幅提高了检测精度。

Pseudo-LiDAR：首先使用金字塔立体匹配网络（PSMNET）估计深度，然后根据视差图将图像投影到3D空间（伪激光雷达点云），使用基于激光雷达点云的方法处理。

缺点：因为深度估计误差与距离成二次关系，故Pseudo-LiDAR仅在近距离目标检测上效果好。

MF3D：先通过单目深度估计模块计算视差，获得3D点云。然后将视差图的前视图特征与RGB图像融合，输入到2D区域提案网络，得到2D区域提案。最后将RGB图像的特征与伪激光雷达的特征拼接，进一步细化。

Mono3D-PLiDAR：通过单目深度估计方法（如DORN），将图像转换为点云，然后使用Frustum PointNets（见后面）处理。由于单目深度估计的误差，伪激光雷达含有大量噪声，表现在两方面：局部偏差和深度伪影。使用2D-3D边界框一致性损失(BBCL)处理前一个问题；使用Mask R-CNN估计的实例mask而非2D边界框，减少Frustum中的无关点，从而减轻后一个问题。

B.基于点云的方法

（1）基于多视图的方法

将点云转换为前视域或鸟瞰图（BEV），以使用CNN和2D检测方法。

VeloFCN将点云投影到前视域，使用现成的2D检测器。

PIXOR将点云投影到BEV，减少遮挡，避免物体大小随距离变化；但舍弃了高度上的信息。

（2）基于体素的方法

将点云转化为体素，使用3D CNN提取特征。因其在离散化过程中舍弃了细粒度的坐标信息而计算高效。

分为硬体素化（划分体素，分配每一个点，超出限制的点会被丢掉，如SECOND和PointPillars使用）和动态体素化，区别如下图所示。

体素中每个点的坐标信息可被加强为原始坐标和相对体素中心的偏移。

将点的特征聚合为体素的特征，主要有3种方法：取平均、随机采样和用MLP（PointNet）处理（如VoxelNet、PointPillars、F-ConvNet采用此法）。

VoxelNet：3个组成部分——特征学习网络（引入类似PointNet的体素特征编码（VFE）层将点云转化为体素），卷积中间层（3D卷积），区域提案网络（RPN，输出检测结果）。

缺点：3D卷积的复杂性和内存占用。

SECOND：使用稀疏卷积减小内存占用、加速计算。

缺点：耗时的3D卷积仍然存在。

PointPillars：将点云转化为垂直柱体的集合，使用2D卷积进行目标检测。同样包含3个部分：特征编码网络（点云转化为柱体，生成BEV伪图像），2D卷积网络（下采样、上采样），检测头（回归3D边界框）。

缺点：BEV丢失信息。

Part- $\mathrm{A^2}$ ：由于3D边界框可以无遮挡地提供物体内part的信息，设计两个阶段（part感知阶段和part聚合阶段）。前一阶段使用类似UNet的网络卷积和反卷积非空体素来分割前景点以及预测part；同时，RPN输出粗糙的3D提案。后一阶段使用感兴趣区池化模块消除3D边界框的模糊性，并学习3D提案中点的空间关系。最后3D稀疏卷积聚合part信息，评分并细化位置。

HVNet：包含3个部分：多尺度体素化和特征提取、多尺度特征融合和动态特征投影、检测头。首先将点云体素化为不同尺度，再输入到注意体素特征编码器（AVFE）。然后高级语义特征被投影回原来位置，形成伪图像。最后使用FPN预测实例。

（3）基于点的方法

通常有两种主干网络：PointNet及其变体、图卷积网络（GNN）。

（A）PointNet++分层递归调用PointNet；密度自适应层（含多尺度分组MSG和多分辨率分组MRG）使其能自适应地抓取局部信息和细粒度模式；使用SA层下采样，FP层上采样。可以通过堆叠SA层获得灵活的感受野。

PointRCNN和3DSSD基于PointNet++建立模型，使用3D RPN生成以每个点为中心的高质量提案，在最后阶段进行细化。

PointRCNN：两阶段检测网络，将2D检测网络Faster RCNN移植到3D域。使用PointNet++语义分割生成前景点，然后自底向上地生成高质量3D提案；使用3D感兴趣区池化来汇集每个提案内的点及其语义特征，从而细化边界框和预测置信度。

缺点：PointNet++和细化模块都很耗时。

3DSSD：移除了耗时的FP层，最远点采样时融合使用欧氏距离度量和特征度量，以弥补下采样时前景点的丢失；提出anchor-free的回归头，减小内存和增加精度。

（B）GNN

Point-GNN：将点云中的每个点看作图的节点，距离足够近的点之间建立边。三个步骤：从下采样点云中建立图；利用邻域信息更新节点，用于检测类别和位置；从多个节点中融合3D边界框。

缺点：建立图的时间和推断时间很长。

基于点的方法没有平移不变性。

为了减轻这一问题，Point-GNN提出自动配准机制，使用中心节点的结构特征，预测邻居相对坐标的对齐偏差；3DSSD预测前景点的偏移，由点和其所属实例中心的偏移的相对位置监督。

（4）基于点和体素的方法

PVConv

Fast Point R-CNN：第一阶段，通过VoxelRPN自下而上地体素化，生成少量高质量提案。第二阶段，一个轻型PointNet，RefinerNet，通过注意力机制融合点和其卷积特征，作为第一阶段体素化丢失定位信息的补充。

STD：与PointRCNN类似。创新在于提出球形anchor，比矩形anchor有更高的召回率。

PV-RCNN：集成了3D稀疏卷积的效率以及PointNet SA层感受野的灵活性。首先和SECOND一样使用3D稀疏卷积作为主干编码场景；然后使用体素到关键点的场景编码以及关键点到网格RoI的特征抽取以节省计算、细化定位。具体而言，前者使用体素SA（VSA）模块，来聚合多尺度体素级语义特征为关键点特征（关键点由原始点云的最远点采样得到）。

SA-SSD：先使用稀疏卷积逐步下采样；再将卷积特征均匀离散化为具有原始体素级单位的点级特征。然后真实3D边界框内的点，以及来自边界框中心的偏移量，联合优化一个辅助网络。前者使特征对物体边界敏感，后者建立了体素间的物体内关系。辅助网络在训练后被丢弃。

无论是3D还是2D的目标检测，分类得分和定位精度的不匹配性都很显著（例如，非最大抑制（NMS）可能会删掉具有低分类分数的高质量边界框）。

STD增加了一个3D IoU估计分支，将每个边界框的置信度与3D IoU相乘；PV-RCNN直接将3D IoU作为训练目标

SA-SSD开发了一种部分敏感的warp操作，在通道维度上采样特征来进行分类。

总的来说，基于体素的方法利于硬件实现，效果好；但计算量大，且对体素参数敏感；基于点的方法保留原始点的几何信息，其中基于PointNet的方法，最远点采样和FP层会花费比体素化更长的时间，而基于GNN的方法更容易抓取几何信息，但花费时间比PointNet更长。

C.基于多模态融合的方法

一般的多模态融合分为早期融合和晚期融合。但在自动驾驶领域中分类为顺序融合和并行融合。

（1）顺序融合

顺序利用多阶段特征。

Frustum PointNets：首先用2D检测器提取感兴趣区，然后转换到3D空间来获得棱台提案。然后棱台中的每个点被一个类PointNet的网络分割，获得兴趣点用于回归。

2D检测器减小了3D搜索范围，提供先验。

缺点：非常依赖2D检测器的精度。

PointPainting：利用图像的语义信息整合到点云中。首先对图像进行语义分割，然后将分类分数直接加到激光雷达点云上。然后对激光雷达点云使用3D检测器用于分类和定位。

缺点：不是端到端的训练；要求高精度语义分割。

Pseudo-LiDAR++：基于Pseudo-LiDAR的缺点，Pseudo-LiDAR++考虑对齐远处物体。它提出基于图的深度修正（GDC）算法，即使用稀疏而精确的激光雷达点来修正估计的深度。激光雷达点被投影到图像上，作为对应的伪激光雷达点的真实深度。仍使用PSMNET估计深度，但修正时先用kNN建立图，然后利用真实深度更新图的权重。最后，信息在整个图上传播。

缺点：不是端到端的深度学习方法。后来的Pseudo-LiDAR E2E解决了这一问题。

（2）并行融合

在特征空间融合模态为多模态表达，然后输入到监督学习器。

MV3D：使用图像、激光雷达的BEV和前视图为输入。首先用BEV生成精确的3D候选边界框，然后根据其裁剪出各视图的相应区域。然后深度多视图融合网络融合RoI特征。

缺点：使用手工特征；小物体检测困难（下采样容易丢失）。

AVOD：将融合策略延伸到RoI预测阶段。给定3D锚框，从特征金字塔顶部的图像和BEV特征图中裁剪和缩放相应区域。使用平均融合特征，输入到全连接层中检测物体。这样可以生成高召回率的提案，对提高小物体的检测精度有帮助。

缺点：区域融合进发生在特征金字塔的顶部，而中部特征对检测很重要。

MV3D和AVOD都是RoI级别上的融合。后来提出了像素级融合。

ContFuse：使用连续卷积像素级地融合多尺度卷积特征。

由于激光雷达点云中不是所有点都能在图像中看到，因此寻找BEV中每个像素最近的个激光雷达点，然后根据激光雷达点的坐标，使用双线性插值检索对应的个图像特征。然后使用MLP编码插值后的图像特征，以及这个点和目标像素之间的偏移（用于建模每个点对最终表达的贡献），生成BEV像素的最终表达。

（对于BEV的每个像素，个最近点被投影到图像获取图像特征，然后用类PointNet网络处理这个图像特征。）

缺点：受限于远距离激光雷达点的稀疏性。

MMF：使用多个相关任务（如地面估计、深度补全和目标检测），通过不同层次的特征融合促进表达学习。这些辅助任务通过提供几何先验和跨模态关联促进融合。

使用像素级融合和RoI融合。前者对于BEV中每个像素，通过将最近的点投影到图像上来检索相应图像特征；后者分别在图像和BEV上进行RoI对齐操作，提取RoI用于融合和细化。缺点：深度补全确实增加了远距离激光雷达点的密度，但估计误差在多大程度上影响系统鲁棒性是不可知的。

3D-CVF：体素化后使用3D稀疏卷积下采样到1/8，然后转化为BEV。同时使用预训练的ResNet-18提取相应的图像特征。

为了解决图像和BEV不对齐的问题，第一阶段采用简化的连续融合层自动校准特征投影，对齐BEV和图像：直接将体素的中心坐标投影到图像，插值图像特征；使用自适应注意力机制从图像特征和点云特征过滤信息。

第二阶段中，利用第一阶段提供的提案，使用RoI池化实现图像和BEV的RoI融合。

缺点：与基于激光雷达点云的方法（如PV-RCNN）仍有差距。

像素级融合的缺点是引入“特征模糊”，即相距很远的两个激光雷达点可能对应同一个像素。

顺序融合方法往往不能端到端训练；不同阶段之间存在紧密耦合，即前面阶段效果差会影响后面所有的阶段；富含信息、对检测重要的中间特征被抛弃。并行融合只有一个学习阶段，但多视图之间的对齐问题很棘手。

IV. 评估

KITTI：覆盖了几乎所有的3D任务（如车道检测、深度估计和补全、目标跟踪和域自适应）。4个高分辨率摄像机，一个激光扫描仪和一个GPS/IMU定位单元。有汽车、行人和自行车3个类别，每个类别分为简单、中等和困难三个难度。

A.评估指标

mAP（ $\mathrm{IoU_{3D}}$ ；TP、FP、TN；准确率P、召回率R；PR曲线；PR曲线的插值方法；AP）

B.SotA的比较

（1）基于点云的方法效果最好，基于多模态融合的方法正在缩小与前者的差距（缺点是多模态处理会增加计算时间，不能在实际中使用）；基于图像的方法效果很差（深度估计误差）。

（2）单阶段检测正在接近两阶段检测的效果；但3D目标检测的性能仍与2D目标检测有一定差距。

（3）在汽车类别上的检测结果好于其他两类（遮挡对汽车的影响更小）。

（4）当点数变得相当多的时候，基于点的方法比基于体素的方法性能下降大。

附录

A. 将点云转化为BEV的算法

B. 将点云转化为前视图的算法

D. 实施细节

（1）数据增广

“ground truth augmentor”：在相应的场景中裁剪出真实边界框内的点，根据类别建立数据库。然后应用加权抽样，从数据库中随机“复制”真实边界框，无缝“粘贴”到当前场景中。

（2）损失函数

（a）基础损失：定位损失和类别损失。

使用 $(x^{gt},y^{gt},z^{gt},w^{gt},l^{gt},h^{gt},\theta^{gt})$ 表示真实的边界框， $(x^{a},y^{a},z^{a},w^{a},l^{a},h^{a},\theta^{a})$ 表示估计的边界框。

$\Delta x=\frac{x^{gt}-x^a}{d^a},\Delta y=\frac{y^{gt}-y^a}{d^a},\Delta z=\frac{z^{gt}-z^a}{d^a}$

$\Delta w=\log\frac{w^{gt}}{w^a},\Delta l=\log\frac{l^{gt}}{l^a},\Delta h=\log\frac{h^{gt}}{h^a}$

$\Delta\theta=\sin(\theta^{gt}-\theta^a),d^a=\sqrt{(w^a)^2+(l^a)^2}$

$L_{loc}=\sum_{b\in (x,y,z,w,l,h,\theta)}\mathrm{SmoothL1}(\Delta b)$

为处理类别不平衡问题，使用focal loss（为检测的类别概率）：

$L_{focal}(p_t)=-\alpha_t(1-p_t)^\gamma \log(p_t)$

（b）IoU损失：解决分类得分和定位精度的不匹配性问题（为分类分数）。

$q=\left\{\begin{matrix} 1 & if\; \; iou>0.75\\ 0 & if\; \; iou<0.25\\ 2iou-0.5 & otherwise \end{matrix}\right.$

$L_{iou}=-[q\log(p)+(1-q)\log(1-p)]$

$L=\frac{1}{N_{pos}}(\beta_{loc}L_{loc}+\beta_{iou}L_{iou})$

（c）角点损失：最小化边界框8个角的误差。

$L_{corner}=\sum_{k=1}^8 \left \| P_k-G_k \right \|$

（d）基于区间的损失：每个兴趣点在和方向上离散为区间。将原始的回归操作转换为区间分类和残差回归，复杂性（尤其是角度）被大大降低。

YOLOv8 改进：添加 AKConv（任意采样形状和任意数目参数的卷积）鱼弦人工智能时代 YOLO
YOLOv8改进：添加AKConv（任意采样形状和任意数目参数的卷积）引言在目标检测领域中，YOLO（YouOnlyLookOnce）系列因其速度和效率而受到广泛关注。为了进一步优化模型性能，可以引入创新的卷积操作，例如AKConv，即“任意采样形状和任意数目参数的卷积”。这种卷积能够灵活地调整采样策略，以更好地适应输入特征。技术背景传统卷积运算在采样位置和参数数量上具有固定性，这限制了其对复杂几
Ubuntu & Debian 系统下挂载 Samba 共享目录的完整指南 YiYueHuan ubuntu debian linux Samba NAS
文章目录Ubuntu&Debian系统下挂载Samba共享目录的完整指南前提条件挂载Samba共享临时挂载避免明文密码永久挂载常见选项卸载故障排查Ubuntu&Debian系统下挂载Samba共享目录的完整指南想把NAS中的内容通过Samba挂载到OrangePi5B，但是OrangePi5B提供的内核默认是没有开启CONFIG_CIFS的，所以就整理了一下。在Ubuntu/Debian系统上挂载
QT学习笔记(常用控件) 四代目水门 QT学习笔记 qt 学习笔记
QT学习笔记一、QTGUI类继承体系QObject（基类）└──QWidget（所有可视化控件基类）├──QAbstractButton（按钮类基类）│├──QPushButton│├──QRadioButton│└──QCheckBox├──QFrame（带边框控件基类）│└──QLabel├──QLayout（布局管理器基类）└──其他控件类...核心类说明：QObject：所有QT对象的基类
业务7——数据埋点嚯嚯嚯嚯什么都不会业务数据分析
文章目录一、数据生命周期：二、埋点是什么？1、含义2、方式三、埋点流程1、埋点生命周期2、业务需求分析3、埋点文档设计一、数据生命周期：还能从数据角度来看，数据在工作中的参与环节，帮助理清数据分析流程和思路。二、埋点是什么？1、含义数据埋点是数据采集的一种重要方式，是在有需要的位置采集相应的信息，主要是终端用户的操作行为，后续用于解决业务方提出的业务需求。2、方式全埋点代码埋点（百度统计、友盟、T
专业课笔记——（第一章：C、C++基础知识）大小胖虎 C/C++基础知识笔记算法 C C++数据类型操作类型笔记
目录一、数据类型二、不同格式输出的含义三、运算符优先级四、计算机基础知识五、零碎基础知识点一、数据类型1、C语言中的最简单的数据类型：整数类型、字符类型、浮点类型（C语言没有逻辑型(bool)它是C++特有的，而c语言它是通过0、1表示实现的）构造类型：枚举型、数组类型、结构体类型、共用体类型、类类型(C++特有)2、计算字符串长度：strlen()：c语言中的函数length()：c++中的函数
macOS 使用 enca 识别文件编码类型（比 file 命令准确）知识搬运bot 软件工具/使用技巧 macos enca file iconv 文件编码
文章目录macOS上安装enca基本使用起因-iconv关于enca安装Encaenca&enconv其它用法macOS上安装encabrewinstallenca基本使用encafilepath.txt示例$enca动态规划算法.txt[0]SimplifiedChineseNationalStandard;GB2312CRLFlineterminators起因-iconv在macOS上打开一些
Pytest基础使用北条苒茗殇 pytest
概述Pytest是Python里的一个强大的测试框架，灵活易用，可以进行功能，自动化测试使用，可以与Requests，Selenium等进行结合使用，同时可以生成Html的报告。一、Pytest的基本使用在未指定Pytest的配置文件时，会对以下文件进行执行：test_*.py，如：test_1.py*_test.py，如：1_test.py会对以下的类和函数进行执行：类：以Test_开头的类，如
STM32F1基于HAL库的学习记录实用使用教程分享(五、PWM驱动舵机、呼吸灯) 藤樂. STM32学习 stm32 学习数据库
往期内容STM32F1基于HAL库的学习记录实用使用教程分享(一、GPIO_Output)STM32F1基于HAL库的学习记录实用使用教程分享(二、GPIO_Input按键)STM32F1基于HAL库的学习记录实用使用教程分享(三、外部中断按键)STM32F1基于HAL库的学习记录实用使用教程分享(四、OLEDIIC驱动软件IIC硬件IIC)文章目录往期内容前言一、PWMPWM如何控制LED亮度？
交换机救命命令手册：华为 & 思科平台最全运维指令速查表 IT程序媛-桃子数通华为认证服务器运维
引言：这是一份救命的交换机运维秘籍在交换机配置与故障排查过程中，不论你是初入网络世界的小白，还是年资数年的资深工程师，总会遇到那些“关键时刻靠得住的命令”。这篇文章，我将整理一份覆盖华为+思科双平台的实战命令手册，从最基础的设备状态查看，到VLAN、STP、防环、LACP、QOS、抓包、限速、安全加固等操作，通通囊括。关键时刻，拿来即用，就是这篇的全部意义。01️⃣基础生存命令：先活下来再说场景华
springCloud集成tdengine(原生和mapper方式) 其二原生篇张小娟 spring cloud tdengine spring
mapper篇请看另一篇文章一、引入pom文件com.taosdata.jdbctaos-jdbcdriver3.5.3二、在nacos中填写数据库各种value值tdengine:datasource:location:yourLocationusername:rootpassword:yourPassword三、编写TDengineUtil文件下方util文件里面，包含创建database的方
OpenCV图像拼接（4）图像拼接模块的一个匹配器类cv::detail::BestOf2NearestRangeMatcher 村北头的码农 OpenCV opencv 人工智能计算机视觉
操作系统：ubuntu22.04OpenCV版本：OpenCV4.9IDE:VisualStudioCode编程语言：C++11算法描述cv::detail::BestOf2NearestRangeMatcher是OpenCV库中用于图像拼接模块的一个匹配器类，专门用于寻找两幅图像之间的最佳特征点匹配。它是基于“最近邻与次近邻距离比”原则来过滤匹配点对的，以提高匹配结果的准确性。这个类特别适用于需
YUV422转RGB并显示于Qlabel 小火龙的马甲 qt opencv
读取YUV422格式文件，转成Mat类型BGR格式，并显示于Qlabel控件上。写在前面从今天起，多看些书吧。要不，就从黄宁然看过的看起。问题来源anxue100：[https://bbs.csdn.net/topics/****?spm=1001.2014.3001.**77]因“当前发帖距今超过3年，不再开放新的回复”，故新建帖子。迟到的回复。1.新建类编写头文件：YUV422.h文件#ifn
解决前后端分离跨域产生的session丢失问题 luckilyil BUG java servlet
目录前言存储用户信息的方式Cookies：Token（令牌）：LocalStorage/SessionStorage：Session：Redis：OAuth/OIDC：本篇文章主要讲使用session会话来存储信息会话机制1.何为一次会话，会话从什么时候开始，从什么时候结束？2.cookies如何保持会话，它的工作流程？3.什么是Session？Session的工作原理：问题出现解决方法总结前言现
31天Python入门——第11天:挑战一口气把闭包·装饰器讲明白安然无虞 Python手把手教程 python 开发语言后端 pyqt
你好，我是安然无虞。文章目录1.闭包扩展知识:闭包的自由变量是如何存储的2.装饰器装饰器的应用场景3.补充练习1.闭包闭包是指在一个函数内部定义的函数，并且这个内部函数可以访问外部函数的变量、参数.换句话说，闭包是一个包含了函数及其相关引用环境的组合体.在Python中，当一个函数返回了内部函数的引用时，这个内部函数可以访问并操作外部函数的局部变量，它就创建了一个闭包,即使外部函数已经执行完毕，它
算法笔记——前缀树、贪心算法（更新ing....... 不吃香菜的码农左神算法笔记算法数据结构贪心算法 leetcode 堆栈
前缀树、贪心算法一、前缀树1.什么是前缀树2.如何生成前缀树二、贪心算法1.拼接字符串2.金条问题3.项目会议时间问题4.项目收益最大化4.随时获得数据流的中位数一、前缀树1.什么是前缀树前缀树一般指字典树这是指一种结构而不是一类题（注意信息是在树的路上）典型应用是用于统计和排序大量的字符串（但不仅限于字符串），所以经常被搜索引擎系统用于文本词频统计。它的优点是：最大限度地减少无谓的字符串比较，查
Open3D 点云DBSCAN聚类算法 MelaCandy 算法聚类 numpy 计算机视觉图像处理 3d
目录一、DBSCAN基本原理二、代码实现2.1关键函数2.2完整代码三、实现效果3.1原始点云3.2聚类后点云Open3D点云算法汇总及实战案例汇总的目录地址：Open3D点云算法与点云深度学习案例汇总（长期更新）-CSDN博客一、DBSCAN基本原理DBSCAN（Density-BasedSpatialClusteringofApplicationswithNoise）是一种基于密度的聚类算法，
基于 C++ 类的程序设计模式与应用研究饼干帅成渣 c++开发语言
摘要C++语言凭借其强大的功能在软件开发领域占据重要地位，类作为C++面向对象编程的核心，承载着数据封装、代码复用等关键使命。本文深入剖析C++类的基础概念、核心特性及其在实际编程中的应用。通过详细阐述类的定义、成员构成、访问控制以及封装、继承、多态等特性，结合具体代码示例展示其在构建软件架构中的作用。同时，探讨C++类在应用中面临的常见问题及解决方案，为开发者高效运用C++类进行程序设计提供有力
庖丁解java(一篇文章学java) 庖丁解java java 开发语言 spring boot 后端
(大家不用收藏这篇文章,因为这篇文章会经常更新,也就是删除后重发)一篇文章学java,这是我滴一个执念...当然,真一篇文章就写完java基础,java架构,java业务实现,java业务扩展,根本不可能.所以,这篇文章,就是一个索引,索什么呢?请看下文...关于决定开始写博文的介绍(一切故事的起点源于这一次反省)中小技术公司的软扩展(微服务扩展是否有必要?)-CSDN博客SpringCloud(
【传输层协议】TCP协议详解（上）望舒_233 Linux网络 tcp/ip 网络服务器
前言TCP（TransmissionControlProtocol，传输控制协议）是TCP/IP协议栈中的核心协议，作为互联网通信的基石，承担着确保数据可靠传输的重要职责。接下来我将分两篇文章，从四个部分带大家学习一些与TCP相关的基本概念和机制，首先我将带大家认识一下TCP报头字段的含义，然后了解TCP保证可靠性的一些机制，接下来是TCP进行效率优化的机制，最后是TCP与应用层相关的概念。本篇文
我与DeepSeek读《大型网站技术架构》- 总结诺亚凹凸曼架构
文章目录读后感一、总结二、反思三、创新四、展望当代大型网站架构一、架构分层模型二、关键组件与技术选型三、架构演进策略四、架构突破口读后感一、总结架构演化优先于设计大型网站架构不是预先设计的产物，而是通过反复迭代和试错演化形成的。技术选型的核心动机是对业务需求的深刻理解，而非盲目模仿。典型案例包括淘宝架构因业务爆发力被迫转型为分布式系统。开放与协作的价值互联网的开放生态通过API经济（如淘宝Open
“统计视角看世界”专栏阅读引导赛卡统计视角看世界信息可视化数据分析
根据文章主题和逻辑关系，我为您设计以下阅读引导方案：1.六西格玛基础2.帕累托图3.直方图4.散点图基础5.散点图高阶6.多变量可视化7.密度图进阶8.回归分析配套文字说明：入门基石（必读）《1.六西格玛遇上Python》→方法论总纲，建议优先精读基础三剑客（可并行）├─《2.帕累托图》→重点数据排序与决策├─《3.直方图》→数据分布核心工具└─《4.散点图》→数据探索第一视角高阶应用链（递进学习
同时使用接口文档swagger和knife4j 黑taoA java 开发语言
项目场景：springboot项目中同时使用接口文档swagger和knife4j问题描述在实体类中设置了字段必填的属性，在访问接口文档时出现异常实体类关键代码片段/***部门表sys_dept*/publicclassSysDeptextendsBaseEntity{privatestaticfinallongserialVersionUID=1L;/**部门ID*/privateLongdep
Qt插件之自定义插件构建和使用码农飞飞 QT+QML qt 开发语言 ui 插件代码复用
文章目录定义插件的SDK编写自定义插件动态加载自定义插件分发SDK上一篇文章介绍了如何构建QtDesigner插件。其实插件化的这套机制QT是对外开放的，这里就介绍一下如何使用QT开发自定义插件。在开发自定义插件之前我们先定义插件的SDK。插件的SDK就是插件的接口描述，任何开发者开发的插件都应该实现对应的接口。同时只要实现了对应的接口的插件，就可以被集成到系统当中，这其实就是给自定义插件提供了一
QtQML Series - Qt中文乱码解决方案稳定的菜着 #&QT开发数据库 qt
目录系列文章目录前言1.main函数入口设置中文编码2.VisualStudio插件3.如果使用预编译头4.开启UTF-8支持4.1.pro文件4.2MSVC4.3GCC&Clang5.总结系列文章目录系列文章ReadMe前言中文乱码是Qt开发中的常态问题1.main函数入口设置中文编码intmain(){#includeQApplicationa(argc,argv);//设置中文字体a.set
【TypeScript学习】TypeScript基础学习总结二 JAMJAM_NoName typescript 学习前端
主要记录ts中的类、接口与泛型1.类无论是在哪种语言中，类都是面向对象编程(OOP)的一个主要实现方式。能够实现代码更加灵活，更具有结构化。类作用都是提供一个模板，通过类可以创建多个具有相同结构的对象。//类的定义，与对象的声明classStudent{id:stringname:stringage:numberconstructor(id:string,name:string,age:numbe
docker创建的mysql没有配置文件_使用docker安装mysql, redis, kafka等各类服务 Gyrolt
前言大致说来,docker的作用如下绝大部分应用，开发者都可以通过dockerbuild创建镜像，通过dockerpush上传镜像，用户通过dockerpull下载镜像，用dockerrun运行应用。用户不需要再去关心如何搭建环境，如何安装，如何解决不同发行版的库冲突——而且通常不会需要消耗更多的硬件资源，不会明显降低性能。也就是实现了标准化、集装箱如果想要简单使用,可以看答主的这一片文章:番茄番
从 Windows 共享到 Linux：Jenkins 代码部署方案调整 XMYX-0 windows linux jenkins
文章目录从Windows共享到Linux：Jenkins代码部署方案调整方案1：使用NFS（推荐）介绍特点适用场景在192.168.1.100上配置NFS安装NFS服务器创建共享目录修改NFS共享配置启动NFS并应用配置在controller服务器上挂载NFS安装NFS客户端手动挂载开机自动挂载方案2：使用Rsync（RemoteSync）同步文件介绍特点适用场景在controller服务器上安装
Kubernetes 资源管理实战：合理配置 CPU 与内存请求和限制 XMYX-0 K8S kubernetes 容器
文章目录Kubernetes资源管理实战：合理配置CPU与内存请求和限制理解Kubernetes中的资源请求与限制资源请求（Requests）资源限制（Limits）单位解析案例分析：20GB服务器与两个服务的内存配置是否有必要设置如此高的内存限制？如何合理配置？补充知识点：监控与自动扩缩容监控工具自动扩缩容（Autoscaling）总结Kubernetes资源管理实战：合理配置CPU与内存请求和
EasyRoad3D简易使用手册归海_一刀 Unity EasyRoad 道路 Unity
EasyRoad3D简易使用手册使用注意基础使用简单路面弯道衔接问题地形的起伏高低问题倾斜问题路面颠簸问题进阶问题EasyRoad3D简易使用手册使用注意EasyRoads3D可以简单了解为一款道路的建造插件，有免费版，Pro是付费版本。官网可以下载。版本的不同，可能会有一些差别，有些地方很大，有些地方很小。所以我只针对我自己的版本。具体的还是去看官方的英文文档。基础使用简单路面这是初始的面板。
C++中类的三种继承方式爱听雨声的北方汉轻轻松松学C++c++
关于public、protected、private三种继承方式的对比：1.类的一个特征就是封装，public和private作用就是实现这一目的。所以：用户代码（类外）可以访问public成员而不能访问private成员；private成员只能由类成员
github中多个平台共存 jackyrong github
在个人电脑上，如何分别链接比如oschina,github等库呢，一般教程之列的，默认 ssh链接一个托管的而已，下面讲解如何放两个文件 1）设置用户名和邮件地址 $ git config --global user.name "xx" $ git config --global user.email "[email protected]"
ip地址与整数的相互转换(javascript) alxw4616 JavaScript
//IP转成整型 function ip2int(ip){ var num = 0; ip = ip.split("."); num = Number(ip[0]) * 256 * 256 * 256 + Number(ip[1]) * 256 * 256 + Number(ip[2]) * 256 + Number(ip[3]); n
读书笔记-jquey+数据库+css chengxuyuancsdn html jquery oracle
1、grouping ,group by rollup, GROUP BY GROUPING SETS区别 2、$("#totalTable tbody>tr td:nth-child(" + i + ")").css({"width":tdWidth, "margin":"0px", &q
javaSE javaEE javaME == API下载 Array_06 java
oracle下载各种API文档： http://www.oracle.com/technetwork/java/embedded/javame/embed-me/documentation/javame-embedded-apis-2181154.html JavaSE文档： http://docs.oracle.com/javase/8/docs/api/ JavaEE文档： ht
shiro入门学习 cugfy java Web 框架
声明本文只适合初学者，本人也是刚接触而已，经过一段时间的研究小有收获，特来分享下希望和大家互相交流学习。首先配置我们的web.xml代码如下，固定格式，记死就成 <filter> <filter-name>shiroFilter</filter-name> &nbs
Array添加删除方法 357029540 js
刚才做项目前台删除数组的固定下标值时，删除得不是很完整，所以在网上查了下，发现一个不错的方法，也提供给需要的同学。 //给数组添加删除 Array.prototype.del = function(n){
navigation bar 更改颜色张亚雄 IO
今天郁闷了一下午，就因为objective-c默认语言是英文，我写的中文全是一些乱七八糟的样子，到不是乱码，但是，前两个自字是粗体，后两个字正常体，这可郁闷死我了，问了问大牛，人家告诉我说更改一下字体就好啦，比如改成黑体，哇塞，茅塞顿开。翻书看，发现，书上有介绍怎么更改表格中文字字体的，代码如下
unicode转换成中文 adminjun unicode 编码转换
在Java程序中总会出现\u6b22\u8fce\u63d0\u4ea4\u5fae\u535a\u641c\u7d22\u4f7f\u7528\u53cd\u9988\uff0c\u8bf7\u76f4\u63a5这个的字符，这是unicode编码，使用时有时候不会自动转换成中文就需要自己转换了使用下面的方法转换一下即可。 /** * unicode 转换成中文
一站式 Java Web 框架 firefly aijuans Java Web
Firefly是一个高性能一站式Web框架。涵盖了web开发的主要技术栈。包含Template engine、IOC、MVC framework、HTTP Server、Common tools、Log、Json parser等模块。 firefly-2.0_07修复了模版压缩对javascript单行注释的影响，并新增了自定义错误页面功能。更新日志：增加自定义系统错误页面功能
设计模式——单例模式 ayaoxinchao 设计模式
定义 Java中单例模式定义：“一个类有且仅有一个实例，并且自行实例化向整个系统提供。” 分析从定义中可以看出单例的要点有三个：一是某个类只能有一个实例；二是必须自行创建这个实例；三是必须自行向系统提供这个实例。 &nb
Javascript 多浏览器兼容性问题及解决方案 BigBird2012 JavaScript
不论是网站应用还是学习js,大家很注重ie与firefox等浏览器的兼容性问题，毕竟这两中浏览器是占了绝大多数。一、document.formName.item(”itemName”) 问题问题说明：IE下，可以使用 document.formName.item(”itemName”) 或 document.formName.elements ["elementName&quo
JUnit-4.11使用报java.lang.NoClassDefFoundError: org/hamcrest/SelfDescribing错误 bijian1013 junit4.11 单元测试
下载了最新的JUnit版本，是4.11，结果尝试使用发现总是报java.lang.NoClassDefFoundError: org/hamcrest/SelfDescribing这样的错误，上网查了一下，一般的解决方案是，换一个低一点的版本就好了。还有人说，是缺少hamcrest的包。去官网看了一下，如下发现：
[Zookeeper学习笔记之二]Zookeeper部署脚本 bit1129 zookeeper
Zookeeper伪分布式安装脚本(此脚本在一台机器上创建Zookeeper三个进程，即创建具有三个节点的Zookeeper集群。这个脚本和zookeeper的tar包放在同一个目录下，脚本中指定的名字是zookeeper的3.4.6版本，需要根据实际情况修改)： #!/bin/bash #!!!Change the name!!! #The zookeepe
【Spark八十】Spark RDD API二 bit1129 spark
coGroup package spark.examples.rddapi import org.apache.spark.{SparkConf, SparkContext} import org.apache.spark.SparkContext._ object CoGroupTest_05 { def main(args: Array[String]) { v
Linux中编译apache服务器modules文件夹缺少模块(.so)的问题 ronin47 modules
在modules目录中只有httpd.exp，那些so文件呢？我尝试在fedora core 3中安装apache 2. 当我解压了apache 2.0.54后使用configure工具并且加入了 --enable-so 或者 --enable-modules=so (两个我都试过了) 去make并且make install了。我希望在/apache2/modules/目录里有各种模块，
Java基础-克隆 BrokenDreams java基础
Java中怎么拷贝一个对象呢？可以通过调用这个对象类型的构造器构造一个新对象，然后将要拷贝对象的属性设置到新对象里面。Java中也有另一种不通过构造器来拷贝对象的方式，这种方式称为克隆。 Java提供了java.lang.
读《研磨设计模式》-代码笔记-适配器模式-Adapter bylijinnan java 设计模式
声明：本文只为方便我个人查阅和理解，详细的分析以及源代码请移步原作者的博客http://chjavach.iteye.com/ package design.pattern; /* * 适配器模式解决的主要问题是，现有的方法接口与客户要求的方法接口不一致 * 可以这样想，我们要写这样一个类（Adapter）: * 1.这个类要符合客户的要求 ---> 那显然要
HDR图像PS教程集锦&心得 cherishLC PS
HDR是指高动态范围的图像，主要原理为提高图像的局部对比度。软件有photomatix和nik hdr efex。一、教程叶明在知乎上的回答： http://www.zhihu.com/question/27418267/answer/37317792 大意是修完后直方图最好是等值直方图，方法是HDR软件调一遍，再结合不透明度和蒙版细调。二、心得 1、去除阴影部分的
maven-3.3.3 mvn archetype 列表 crabdave ArcheType
maven-3.3.3 mvn archetype 列表可以参考最新的：http://repo1.maven.org/maven2/archetype-catalog.xml [INFO] Scanning for projects... [INFO]
linux shell 中文件编码查看及转换方法 daizj shell 中文乱码 vim 文件编码
一、查看文件编码。在打开文件的时候输入:set fileencoding 即可显示文件编码格式。二、文件编码转换 1、在Vim中直接进行转换文件编码,比如将一个文件转换成utf-8格式 &
MySQL--binlog日志恢复数据 dcj3sjt126com binlog
恢复数据的重要命令如下 mysql> flush logs; 默认的日志是mysql-bin.000001，现在刷新了重新开启一个就多了一个mysql-bin.000002
数据库中数据表数据迁移方法 dcj3sjt126com sql
刚开始想想好像挺麻烦的，后来找到一种方法了，就SQL中的 INSERT 语句，不过内容是现从另外的表中查出来的，其实就是 MySQL中INSERT INTO SELECT的使用下面看看如何使用语法：MySQL中INSERT INTO SELECT的使用 1. 语法介绍有三张表a、b、c，现在需要从表b
Java反转字符串 dyy_gusi java 反转字符串
前几天看见一篇文章，说使用Java能用几种方式反转一个字符串。首先要明白什么叫反转字符串，就是将一个字符串到过来啦，比如"倒过来念的是小狗"反转过来就是”狗小是的念来过倒“。接下来就把自己能想到的所有方式记录下来了。 1、第一个念头就是直接使用String类的反转方法，对不起，这样是不行的，因为Stri
UI设计中我们为什么需要设计动效 gcq511120594 UI linux
随着国际大品牌苹果和谷歌的引领，最近越来越多的国内公司开始关注动效设计了，越来越多的团队已经意识到动效在产品用户体验中的重要性了，更多的UI设计师们也开始投身动效设计领域。但是说到底，我们到底为什么需要动效设计？或者说我们到底需要什么样的动效？做动效设计也有段时间了，于是尝试用一些案例，从产品本身出发来说说我所思考的动效设计。一、加强体验舒适度嗯，就是让用户更加爽更加爽的用
JBOSS服务部署端口冲突问题 HogwartsRow java 应用服务器 jboss server EJB3
服务端口冲突问题的解决方法，一般修改如下三个文件中的部分端口就可以了。 1、jboss5/server/default/conf/bindingservice.beans/META-INF/bindings-jboss-beans.xml 2、./server/default/deploy/jbossweb.sar/server.xml 3、.
第三章 Redis/SSDB+Twemproxy安装与使用 jinnianshilongnian ssdb reids twemproxy
目前对于互联网公司不使用Redis的很少，Redis不仅仅可以作为key-value缓存，而且提供了丰富的数据结果如set、list、map等，可以实现很多复杂的功能；但是Redis本身主要用作内存缓存，不适合做持久化存储，因此目前有如SSDB、ARDB等，还有如京东的JIMDB，它们都支持Redis协议，可以支持Redis客户端直接访问；而这些持久化存储大多数使用了如LevelDB、RocksD
ZooKeeper原理及使用 liyonghui160com
ZooKeeper是Hadoop Ecosystem中非常重要的组件，它的主要功能是为分布式系统提供一致性协调(Coordination)服务，与之对应的Google的类似服务叫Chubby。今天这篇文章分为三个部分来介绍ZooKeeper，第一部分介绍ZooKeeper的基本原理，第二部分介绍ZooKeeper
程序员解决问题的60个策略 pda158 框架工作单元测试
根本的指导方针 1. 首先写代码的时候最好不要有缺陷。最好的修复方法就是让 bug 胎死腹中。良好的单元测试强制数据库约束使用输入验证框架避免未实现的“else”条件在应用到主程序之前知道如何在孤立的情况下使用日志 2. print 语句。往往额外输出个一两行将有助于隔离问题。 3. 切换至详细的日志记录。详细的日
Create the Google Play Account sillycat Google
Create the Google Play Account Having a Google account, pay 25$, then you get your google developer account. References: http://developer.android.com/distribute/googleplay/start.html https://p
JSP三大指令 vikingwei jsp
JSP三大指令一个jsp页面中，可以有0~N个指令的定义！ 1. page --> 最复杂：<%@page language="java" info="xxx"...%> * pageEncoding和contentType： > pageEncoding：它