江南才尽，年少无知！

姿态估计2-03：PVNet(6D姿态估计)-白话给你讲论文-翻译无死角（1）

以下链接是个人关于PVNet(6D姿态估计) 所有见解，如有错误欢迎大家指出，我会第一时间纠正。有兴趣的朋友可以加微信：a944284742相互讨论技术。若是帮助到了你什么，一定要记得点赞！因为这是对我最大的鼓励。
姿态估计2-00：PVNet(6D姿态估计)-目录-史上最新无死角讲解
本论文名为：
PVNet: Pixel-wise Voting Network for 6DoF Pose Estimation（CVPR 2019 oral）
话不多说，本人直接开始翻译了

Abstract

该论文主要提出一种，从单张RGB图像估算目标物体（遮挡或者截断情况下）的6D姿态。目前很多的方式都是使用两阶段的算法，首先是检测物体的关键点，然后利用Perspective-n-Point (PnP-目标姿态估算) 估算其6D姿态。然而，这些方法大多只通过回归它们的图像坐标或热图来定位一组稀疏的关键点。所以对于目标物体遮挡或者截断情况下的鲁棒性是非常差的，然而我们提出了Pixel-wise Voting Network (PVNet) 算法回归指向关键点的矢量（像素级别），并且利用这些方向矢量基于RANSAC（随机森林）对关键点进行投票选举，这为锁定或截断的关键点创建了一个灵活的表示法。这种表示法的另一个重要特征是它提供了关键点位置的不确定性，这可以被PnP求解器进一步利用。实验证明，我们的算法在LINEMOD，Occlusion LINEMOD 以及 YCBVideo datasets 等数据集上达到了目前最好的效果。

1. Introduction

物体姿态估算是为了检测物体，并且估算他们的旋转以及偏移矩阵。很多应用都建立在准确的姿态估算上面，如虚拟现实增强，自动驾驶，机器人抓取等。本文重点研究了恢复物体六自由度位姿的具体过程，如从单张RGB图像估算目标物体3D的rotation，translation。这个问题从很多方面来看都很具有挑战性，如严重遮挡，照明和外观变化，混乱背景情况的目标检测。
传统的方法通过建立目标图像和目标模型之间的对应关系可以实现位姿估计，他们依赖于手工提取特征，其对图片发生变化，或者背景凌乱的鲁棒性是很差的。使用深度学习的方法，通过端到端的训练进行特征提取，输入一张图像，获得目标物体对应的姿态。然而，泛化仍然是一个问题，因为不清楚这种端到端方法是否学习了足够的特征表示来进行姿态估计。
有的一些算法，首先利用CNN去回归2D keypoints，然后通过 Perspective-n-Point (PnP)计算 6D姿态参数，换句话说，检测关键点为姿态估算的一个中间步骤，这种两截断的方法达到了目前最先进的效果，多亏了关键点的鲁棒检测。然而，这些方法在处理遮挡和截断目标时存在困难，尽管cnn可以通过记忆相似的模式来预测这些看不见的关键点,但是算法的泛化是很困难的。
们认为解决遮挡和截断需要密集的预测，也就是对最终输出或中间表示的 pixel-wise 或 patch-wise 估计。为此，我们提出了一个新的框架使用像素级投票网络的6D位姿估计(PVNet)，其基本实现如Figure 1所示：
Figure 1

图解：将6D位姿估计问题表述为Perspective-n-Point (PnP)的问题，需要2D和3D关键点的对应，如上的插图(d) and (e)，我们对每个像素都预测其指向关键点的 vectors（如图b所示），并在基于RANSACbased的投票方案中定位2D关键点（如图c所示）。提出的这种方法对于occlusion（如图g-遮挡），truncation (如图h-截断)的鲁棒性是很好的，绿色的边界盒代表地面真相的姿势蓝色的边界盒代表我们的预测。

我们并不是直接回归图像的关键点，PVNet预测的Vectors每个像素趋向目标各个关键点的方向，最后基于Vectors对关键点的位置进行投票，这个投票方案是由刚性物体的一种特性激发的，一旦我们看到一些局部部分，我们就能够推断出相对于其他部分的方向，
我们的方法本质上是为关键点定位创建一个矢量场表示，与基于坐标或热图的表示相反，学习这样种表示方式会使网络专注于物体的局部特征和物体各部分之间的空间关系，因此，因此物体的不可视部分，可以从物体的可是部分推算出来。另外， vector-field 是有能力去便是输入图像之外的关键点的。所有这些优点使它能较好的表示遮挡或者截断的对象，Xiang 等人，提出了一个类似的方法来检测目标，在这里我们使用它来定位关键点。
该方法的另一个优点是稠密的输出，为PnP求解器提供了丰富的信息来处理不准确的关键点预测。具体来说，基于RANSAC的投票抹去了局外人的预测，并给出了每个关键点的空间概率分布，这种关键点位置的不确定性，为PnP求解提供了更多的自由空间，去自主最终位姿，实验表明，不确定性驱动PnP算法提高了位姿估计的精度。
我们在 LINEMOD，Occlusion LINEMOD，YCB-Video等数据集上评估了我们的算法，这些都是6D姿态估计中广泛使用的基准数据集，通过这些数据集，PVNet展现了最先进的性能，我们还演示了我们的方法在名为Truncation LINEMOD的新数据集中处理截断对象的能力，该数据是由随机裁剪LINEMOD的图像生成。另外我们的算法，效率也是比较高的。在GTX 1080ti GPU能达到 25 fps ，其可以实时的进行姿态估算。该篇论文的提出，主要做了如下贡献：
1.我们提出了新异的目标检测框架PVNet，其是基于像素级别的投票网络。主要是学习能够代表关键点的 vector-field ，其对遮挡或者截断对象的鲁棒性是很好的。
2.基于PVNet的密集预测，我们提出利用不确定性驱动的PnP算法来解释二维关键点定位中的不确定性。
3.在多个数据集上已经证明我们的算法是是否优越的，同时创建了一个新的数据集。

2. Related work

Holistic methods. 在给定一幅图像的情况下，一些方法的目的是在单镜头下估计物体的三维位置和方向，传统的方法主要依靠模板匹配技术，哪些对杂乱的环境和外观变化很敏感。最近，CNN对于环境外貌的改变展现出了很大的鲁棒性，作为一个先锋，PoseNet 介绍了使用CNN从单张图像RGB图像直接回归目标的 6D camera pose，但是，由于缺乏深度信息，直接在3D中定位对象是困难的，因为这是一个很大的空间。为了解决这个问题，PoseCNN对二维图像中的物体进行定位，并预测其深度，从而获得三维位置。然而，直接估计三维旋转也是困难的，由于旋转空间的非线性，使得CNNs的推广性较差。为了避免这种麻烦，将旋转空间离散化，将三维旋转估计转化为分类任务，这样的离散化会产生一个粗糙的结果，而后细化对于获得准确的6自由度姿态是至关重要的。

Keypoint-based methods. 基于关键的方法，其不是直接中一张图像获得姿态，其实使用了二截断的方式，其首先是获得2D关键点位置，然后通过PnP算法求解2D到3D之间坐标的对应关系。2D关键点的检测比3D定位以及旋转矩阵的估算是更加简单的。对于纹理丰富的对象，传统的方法对局部关键点的检测鲁棒性是很好的，从而有效、准确地估计出目标的姿态，即使在杂乱的场景和严重的遮挡下。然而传统的方法很难处理低纹理的目标以及低分辨率的图像。为了解决这个问题，最近的研究定义了一组语义关键点，并使用cnn作为关键点检测器，利用分割确定目标在图像的区域，并且对该区域进行关键点回归。使用YOLO架构来估计对象关键点，该网络的预测是基于低分辨率的特征图。当发生干扰时，如遮挡情况下姿态估算的准确率是很低的。受到2D人体姿态估以及其他算法的启发，输出关键点的像素级热图来解决遮挡问题。然而关键点热图是固定大小的，所以其是很难处理截断（关键点在图片的外面）情况，相比之下，我们的方法使用更灵活的表示法对二维关键点进行像素预测，比如 vector field，关键点的定位是通过他们进行投票决定的。
Dense methods. 在这种方法中，对每个 pixel 或者 patch 进行预测，然后使用 Hough voting
scheme 进行投票处理。使用随机森林预测三维对象坐标为每个像素，并产生二维到三维对应假设使用几何约束。总的来说使用CNN提取特征，用于最后的投票。然而这种方法需要RGB-D图像，使用自动上下文回归框架生成3D对象坐标的像素分布，相对于稀疏的关键点，为姿态估计提供了密集的2D-3D对应信息，对于遮挡物体的鲁棒性更加强。但是回归物体的3D坐标是比回归关键困难很多的。
我们的方法对关键点定位进行了密集预测。它结合了两种方法的优点，是一种基于关键点的密集方法

3. Proposed approach

在这篇论文中，我们提出一种新异的6D姿态估算框架，输入一张RGB图像，检测目标并且同时估算其6D姿态。其中，6D位姿(R;t)从物体坐标系到摄像机坐标系变换而来。R表示三维旋转，t表示三维平移。
受到最近一些方法的启发，我们使用两阶段的方法进行姿态评估：我们首先利用CNN检测2D关键点，然后使用PnP算法计算其姿态。我们的创新之处在于提出了一种新的二维目标关键点表示和改进的PnP位姿估计算法。我们的方法使用像素级的投票网络(PVNet)以类似搜查的方式检测2D关键点，其对于目标遮挡或者截断的鲁棒性是很强的。基于RANSAC的投票机制，给出每个关键点的概率分布。使得我们可以用不确定驱动的PnP来估计6D的姿态

3.1. Voting-based keypoint localization

Figure 2概括呢关键定位的处理过程，输入一张RGB图像，PVNet预测每个像素的类别标签以及unit vectors。unit vectors代表了其趋向于关键点的方向。给定从属于该对象的所有像素到某个对象关键点的方向，我们为该关键点生成2D位置进行假设，然后根据置信分数使用RANSAC-based投票。我们评估每个关键点空间概率分布的均值与协方差。
与直接从图像部分进行关键点回归的明显差异。对每个像素进行方向预测，强制网络更加关注局部信息，去减少遮挡或者混乱背景的干扰。另外一个优势就是，该方式有能力代表遮挡或者处于图像之外的关键点。甚至一些不可见的关键点，通过可见的部分也能预测出来。
更加具体的说明，PVNet 执行两个任务，分别是语义分割以及 vector-field 的预测。针对于每个 pixel $P$ ，PVNet输出目标对应目标的语义标签，以及 unit vector $V_k(P)$ , $V_k(P)$ 代表了每个像素趋向于2D关键点 $X_K$ 的方向， $V_k(P)$ 的定义如下：
$V_k(P) = \frac {X_k-P}{||X_{k}-P||_2}$
给去语义分割的标签 mask 以及unit vectors，我们基于RANSAC策略去生成假设的关键点。首先使用语义分割的标签获得目标物体的相关像素，随机选择一对像素的vector，把他们的交叉点看作为关键点 $h_k$ ,例如针对于关键点 $X_k$ ,随机选取成对vector操作重复N次，这样我们就获得一个关键点假设集合 ${h_{k,i}|i=1,2,3......,N\}$ ，其表示的是关键点可能所在位置，最后，对象的所有像素都对这些假设进行投票，具体而言，假设 $h_{k,i}$ 的投票分数 $w_{k,i}$ 定义为
$w_{k,i}=\sum_{p \in O} \Pi (\frac {(h_{k,i}-P)^T}{||h_{k,i}-P||_2}V_k(P) \geq θ)$
其中的 $\Pi$ 表示指示函数， $θ$ 表示阈值（实验中全部使用0.99）， $\in O$ 意味着像素 $P$ 属于目标物体 $O$ ,直观的来说，更高的投票分数意味着一个假设更有信心，因为它与更多预测的方向一致。
由此产生的假设代表了图像中一个关键点的空间概率分布，如下图Figure 2中的 e 图：
Figure 2

e图是一个代表的例子，对于关键点 $X_k$ 均值 $u_k$ 与协方差 $\sum_k$ 的估算如下：
$u_k = \frac {\sum_{i=1}^N w_{k,i}h_k}{\sum_{i=1}^Nw_{k,i}}$

$\sum_k = \frac{\sum_{i=1}^Nw_{k,i}(h_{k,i}-{u_k})(h_{k,i}-u_k)^T}{\sum^N_{i=1}w_{k,i}}$
在第3.2节中描述的不确定性驱动的PnP使用哪些。

Keypoint selection. 需要根据三维对象模型定义关键点，最近的很多算法，使用 3D bounding box 的8个顶点当作关键点，一个例子如下图Figure 3(a)：

图中的 a，可与看到每个顶点的坐标都是远离目标物体的，距离目标像素越远，定位误差就越大，因为关键点假设是用从目标像素开始的向量生成的。图Figure 3中的 b和 c 显示物体表面上选择的边框顶点和关键点的假设，他们都由PVNet网络生成，在定位过程中，物体表面的关键点通常具有较小的变化。
因此，对于关键点的选择，我们是选取物体表面的关键代理，而不是长方体边框的顶点。同时，这些关键点要分散在目标上，使PnP算法更加稳定。考虑到两个需求，我们使用 farthest point sampling (FPS) 算法选取 $K$ 个关键点，我们通过添加对象中心来初始化关键点设置，然后我们重复的在物体表面选择关键点，哪个距离当前关键点集最远，然后把它加到集合中，直到集合的大小达到 $K$ 。实证结果见第5.3节,表明使用这种方法，更加由于使用长方体边框的顶点作为关键点。我们对不同数目的关键点进行测试，考虑到效率和准确率的问题，我们建议是最好是选取 $K$ = 8。

Multiple instances.
基于该策略，我们的方法可以处理多个实例, 使用我们提出的投票方案生成对象中心及其投票分数的假设, 最后后，我们在假设中找出模型，并将这些模型标记为不同实例的中心。最后，通过将像素分配到他们投票选择的最近的实例中心来获得实例掩码（这段不太会翻译，不知道modes表示什么）

3.2. Uncertainty-driven PnP

获得目标对象的2D关键位置后，可以使用 PnP 算法求解6d姿态。如之前很多的算法采用EPnP，但是他们忽略每个关键点的置信度是由差异的，存在不确定性，在使用PnP进行求解的时候，我们应该考虑到这些问题。
如第3.1节所述，我们的投票机制，出来的结果是每个关键的对应的概率分布，对于每个关键点的评估标准，是计算他们的均值 $u_k$ 以及协方差 $\sum_k=1,2,3,...k$ ,通过最小化Mahalanobis distance 计算6D姿态估算pose (R,t)。
$minimize_{R,T} \sum_{k=1}^k((\overline X_k-u_k)^T\sum_k^{-1}(\overline X_k-u_k))$ $\overline X_k = \pi(RX_k + t)$
这里的 $X_k$ 代表关键点的3D坐标， $\overline X_k$ 是 3D $X_k$ 的 2D 映射，EPnP算法根据四个关键点对参数R和t进行初始化，其协方差矩阵轨迹最小。然后利用LevenbergMarquardt算法求解，在其他的一些工作中还通过最小化逼近值来考虑特征的不确定性Sampson错误，在我们的方法中，我们直接最小化重投影误差。

4. Implementation details

假设存在C类物体，每个物体的关键点数目为K个，PVNet 输入要求为 $\times W \times 3$ 的图像，用一个完全卷积的架构处理它。输出 $\times W \times (K \times 2 \times C)$ 的unit vectors， $H \times W \times (C + 1)$ 的类别概率，我们使用预训练好的ResNet-18 模型作为主干网络，我们对其作了三次修改：
1.当网络的feature map的大小为 $H = 8 \times W = 8$ 时，我们不再通过丢弃后续的pooling层对feature map进行downsample
2.为了保持接收域不变，用合适的扩张的卷积替换后续的卷积
3.将原ResNet-18中全连接层替换为卷积层
然后在feature map上反复进行跳跃连接、卷积和上采样,直到其输出 $H x W$ 的特征图为止，展示如之前的贴图Figure 2，在最终的feature map上进行1×1的卷积，我们得到了单位向量和类概率。
我们使用CUDA实现假设生成、像素级投票和密度估计，用于初始化姿态的EPnP在OpenCV中实现，为了得到最终的位姿，我们使用迭代求解器Ceres去最小化Mahalanobis distance。对于对称对象，关键点位置存在歧义，为了消除歧义，我们在训练中将对称对象旋转到一个标准姿势。

4.1. Training strategy

我们使用平滑 $\varphi ~loss$ 去学习unit vectors，其 $l o s s$ 函数被定义如下：
$\varphi (w)=\sum_{k=1}^{k}\sum_{p \in O} \varphi(\Delta v_k(p;w)|_x)+\varphi(\Delta v_k(p:w)|_y)$ $\Delta v_k(p;w)= \overline v_k(p;w)-v_k(p)$

其上的 $w$ 代表 PVNet 的网络参数， $\overline v$ 表示预测的unit vector， $v_k$ 表示 ground truth unit vector， $\Delta v_k|_x$ 与 $\Delta v_k|_y$ 表示 $\Delta v$ 的两个元素。对于训练语义分割的标签，使用的是softmax cross-entropy，值得注意的是，我们不需要预测的向量单位的具体值，因为后续的处理只使用向量的方向。
为了防止过拟合，添加了合成的数据到训练集之中，对于每个对象，我们渲染10000张视点一致采样的图像，们进一步使用“剪切粘贴”策略合成了另外10000张图像，每张图片的背景都是从SUN397数据集中随机选取的，我们还应用了在线数据增加，包括随机裁剪，在训练中调整大小，旋转和颜色抖动等。我们将初始学习率设置为0.001，并每20个epoch将其减半。所有的模型都训练了200个epoch

结语

到这里，该篇论文的重点可以说是翻译完成了，下篇博客继续为大家翻译剩余的部分

halcon几何测量(一)3d_position_of_rectangle mm_exploration 计算机视觉 halcon 图像处理
目录一、提取目标区域，选择不和边缘相交的目标二、计算矩形工件的姿态三、显示矩形的立体结构一、提取目标区域，选择不和边缘相交的目标1、提取目标区域：mean_image、dyn_threshold、fill_up、connection、select_shape2、选择不和边缘相交的目标：intersection、area_center、select_mask_objread_image(Image,
Python 的 ultralytics 库详解白.夜人工智能
ultralytics是一个专注于计算机视觉任务的Python库，尤其以YOLO（YouOnlyLookOnce）系列模型为核心，提供了简单易用的接口，支持目标检测、实例分割、姿态估计等任务。本文将详细介绍ultralytics库的功能、安装方法、核心模块以及使用示例。1.ultralytics库简介ultralytics库由Ultralytics团队开发，旨在为YOLO系列模型提供高效、灵活且易
大模型时代的知识焦虑机载软件与适航机器学习-建模算法-代理模型人工智能大数据
引言：浪潮之巅，焦虑暗涌大模型时代已经浩荡而来，如同奔腾的浪潮，以令人惊叹的速度重塑着世界的面貌。从智能客服的温声细语，到AI绘画的妙笔生花，再到自动驾驶的日趋成熟，大型语言模型、图像模型等人工智能技术以前所未有的姿态，渗透进我们生活的方方面面。信息获取前所未有的便捷，知识创造空前高效，人机交互焕然一新，一个充满无限可能的智能化未来似乎触手可及。然而，在这令人眼花缭乱的技术盛景之下，一股无形的焦虑
达梦数据库统计信息详解 Megamind_cx 达梦数据库运维
达梦数据库查询优化器采用基于代价的计算方法。在优化器估算查询代价时，也是以统计信息或者普遍的数据分布为主要依据的，这跟Oracle数据库基于成本的优化器原理是类似的。所以，统计信息在达梦数据库优化中，是至关重要的。例如统计信息缺失，或统计信息陈旧，或抽样数据不能很好地反映数据分布时，优化器选择的执行计划不是“最优”的，甚至可能是很差的执行计划，就会引起严重的数据库性能问题，甚至导致数据库服务器夯死
GitHub Copilot两期连看：开发流程全览及 Copilot 在 SQL 开发中的妙用 microsqlgithub
GitHubCopilot，这款备受瞩目的AI开发助手，正以前所未有的姿态重塑开发流程。而现在，专为开发者和技术团队精心打造的GitHubCopilotFridays系列课程，正持续为大家解锁Copilot的无限潜能。今天，我们迎来了第五期和第六期课程，这将是两场不容错过的技术盛宴，深度探索Copilot在更多复杂场景、特定角色工作流中的卓越应用，准备好与我们一同深入挖掘其中的奥秘了吗？GitHu
一文让你详细理解Qualcomm WLAN Roaming机制：连载2 思考的下一页 #Wi-Fi Roaming Roaming Wi-Fi Qualcomm
1.基于PER的漫游及BSS负载元素的使用通过监控Rx/Tx的MCS速率触发漫游扫描基于数据包错误率（PER）的漫游扫描机制用于将STA（站点）从拥塞信道迁移至更优候选信道。漫游扫描的触发条件基于当前使用的接收（Rx）和发送（Tx）数据速率。发送速率间接反映STA观测到的PER值，而接收速率则用于估算AP（接入点）观测到的PER值。当接收和发送数据速率低于20Mbps（可配置）时，固件开始监控Rx
从“参数竞赛”到“行动革命”：Manus与DeepSeek背后的中国AI范式之争 AWS官方合作商人工智能 AI deepseek Manus
引言：当中国AI开始定义游戏规则在OpenAI用ChatGPT掀起全球AI浪潮的两年后，中国科技企业正以两种截然不同的姿势重新书写竞争剧本——DeepSeek用671亿参数的R1模型震撼硅谷，而Manus则以“数字打工人”的姿态突破AI代理的想象边界。这不仅是技术的较量，更是中国AI产业对西方话语体系的颠覆性回应。本文将用技术现实主义视角，解剖这场“参数狂魔”与“行动派”的角力真相一、DeepSe
AI 革命再提速：从 Manus 封停到 OpenAI 开源，技术竞赛与伦理博弈下的产业变局 zhz5214 AI 人工智能开源智能体 ai AI编程 AI写作
2025年3月，人工智能领域迎来戏剧性转折。继DeepSeek以开源策略搅动市场后，新兴AI公司Manus的官方X账号因涉嫌关联加密货币诈骗被平台封禁，引发轩然大波。而在封禁事件发酵不到一周，OpenAI连夜发布AgentSDK与ResponsesAPI，以开源姿态强势回应。这场技术竞赛与伦理博弈交织的产业变局，正将AI革命推向新的临界点。一、技术突围与平台博弈：Manus事件的双重隐喻Manus
关于PLC、电缆线材及气缸选型的详细教程自动化专业爱好者网络
以下是关于PLC、电缆线材及气缸选型的详细教程，整合了多个专业来源的核心要点：一、PLC选型要点生产厂家选择日系PLC（如三菱FX系列、欧姆龙CP1系列）适合独立设备或简单控制系统，性价比高。欧美系PLC（如西门子S7-1200/1500系列）适用于大型分布式系统或需复杂通信的场景（如工业以太网）。特殊行业（如冶金、烟草）需选择有行业成熟案例的PLC品牌。I/O点数估算统计所有输入/输出信号（如传
Web3.0 从入门到实战：一站式开发指南七七知享 Web web3 html5 javascript 区块链网络安全安全 web安全
在科技浪潮持续翻涌的当下，Web3.0作为互联网发展的全新篇章，正以前所未有的姿态重塑数字世界格局。从去中心化应用（DApps）蓬勃兴起，到区块链技术成为底层支撑架构，Web3.0开启了一个用户真正掌控数据、价值自由流通的崭新时代。对于怀揣探索精神的开发者而言，投身Web3.0领域，不仅意味着解锁全新技术栈，更能参与塑造互联网的未来形态。本文精心打造了一套从理论基石铺陈，到实战项目落地的Web3.
TPAMI 2025 | Glissando-Net: 基于单视图的类别级姿态估计与3D重建小白学视觉论文解读 IEEE TPAMI 3d 深度学习论文解读顶刊论文 IEEE TPAMI
论文信息Glissando-Net:DeepSinglevIewCategoryLevelPoseeStimationANd3DReconstructionGlissando-Net:基于单视图的类别级姿态估计与3D重建作者：BoSun;HaoKang;LiGuan;HaoxiangLi;PhilipposMordohai;GangHua论文创新点联合估计3D形状和6D姿态：Glissando-N
欧拉角的，万向锁---和---奇点，的数学解释 Zwc 1 飞行器无人机
效果演示部分（注意，欧拉旋转的三个转动参数，是从初始位置开始然后按照顺序的转动再到达最终姿态，而不是在现有姿态上进行绕自己某个轴来转动）如下动图所示，在欧拉旋转中（真笛卡尔坐标系中，围绕自身坐标轴的有固定旋转的顺序），当某个轴旋转90度时候，不管怎么给另外两个旋转轴数值，产生的效果都只是能围绕某个轴进行转动。这样的话相当于两个轴合并成了一个轴（两个系数合并成一个系数）（这就是所谓的损失了一个自由度
全国计算机一级考试理论题第十套,2012年计算机一级B第十套选择题精选及参考答案... 孕产训导师单sir 全国计算机一级考试理论题第十套
【第十套】(1)在目前为止，微型计算机经历了几个阶段？A)8B)7C)6D)5(2)计算机辅助设计简称是？A)CAMB)CADC)CATD)CAI(3)二进制数11000000对应的十进制数是？A)384B)192C)96D)320(4)下列4种不同数制表示的数中，数值最大的一个是？A)八进制数110B)十进制数71C)十六进制数4AD)二进制数1001001(5)为了避免混淆，十六进制数在书写时
结合大语言模型的机械臂抓取操作学习 roman_fan 机器人人工智能语言模型机器人
一、大语言模型的机械臂抓取操作关键步骤介绍如何基于大语言模型实现机械臂在PyBullet环境中的抓取操作，涵盖机器人运动学、坐标系转换、抓取候选位姿生成、开放词汇检测以及大语言模型代码生成等模块。1.机器人正逆运动学基本概念正运动学:已知机器人的关节角度，计算机器人末端执行器在空间中的位姿（位置和姿态）。逆运动学:已知机器人末端执行器在空间中的目标位姿，计算机器人各关节角度使其达到目标位姿。在Py
旋翼机自主着陆-主要技术难点兜兜有糖_DC 位姿测量无人机智能控制 UAV landing 自动计算机视觉深度学习算法
搜索阶段:远距离：目标为几个像素，并且淹没在环境里完全没有任何目标或目标偶尔出现，如何进行导航中远距离目标部分容易被遮挡，如何进行目标检测在光线条件较差的环境下，目标检测出现误判和无法工作的情况近距离目标在视场中占据较大部分，飞机的剧烈姿态变换容易引起目标丢失受到飞机震动和相机抖动限制，特征点提取误差较大，位姿解算精度不高当前解决方案：1.依靠GPS、RTK等设备进行目标追踪存在与目标的通信特定的
MPU6050 卡尔曼滤波算法四元数欧拉姿态解算 STM32 CubeMX HAL库 MDKkeil5 零基础移植辛尘大海算法 stm32 嵌入式硬件
文章目录一、在cubemx开启IIC并设置好对应的IIC引脚二、generatecode生成代码三、复制以下的全部代码新建分别保存放到IncSrc文件夹中1.MPU6050.h2.MPU6050.C四、如何使用总结一、在cubemx开启IIC并设置好对应的IIC引脚二、generatecode生成代码（记得生成单个c.h.文件）！！！！！！三、复制以下的全部代码新建分别保存放到IncSrc文件夹中
卡尔曼滤波算法从理论到实践：在STM32中的嵌入式实现 DOMINICHZL STM32 算法 stm32 嵌入式硬件
摘要：卡尔曼滤波（KalmanFilter）是传感器数据融合领域的经典算法，在姿态解算、导航定位等嵌入式场景中广泛应用。本文将从公式推导、代码实现、参数调试三个维度深入解析卡尔曼滤波，并给出基于STM32硬件的完整工程案例。一、卡尔曼滤波核心思想1.1什么是卡尔曼滤波？卡尔曼滤波是一种最优递归估计算法，通过融合预测值（系统模型）与观测值（传感器数据），在噪声干扰环境下实现对系统状态的动态估计。其核
benchmark和baseline的联系与区别 Lntano__y 人工智能深度学习机器学习
在深度学习算法中，benchmark（基准）和baseline（基线）是两个常用的概念，用于评估算法的性能和进行比较。尽管它们有一些相似之处，但它们在定义和使用上有一些区别。Benchmark（基准）：基准是指作为参考标准的一组算法或数据集，通常是在特定任务或领域中广泛接受的准则。基准的目标是提供一个衡量算法性能的标准，以便其他算法可以与之进行比较。基准可以是一种算法、一个数据集或者是两者的结合。
EDPose：探讨端到端的实时多人姿态估计烧技湾 AI &Computer Vision HPE 人体姿态估计端到端检测
作者：曾爱玲（港中文博士，现已入职腾讯）单位：IDEA（深圳数字经济研究院）源码：github/ED-Pose该篇论文取得效果如下：这篇文章的优势在于：在复杂的多人场景下能够取得不错的性能提升，虽然在COCO等数据集上的提升不明显。这种端到端的方法，优势在于检测到人体是检测到关键点的一个保证。目录摘要一、介绍二、相关工作2.1.单阶段多人姿态估计2.2检测变压器：三、重新思考单阶段多人姿态估计3.
使用OpenCV和MediaPipe库——驼背检测（姿态监控） WenJGo AI学习之路 Python之路 opencv 人工智能计算机视觉算法 python numpy
目录驼背检测的运用1.驾驶姿态与疲劳关联分析2.行业应用案例1.教育场景痛点分析2.智能教室系统架构代码实现思路1.初始化与配置2.MediaPipe和摄像头设置3.主循环4.资源释放RGB与BGR的区别一、本质区别二、OpenCV的特殊性内存结构示意图：三、转换必要性分析转换流程图示：四、常见问题场景五、性能优化建议六、底层原理七、验证实验八、现代发展趋势整体代码效果展示驼背检测的运用1.驾驶姿
hbase集群archive目录过大问题处理 spring208208 大数据组件线上问题分析 hbase 数据库大数据
1.问题现象现场反馈hbase集群/hbase/archive目录过大，大小约为1.52PB现场集群已经清理掉2个月以前的snapshot文件，当前archive目录文件仍不能释放现场发现1T以上的archive子目录有211个查看集群hbase配置，hmaster堆栈大小20GB，hmaster清理周期5分钟查看hmaster进程分配内存占用6G上下问题分析HMaster内存估算，假如/hbas
搭建一套东郊到家上门按摩app需要多少钱？郑州拽牛科技开源软件系统架构大数据小程序微信小程序
用户端、技师端、总后台，分销端，代理商端等，我粗略估算了下，几万起码是要的。工期嘛，定制开发的话最少敲代码需要3个月以上。如果你按3万去报，那完了，基本算是白打工。报5万以上，还有点利润空间。现在软开这个行业，像咱们做定制的，大家都在卷价格。你报8，他报5，再来一个报3。把利润挤压没了。所以服务要做好，接活要慎重。像东郊到家这类的成品软件要多少钱，怎么着一两万是要的。最主要是不好找，我相信肯定有人
TikTok走红全球：中国短视频平台以全新姿态登陆海外市场 ClonBrowser Tiktok vr 虚拟现实社交媒体 tiktok
在数字化浪潮中，短视频已经成为全球年轻人表达自我、分享生活的重要方式。TikTok，这个起源于中国的短视频平台，以其独特的魅力和创新的功能在全球范围内迅速走红。本文将探讨TikTok如何以全新姿态登陆海外市场，并分析其成功的关键因素。TikTok的全球扩张TikTok，最初名为Musical.ly，后被字节跳动收购并重新命名为TikTok。它以短视频形式迅速在全球范围内流行起来，尤其是在年轻用户群
基于人体姿态识别和多人复杂场景下的人员ID唯一方案设计云栖道人人工智能
一、方案概述公安系统中的多人跟踪与身份识别应用场景广泛，包括人群密集的公共场所监控、搜捕行动中的人员跟踪、犯罪行为检测和身份识别等。方案结合人体姿态识别和人员ID唯一跟踪技术，旨在复杂场景中保持对人员的稳定跟踪并精确识别，处理遮挡、多目标交互等复杂情况。二、应用场景人群密集场所监控：如火车站、机场等公共场所，自动跟踪监控下的所有人员并在多人遮挡的情况下保持人员ID一致。高风险地区监控：在公安系统设
【webrtc】rtp扩展：绝对发送时间、绝对采集时间、时间戳插值等风来不如迎风去 WebRTC入门与实战 webrtc
WebRTCRTP标头扩展审查绝对发送时间和绝对采集时间，二者是不同的当没有打开绝对采集时间戳的扩展时，webrtc依旧会使用AbsoluteCaptureTimeInterpolator在接收测估算绝对采集时间戳。AbsoluteSendTime带宽估计算法用TheAbsoluteSendTimeextensionisusedtostampRTPpacketswithatimestampshow
嵌入式开发：磁通门传感器开发（6）：在STM32上实现FFT需要的空间资源魂兮-龙游嵌入式开发 stm32 嵌入式硬件单片机傅里叶变换 MCU资源计算
文章目录空间资源计算综合考虑结论在STM32上使用CMSIS-DSP库进行FFT计算时，我们这里进行的是128点的实数FFT（使用arm_rfft_fast_f32），每个点用一个float表示（占4字节），那么我们可以从以下几个方面来估算所需要的空间资源：空间资源计算原始采样数据：128个float数据占据的空间：128*4=512FFT输出数据：对于实数FFT，输出通常也会用128个float
2024年03月 Scratch 图形化（三级）真题解析#中国电子学会#全国青少年软件编程等级考试码农StayUp 青少年编程 scratch 图形化电子学会等级考试
Scratch图形化等级考试（1~4级）全部真题・点这里一、单选题（共18题，共50分）第1题运行程序后，角色一定不会说出的数字是？（）A：2B：4C：6D：8答案：A程序中随机数的取值最小为2，最大为20，那么随机数加上2之后的结果的最小值为4，最大值为22。所以角色是可能说出4、6、8这三个数字的，但一定不会说出2。正确选项是A。第2题
一文读懂！OpenCV 实时人脸识别从 0 到 1，小白也能轻松实操的超详细教程（完整教程及源码） AI_DL_CODE opencv 人工智能计算机视觉人脸识别
摘要：本文围绕使用OpenCV实现实时人脸识别展开。从环境搭建入手，详细介绍Python及相关库的安装。数据准备环节涵盖收集、标注及预处理步骤。深入阐述特征提取、模型训练方法，包含传统与深度学习方式，还介绍OpenCV预训练模型的使用与评估。详细讲解实时识别过程，包括打开摄像头、逐帧处理及结果显示优化。针对复杂场景，提出光照、姿态、遮挡等问题的解决办法及模型更新维护策略。通过丰富代码示例与解释，助
数据管理-估算和建模数据处理的内存需求李星星BruceL 自动化测试 python numpy pandas 大数据
估算和建模数据处理的内存需求无论是数据处理管道还是科学计算，您通常需要了解您的进程需要多少内存：如果您的内存不足，了解您是否只需要将笔记本电脑的内存从8GB升级到16GB，或者您的进程需要200GB内存并需要优化，这是很有帮助的。如果您正在运行并行计算，您需要了解每个任务的内存需求，以便知道可以并行运行多少个任务。如果您要扩展到多次运行，您需要估算硬件或云资源的成本。在第一种情况下，您实际上无法测
工业机器人reLTOOL坐标方向_工业机器人工具坐标系（TCF）标定的六点法原理 weixin_39992831
一、基本步骤(1)在机器人动作范围内找一个非常精确的固定点作为参考点；(2)在工具上确定一个参考点(最好是工具中心点ToolCenterPoint,TCP);(3)手动操纵机器人的方法移动TCP，以四种不同的工具姿态与固定点刚好碰上。前三个点任意姿态，第四点是用工具的参考点垂直于固定点，第五点是工具参考点从固定点向将要设定的TCP的x方向移动，第六点是工具参考点从固定点向将要设定的TCP的在z方向
jdk tomcat 环境变量配置 Array_06 java jdk tomcat
Win7 下如何配置java环境变量 1。准备jdk包，win7系统，tomcat安装包（均上网下载即可） 2。进行对jdk的安装，尽量为默认路径（但要记住啊！！以防以后配置用。。。） 3。分别配置高级环境变量。电脑-->右击属性-->高级环境变量-->环境变量。分别配置 : path &nbs
Spring调SDK包报java.lang.NoSuchFieldError错误 bijian1013 java spring
在工作中调另一个系统的SDK包，出现如下java.lang.NoSuchFieldError错误。 org.springframework.web.util.NestedServletException: Handler processing failed; nested exception is java.l
LeetCode[位运算] - #136 数组中的单一数 Cwind java 题解位运算 LeetCode Algorithm
原题链接：#136 Single Number 要求：给定一个整型数组，其中除了一个元素之外，每个元素都出现两次。找出这个元素注意：算法的时间复杂度应为O(n)，最好不使用额外的内存空间难度：中等分析：题目限定了线性的时间复杂度，同时不使用额外的空间，即要求只遍历数组一遍得出结果。由于异或运算 n XOR n = 0, n XOR 0 = n，故将数组中的每个元素进
qq登陆界面开发 15700786134 qq
今天我们来开发一个qq登陆界面，首先写一个界面程序，一个界面首先是一个Frame对象，即是一个窗体。然后在这个窗体上放置其他组件。代码如下： public class First { public void initul(){ jf=ne
Linux的程序包管理器RPM 被触发 linux
在早期我们使用源代码的方式来安装软件时，都需要先把源程序代码编译成可执行的二进制安装程序，然后进行安装。这就意味着每次安装软件都需要经过预处理-->编译-->汇编-->链接-->生成安装文件--> 安装，这个复杂而艰辛的过程。为简化安装步骤，便于广大用户的安装部署程序，程序提供商就在特定的系统上面编译好相关程序的安装文件并进行打包，提供给大家下载，我们只需要根据自己的
socket通信遇到EOFException 肆无忌惮_ EOFException
java.io.EOFException at java.io.ObjectInputStream$PeekInputStream.readFully(ObjectInputStream.java:2281) at java.io.ObjectInputStream$BlockDataInputStream.readShort(ObjectInputStream.java:
基于spring的web项目定时操作知了ing java Web
废话不多说，直接上代码，很简单配置一下项目启动就行 1，web.xml <?xml version="1.0" encoding="UTF-8"?> <web-app xmlns:xsi="http://www.w3.org/2001/XMLSchema-instance" xmlns="h
树形结构的数据库表Schema设计矮蛋蛋 schema
原文地址： http://blog.csdn.net/MONKEY_D_MENG/article/details/6647488 程序设计过程中，我们常常用树形结构来表征某些数据的关联关系，如企业上下级部门、栏目结构、商品分类等等，通常而言，这些树状结构需要借助于数据库完成持久化。然而目前的各种基于关系的数据库，都是以二维表的形式记录存储数据信息，
maven将jar包和源码一起打包到本地仓库 alleni123 maven
http://stackoverflow.com/questions/4031987/how-to-upload-sources-to-local-maven-repository <project> ... <build> <plugins> <plugin> <groupI
java IO操作与 File 获取文件或文件夹的大小，可读，等属性！！！百合不是茶
类 File File是指文件和目录路径名的抽象表示形式。 1，何为文件：标准文件（txt doc mp3...）目录文件（文件夹）虚拟内存文件 2，File类中有可以创建文件的 createNewFile（）方法,在创建新文件的时候需要try{} catch(）{}因为可能会抛出异常；也有可以判断文件是否是一个标准文件的方法isFile();这些防抖都
Spring注入有继承关系的类（2） bijian1013 java spring
被注入类的父类有相应的属性，Spring可以直接注入相应的属性，如下所例：1.AClass类 package com.bijian.spring.test4; public class AClass { private String a; private String b; public String getA() { retu
30岁转型期你能否成为成功人士 bijian1013 成长励志
很多人由于年轻时走了弯路，到了30岁一事无成，这样的例子大有人在。但同样也有一些人，整个职业生涯都发展得很优秀，到了30岁已经成为职场的精英阶层。由于做猎头的原因，我们接触很多30岁左右的经理人，发现他们在职业发展道路上往往有很多致命的问题。在30岁之前，他们的职业生涯表现很优秀，但从30岁到40岁这一段，很多人
【Velocity四】Velocity与Java互操作 bit1129 velocity
Velocity出现的目的用于简化基于MVC的web应用开发，用于替代JSP标签技术，那么Velocity如何访问Java代码.本篇继续以Velocity三http://bit1129.iteye.com/blog/2106142中的例子为基础， POJO package com.tom.servlets; public
【Hive十一】Hive数据倾斜优化 bit1129 hive
什么是Hive数据倾斜问题操作：join,group by,count distinct 现象：任务进度长时间维持在99%（或100%），查看任务监控页面，发现只有少量（1个或几个）reduce子任务未完成；查看未完成的子任务，可以看到本地读写数据量积累非常大，通常超过10GB可以认定为发生数据倾斜。原因：key分布不均匀倾斜度衡量：平均记录数超过50w且
在nginx中集成lua脚本：添加自定义Http头，封IP等 ronin47 nginx lua csrf
Lua是一个可以嵌入到Nginx配置文件中的动态脚本语言，从而可以在Nginx请求处理的任何阶段执行各种Lua代码。刚开始我们只是用Lua 把请求路由到后端服务器，但是它对我们架构的作用超出了我们的预期。下面就讲讲我们所做的工作。强制搜索引擎只索引mixlr.com Google把子域名当作完全独立的网站，我们不希望爬虫抓取子域名的页面，降低我们的Page rank。 location /{
java-3.求子数组的最大和 bylijinnan java
package beautyOfCoding; public class MaxSubArraySum { /** * 3.求子数组的最大和题目描述：输入一个整形数组，数组里有正数也有负数。数组中连续的一个或多个整数组成一个子数组，每个子数组都有一个和。求所有子数组的和的最大值。要求时间复杂度为O(n)。例如输入的数组为1, -2, 3, 10, -4,
Netty源码学习-FileRegion bylijinnan java netty
今天看org.jboss.netty.example.http.file.HttpStaticFileServerHandler.java 可以直接往channel里面写入一个FileRegion对象，而不需要相应的encoder： //pipeline（没有诸如“FileRegionEncoder”的handler）： public ChannelPipeline ge
使用ZeroClipboard解决跨浏览器复制到剪贴板的问题 cngolon 跨浏览器复制到粘贴板 Zero Clipboard
Zero Clipboard的实现原理 Zero Clipboard 利用透明的Flash让其漂浮在复制按钮之上，这样其实点击的不是按钮而是 Flash ，这样将需要的内容传入Flash，再通过Flash的复制功能把传入的内容复制到剪贴板。 Zero Clipboard的安装方法首先需要下载 Zero Clipboard的压缩包，解压后把文件夹中两个文件：ZeroClipboard.js
单例模式 cuishikuan 单例模式
第一种（懒汉，线程不安全）： public class Singleton { 2 private static Singleton instance; 3 pri
spring+websocket的使用 dalan_123
一、spring配置文件 <?xml version="1.0" encoding="UTF-8"?><beans xmlns="http://www.springframework.org/schema/beans" xmlns:xsi="http://www.w3.or
细节问题：ZEROFILL的用法范围。 dcj3sjt126com mysql
1、zerofill把月份中的一位数字比如1，2，3等加前导0 mysql> CREATE TABLE t1 (year YEAR(4), month INT(2) UNSIGNED ZEROFILL, -> day
Android开发10——Activity的跳转与传值 dcj3sjt126com Android开发
Activity跳转与传值，主要是通过Intent类，Intent的作用是激活组件和附带数据。一、Activity跳转方法一Intent intent = new Intent(A.this, B.class); startActivity(intent) 方法二Intent intent = new Intent();intent.setCla
jdbc 得到表结构、主键 eksliang jdbc 得到表结构、主键
转自博客：http://blog.csdn.net/ocean1010/article/details/7266042 假设有个con DatabaseMetaData dbmd = con.getMetaData(); rs = dbmd.getColumns(con.getCatalog(), schema, tableName, null); rs.getSt
Android 应用程序开关GPS gqdy365 android
要在应用程序中操作GPS开关需要权限： <uses-permission android:name="android.permission.WRITE_SECURE_SETTINGS" /> 但在配置文件中添加此权限之后会报错，无法再eclipse里面正常编译，怎么办？ 1、方法一：将项目放到Android源码中编译； 2、方法二：网上有人说cl
Windows上调试MapReduce zhiquanliu mapreduce
1.下载hadoop2x-eclipse-plugin https://github.com/winghc/hadoop2x-eclipse-plugin.git 把 hadoop2.6.0-eclipse-plugin.jar 放到eclipse plugin 目录中。 2.下载 hadoop2.6_x64_.zip http://dl.iteye.com/topics/download/d2b
如何看待一些知名博客推广软文的行为？ justjavac 博客
本文来自我在知乎上的一个回答：http://www.zhihu.com/question/23431810/answer/24588621 互联网上的两种典型心态：当初求种像条狗，如今撸完嫌人丑当初搜贴像条犬，如今读完嫌人软你为啥感觉不舒服呢？难道非得要作者把自己的劳动成果免费给你用，你才舒服？就如同 Google 关闭了 Gooled Reader，那是
sql优化总结 macroli sql
为了是自己对sql优化有更好的原则性，在这里做一下总结，个人原则如有不对请多多指教。谢谢！要知道一个简单的sql语句执行效率，就要有查看方式，一遍更好的进行优化。一、简单的统计语句执行时间 declare @d datetime ---定义一个datetime的变量set @d=getdate() ---获取查询语句开始前的时间select user_id
Linux Oracle中常遇到的一些问题及命令总结超声波 oracle linux
1.linux更改主机名 (1)#hostname oracledb　　　　临时修改主机名 (2) vi /etc/sysconfig/network 　　修改hostname (3) vi /etc/hosts　　　　　　　　修改IP对应的主机名 2.linux重启oracle实例及监听的各种方法（注意操作的顺序应该是先监听，后数据库实例） &nbs
hive函数大全及使用示例 superlxw1234 hadoop hive函数
具体说明及示例参见附件文档。文档目录：目录一、关系运算： 4 1. 等值比较: = 4 2. 不等值比较: <> 4 3. 小于比较: < 4 4. 小于等于比较: <= 4 5. 大于比较: > 5 6. 大于等于比较: >= 5 7. 空值判断: IS NULL 5
Spring 4.2新特性-使用@Order调整配置类加载顺序 wiselyman spring 4
4.1 @Order Spring 4.2 利用@Order控制配置类的加载顺序 4.2 演示两个演示bean package com.wisely.spring4_2.order; public class Demo1Service { } package com.wisely.spring4_2.order; public class