DenseFusion(6D姿态估计)解读-2019cvpr

资源

论文
作者源码
他人修改过代码

作者的想法

我们在研究中发现，从 RGB-D 输入中提取 6D 姿态信息时，很多点是被其他对象遮挡住的，这就会导致识别性能发生明显下降。在前人的工作中，一种流行的方法是利用全局特征进行 6D 位姿估计。但是当发生了遮挡，全局特征很大程度上会受到影响，导致预估测结果不佳。在这项工作中，我们生成了基于像素的密集融合方式，在不同的通道中先分别处理 RGB 和深度信息，以生成基于像素的颜色嵌入和带有 PointNet 结构的几何嵌入。然后我们利用 RGB 和密集度之间的对应关系就可以实现像素级别的融合并进行预测

1.摘要

从RGB-D图像进行6D目标位姿估计的一个关键技术挑战是充分利用两个互补的数据源。以前的工作要么是从RGB图像和深度中分别提取信息，要么是使用昂贵的后处理步骤，限制了它们在高度混乱的场景和实时应用中的性能。在这项工作中，我们提出了一个从RGB-D图像中估计一组已知物体的6D姿态的通用框架DENSEFORSION。dense fusion是一种异构的体系结构，它对两个数据源分别进行处理，并使用一种新的密集融合网络来提取像素级的密集特征嵌入，从中估计姿态。此外，我们还集成了一个端到端迭代位姿优化过程，在实现近实时推理的同时进一步改进了位姿估计。实验结果表明，该方法在YCB视频和LineMOD两个数据集上均优于目前最新的方法，并将该方法应用于实际机器人中，实现了基于姿态估计的目标抓取和操作。

2.介绍

6D目标姿态估计是许多重要的现实应用的关键，如机器人抓取和操纵、自主导航和增强现实。理想情况下，解决方案应处理形状和纹理变化的对象，对严重遮挡、传感器噪声和改变照明条件显示鲁棒性，同时达到实时任务的速度要求。廉价的RGB-D传感器的出现使得即使在光线不好的环境中也能比仅用RGB的方法更准确地推断低纹理物体的姿态。然而，现有的方法很难同时满足精确姿态估计和快速推理的要求。
在这项工作中，我们提出了一种端到端的深度学习方法，用于从RGB-D输入估计已知物体的六自由度姿态。我们方法的核心是在每像素级别嵌入和融合RGB值和点云，这与之前使用图像裁剪来计算全局特征[41]或2D边界框[22]的工作类似。这种每像素的融合方案使我们的模型能够明确地了解局部的外观和几何信息，这对于处理严重的遮挡是至关重要的。此外，我们还提出了一种在端到端学习框架下进行姿态调整的迭代方法。这大大提高了模型的性能，同时保持了参考速度的实时性。
我们在YCB视频[40]和LineMOD[12]两个常用的6D姿态估计基准中评估了我们的方法。结果表明，经过ICP精细化[40]后，我们的方法的位姿准确度比最新的PoseCNN高3.5%，而推理时间比现有的PoseCNN快200倍。特别地，由于我们提出了一种新的密集融合方法，我们证明了它在高度混乱的场景中的鲁棒性。最后，我们还展示了它在一个真实的机器人任务中的实用性，在这个任务中，机器人估计物体的姿势并抓住它们来清理桌子。

总之，这项工作的贡献有两方面：
首先，我们提出了一种从RGB-D输入中结合颜色和深度信息的原则性方法。我们利用为任务学习的嵌入空间中的二维信息来增强每个三维点的信息，并利用这个新的颜色深度空间来估计6D姿态。其次，我们在神经网络架构中整合了一个迭代求精过程，消除了前一个后处理ICP步骤方法的依赖性。

3.相关工作

经典方法从输入的RGB-D数据中提取三维特征，并进行相应的分组和假设验证。然而，这些特征要么是硬编码的，要么是通过优化替代目标，例如重建，而不是6D姿态估计的真正目标。像PoseCNN这样的新方法直接从图像数据中估计出6D姿态。Li等人进一步将深度输入作为附加信道融合到基于CNN的体系结构中。然而，这些方法依靠昂贵的后处理步骤来充分利用3D输入。相比之下，我们的方法在保留输入空间的几何结构的同时，将三维数据融合到二维外观特征中，并且我们证明它在YCB视频数据集[40]上执行[40]而无需后期处理步骤。我们的方法与点融合最为相关，其中几何和外观信息融合在一个异质的结构中。结果表明，我们提出的新的局部特征融合方案明显优于点融合的级联融合方法。此外，我们还使用了一种新的迭代求精方法来进一步改进姿态估计。

4.模型

我们的目标是估计一组已知物体在杂乱场景的RGB-D图像中的6D姿态。在不失一般性的前提下，将6D位姿表示为齐次变换矩阵p∈SE（3）。换言之，6D姿势由旋转R∈SO（3）和平移t∈R3组成，p=[R | t]。由于我们从摄像机图像中估计出物体的6D姿态，所以这些姿态是相对于摄像机坐标系定义的。估计已知物体在敌对条件下的姿态（如严重遮挡、光线不足等）只有通过组合颜色和深度图像通道中包含的信息才有可能。但是，这两个数据源位于不同的空间中。从异构数据源中提取特征并进行适当的融合是该领域的关键技术挑战。
我们通过：
（1）一个异构体系结构来解决这个问题，该体系结构以不同的方式处理颜色和深度信息，保留每个数据源的本机结构（秒）。（2）一个密集的像素级融合网络，通过利用数据源之间的内在映射（秒）进行颜色深度融合。
（3）最后，利用可微迭代求精模块（Sec）进一步改进姿态估计。与[16，40]中使用的昂贵的事后优化步骤相比，我们的优化模块可以与主架构联合训练，只需要总推理时间的一小部分。

5.模型结构

**如图示出了整体提议的架构。体系结构包含两个主要阶段：**第一阶段以彩色图像为输入，对每个已知的对象类别进行语义分割。然后，对于每个分割的对象，我们将masked深度像素（转换为三维点云）以及masked边界框裁剪的图像块馈送到第二阶段。
第二阶段处理分割结果并估计物体的6D姿态。它包括四个部分：a）处理颜色信息并将图像裁剪中的每个像素映射到颜色特征嵌入的完全卷积网络；b）基于点网的[23]网络，将屏蔽的三维点云中的每个点处理到几何特征嵌入，c）一种基于无监督置信度评分的像素级融合网络，它结合了嵌入和输出对目标6D姿态的估计；d)一种迭代自求精方法，以课程学习的方式训练网络并迭代地优化估计结果。

6.语义分割

第一步是对图像中感兴趣的对象进行分割。我们的语义分割网络是一个以图像为输入，生成N+1通道语义分割图的编解码结构。每个通道都是一个二进制掩码，其中活动像素描述N个可能已知类中的每个类的对象。本文的工作重点是开发一种位姿估计算法。因此，我们使用了由[40]提出的现有分割架构。

7.密集特征提取

在这一领域的关键技术挑战是从颜色和深度通道中正确提取信息并进行协同融合。尽管颜色和深度在RGB-D帧中呈现类似的格式，但它们的信息驻留在不同的空间中。因此，我们分别处理它们，从保留数据源内在结构的嵌入空间生成颜色和几何特征。

**密集三维点云特征嵌入：**以前的方法使用CNN作为附加图像通道来处理深度图像[16]。然而，这种方法忽略了深度通道固有的三维结构。相反，我们首先使用已知的相机内部函数将分割的深度像素转换为三维点云，然后使用类似于点网的结构来提取几何特征。Qi等人的PointNet。[23]率先使用对称函数（max pooling）在处理无序点集时实现置换不变性。最初的架构以原始点云作为输入，并学习如何对每个点附近以及整个点云的信息进行编码。这些特征在形状分类和分割[23]和姿态估计[22，41]中被证明是有效的。我们提出了一个几何嵌入网络，通过将每个P分割点映射到一个dgeo维特征空间来生成密集的每点特征。我们实现了PointNet体系结构的一个变体，它使用平均池化而不是常用的最大池化作为对称归约函数。
**密集彩色图像特征嵌入：**彩色嵌入网络的目标是提取每个像素的特征，从而在三维点特征和图像特征之间形成密集的对应关系。形成这些密集对应关系的原因将在下一节中阐明。图像嵌入网络是一种基于CNN的编解码结构，它将一幅大小为H×W×3的图像映射到一个H×W×drgb的嵌入空间中。嵌入的每个像素是一个drgb维向量，表示输入图像在相应位置的外观信息。

8.像素级密集融合

到目前为止，我们已经从图像和三维点云输入中获得了密集的特征；现在我们需要融合这些信息。一种简单的方法是从分割区域的密集颜色和深度特征生成全局特征。但是，由于严重的遮挡和分割错误，上一步的特征集可能包含其他对象或背景部分上的点/像素特征。因此，盲目地将颜色和几何特征进行全局融合会降低估计的性能。接下来我们描述了一种新的像素级密集融合网络，它有效地结合了提取的特征，特别是在严重遮挡和不完全分割的情况下的姿态估计。
**像素级的密集融合：**我们的密集融合网络的核心思想是进行局部的逐像素融合，而不是全局融合，这样我们就可以根据每个融合的特征进行预测。通过这种方法，我们可以潜在地选择基于对象可见部分的预测，并最小化遮挡和分割噪声的影响。具体来说，我们的密集融合程序首先根据已知摄像机内参数投影到图像平面上，将每个点的几何特征与其对应的图像特征像素相关联。然后将获得的特征对串接并馈送到另一个网络，以使用对称约化函数生成固定大小的全局特征向量。虽然我们避免使用单一的全局特征进行估计，但在这里，我们使用全局密集融合特征来丰富每个密集像素特征，以提供全局上下文。我们将每一个像素特征输入到最终的网络中，预测物体的6D姿态。换言之，我们将训练该网络从每个密集融合的特征中预测一个姿势。结果是一组预先设定的姿势，每个特征一个。这定义了我们的第一个学习目标，我们将在第二节中看到。
我们现在将解释我们的方法，学习如何以自我监督的方式选择最佳预测，这是由Xu等人的工作启发的。〔41〕
**每像素自监督置信度：**我们希望训练我们的姿势估计网络，以根据特定的上下文来决定哪个姿势估计可能是最佳的假设。为此，除了姿态估计预测外，我们还修改网络以输出每个预测的置信度ci。我们必须在总体学习目标中反映第二个学习目标，我们将在下一节末尾看到这一点。

9.6D目标姿态估计

在定义了整个网络结构之后，我们现在更仔细地看一下学习目标。将姿态估计损失定义为ground truth姿态下的目标模型的采样点与由预测姿态变换后的同一模型上对应点之间的距离。具体地说，对于每一密集像素的预测，最小化的损失被定义为
上述损失函数仅适用于非对称对象，其中对象形状和/或纹理确定唯一的规范框架。对称对象有多个且可能有无限多个规范框架，这导致学习目标不明确。因此，对于对称对象，我们将估计模型方向上的每个点与ground truth模型上最近点之间的距离最小化。损失函数变成：

优化所有预测的每稠密像素姿势将是最小化每稠密像素损失的总和：然而，如前所述，我们希望我们的网络学习平衡每稠密像素预测之间的信任。为此，我们用稠密像素置信度加权每稠密像素损失，并添加第二个置信正则项：

10.迭代优化

迭代最近点算法（ICP）[2]是许多6D位姿估计方法[14，30，40]使用的一种强大的求精方法。然而，对于实时应用程序来说，性能最好的ICP实现往往不够高效。本文提出了一种基于神经网络的迭代求精模块，能够快速、稳健地提高最终姿态估计结果。
其目的是使网络能够以迭代的方式修正其自身的姿态估计误差。这里的挑战是训练网络改进先前的预测，而不是做出新的预测。为此，我们必须将上一次迭代中所做的预测作为下一次迭代输入的一部分。**我们的核心思想是将先前预测的姿态作为目标对象的标准帧的估计，并将输入点云转化为该估计的标准帧。**这样，转换后的点云隐式地对估计的姿态进行编码。然后，我们将转换后的点云反馈到网络中，并基于先前估计的姿态预测一个残差姿态。此过程可以迭代应用，并在每次迭代中生成可能更精细的姿势估计。程序如图3所示。具体来说，我们训练一个专用的位姿残差估计器网络来实现给定的主网络初始位姿估计的细化。在每次迭代中，我们都会重复使用从主网络嵌入的图像特征，并对新转换的点云计算出的几何特征进行密集融合。姿态残差估计器使用融合像素特征集的全局特征作为输入。经过K次迭代，我们得到最终的姿态估计，作为每次迭代估计的串联：pˆ=[RK | tK]·[RK−1 | tK−1]·····[R0 | t0]姿态残差估计器可以与主网络联合训练。然而，训练开始时的姿势估计太过嘈杂，无法学习到任何有意义的东西。因此，在实践中，联合训练是在主网络融合后开始的。

实验

在实验部分，我们将回答以下问题：（1）密集融合网络与单纯的级联全局融合相比如何？（2）密集融合和预测方案对严重的遮挡和分割错误是否具有鲁棒性？（3）迭代求精模块是否改进了最终姿态估计？（4）我们的方法对于机器人抓取等下游任务是否足够健壮和高效？
为了回答前三个问题，我们评估了两个具有挑战性的6D目标姿态估计数据集的方法：YCB视频数据集[40]和LineMOD[12]。YCB视频数据集在不同遮挡条件下具有不同形状和纹理级别的对象。因此，它是一个理想的测试平台，我们的咬合弹性多模态融合方法。LineMOD数据集是一个广泛使用的数据集，它允许我们与更广泛的现有方法进行比较。我们将我们的方法与最先进的方法[14，30]以及模型变体进行比较。对于最后一个问题，我们将我们的模型部署到一个真实的机器人平台上，并使用我们模型的预测来评估机器人抓取任务的性能。

结论

提出了一种新的基于RGB-D图像的已知物体6D姿态估计方法。我们的方法融合了特征的密集表示，其中包括基于预测可信度的颜色和深度信息。使用这种密集融合方法，我们的方法在多个数据集上都优于以前的方法，并且对遮挡的鲁棒性显著提高。此外，我们证明机器人可以使用我们提出的方法来抓取和操作物体。

【Python】一文详细介绍 py格式文件高斯小哥 Python基础【高质量合集】python 新手入门学习
【Python】一文详细介绍py格式文件个人主页：高斯小哥高质量专栏：Matplotlib之旅：零基础精通数据可视化、Python基础【高质量合集】、PyTorch零基础入门教程希望得到您的订阅和支持~创作高质量博文(平均质量分92+)，分享更多关于深度学习、PyTorch、Python领域的优质内容！（希望得到您的关注~）文章目录一、py格式文件简介二、如何创建和编辑py格式文件三、如何运行py
数据结构奇妙旅程之深入解析快速排序山间漫步人生路数据结构排序算法算法
快速排序（QuickSort）是一种高效的排序算法，它使用了分治法的策略来将一个数组排序。其基本思想是选择一个基准元素，通过一趟排序将待排序的数据分割成独立的两部分，其中一部分的所有数据都比基准元素小，另一部分的所有数据都比基准元素大，然后再按此方法对这两部分数据分别进行快速排序，整个排序过程可以递归进行，以此达到整个数据变成有序序列。工作原理选择基准：从待排序的序列中选一个元素作为基准（pivo
php 把一个数组分成有n个元素的二维数组的算法风清扬-独孤九剑 php php 算法
一、第一种解法0){$columns_map[$position]++;//这个地方格外注意,$position与$columns比较$position=($position<$columns-1)?++$position:0;$array_length--;}foreach($columns_mapas$val){$newarray[]=array_splice($array,0,$val);}
【算法分析与设计】去除重复字母五敷有你算法分析与设计 java javascript 开发语言算法数据结构
个人主页：五敷有你系列专栏：算法分析与设计⛺️稳中求进，晒太阳题目给你一个字符串s，请你去除字符串中重复的字母，使得每个字母只出现一次。需保证返回结果的字典序最小（要求不能打乱其他字符的相对位置）。示例示例1：输入：s="bcabc"输出："abc"示例2：输入：s="cbacdcbc"输出："acdb"思路贪心+单调栈实现【字符串删除一个字符使其字典序最小的贪心策略】：对于两个长度相同的字符串，
yarn的安装和使用全网最详细教程 zxj19880502 yarn npm
一、yarn的简介：Yarn是facebook发布的一款取代npm的包管理工具。二、yarn的特点：速度超快。Yarn缓存了每个下载过的包，所以再次使用时无需重复下载。同时利用并行下载以最大化资源利用率，因此安装速度更快。超级安全。在执行代码之前，Yarn会通过算法校验每个安装包的完整性。超级可靠。使用详细、简洁的锁文件格式和明确的安装算法，Yarn能够保证在不同系统上无差异的工作。三、yarn的
图论记录之最短路迪杰斯特拉 Just right 算法图论 java 开发语言
简述思想这个思想能用一句话来概括，精简到的极致:每次找到一个最短距离的点并更新起点到各个点的最短距离如果要可视化的话，B站搜索Dijksra算法，有视频讲解伪代码写到这里，其实是想整一个动画的，这样效果更好点，但由于种种原因所以就拖一下intdijkstr(){dist[1]=0;其余的点的距离全部初始化为真无穷，不要写成int的最大值迭代n次将不在s中的，且距离最近的点给tsj即先到t，再加上t
大创项目推荐深度学习 opencv python 公式识别(图像识别机器视觉) laafeer python
文章目录0前言1课题说明2效果展示3具体实现4关键代码实现5算法综合效果6最后0前言优质竞赛项目系列，今天要分享的是基于深度学习的数学公式识别算法实现该项目较为新颖，适合作为竞赛课题方向，学长非常推荐！学长这里给一个题目综合评分(每项满分5分)难度系数：3分工作量：4分创新点：4分更多资料,项目分享：https://gitee.com/dancheng-senior/postgraduate1课题
排序算法太多？常用排序都在这了，一篇文章总结和实现所有面试会考的排序算法（基于Python实现）宇宙之一粟不归路之Python #IT面试题收集与总结数据结构与算法算法数据结构排序算法 python java
文章目录排序算法1.常见的排序算法1.1选择排序1.1.1思想1.1.2实现**1.1.3选择排序分析**1.2冒泡排序**1.2.1思想****1.2.2实现****1.2.3冒泡排序分析**1.3插入排序**1.3.1思想****1.3.2实现****1.3.3插入排序分析**1.4归并排序☆☆★**1.4.1思想****1.4.2实现****1.4.3归并排序分析**1.5快速排序☆★★**
【数据结构】实验一实现顺序表各种基本运算的算法张鱼·小丸子数据结构实验 c++数据结构
题目：实现顺序表各种基本运算的算法要求：1、建立一个顺序表，输入n个元素并输出；2、查找线性表中的最大元素并输出；3、在线性表的第i个元素前插入一个正整数x；4、删除线性表中的第j个元素；5、将线性表中的元素按升序排列；6、将线性表中的元素就地逆序（只允许用一个暂存单元）；#include#defineSIZE1000usingnamespacestd;typedefstruct{int*a;//
python清华大学出版社答案_Python机器学习及实践 weixin_39805119 python清华大学出版社答案
第1章机器学习的基础知识1.1何谓机器学习1.1.1传感器和海量数据1.1.2机器学习的重要性1.1.3机器学习的表现1.1.4机器学习的主要任务1.1.5选择合适的算法1.1.6机器学习程序的步骤1.2综合分类1.3推荐系统和深度学习1.3.1推荐系统1.3.2深度学习1.4何为Python1.4.1使用Python软件的由来1.4.2为什么使用Python1.4.3Python设计定位1.4.
Java回溯知识点（含面试大厂题和源码）一成码农 java 面试开发语言
回溯算法是一种通过遍历所有可能的候选解来寻找所有解的算法，如果候选解被确认不是一个解（或至少不是最后一个解），回溯算法会通过在上一步进行一些变化来丢弃这个解，即“回溯”并尝试另一个候选解。回溯法通常用递归方法来实现，在解决排列、组合、选择问题时非常有效。回溯算法的核心要点：路径：也就是已经做出的选择。选择列表：也就是你当前可以做的选择。结束条件：也就是到达决策树底层，无法再做出选择的条件。回溯算法
深度学习项目-基于深度学习的股票价格预测研究雅致教育计算机毕业设计深度学习人工智能
概要随着经济的发展，中国股票市场的规模持续扩大，早已成为金融投资的重要部分，掌握股票市场的变化规律无论是对监管者还是投资者都具有极其重要的意义。正因如此，人们不断探索着股票市场的变化规律，其中使用深度学习预测股价是当前国内国际研究与应用的热点。本文首先从有效市场假说和分形市场假说两个角度讨论了中国股票市场的有效性，说明股票市场具有复杂的非线性特征。其次，结合股票市场特征对比了当前的预测方法
第七章索引及执行计划，存储引擎执笔为剑 #MySQL运维篇编辑器 mysql
第七章索引及执行计划，存储引擎1，索引及执行计划1，作用：提供类似书目录的作用，目的是优化查询2，所用的种类（根据算法）B树索引Hash索引R树FulltextGIS3，B树基于不同的查找算法分类介绍B-tree：在范围查询方面提供了更好的性能（>showengines;#存储引擎作用在表上，不同的表可能有不同的存储引擎mysql>select@@default_storage_engine;#查
Java面试题：解释JVM的内存结构，并描述堆、栈、方法区在内存结构中的角色和作用，Java中的多线程是如何实现的，Java垃圾回收机制的基本原理，并讨论常见的垃圾回收算法杰哥在此 Java系列 java jvm 算法面试
Java内存模型与多线程的深入探讨在Java的世界里，内存模型和多线程是开发者必须掌握的核心知识点。它们不仅关系到程序的性能和稳定性，还直接影响到系统的可扩展性和可靠性。下面，我将通过三个面试题，带领大家深入理解Java内存模型、多线程以及并发编程的相关原理和实践。面试题一：请解释JVM的内存结构，并描述堆、栈、方法区在内存结构中的角色和作用。关注点：JVM内存结构的基本组成堆、栈、方法区的功能和
ChatGPT技巧大揭秘：AI写代码新境界 2401_83550420 chatgpt4.0 chatgpt chatgpt 人工智能 AI写作
ChatGPT无限次数:点击直达ChatGPT技巧大揭秘：AI写代码新境界随着人工智能技术的不断进步，开发人员现在有了更多有趣的工具来提高他们的工作效率。其中，ChatGPT作为一种基于深度学习的自然语言处理模型，已经成为许多开发者的新宠。在本文中，我们将揭秘使用ChatGPT来帮助编写代码的技巧，探索AI在编程领域的新境界。ChatGPT简介ChatGPT是一种基于大型神经网络的对话生成模型，它
优化选址问题 | 基于和声搜索算法求解基站选址问题含Matlab源码天天酷科研优化选址问题（LP）matlab 和声搜索算法基站选址问题
目录问题代码问题和声搜索算法（HarmonySearch,HS）是一种模拟音乐创作过程中乐师们凭借自己的记忆，通过反复调整各乐器的音调，直至达到最美和声状态为启发，通过反复调整解向量的各分量来寻求全局最优解的智能优化算法。下面是一个基于和声搜索算法求解基站选址问题的Matlab伪代码框架。请注意，这个框架是一个基本的实现，你可能需要根据你的具体问题和约束条件进行调整和优化。代码%和声搜索算法求解基
AI大模型学习：开启智能时代的新篇章游向大厂的咸鱼人工智能学习
随着人工智能技术的不断发展，AI大模型已经成为当今领先的技术之一，引领着智能时代的发展。这些大型神经网络模型，如OpenAI的GPT系列、Google的BERT等，在自然语言处理、图像识别、智能推荐等领域展现出了令人瞩目的能力。然而，这些模型的背后是一系列复杂的学习过程，深度学习技术的不断演进推动了AI大模型学习的发展。首先，AI大模型学习的基础是深度学习技术。深度学习是一种模仿人类大脑结构的机器
【Python】成功解决ModuleNotFoundError: No module named ‘torchinfo‘ 高斯小哥 BUG解决方案合集 python pytorch 新手入门学习 debug
【Python】成功解决ModuleNotFoundError:Nomodulenamed‘torchinfo’个人主页：高斯小哥高质量专栏：Matplotlib之旅：零基础精通数据可视化、Python基础【高质量合集】、PyTorch零基础入门教程希望得到您的订阅和支持~创作高质量博文(平均质量分92+)，分享更多关于深度学习、PyTorch、Python领域的优质内容！（希望得到您的关注~）文
【循环神经网络rnn】一篇文章讲透 CX330的烟花 rnn 人工智能深度学习算法 python 机器学习数据结构
目录引言二、RNN的基本原理代码事例三、RNN的优化方法1长短期记忆网络（LSTM）2门控循环单元（GRU）四、更多优化方法1选择合适的RNN结构2使用并行化技术3优化超参数4使用梯度裁剪5使用混合精度训练6利用分布式训练7使用预训练模型五、RNN的应用场景1自然语言处理2语音识别3时间序列预测六、RNN的未来发展七、结论引言众所周知，CNN与循环神经网络（RNN）或生成对抗网络（GAN）等算法结
ChatGPT神技：AI成为你的编程良友 2401_83481083 chatgpt4.0 chatgpt chatgpt 人工智能 AI写作
ChatGPT无限次数:点击直达ChatGPT神技：AI成为你的编程良友近年来，人工智能技术的发展迅猛，ChatGPT作为其中一项创新技术，正逐渐走进我们的生活。在编程领域，AI不仅可以助力我们提高效率，还能成为我们的良友，帮助解决各种编程难题。一、ChatGPT简介ChatGPT是一种基于自然语言处理技术的人工智能模型，它能够生成类人对话。ChatGPT通过深度学习模型，能够理解输入的文本并生成
SWIFT环境配置及大模型微调实践 weixin_43870390 swift 开发语言 ios
SWIFT环境配置及大模型微调实践SWIFT环境配置基础配置增量配置SWIFTQwen_audio_chat大模型微调实践问题1:问题2:问题定位解决方法手动安装pytorchSWIFT介绍参考：这里SWIFT环境配置基础配置condacreate-nswiftpython=3.8pipinstallms-swift[all]-U#下载项目gitclonehttps://github.com/mo
15届蓝桥杯备赛(3) sad_liu #sad_liu的刷题记录蓝桥杯职场和发展
文章目录15届蓝桥杯备赛(3)回溯算法组合组合总和III电话号码的字母组合组合总和组合总和II分割回文串子集子集II非递减子序列全排列全排列II贪心算法分发饼干最大子数组和买股票的最佳时机II跳跃游戏15届蓝桥杯备赛(3)提高C++程序的输入输出效率，尤其是在需要大量输入输出操作时。ios_base::sync_with_stdio(false);cin.tie(nullptr);cout.tie
深度学习如何入门？科学的N次方深度学习
入门深度学习需要系统性的学习和实践经验积累，以下是一份详细的入门指南，包含了关键的学习步骤和资源：预备知识：•编程基础：熟悉Python编程语言，它是深度学习领域最常用的编程语言。确保掌握变量、条件语句、循环、函数等基本概念，并学习如何使用Python处理数据和文件操作。•数学基础：理解线性代数（矩阵运算、向量空间等）、微积分（导数、梯度求解等）、概率论与统计学（期望、方差、概率分布、最大似然估计
深度学习与（复杂系统）事物的属性科学禅道深度学习模型专栏深度学习人工智能
深度学习与复杂系统中事物属性的关系体现在：特征学习与表示:深度学习通过多层神经网络结构，能够自动从原始输入数据中学习和提取出丰富的特征表示。每一层神经网络都可能对应着事物属性的不同抽象层次，底层可能对应简单直观的属性，而随着网络深度的增加，顶层可以学习到更抽象、复杂的属性及其相互关系。非线性关系建模:深度学习特别擅长处理非线性关系，而在复杂系统中，事物属性间的相互作用往往表现为非线性，例如，某些属
Win环境下安装 torch==1.1.0 JOYCE_Leo16 Bug记录深度学习 python 人工智能 pytorch
问题描述复现很多模型的时候，会遇到torch版本不一致问题，尤其是torch1.1.0一直都在安装错误，试了很多方法都没用。解决方案在默认环境中安装torch：pipinstallhttps://download.pytorch.org/whl/cu90/torch-1.1.0-cp36-cp36m-win_amd64.whlpipinstallhttps://download.pytorch.o
C#杨辉三角形 wenchm c#算法数据结构
目录1.杨辉三角形定义2.用数组实现10层的杨辉三角形3.使用List泛型链表集合设计10层的杨辉三角形（1）代码解释：（2）算法中求余的作用4.使用List泛型链表集合设计10层的等腰的杨辉三角形1.杨辉三角形定义杨辉三角是一个由数字排列成的三角形数表，其最本质的特征是它的两条边都是由数字1组成的，而其余的数则等于它上方的两个数之和。杨辉三角有两种常用的表示形式。2.用数组实现10层的杨辉三角形
代码随想录 day29 第七章回溯算法part05 厦门奥特曼代码随想录算法 golang 剪枝
491.递增子序列46.全排列47.全排列II1.递增子序列关联leetcode491.递增子序列本题和大家刚做过的90.子集II非常像，但又很不一样，很容易掉坑里。思路不能改变原数组顺序不能先排序去重同一层去重树枝上可以有重复元素新元素添加条件大于等于当前次收集数组最右元素value>array[right]题解funcfindSubsequences(nums[]int)[][]int{ret
分布式应用下登录检验解决方案敲键盘的小夜猫分布式 java
优缺点JWT是一个开放标准，它定义了一种用于简洁，自包含的用于通信双方之间以JSON对象的形式安全传递信息的方法。可以使用HMAC算法或者是RSA的公钥密钥对进行签名。说白了就是通过一定规范来生成token，然后可以通过解密算法逆向解密token，这样就可以获取用户信息。生产的token可以包含基本信息，比如id、用户昵称、头像等信息，避免再次查库，可以存储在客户端，不占用服务端的内存资源，在前后
数据结构——单向链表（C语言版） GG Bond.ฺ 数据结构链表 c语言
在数据结构和算法中，链表是一种常见的数据结构，它由一系列节点组成，每个节点包含数据和指向下一个节点的指针。在C语言中，我们可以使用指针来实现单向链表。下面将详细介绍如何用C语言实现单向链表。目录1.定义节点结构体2.初始化链表3.插入节点4.删除节点5.遍历链表6.主函数1.定义节点结构体首先，我们需要定义表示链表节点的结构体。每个节点包含一个数据域和一个指向下一个节点的指针域。typedefst
【牛客】SQL148 筛选昵称规则和试卷规则的作答记录 talle2021 MySQL-刷题 MySQL 数据库
描述现有用户信息表user_info（uid用户ID，nick_name昵称,achievement成就值,level等级,job职业方向,register_time注册时间）：iduidnick_nameachievementleveljobregister_time11001牛客1号19002算法2020-01-0110:00:0021002牛客2号12003算法2020-01-0110:00
rust的指针作为函数返回值是直接传递，还是先销毁后创建？ wudixiaotie 返回值
这是我自己想到的问题，结果去知呼提问，还没等别人回答，我自己就想到方法实验了。。 fn main() { let mut a = 34; println!("a's addr:{:p}", &a); let p = &mut a; println!("p's addr:{:p}", &a
java编程思想 -- 数据的初始化百合不是茶 java 数据的初始化
1.使用构造器确保数据初始化 /* *在ReckInitDemo类中创建Reck的对象 */ public class ReckInitDemo { public static void main(String[] args) { //创建Reck对象 new Reck(); } }
[航天与宇宙]为什么发射和回收航天器有档期 comsci
地球的大气层中有一个时空屏蔽层,这个层次会不定时的出现,如果该时空屏蔽层出现,那么将导致外层空间进入的任何物体被摧毁,而从地面发射到太空的飞船也将被摧毁... 所以,航天发射和飞船回收都需要等待这个时空屏蔽层消失之后,再进行 &
linux下批量替换文件内容商人shang linux 替换
1、网络上现成的资料　　格式: sed -i "s/查找字段/替换字段/g" `grep 查找字段 -rl 路径` 　　linux sed 批量替换多个文件中的字符串　　sed -i "s/oldstring/newstring/g" `grep oldstring -rl yourdir` 　　例如：替换/home下所有文件中的www.admi
网页在线天气预报 oloz 天气预报
网页在线调用天气预报 <%@ page language="java" contentType="text/html; charset=utf-8" pageEncoding="utf-8"%> <!DOCTYPE html PUBLIC "-//W3C//DTD HTML 4.01 Transit
SpringMVC和Struts2比较杨白白 springMVC
1. 入口 spring mvc的入口是servlet，而struts2是filter（这里要指出，filter和servlet是不同的。以前认为filter是servlet的一种特殊），这样就导致了二者的机制不同，这里就牵涉到servlet和filter的区别了。参见：http://blog.csdn.net/zs15932616453/article/details/8832343 2
refuse copy, lazy girl! 小桔子 copy
妹妹坐船头啊啊啊啊！都打算一点点琢磨呢。文字编辑也写了基本功能了。。今天查资料，结果查到了人家写得完完整整的。我清楚的认识到： 1.那是我自己觉得写不出的高度 2.如果直接拿来用，很快就能解决问题 3.然后就是抄咩~~ 4.肿么可以这样子，都不想写了今儿个，留着作参考吧！拒绝大抄特抄，慢慢一点点写！
apache与php整合 aichenglong php apache web
一 apache web服务器 1 apeche web服务器的安装 1)下载Apache web服务器 2)配置域名(如果需要使用要在DNS上注册) 3)测试安装访问http://localhost/验证是否安装成功 2 apache管理 1)service.msc进行图形化管理 2)命令管理，配
Maven常用内置变量 AILIKES maven
Built-in properties ${basedir} represents the directory containing pom.xml ${version} equivalent to ${project.version} (deprecated: ${pom.version}) Pom/Project properties Al
java的类和对象百合不是茶 JAVA面向对象类对象
java中的类： java是面向对象的语言，解决问题的核心就是将问题看成是一个类，使用类来解决 java使用 class 类名来创建类，在Java中类名要求和构造方法，Java的文件名是一样的创建一个A类： class A{ } java中的类：将某两个事物有联系的属性包装在一个类中，再通
JS控制页面输入框为只读 bijian1013 JavaScript
在WEB应用开发当中，增、删除、改、查功能必不可少，为了减少以后维护的工作量，我们一般都只做一份页面，通过传入的参数控制其是新增、修改或者查看。而修改时需将待修改的信息从后台取到并显示出来，实际上就是查看的过程，唯一的区别是修改时，页面上所有的信息能修改，而查看页面上的信息不能修改。因此完全可以将其合并，但通过前端JS将查看页面的所有信息控制为只读，在信息量非常大时，就比较麻烦。
AngularJS与服务器交互 bijian1013 JavaScript AngularJS $http
对于AJAX应用（使用XMLHttpRequests）来说，向服务器发起请求的传统方式是：获取一个XMLHttpRequest对象的引用、发起请求、读取响应、检查状态码，最后处理服务端的响应。整个过程示例如下： var xmlhttp = new XMLHttpRequest(); xmlhttp.onreadystatechange
[Maven学习笔记八]Maven常用插件应用 bit1129 maven
常用插件及其用法位于：http://maven.apache.org/plugins/ 1. Jetty server plugin 2. Dependency copy plugin 3. Surefire Test plugin 4. Uber jar plugin 1. Jetty Pl
【Hive六】Hive用户自定义函数(UDF) bit1129 自定义函数
1. 什么是Hive UDF Hive是基于Hadoop中的MapReduce，提供HQL查询的数据仓库。Hive是一个很开放的系统，很多内容都支持用户定制，包括：文件格式：Text File，Sequence File 内存中的数据格式： Java Integer/String, Hadoop IntWritable/Text 用户提供的 map/reduce 脚本：不管什么
杀掉nginx进程后丢失nginx.pid，如何重新启动nginx ronin47 nginx 重启 pid丢失
nginx进程被意外关闭，使用nginx -s reload重启时报如下错误：nginx: [error] open() “/var/run/nginx.pid” failed (2: No such file or directory)这是因为nginx进程被杀死后pid丢失了，下一次再开启nginx -s reload时无法启动解决办法：nginx -s reload 只是用来告诉运行中的ng
UI设计中我们为什么需要设计动效 brotherlamp UI ui教程 ui视频 ui资料 ui自学
随着国际大品牌苹果和谷歌的引领，最近越来越多的国内公司开始关注动效设计了，越来越多的团队已经意识到动效在产品用户体验中的重要性了，更多的UI设计师们也开始投身动效设计领域。但是说到底，我们到底为什么需要动效设计？或者说我们到底需要什么样的动效？做动效设计也有段时间了，于是尝试用一些案例，从产品本身出发来说说我所思考的动效设计。一、加强体验舒适度嗯，就是让用户更加爽更加爽的用你的产品。
Spring中JdbcDaoSupport的DataSource注入问题 bylijinnan java spring
参考以下两篇文章： http://www.mkyong.com/spring/spring-jdbctemplate-jdbcdaosupport-examples/ http://stackoverflow.com/questions/4762229/spring-ldap-invoking-setter-methods-in-beans-configuration Sprin
数据库连接池的工作原理 chicony 数据库连接池
随着信息技术的高速发展与广泛应用，数据库技术在信息技术领域中的位置越来越重要，尤其是网络应用和电子商务的迅速发展，都需要数据库技术支持动态Web站点的运行，而传统的开发模式是：首先在主程序（如Servlet、Beans）中建立数据库连接；然后进行SQL操作，对数据库中的对象进行查询、修改和删除等操作；最后断开数据库连接。使用这种开发模式，对
java 关键字 CrazyMizzz java
关键字是事先定义的，有特别意义的标识符，有时又叫保留字。对于保留字，用户只能按照系统规定的方式使用，不能自行定义。 Java中的关键字按功能主要可以分为以下几类：（1）访问修饰符 public,private,protected p
Hive中的排序语法 daizj 排序 hive order by DISTRIBUTE BY sort by
Hive中的排序语法 2014.06.22 ORDER BY hive中的ORDER BY语句和关系数据库中的sql语法相似。他会对查询结果做全局排序，这意味着所有的数据会传送到一个Reduce任务上，这样会导致在大数量的情况下，花费大量时间。与数据库中 ORDER BY 的区别在于在hive.mapred.mode = strict模式下，必须指定 limit 否则执行会报错。
单态设计模式 dcj3sjt126com 设计模式
单例模式（Singleton）用于为一个类生成一个唯一的对象。最常用的地方是数据库连接。使用单例模式生成一个对象后，该对象可以被其它众多对象所使用。 <?phpclass Example{ // 保存类实例在此属性中 private static&
svn locked dcj3sjt126com Lock
post-commit hook failed (exit code 1) with output: svn: E155004: Working copy 'D:\xx\xxx' locked svn: E200031: sqlite: attempt to write a readonly database svn: E200031: sqlite: attempt to write a
ARM寄存器学习 e200702084 数据结构 C++c C#F#
无论是学习哪一种处理器，首先需要明确的就是这种处理器的寄存器以及工作模式。 ARM有37个寄存器，其中31个通用寄存器，6个状态寄存器。 1、不分组寄存器（R0-R7）不分组也就是说说，在所有的处理器模式下指的都时同一物理寄存器。在异常中断造成处理器模式切换时，由于不同的处理器模式使用一个名字相同的物理寄存器，就是
常用编码资料 gengzg 编码
List<UserInfo> list=GetUserS.GetUserList(11); String json=JSON.toJSONString(list); HashMap<Object,Object> hs=new HashMap<Object, Object>(); for(int i=0;i<10;i++) {
进程 vs. 线程 hongtoushizi 线程 linux 进程
我们介绍了多进程和多线程，这是实现多任务最常用的两种方式。现在，我们来讨论一下这两种方式的优缺点。首先，要实现多任务，通常我们会设计Master-Worker模式，Master负责分配任务，Worker负责执行任务，因此，多任务环境下，通常是一个Master，多个Worker。如果用多进程实现Master-Worker，主进程就是Master，其他进程就是Worker。如果用多线程实现
Linux定时Job：crontab -e 与 /etc/crontab 的区别 Josh_Persistence linux crontab
一、linux中的crotab中的指定的时间只有5个部分：* * * * * 分别表示：分钟，小时，日，月，星期，具体说来：第一段代表分钟 0—59 第二段代表小时 0—23 第三段代表日期 1—31 第四段代表月份 1—12 第五段代表星期几，0代表星期日 0—6 如： */1 * * * * 每分钟执行一次。 *
KMP算法详解 hm4123660 数据结构 C++算法字符串 KMP
字符串模式匹配我们相信大家都有遇过，然而我们也习惯用简单匹配法（即Brute-Force算法)，其基本思路就是一个个逐一对比下去，这也是我们大家熟知的方法，然而这种算法的效率并不高，但利于理解。假设主串s="ababcabcacbab",模式串为t="
枚举类型的单例模式 zhb8015 单例模式
E.编写一个包含单个元素的枚举类型[极推荐]。代码如下： public enum MaYun {himself; //定义一个枚举的元素，就代表MaYun的一个实例private String anotherField;MaYun() {//MaYun诞生要做的事情//这个方法也可以去掉。将构造时候需要做的事情放在instance赋值的时候：/** himself = MaYun() {*
Kafka+Storm+HDFS ssydxa219 storm
cd /myhome/usr/stormbin/storm nimbus &bin/storm supervisor &bin/storm ui &Kafka+Storm+HDFS整合实践kafka_2.9.2-0.8.1.1.tgzapache-storm-0.9.2-incubating.tar.gzKafka安装配置我们使用3台机器搭建Kafk
Java获取本地服务器的IP 中华好儿孙 java Web 获取服务器ip地址
System.out.println("getRequestURL:"+request.getRequestURL()); System.out.println("getLocalAddr:"+request.getLocalAddr()); System.out.println("getLocalPort:&quo

DenseFusion(6D姿态估计)解读-2019cvpr

DenseFusion(6D姿态估计)解读-2019cvpr

资源

作者的想法

1.摘要

2.介绍

3.相关工作

4.模型

5.模型结构

6.语义分割

7.密集特征提取

8.像素级密集融合

9.6D目标姿态估计

10.迭代优化

实验

结论

你可能感兴趣的:(pyTorch,深度学习,算法)