[论文笔记] Fusion++: VolumetricObject-LevelSLAM

1. introduction

本文结合了MASK RCNN，说是语义SLAM，其实基本没用到语义信息，而是结合了物体检测结果，对每个物体进行三维重建，建立物体级的地图。并完善了基于这个地图的初始化、删除、更新、跟踪、重定位、图优化的工作。

存在的不足还是挺多的，默认场景是静态的，并且不追踪动态物体。MASK RCNN的阈值很高，这样漏检应该是比较严重的。MASK RCNN并非实时，30帧运行一次。

基于Kinect fusion，使用MASK RCNN分割每张图像上的实例级物体，建立每个物体的TSDF，利用其对每个物体进行重建、赋予3D前景mask，并且每个重建的物体都含有其语义信息和所有其他预测。

重建的物体以6自由度的位姿图的形式存储，每一帧以物体为单位，对其进行优化，并用于跟踪、重定位和闭环检测。在检测到闭环后，物体的位姿会被调整，但每个物体内部的结构不变，物体的语义信息也每一帧优化更新。

主要贡献有：

创建了一个物体朝向的SLAM系统，构造含有不同分辨率的3D实例级物体的地图。
每一帧的2D物体检测都使用体素前景(voxel foreground)融合，并记录其被检测到的次数比例。
实现了全局一致、闭环的地图，包含高质量的物体重建。

2. Method

系统流程是：

输入RGBD图像，初始化背景TSDF，用于local tracking和occlusion handling。
若位姿改变过大或跟踪丢失，进行重定位和图优化，并重置TSDF。
独立的检测线程使用MASK RCNN检测物体，检测结果经滤波与已存的物体级地图匹配。
若地图中无匹配上的物体，新建TSDF物体实例并加入地图。
关联的前景检测与物体的3D前景mask融合，并关联其语义信息和存在概率图。

2.1. TSDF Object Instances

地图是以重建的物体为单位组成的，每个物体由TSDF进行重建，记为 $v_o$ 。每个 $v_o$ 有一个相应的位姿属性 $T_{wo}$ ，表示这个物体出现的一帧到世界坐标系所在参考帧的转换。每一个重建的物体实例都由一个正方体volume进行表示，相应的，这个volume包含一个中心点位置（坐标系为?），以三维点坐标表示，和一个size，以边长表示。

总结一下，这部分讲了地图的基本构成单位：instance。

它的表示方法：TSDF重建。
如何初始化和更新其位置和大小。
如何更新其形状和前景标记。
如何渲染。
如何记录更新其检测概率和语义概率。
如何判断其是否应该被新建或删除。

2.1.1. Initialisation and resizing

这步的目的是新建一个TSDF重建模型，初始化其参数。

当在当前帧检测到当前地图中不存在的物体时，要重建一个新的TSDF插入地图。重建一个新的TSDF，首先要确定它的size和position。

重建时，根据检测到物体的mask，将其投影到三维世界坐标系中。具体做法是对于每个mask中的坐标点，找到其对应深度图中的深度，将归一化坐标scale，再经内参矩阵和外参矩阵转换，得到世界坐标系下的三维坐标。这里，外参是当前相机位姿的估计。文中说，同时会将部分背景也重建，因此猜想，这里的mask是mask rcnn直接得到的bounding box，而非分割轮廓？

确定position

找到10%和90%的坐标点，计算其均值为中心坐标。

确定size

确定体积为 $s_o=m||p_{90}-p_{10}||_∞$ ，根据固定的分辨率 $r_o=64$ ，计算每一个体素的大小 $v_o=\frac {s_o}{r_o}$ 。

因此，分辨率固定，体积越小，体素越小，建模越精细。

更新TSDF

同时，在运行过程中，可能会检测到一个物体的其他区域（之前没看到的），就需要把之前的建模补全，重新计算大小和中心点。其中心点是通过以体素大小为单位平移和改变，大小改变时，保持体素大小不变，增加其分辨率。同时，限制了最大的分辨率和size。

确定是否新建一个新的模型

若计算到的中心点在相机5m内，且与其他已存在于地图中的模型的3DIOU<0.5，则新建。

2.1.2. Integration

这步的目的是在每一帧根据深度图和检测结果，维护地图中的TSDF重建模型和其参数。

维护分为两个方面：模型的voxel和对应的语义信息。

surface integration

这个是用来维护三维重建模型的形状。根据每一帧的深度图，模型 $v_o$ 的每个体素 $v$ 包含的属性有：其location，归一截断段距离（normalised truncated signed distance value） $S_{k-1}^{o}$ ，相应权重 $W_{k-1}^{o}$ 。

对于每一帧，若这个TSDF volume可见，并且其百分之五十的像素被追踪，且ICP RMSE<0.03，则对于这个volume，判断它的每个体素是否更新。是否更新volume，与它是否在当前帧被检测到是无关的。

若这个体素 $v$ 投影到当前帧像素位置的深度值，小于对应深度图中的测量深度值加阶段距离（不懂这俩个深度值的区别，一个是根据三维坐标计算的深度，一个是当前帧传感器测量的RGFD图中的深度？），则这个测量深度，根据权重 $w$ 去更新这个volume。

instance mask intergration

这一步是维护三维模型各体素是否是前景的计数器。MASK RCNN的检测结果是一个二项值：是或不是前景。每个体素有一个对应的计数器： $F_{k-1}^{o}(v)$ 、 $N_{k-1}^{o}(v)$ ，根据MASK在这个像素点的值 $M_{k}^{i}$ ，进行更新。

$F_{k}^{o}(v)=F_{k-1}^{o}(v)+M_{k}^{i}(K \pi (cP(v)))$

$N_{k}^{o}(v)=N_{k-1}^{o}(v)+(1-M_{k}^{i}(K \pi (cP(v)))$

其中， $p i$ 是将相机坐标系下的三维坐标归一化的函数，经过K转换成像素坐标。那么， $P (v)$ 是体素在世界坐标系下的三维坐标？ $c$ 难道是外参？

然后再计算前景统计的比例，根据这个比例判断这个体素是不是前景。

2.1.3. Raycasting

某种光线追踪方法，渲染了深度、法线、顶点、TGB、目标索引。主要是用来判断是不是前景，避免碰撞什么的。

2.1.4. Existence probability

这一步，维护了一个instance被检测到的次数计数器。对每一帧，若一个instance被清晰的观测到，则记录它是否被检测到。然后被检测到的次数所占的比例，如果过小，则从地图中删除这个instance。

2.1.5. Semantic Labels

这一步，维护了TSDF的语义类别概率。文章中认为semantic fusion的更新方式存在问题，而选择使用直接取平均。

2.2. Detection and Data Association

这一步是讲检测结果的数据关联，具体是在上面都说过。

使用MASK RCNN得到前景mask、bounding box和类别概率。MASK RCNN的检测结果经过滤波，只留下最合适的100个。

这100个检测结果和地图中的TSDF匹配，找mask相交最大的匹配，去更新它的mask和类别概率。

2.3. Layered Local Tracking

这部分讲了一下tracking的方法，和kinect fusion的差不多，没有细看。

有几点值得注意：

地图中同时建了一个背景的TSDF，用于地图中无instance或出现碰撞（occlusion）的情况。
利用上一帧的位姿，将单独instance结合背景TSDF，render到当前坐标系下，去得到一个外层的参考帧，用于之后的tracking。
参考帧和当前帧构造point-to-plane error，使用高斯牛顿法优化，优化目标是当前帧的位姿。
同时对每一个实例进行位姿图优化，使用ICP RMSE评测，用于instance integration和检查是否跟踪失败。

2.4. Relocalisation

如果跟踪丢失或者重置了TSDF，则进行重定位，把当前帧与地图中的instance对其。

文章认为，只对重建的volume使用ICP效果不好（应该是这些volume与有深度的特征点ICP？），因此，选择使用snapshots of sparse BRISK features对当前图像进行检测，再根据深度图投影到3D点。

文章使用了snapshots of sparse BRISK features的方法。我的意会是，对地图中的物体，每隔15°提一次snapshot，用于和当前帧中检测的结果的对应深度图来匹配。匹配时使用3D-3D RANSAC，对每一个instance进行匹配，如果有物体匹配上了，就对所有点使用3D-3D RANSAC进行匹配，来得到最终重定位的位姿。

这个snapshot不太懂，究竟是什么的snapshot和什么做RANSAC？？

2.5. Object level Pose Graph

和slam++的方法一样。

建图

节点：

都以SE(3)的形式表示位姿变换，具体是针对一个固定的世界参考帧 $w$ 的旋转和平移。

$T_{w,o}$ ：世界到物体 $j$ 的位姿转换
$T_{w,c}$ ：世界到时间戳为 $i$ 的相机的位姿转换

边：

也是以SE(3)的形式表示的位姿变换。

$T_{o,c}$ ：为第 $i$ 个时间戳的相机到物体 $j$ 的位姿转换
$T_{c_{k},c_{k-1}}$ ：为相邻两帧之间相机位姿的转换。

优化

边之间的constraint

$T_{o,c}$ ：为对于物体每个像素的ICP误差
$T_{c_{k},c_{k-1}}$ ：为对于为止instance的背景的ICP误差

然后可以写出误差项

优化过程中，要求协方差矩阵，用李代数求导的方式，定义扰动项，求雅可比，最后写出信息矩阵H。

最后得到总的误差项，就是所有边的误差和，包括cam-obj和cam-cam。然后对其进行优化。

优化后得到新的instance的位姿，和相机的位姿。在新建其他新的instance之前，对这些优化的位姿变量更新。

此外还提及了，如果一个instance发生resize，其中心点坐标也会移动，这时，其拥有一个移动前后的变换 $T_{O,O'}$ ，对于预期相连的点，cam-obj和world-obj，相应的位姿都要被这个 $T_{O,O'}$ 更新。

你可能感兴趣的:(SLAM,论文笔记)

导致格式错误的 Lambda 代理响应的原因以及如何修复它 zqhdz米时空汇编
当人们尝试使用AWSAPIGateway和AWSLambda构建无服务器应用程序时，经常出现的一个问题是_由于配置错误而执行失败：Lambda代理响应格式错误。_没有什么比通用错误消息更糟糕的了，它们不会告诉您解决问题所需的任何内容，对吧？AWS并不是以其错误消息设计而闻名，如果甚至可以这样称呼它的话，更不用说为您提供解决问题的方法了。那么如何修复这个Lambda错误以及是什么原因造成的呢？花椒壳
ROS yaml参数文件的使用 Sun Shiteng ROS
举个例子，若在params.yaml文件中定义如下参数LidarImageFusion:points_src:"/hilbert_h/deskew/cloud_info"image_src:"/usb_cam0/image_raw"camera_info_src:"/home/hdj/fusion_slam/Color_SLAM_ws/src/hilbert_h/config/firefly_8s
xwiki html和css,MediaWiki vs. XWiki Ake阿科多语言信息技术编程数据库操作系统
140Afar,Abkhazian,Afrikaans,Amharic,Arabic,Assamese,Aymara,Azerbaijani,Bashkir,Byelorussian,Bulgarian,Bihari,Bislama,Bengali;Bangla,Tibetan,Breton,Catalan,Corsican,Czech,Welsh,Danish,German,Bhutani,Gr
2021-07-07 潇洒二爷
一辆特斯拉“花格子S型”小车，突然起火，电子技术的车门也失灵TeslaModelSPlaidbrokeintofirewithfailureofelctronicdoors一辆“花格子牌”（ModelSPlaid）特斯拉轿车，在6月29日这天，车主正在路上行驶，突然烈焰腾飞，他的代理律师说，他被短时间困在车内，因为几个电动门都打不开。事情在几天前发生于费城外，这名男子拿到这款特斯拉之后，号称是世界
力扣刷题记录（一）剑指Offer（第二版）乘凉~ 求职过程记录 leetcode 链表算法
1、本栏用来记录社招找工作过程中的内容，包括基础知识学习以及面试问题的记录等，以便于后续个人回顾学习；暂时只有2023年3月份，第一次社招找工作的过程；2、个人经历：研究生期间课题是SLAM在无人机上的应用，有接触SLAM、Linux、ROS、C/C++、DJIOSDK等；3、参加工作后（2021-2023年）岗位是嵌入式软件开发，主要是服务器开发，Linux、C/C++、网络编程、docker容
论文笔记—NDT-Transformer: Large-Scale 3D Point Cloud Localization using the Normal Distribution Transfor 入门打工人笔记 slam 定位算法
论文笔记—NDT-Transformer:Large-Scale3DPointCloudLocalizationusingtheNormalDistributionTransformRepresentation文章摘要~~~~~~~在GPS挑战的环境中，自动驾驶对基于3D点云的地点识别有很高的要求，并且是基于激光雷达的SLAM系统的重要组成部分（即闭环检测）。本文提出了一种名为NDT-Transf
深度学习特征提取魔改版太强了！发文香饽饽！深度之眼深度学习干货人工智能干货人工智能深度学习机器学习论文特征提取
要说CV领域经久不衰的研究热点，特征提取可以占一席，毕竟SLAM、三维重建等重要应用的底层都离不开它。再加上近几年深度学习兴起，用深度学习做特征提取逐渐成了主流，比传统算法无论是性能、准确性还是效率都更胜一筹。目前比较常见的深度学习特征提取方法有基于transformer、基于CNN、基于LSTM以及基于GAN，都发展的比较成熟。但为了追求更快速、准确、鲁棒的特征点提取，研究者们开始致力于改进深度
视觉SLAM十四讲学习笔记——第十讲后端优化（2）晒月光12138 视觉SLAM十四讲学习笔记 slam ubuntu
上文提到考虑全局的后端优化计算量非常大，因此在计算增量方程时，借助H矩阵的稀疏性加速运算。但是随着时间的推移，累积的相机位姿和路标数量还是会导致计算量过大，以上一节的示例代码数据为例：16张图像，共提取到22106个特征点，这些特征点共出现了83718次。对于一个20Hz更新速度，上述的数据量甚至还不到1s的内容，因此在求解大规模定位建图问题时，一定要控制BA的规模。这里主要有两种解决思路：（1）
《Java基础知识》Java Lambda表达式 Limingmingaa java java 开发语言蓝桥杯
接触Lambda表达式的时候，第一感觉就是，这个是啥？我居然看不懂，于是开始寻找资料，必须弄懂它。先来看一个案例：@FunctionalInterfacepublicinterfaceMyLamda{voidtest1(Stringy);}importdemo.knowledgepoints.Lambda.inf.MyLamda;publicclassLambdaTest{publicsta
[论文笔记]Circle Loss: A Unified Perspective of Pair Similarity Optimization 愤怒的可乐 #文本匹配[论文]论文翻译/笔记自然语言处理论文阅读人工智能
引言为了理解CoSENT的loss，今天来读一下CircleLoss:AUnifiedPerspectiveofPairSimilarityOptimization。为了简单，下文中以翻译的口吻记录，比如替换"作者"为"我们"。这篇论文从对深度特征学习的成对相似度优化角度出发，旨在最大化同类之间的相似度sps_ps
NDT算法 Joeybee SLAM 算法
上一次我们学习了高翔《自动驾驶与机器人中的SLAM技术》中的三维ICP算法，其中包括点对点、点对线、点对面的ICP算法，本次博客学习NDT算法的源码。NDT算法与ICP算法的最大不同之处，在我看来是NDT考虑了均值和方差这两个局部统计量。从最后的求解方法来看，NDT采用了加权最小二乘问题的高斯-牛顿法，和ICP算法的最明显区别是多了权重分布。从高翔书中的测试结果来看，NDT的收敛速度稍弱于点对面I
【论文笔记】Multi-Task Learning as a Bargaining Game xhyu61 机器学习学习笔记论文笔记论文阅读人工智能深度学习
Abstract本文将多任务学习中的梯度组合步骤视为一种讨价还价式博弈(bargaininggame)，通过游戏，各个任务协商出共识梯度更新方向。在一定条件下，这种问题具有唯一解(NashBargainingSolution)，可以作为多任务学习中的一种原则方法。本文提出Nash-MTL，推导了其收敛性的理论保证。1Introduction大部分MTL优化算法遵循一个通用方案。计算所有任务的梯度g
[论文笔记] LLaVA 心心喵论文笔记论文阅读
一、LLaVA论文中的主要工作和实验结果ExistingGap:之前的大部分工作都在做模态对齐，做图片的representationlearning，而没有针对ChatBot（多轮对话，指令理解）这种场景优化。Contribution:这篇工作已经在BLIP-2之后了，所以Image的理解能力不是LLaVA希望提升的重点，LLaVA是想提升多模态模型的Instruction-Followingab
[论文笔记] LLM模型剪枝心心喵论文笔记论文阅读剪枝算法
AttentionIsAllYouNeedButYouDon’tNeedAllOfItForInferenceofLargeLanguageModelsLLaMA2在剪枝时，跳过ffn和跳过fulllayer的效果差不多。相比跳过ffn/fulllayer，跳过attentionlayer的影响会更小。跳过attentionlayer：7B/13B从100%参数剪枝到66%，平均指标只下降1.7～
SLAM中常用的库 wq_151 人工智能 SLAM 计算机视觉人工智能机器学习 slam
SLAM中常用的库关于库关于库Pangolin是一个用于OpenGL显示/交互以及视频输入的一个轻量级、快速开发库，下面是Pangolin的Github网址：githubEigen是一个高层次的C++库，有效支持线性代数，矩阵和矢量运算，数值分析及其相关的算法。pagenanoflann是一个c++11标准库，用于构建具有不同拓扑（R2，R3（点云），SO(2)和SO(3)（2D和3D旋转组））的
【论文笔记】Training language models to follow instructions with human feedback B部分 Ctrl+Alt+L 大模型论文整理论文笔记论文阅读语言模型人工智能自然语言处理
TraininglanguagemodelstofollowinstructionswithhumanfeedbackB部分回顾一下第一代GPT-1：设计思路是“海量无标记文本进行无监督预训练+少量有标签文本有监督微调”范式；模型架构是基于Transformer的叠加解码器（掩码自注意力机制、残差、Layernorm）；下游各种具体任务的适应是通过在模型架构的输出后增加线性权重WyW_{y}Wy实
【XR】优化SLAM SDK的稳定性大江东去浪淘尽千古风流人物 xr
优化SLAMSDK的稳定性是确保增强现实(AR)和虚拟现实(VR)应用在各种环境和设备上都能稳定运行的关键。以下是一些主要的优化方法：1.传感器融合优化方法:将多个传感器的数据（如摄像头、加速度计、陀螺仪、磁力计）进行融合，以补偿单一传感器可能存在的误差。优势:提高了环境理解的准确性，减少了由于单一传感器误差导致的抖动和漂移现象。实例:ARKit和ARCore都利用了传感器融合技术来增强稳定性。2
【论文笔记】：LAYN：用于小目标检测的轻量级多尺度注意力YOLOv8网络 hhhhhhkkkyyy 论文阅读目标检测 YOLO
背景针对嵌入式设备对目标检测算法的需求，大多数主流目标检测框架目前缺乏针对小目标的具体改进，然后提出的一种轻量级多尺度注意力YOLOv8小目标检测算法。小目标检测精度低的原因随着网络在训练过程中的加深，检测到的目标容易丢失边缘信息和灰度信息等。获得高级语义信息也较少，图像中可能存在一些噪声信息，误导训练网络学习不正确的特征。映射到原始图像的感受野的大小。当感受野相对较小时，空间结构特征保留较多，但
ROS2导航SLAM建图探索鱼香ROS ROS2 机器人 SLAM ROS2 导航 SLAM
大家好，我是昨晚熬夜太多脑壳痛的小鱼。今天带大家一起探索一些ROS2+turtlebot3的slam建图。先上最终效果图1.安装ROS2第一步就是要有一个ROS2的环境，这个没有的请打开小鱼的fishros网站，选择一行代码安装ROS2进行安装。2.安装turtlebot3sudoaptinstallros-foxy-turtlebot3*sudoaptinstallros-foxy-cartog
数百倍加速！港科大最新：嵌入式平台上实时运行的NeRF SLAM！计算机视觉工坊 3D视觉从入门到精通学习自动驾驶算法
来源：计算机视觉工坊添加微信：dddvision，备注：NeRF，拉你入群。文末附行业细分群0.笔者个人体会传统的NeRF和NeRFSLAM所需要的计算量非常大，很难在嵌入式设备上跑起来，这也就很大程度上限制了NeRFSLAM的落地。但最近港科大&中山大学提出了一项工作Photo-SLAM，不仅实现了高保真的建图，还可以在嵌入式设备上实时运行，甚至渲染速度提高了数百倍。下面一起来阅读一下这项工作，
自动驾驶-机器人-slam-定位面经和面试知识系列07之C++STL面试题（03） lonely-stone 面试 c++职场和发展
这个博客系列会分为C++STL-面经、常考公式推导和SLAM面经面试题等三个系列进行更新，基本涵盖了自己秋招历程被问过的面试内容（除了实习和学校项目相关的具体细节）。在知乎和牛客也会同步更新，全网同号（lonely-stone或者lonely_stone）。关于高频面试题和C++STL面经，每次我会更新10个问题左右，每次更新过多，害怕大家可能看了就只记住其中几个点。（在个人秋招面试过程中，面试到
激光SLAM--(8) LeGO-LOAM论文笔记 lonely-stone slam 激光SLAM 论文阅读
论文标题：LeGO-LOAM：LightweightandGround-OptimizedLidarOdometryandMappingonVariableTerrain应用在可变地形场景的轻量级的、并利用地面优化的LOAMABSTRACT轻量级的、基于地面优化的LOAM实时进行六自由度位姿估计，应用在地面的车辆上。强调应用在地面车辆上是因为在这里面要求雷达必须水平安装，而像LOAM和LIO-SA
自动驾驶-机器人-slam-定位面经和面试知识系列03之C++STL面试题（01） lonely-stone 面试 c++职场和发展
这两天有点忙耽搁了，抱歉！！！这个博客系列会分为C++STL-面经、常考公式推导和SLAM面经面试题等三个系列进行更新，基本涵盖了自己秋招历程被问过的面试内容（除了实习和学校项目相关的具体细节）。在知乎和牛客也会同步更新，全网同号（lonely-stone或者lonely_stone）。关于高频面试题和C++STL面经，每次我会更新10个问题左右，每次更新过多，害怕大家可能看了就只记住其中几个点。
自动驾驶-机器人-slam-定位面经和面试知识系列04之高频面试题（02） lonely-stone 自动驾驶机器人面试
这个博客系列会分为C++STL-面经、常考公式推导和SLAM面经面试题等三个系列进行更新，基本涵盖了自己秋招历程被问过的面试内容（除了实习和学校项目相关的具体细节）。在知乎和牛客也会同步更新，全网同号（lonely-stone或者lonely_stone）。关于高频面试题和C++STL面经，每次我会更新10个问题左右，每次更新过多，害怕大家可能看了就只记住其中几个点。（在个人秋招面试过程中，面试到
论文浅尝 - AAAI2020 | 迈向建立多语言义元知识库：用于 BabelNet Synsets 义元预测... 开放知识图谱机器学习人工智能知识图谱自然语言处理深度学习
论文笔记整理：潘锐，天津大学硕士。来源：AAAI2020链接：https://arxiv.org/pdf/1912.01795.pdf摘要义原被定义为人类语言的最小语义单位。义原知识库（KBs）是一种包含义原标注词汇的知识库，它已成功地应用于许多自然语言处理任务中。然而，现有的义原知识库建立在少数几种语言上，阻碍了它们的广泛应用。为此论文提出在多语种百科全书词典BabelNet的基础上建立一个统一
[论文笔记] LLM数据集——LongData-Corpus 心心喵论文笔记服务器 ubuntu linux
https://huggingface.co/datasets/yuyijiong/LongData-Corpus1、hf的数据在开发机上要设置sshkey，然后cat复制之后在设置在hf上2、中文小说数据在云盘上清华大学云盘下载：#!/bin/bash#BaseURLbase_url="https://cloud.tsinghua.edu.cn/d/0670fcb14d294c97b5cf/fi
[论文笔记] eval-big-refactor lm_eval 每两个任务使用一个gpu，并保证端口未被使用心心喵论文笔记 restful 后端
1.5B在eval时候两个任务一个gpu是可以的。7B+在evalbelebele时会OOM，所以分配时脚本不同。eval_fast.py：importsubprocessimportargparseimportosimportsocket#参数列表task_name_list=["flores_mt_en_to_id","flores_mt_en_to_vi","flores_mt_en_to_
【论文笔记】Separating the “Chirp” from the “Chat”: Self-supervised Visual Grounding of Sound and Language xhyu61 机器学习学习笔记论文笔记论文阅读
Abstract提出了DenseAV，一种新颖的双编码器接地架构，仅通过观看视频学习高分辨率、语义有意义和视听对齐的特征。在没有明确的本地化监督的情况下，DenseAV可以发现单词的"意义"和声音的"位置"。此外，它在没有监督的情况下自动发现并区分这两种类型的关联。DenseAV的定位能力源于一种新的多头特征聚合算子，该算子直接比较稠密的图像和音频表示进行对比学习。相比之下，许多其他学习"全局"音
图形学论文笔记 Jozky86 图形学图形学笔记
文章目录PBD：XPBD：shapematchingPBD：【深入浅出NvidiaFleX】(1)PositionBasedDynamics最简化的PBD(基于位置的动力学)算法详解-论文原理讲解和太极代码最简化的PBD(基于位置的动力学)算法详解-论文原理讲解和太极代码XPBD：基于XPBD的物理模拟一条龙：公式推导+代码+文字讲解（纯自制）【论文精读】XPBD基于位置的动力学XPBD论文解读(
【视觉三维重建】【论文笔记】Deblurring 3D Gaussian Splatting CS_Zero 论文阅读
去模糊的3D高斯泼溅，看Demo比3D高斯更加精细，对场景物体细节的还原度更高，[官网]（https://benhenryl.github.io/Deblurring-3D-Gaussian-Splatting/）背景技术Volumetricrendering-basednerualfields：NeRF.Rasterizationrendering:3D-GS.Rasterization比vol
书其实只有三类西蜀石兰类
一个人一辈子其实只读三种书，知识类、技能类、修心类。知识类的书可以让我们活得更明白。类似十万个为什么这种书籍，我一直不太乐意去读，因为单纯的知识是没法做事的，就像知道地球转速是多少一样（我肯定不知道），这种所谓的知识，除非用到，普通人掌握了完全是一种负担，维基百科能找到的东西，为什么去记忆？知识类的书，每个方面都涉及些，让自己显得不那么没文化，仅此而已。社会认为的学识渊博，肯定不是站在
《TCP/IP 详解，卷1：协议》学习笔记、吐槽及其他 bylijinnan tcp
《TCP/IP 详解，卷1：协议》是经典，但不适合初学者。它更像是一本字典，适合学过网络的人温习和查阅一些记不清的概念。这本书，我看的版本是机械工业出版社、范建华等译的。这本书在我看来，翻译得一般，甚至有明显的错误。如果英文熟练，看原版更好： http://pcvr.nl/tcpip/ 下面是我的一些笔记，包括我看书时有疑问的地方，也有对该书的吐槽，有不对的地方请指正： 1.
Linux—— 静态IP跟动态IP设置 eksliang linux IP
一.在终端输入 vi /etc/sysconfig/network-scripts/ifcfg-eth0 静态ip模板如下： DEVICE="eth0" #网卡名称 BOOTPROTO="static" #静态IP（必须） HWADDR="00:0C:29:B5:65:CA" #网卡mac地址 IPV6INIT=&q
Informatica update strategy transformation 18289753290
更新策略组件：标记你的数据进入target里面做什么操作，一般会和lookup配合使用，有时候用0,1,1代表 forward rejected rows被选中，rejected row是输出在错误文件里，不想看到reject输出，将错误输出到文件，因为有时候数据库原因导致某些column不能update，reject就会output到错误文件里面供查看，在workflow的
使用Scrapy时出现虽然队列里有很多Request但是却不下载，造成假死状态酷的飞上天空 request
现象就是：程序运行一段时间，可能是几十分钟或者几个小时，然后后台日志里面就不出现下载页面的信息，一直显示上一分钟抓取了0个网页的信息。刚开始已经猜到是某些下载线程没有正常执行回调方法引起程序一直以为线程还未下载完成，但是水平有限研究源码未果。经过不停的google终于发现一个有价值的信息，是给twisted提出的一个bugfix 连接地址如下http://twistedmatrix.
利用预测分析技术来进行辅助医疗蓝儿唯美医疗
2014年，克利夫兰诊所（Cleveland Clinic）想要更有效地控制其手术中心做膝关节置换手术的费用。整个系统每年大约进行2600例此类手术，所以，即使降低很少一部分成本，都可以为诊所和病人节约大量的资金。为了找到适合的解决方案，供应商将视野投向了预测分析技术和工具，但其分析团队还必须花时间向医生解释基于数据的治疗方案意味着什么。克利夫兰诊所负责企业信息管理和分析的医疗
java 线程(一)：基础篇 DavidIsOK java 多线程线程
&nbs
Tomcat服务器框架之Servlet开发分析 aijuans servlet
最近使用Tomcat做web服务器，使用Servlet技术做开发时，对Tomcat的框架的简易分析：疑问：为什么我们在继承HttpServlet类之后，覆盖doGet(HttpServletRequest req, HttpServetResponse rep)方法后，该方法会自动被Tomcat服务器调用，doGet方法的参数有谁传递过来？怎样传递？分析之我见： doGet方法的
揭秘玖富的粉丝营销之谜与小米粉丝社区类似 aoyouzi 揭秘玖富的粉丝营销之谜
玖富旗下悟空理财凭借着一个微信公众号上线当天成交量即破百万，第七天成交量单日破了1000万;第23天时，累计成交量超1个亿……至今成立不到10个月，粉丝已经超过500万，月交易额突破10亿，而玖富平台目前的总用户数也已经超过了1800万，位居P2P平台第一位。很多互联网金融创业者慕名前来学习效仿，但是却鲜有成功者，玖富的粉丝营销对外至今仍然是个谜。　　近日，一直坚持微信粉丝营销
Java web的会话跟踪技术百合不是茶 url会话 Cookie会话 Seession会话 Java Web 隐藏域会话
会话跟踪主要是用在用户页面点击不同的页面时,需要用到的技术点会话:多次请求与响应的过程 1,url地址传递参数,实现页面跟踪技术格式:传一个参数的 url?名=值传两个参数的 url?名=值 &名=值关键代码
web.xml之Servlet配置 bijian1013 java web.xml Servlet配置
定义： <servlet> <servlet-name>myservlet</servlet-name> <servlet-class>com.myapp.controller.MyFirstServlet</servlet-class> <init-param> <param-name>
利用svnsync实现SVN同步备份 sunjing SVN 同步 E000022 svnsync 镜像
1. 在备份SVN服务器上建立版本库 svnadmin create test 2. 创建pre-revprop-change文件 cd test/hooks/ cp pre-revprop-change.tmpl pre-revprop-change 3. 修改pre-revprop-
【分布式数据一致性三】MongoDB读写一致性 bit1129 mongodb
本系列文章结合MongoDB，探讨分布式数据库的数据一致性，这个系列文章包括：数据一致性概述与CAP 最终一致性(Eventually Consistency) 网络分裂(Network Partition)问题多数据中心(Multi Data Center) 多个写者(Multi Writer)最终一致性一致性图表(Consistency Chart) 数据
Anychart图表组件-Flash图转IMG普通图的方法白糖_ Flash
问题背景：项目使用的是Anychart图表组件，渲染出来的图是Flash的，往往一个页面有时候会有多个flash图，而需求是让我们做一个打印预览和打印功能，让多个Flash图在一个页面上打印出来。那么我们打印预览的思路是获取页面的body元素，然后在打印预览界面通过$("body").append(html)的形式显示预览效果，结果让人大跌眼镜：Flash是
Window 80端口被占用 WHY? bozch 端口占用 window
平时在启动一些可能使用80端口软件的时候，会提示80端口已经被其他软件占用，那一般又会有那些软件占用这些端口呢？下面坐下总结： 1、web服务器是最经常见的占用80端口的，例如：tomcat , apache , IIS , Php等等； 2
编程之美-数组的最大值和最小值-分治法（两种形式） bylijinnan 编程之美
import java.util.Arrays; public class MinMaxInArray { /** * 编程之美数组的最大值和最小值分治法 * 两种形式 */ public static void main(String[] args) { int[] t={11,23,34,4,6,7,8,1,2,23}; int[]
Perl正则表达式 chenbowen00 正则表达式 perl
首先我们应该知道 Perl 程序中，正则表达式有三种存在形式，他们分别是：匹配：m/<regexp>;/ （还可以简写为 /<regexp>;/ ，略去 m）替换：s/<pattern>;/<replacement>;/ 转化：tr/<pattern>;/<replacemnt>;
[宇宙与天文]行星议会是否具有本行星大气层以外的权力呢? comsci
举个例子: 地球,地球上由200多个国家选举出一个代表地球联合体的议会,那么现在地球联合体遇到一个问题,地球这颗星球上面的矿产资源快要采掘完了....那么地球议会全体投票,一致通过一项带有法律性质的议案,既批准地球上的国家用各种技术手段在地球以外开采矿产资源和其它资源........ &
Oracle Profile 使用详解 daizj oracle profile 资源限制
Oracle Profile 使用详解转一、目的： Oracle系统中的profile可以用来对用户所能使用的数据库资源进行限制，使用Create Profile命令创建一个Profile，用它来实现对数据库资源的限制使用，如果把该profile分配给用户，则该用户所能使用的数据库资源都在该profile的限制之内。二、条件：创建profile必须要有CREATE PROFIL
How HipChat Stores And Indexes Billions Of Messages Using ElasticSearch & Redis dengkane elasticsearch Lucene
This article is from an interview with Zuhaib Siddique, a production engineer at HipChat, makers of group chat and IM for teams. HipChat started in an unusual space, one you might not
循环小示例，菲波拉契序列，循环解一元二次方程以及switch示例程序 dcj3sjt126com c 算法
# include <stdio.h> int main(void) { int n; int i; int f1, f2, f3; f1 = 1; f2 = 1; printf("请输入您需要求的想的序列："); scanf("%d", &n); for (i=3; i<n; i
macbook的lamp环境 dcj3sjt126com lamp
sudo vim /etc/apache2/httpd.conf /Library/WebServer/Documents 是默认的网站根目录重启Mac上的Apache服务这个命令很早以前就查过了，但是每次使用的时候还是要在网上查：停止服务：sudo /usr/sbin/apachectl stop 开启服务：s
java ArrayList源码下 shuizhaosi888 ArrayList源码
版本 jdk-7u71-windows-x64 JavaSE7 ArrayList源码上：http://flyouwith.iteye.com/blog/2166890 /** * 从这个列表中移除所有c中包含元素 */ public boolean removeAll(Collection<?> c) {
Spring Security（08）——intercept-url配置 234390216 Spring Security intercept-url 访问权限访问协议请求方法
intercept-url配置目录 1.1 指定拦截的url 1.2 指定访问权限 1.3 指定访问协议 1.4 指定请求方法 1.1 &n
Linux环境下的oracle安装 jayung oracle
linux系统下的oracle安装本文档是Linux(redhat6.x、centos6.x、redhat7.x) 64位操作系统安装Oracle 11g(Oracle Database 11g Enterprise Edition Release 11.2.0.4.0 - 64bit Production)，本文基于各种网络资料精心整理而成，共享给有需要的朋友。如有问题可联系：QQ：52-7
hotspot虚拟机 leichenlei java HotSpot jvm 虚拟机文档
JVM参数 http://docs.oracle.com/javase/6/docs/technotes/guides/vm/index.html JVM工具 http://docs.oracle.com/javase/6/docs/technotes/tools/index.html JVM垃圾回收 http://www.oracle.com
读《Node.js项目实践：构建可扩展的Web应用》 ——引编程慢慢变成系统化的“砌砖活” noaighost Web node.js
读《Node.js项目实践：构建可扩展的Web应用》 ——引编程慢慢变成系统化的“砌砖活” 眼里的Node.JS 初初接触node是一年前的事，那时候年少不更事。还在纠结什么语言可以编写出牛逼的程序，想必每个码农都会经历这个月经性的问题：微信用什么语言写的？facebook为什么推荐系统这么智能，用什么语言写的？dota2的外挂这么牛逼，用什么语言写的？……用什么语言写这句话，困扰人也是阻碍
快速开发Android应用 rensanning android
Android应用开发过程中，经常会遇到很多常见的类似问题，解决这些问题需要花时间，其实很多问题已经有了成熟的解决方案，比如很多第三方的开源lib，参考 Android Libraries 和 Android UI/UX Libraries。编码越少，Bug越少，效率自然会高。但可能由于根本没听说过、听说过但没用过、特殊原因不能用、自己已经有了解决方案等等原因，这些成熟的解决
理解Java中的弱引用 tomcat_oracle java 工作面试
　不久之前，我面试了一些求职Java高级开发工程师的应聘者。我常常会面试他们说，“你能给我介绍一些Java中得弱引用吗？”，如果面试者这样说，“嗯，是不是垃圾回收有关的？”，我就会基本满意了，我并不期待回答是一篇诘究本末的论文描述。　　然而事与愿违，我很吃惊的发现，在将近20多个有着平均5年开发经验和高学历背景的应聘者中，居然只有两个人知道弱引用的存在，但是在这两个人之中只有一个人真正了
标签输出html标签" target="_blank">关于标签输出html标签 xshdch jsp
http://back-888888.iteye.com/blog/1181202 关于<c:out value=""/>标签的使用，其中有一个属性是escapeXml默认是true(将html标签当做转移字符，直接显示不在浏览器上面进行解析)，当设置escapeXml属性值为false的时候就是不过滤xml，这样就能在浏览器上解析html标签， &nb

按字母分类： A B C D E F G H I J K L M N O P Q R S T U V W X Y Z 其他