跨越海的风

KinectFusion: Real-time 3D Reconstruction and Interaction Using a Moving Depth Camera

KinectFusion仅用Kinect的深度信息来追踪相机的3D姿态，实时重建室内场景的3D模型。本文详细描述了KinectFusion的功能和新提出的基于GPU的流水线。这个核心GPU流水线的扩展表明了能够在不降低相机追踪和重建的精确度的情况下，直接在相机前进行物体分割和用户交互。

Kinect生成实时的实物场景的离散测量点深度图，这些测量值可以被投影到一系列离散3D点（点云）。Kinect的噪声会引起深度测量值波动，使深度图中包含没有读到的“空洞”。

为了达到实时重建高质量3D模型的效果，系统持续追踪相机的6D自由度，实时地把摄像得到的深度数据融合成一整个全局3D模型。随着相机移动，新拍摄到的物理场景融合到同一模型中，重建模型随着新的深度测量值加入而得到细节的完善，空洞被填补，模型也变得完善。重建的模型还可以运用Kinect的RGB相机进行纹理贴图。

法线贴图：在原物体的凹凸表面的每个点上均作法线，通过RGB颜色通道来标记法线的方向，若在特定位置上应用光源，可以让细节程度较低的表面生成高细节程度的精确光照方向和反射效果。

KinectFusion支持先重建出整个场景，再通过移动想要分离的物体，精确地将其分离出来。

GPU实现：

主流水线包括4个阶段：

1．Depth Map Conversion：把实时深度图从二维图像坐标转化到相机坐标空间的3D顶点（vertices）和法线。

2．Camera Tracking（ICP）：在追踪阶段，用ICP算法的GPU实现，计算六维刚体变换，使每个当前有向点都与前一帧对应点紧密配准。所有相关变换都累积应用于一个单一变换，这个单一变换定义了Kinect的全局姿态。

3．Volumetric Integration：应用基于[5]的体积表面表示方法，给出相机的全局姿态，有向点就能转化到全局坐标系，单个的3D体素网格被更新。每个体素存储一个持续更新的由它到假定实物表面位置的平均距离。

4．Raycasting（3D Rendering）：为了渲染给用户，整体被光线投射以提取隐式表面的视图。若给出相机的全局姿态，这个体光线投射视图就等同于一个合成深度图，这个合成深度图可用作下一次ICP迭代的全局一致的低噪参考帧。这使得我们能通过把当前实时深度图和模型的低噪光线投射视图进行配准来实现追踪。

以上每一步都是在GPU上使用CUDA并行执行的。

1. Depth Map Conversion

在时刻i，每个CUDA线程并行地操作输入深度图D_i(u)中一个单独的像素u=(x,y)。给定Kinect相机内部校准矩阵K后，每个GPU线程把一个深度测量值投影变换为相机坐标空间中的一个3D顶点：v_i(u)=D_i(u)K^-1[u,1]。这样就并行地算出了一个顶点图V_i。

每个顶点对应的法向量由使用每个GPU线程使用相邻投影点计算出来：n_i(u)=(v_i(x+1,y)-v_i(x,y))×(v_i(x,y+1)-v_i(x,y))（标准化到单位长度n_i/||n_i||）。这样就并行地计算出了一个法线图N_i。

在时刻i的6自由度（6DOF）相机姿态是一个刚体变换矩阵T_i=[R_i|t_i],其中R_i是一个3*3的旋转矩阵，t_i是一个3D平移向量。给定这个变换后，顶点和法线能分别转换到全局坐标系中：，。

2. Camera Tracking

在KinectFusion中，ICP通过估算一个6DOF变换来追踪每个新深度帧的相机姿态，对当前帧中的有向点与之前的帧进行配准。这样得到一个相应的能够累加地应用到全局相机姿态T_i的6DOF变换。

ICP算法的第一步是：找到当前时刻i和前一时刻i-1的有向点的对应关系。在本文采用的系统中，我们使用投影数据关联（projectivedata association）来找到这些对应关系。这部分基于GPU的算法的伪代码为：

给定前一时刻的全局相机姿态T_i-1,每个GPU线程把一个独立点v_i-1变换到相机坐标系空间中，并将其透视投影到图像坐标中。然后把这个2D点作为当前顶点（V_i)和法线图（N_i）中沿着射线（投影到同一图像坐标）查找对应点的查找索引。最后，每个GPU线程测试对应点的相容性以剔除异常值，首先把顶点和对应点都转换到全局坐标系中，然后测试它们之间的欧氏距离和角度是否在一个阈值之内。注意，T_i是由T_i-1来初始化的,并且由每次ICP迭代过程中计算出来的增量变换（incremental transform）来更新。

给定这些对应有向点的集合，每次ICP迭代的输出是一个将点到面误差度量最小化的单一变换矩阵T，定义为每个当前帧中的点与它在前一帧中对应点所在切平面的距离平方和：，(1)。

我们用一个线性近似来解决这个系统，假设在帧之间仅有一个增量变换。这个线性系统采用树规约方法（tree reduction）在GPU上并行运算与求和。这个6*6系统的解决方案为在CPU上使用乔利斯基分解（Cholesky decomposition）。

本文中基于GPU相机追踪实现的一个关键贡献是：ICP是在640*480的Kinect深度图提供的所有测量值上执行的。没有对点进行稀疏采样，也没有明确的特征提取（虽然ICP隐式地需要整合深度特征）。这种密集追踪方式只能用于本文中这种新的GPU实现，并且在KinectFusion里物体分割和用户交互中起到了重要作用。

3. Volumetric Representation

通过使用ICP预测相机的全局姿态，所有深度测量值都能够从图像坐标系转换到一个一致的全局坐标空间。我们使用基于[5]的体表示（volumetric representation）方法来整合这些数据。预定义一个固定分辨率的三维体，将其映射到一个特定尺寸3D物理空间中。将这个三维体均匀地细分到3D体素网格中。使用一种符号距离函数（SDFs）的变体将全局3D顶点整合到体素中，SDFs值表示到实际表面的相对距离。当点在实际表面前面时，值为正；在实际表面后面时，值为负；表面交界处值定义为0。

实际上我们只存储实际表面附近的截断区域[5],即截断符号距离函数（TSDFs）。我们发现这种表示方法对于Kinect扫描数据有很多优势，尤其是和其他诸如网格的表示方法相比。它隐式地编码了距离数据的不确定性，高效地处理了多种测量值，随着新测量值的增加来填补空洞，能适应相机运动，而且隐式地存储了表面几何体。

3.1 Volumetric Integration

为了达到实时运算速度，我们使用一种新的体表示TSDFs的GPU实现。GPU给整个3D体素网格分配了线性内存。虽然有明显内存效率不足（一个包含32位体素的512³体积需要512MB的内存），但是运行速度是高效的。由于内存是连续排列的，所以并行线程的访问可以联合起来提高内存的吞吐量。

算法保证了能够合并访问体素网格，同时整合投影深度数据。算法实时更新体内的TSDF值（以每2ms更新512³体积的速度），并且允许连续表面估计从基于点的Kinect深度图中离散化到体素网格中。此外，这种方法比层次法更加易于实现，随着GPU可用内存的增加，本方法能扩展到为整个房间建模。

算法主要步骤的伪代码如图：

由于体积内通常包含大量的体素，所以不能给每个体素都创建一个GPU线程。为了保证合并内存访问，一个GPU线程被分派给每个体积前表面薄片的(x,y)点。然后GPU线程沿着z轴在每个薄片上移动，就并行地扫过整个体积。已知体积的分辨率，以及这个体积映射到的物理尺寸，每个离散的3D网格就能够被转化为全局坐标系的一个顶点。从相机中心（全局相机变换的平移向量）到这个顶点的度量距离是能够被计算出来的。这个3D顶点也能够被透视投影回图像坐标系以查找沿着射线的实际深度测量值。测量距离值和计算距离值的差值得出了一个新的体素SDF值（line 7）。将其标准化为一个TSDF（lines 9&11），并用一个简单的连续加权平均值（line 13）与之前存储的值做平均。新的权重和平均TSDF都存储在体素中。

3.2 Raycasting for Rendering andTracking

本文实现了基于GUP的光线跟踪（raycaster，是渲染的主要方法），用来渲染和追踪上一步中体（volume）内的隐式表面。伪代码如下：

每个GPU线程并行地沿着一条射线渲染输出图像中的一个像素。给定一个起点和射线的方向，每个GPU线程沿着射线穿过体素，通过观察零点交界（zero-crossing，沿着射线存储的TSDF值改变符号的位置）提取隐式表面的位置。最终表面交界点是在零点交界处左右两边分别由三线采样点用简单的线性插值法计算出来的。假设梯度和表面是正交的，则曲面法线可以通过在零点交界出求导直接算出。因此，每个找到射线/曲面交界点的GPU线程能够计算出一个插值顶点和法线，这些计算结果可以用作输出像素的光照计算的参数，用来渲染表面。

渲染流水线如图所示：

渲染流水线支持将传统的基于多边形的图形学组合到光线投射的视角中，以正确的遮挡处理技术混合（blending，常用的图像融合手段）虚拟和现实场景。在第一步（a）中，基于网格的场景以图形相机参数（与物理全局相机姿态T_i和内置校准矩阵K）来渲染。表面法线和未着色的数据不是渲染到帧缓存（framebuffer）和顶点缓存（vertex buffer）中，而是分别存储到屏幕外的顶点、法线和色彩图中（b），并且在光线投射时用作输入（c）。对于每个GPU线程，从关联网格顶点到相机中心的距离是在网格坐标系中计算的（Listing3，lines7&8）。在沿着射线前进时，这个距离作为一个额外的终止条件，支持在体积和网格表面几何间的精确遮挡检测。

环境光、漫反射、镜面反射的光效能够通过重建和虚拟几何图形来计算。更高级的着色计算可以通过沿着每条射线的第二次（或更多）反射来实现。阴影是在第一道光线打到一个体素或网格表面后（Listing3，lines13&19），通过从表面到光源的二次射线（使用网格坐标系）计算所得。如果光线在终止之前打到表面上，那么这个顶点就会又阴影。对于反光来说，一旦第一道光线达到表面上，一道新光线的方向就会基于表面法线和初试光线方向被计算出来。

本文光线追踪（raycaster）的贡献在于能够将重建模型的隐式表面可视化的能力，以正确的遮挡处理组合了多边形几何图形，并且提供高级的需要光线追踪操作的着色方法，这些全部是通过一个单一算法实时进行的。任何6DOF的图形相机变换都能够用来将物体光线投射，包括任意第三人称视角支持3D模型导航（navigation）。另一个关键贡献在于为ICP相机追踪生成了高质量的数据。当光线投射相机变换等于物理相机姿态时，提取的顶点和法线等同于深度和法线图（从和物理相机相同的视角看），但是与原始Kinect数据相比会少很多噪声、阴影和空洞。如[21]所示，通过直接追踪与帧到帧ICP追踪相反的光线投射模型，这样可以减少偏移问题和ICP错误。

4. Simulating Real-World Physics

将真实和虚拟的几何结构进一步融合，GPU流水线可以扩展到支持虚拟物体和重建场景的真实物理碰撞拟真。基于[9]和[10]，实现了GPU上的粒子仿真。场景的几何结构由一系列的静态例子仿真来表示。这些相同大小的球体保持静止，但是可以和其他动态模拟的粒子碰撞。虽然只是近似，但这个技术为目标体积内每个离散表面体素实时建模，并且即便是对很小的物体和任意形状的物体建模，都能达到良好的效果，比如书的边缘或者茶壶的把手。

静态粒子是在体积合成的时候创建的。随着体积被扫描过，在一个接近于零（定义表面交界处或零水平集）的自适应阈值内的TSDF值被提取出来。对每一个表面体素，都有一个静态粒子被实例化。每个粒子包含全局（度量）空间中的一个3D顶点，一个速度向量（对静态粒子来说是空），和一个ID。一个关键问题是碰撞检测。我们使用一个空间细分统一网格来区分相邻粒子。网格中的每个单元都有一个唯一的ID。通过将粒子的全局顶点转化到网格坐标系，每个动态或静态粒子被分配一个网格单元ID。我们系统中有两个列表：一个容纳静态粒子，另一个容纳动态粒子。在两个列表中，通过按照粒子当前的网格ID（使用基于GPU的基数排序）对粒子排序，将粒子被放入网格单元中。在每个模拟步骤中，为每个动态粒子创建一个GPU线程。每个线程通过检测（3³）单元邻域（首先处理动态-动态的碰撞，然后处理动态-静态碰撞）来处理碰撞。离散元素法（DEM，Discrete Element Method）被用来计算一个当两个粒子碰撞时的速度向量。粒子的全局速度基于邻近碰撞、重力以及和包围体的碰撞而增加。然后每个粒子基于每个模拟步骤的累加速度重新定位。

本文基于GPU的流水线的主要贡献在于：在物理模拟取得突破进展的同时保持了交互速率，同时进行实时的相机追踪和重建。默认情况下，在光线投射过程中只有动态粒子被渲染，而且能够被重建的几何体正确地遮挡。

5. Interacting in The Scene

目前描述的核心系统都基于场景保持合理静止的假设。显然，在一个互动场景中，用户想要在相机前自由运动并和场景交互。这样就产生了两个主要的难题。

第一，ICP追踪假定每一帧都会产生由于相机运动引起的单一刚性变换。用户在相机前的交互会导致独立于相机运动的场景运动，这种情况打破了假定条件。因为我们的ICP追踪是密集的（即使用所有可用的点集），所以我们的系统在处理瞬时的场景运动时是有弹性的。例如在图5中，即使用户移动了物体，也有足够的背景点供ICP汇聚。但是，过大或视角过长的场景运动会造成追踪失败。

第二，在我们系统支持实时重建的同时，表面预测也会随着时间得到改进细化，这是利用一个连续的加权平均距离值实现的。通过调整权重，就能给新的TSDF值更高的优先级，从而支持更快的模型更新，但代价是会有额外的噪声被引入重建结果中。实际上，权重的选择要平衡重建结果的质量和基于场景变化的重建定时更新。然而，这并不支持连续运动场景。通常，用户在场景中自由移动会导致相关深度数据只能被部分集成到体积中（如图8）。因为相机追踪直接依赖于这个模型，如果这个模型和实时数据不一致，就会产生错误。

5.1 ICP Outliers for Segmentation

为了探索用户和重建场景之间的动态交互，我们为核心GPU流水线提供了一种新的扩展。如图：

这种技术利用了密集ICP追踪的一种独特性质。当所有深度测量值被使用时，投影数据关联中的异常值会形成一个强有力的初始预测，如果有足够的刚性背景点供ICP聚集，这个预测就会成为独立于相机运动的场景运动的一部分。我们的解决方案能够稳定健壮地将一个运动的前景物体从背景中分割出来，能够减少追踪错误，并且使用户能够直接在场景中进行交互。

这个流水线假设至少有一部分刚性场景使用核心重建流水线（标记为a）重建完成。在初始扫描后，一个包含定向点的运动物体进入场景，这些定向点与已经重建的表面有显著差别。这些错误的ICP投影数据管理被复制到一个异常值映射（标记为b）中。接下来，一个深度感知连接的组成分析在异常值映射上运行，来聚集大量的连接碎片（connected patches），并除去由相机噪声（标记为c）导致的较小的异常值。在侦测到前景场景运动的地方，为了核心“背景”重建（标记为d），大量连接碎片被掩盖到输入深度图。这阻止了相关前景深度测量值在核心流水线中被用于重建或追踪。大量异常值的碎片能够使用第二个体积块（标记为e）被另外重建——潜在地应用于一个有着不同重建设定的独立GPU。最后一步光线投射两个独立的体积块，并抢输出结果（标记为f）合并，使用图12中相同的方法。

总的来说，我们的技术在稳定追踪方面取得了不错的结果，而且提高了静态背景的重建质量，甚至当部分场景在相机前连续运动也能达到好的效果。此外，这个技术能够健壮地分割出前景物体，并独立于背景进行重建。

5.2 Detecting Touch on Arbitrary Surfaces

这个流水线可以通过观察前景和背景的交叉部分来进一步拓展到支持多点触摸输入。我们将背景体积的默认光线投射拓展到输出一个触摸图（touch map），伪代码如列表4所示：

每个GPU线程使用光线投射前景顶点图作为输入，再次沿着光线穿过背景体积。如果定位到一个零交叉点，相关的前景顶点（沿着相同光线）会被检测（line 6）。如果前景和背景在范围内，前景位置即为触摸图中的输出。触摸图的一个深度感知连接组成分析抑制了噪声，并且随时间追踪标记了指尖。

6. Towards Modeling of DynamicScenes

目前已经可以从背景中稳定地区分出移动的前景，这引出了一个有趣的问题，如何才能最好地重建这种移动表面。关键的挑战在于怎样把前景数据整合到第二体积中，使得表面测量值之间的关联能够随着时间得到保证。作为一个初步的探索，我们在另一个ICP实例中已经试验了单独预测前景对象的姿态。这次同样是运行密集ICP，但是仅使用前景有向点（从实时深度图和光线透视的第二体积得到）。实际上，我们已经发现，即使前景中有微小的非刚性运动，密集ICP也能使其收敛。这提供了一个关于全局相机变换，预测前景物体姿态的粗糙方法。

使用这个预测的姿态，可以将深度测量值配准并融合到第二体积中。对前景的表面预测能够随着时间建立起来，并逐渐变得精细完整。因为前景表面可能会移动，我们给被整合进来的新测量值更高的权重。一个简单的扩展使用每个体素的权重，该权重基于TSDF（整合之前）的导数的动态平均值不断调整。这使我们能够调整单个表面体素的权重，当变化率高的时候（例如手指或手）给予新测量值更高的权重，如果TSDF值稳定（例如前臂）就给予更低的权重。图16和图15显示了基于前景ICP追踪和每体素的自适应加权的初步结果。可以看出，结果与原Kinect数据相比，大幅度降低了噪声，用户的手臂、手和手指都很清晰，这个前景重建发生于侧相机追踪和背景重建的完善过程中。

对于我们的物理仿真，我们把整个前景重建表现为静态粒子，使移动的用户与动态粒子的碰撞被一帧一帧地建模（图9）.这个重建移动前景的方法也能够用于纯粹地追踪用户手持的刚性物体的姿态，使追踪不依赖与相机运动，并且不需要标记和物体的先验知识。

论文阅读笔记1——DARTS：Differentiable Architecture Search可微分架构搜索（一）（论文翻译学习） fuhao7i 论文阅读笔记深度学习人工智能机器学习算法计算机视觉
DARTS：DifferentiableArchitectureSearch可微分架构搜索（一）DARTS：DifferentiableArchitectureSearch（一）ABSTRACT摘要1.INTRODUCTION介绍2.可微的结构搜索加油加油！如果你感觉你现在很累，那么恭喜你，你现在正在走上坡路！让我们一起加油！欢迎关注我的讲解视频，让我们一起学习：Bilibili主页：https:
DeepSeek R1 AI 论文翻译后端java
摘要原文地址：DeepSeekR1AI论文翻译我们介绍了我们的第一代推理模型，DeepSeek-R1-Zero和DeepSeek-R1。DeepSeek-R1-Zero是一个通过大规模强化学习（RL）训练的模型，且在此过程中未使用监督微调（SFT）作为预处理步骤，展现出了显著的推理能力。通过RL，DeepSeek-R1-Zero自然而然地展现了许多强大且引人注目的推理行为。然而，它也遇到了一些挑战
DeepSeek R1 AI 论文翻译老马啸西风 java
摘要原文地址：DeepSeekR1AI论文翻译我们介绍了我们的第一代推理模型，DeepSeek-R1-Zero和DeepSeek-R1。DeepSeek-R1-Zero是一个通过大规模强化学习（RL）训练的模型，且在此过程中未使用监督微调（SFT）作为预处理步骤，展现出了显著的推理能力。通过RL，DeepSeek-R1-Zero自然而然地展现了许多强大且引人注目的推理行为。然而，它也遇到了一些挑战
DeepSeek R1 AI 论文翻译后端java
摘要原文地址：DeepSeekR1AI论文翻译我们介绍了我们的第一代推理模型，DeepSeek-R1-Zero和DeepSeek-R1。DeepSeek-R1-Zero是一个通过大规模强化学习（RL）训练的模型，且在此过程中未使用监督微调（SFT）作为预处理步骤，展现出了显著的推理能力。通过RL，DeepSeek-R1-Zero自然而然地展现了许多强大且引人注目的推理行为。然而，它也遇到了一些挑战
【论文翻译】DeepSeek-Coder-V2: Breaking the Barrier of Closed-Source Models in Code Intelligence 行动π技术博客代码大模型 deepseek
本翻译来自大模型翻译，如有不对的地方，敬请谅解引言开源社区通过开发诸如StarCoder（Li等人，2023b；Lozhkov等人，2024）、CodeLlama（Roziere等人，2023）、DeepSeek-Coder（Guo等人，2024）和Codestral（MistralAI，2024）等开源代码模型，在推进代码智能方面取得了显著进展。这些模型的性能已稳步接近闭源同类产品，为代码智能的
论文翻译：ChatGPT for good? On opportunities and challenges of large language models for education Author CSPhD-winston-杨帆智慧教育论文翻译 chatgpt 语言模型人工智能
高引用论文：ChatGPTforgood?OnopportunitiesandchallengesoflargelanguagemodelsforeducationAuthorlinksopenoverlaypanelhttps://www.sciencedirect.com/science/article/pii/S1041608023000195ChatGPTforgood？大型语言模型在教育
【论文翻译】GOT-OCR论文翻译——General OCR Theory: Towards OCR-2.0 via a Unified End-to-end Model 机器白学论文翻译 ocr 论文阅读论文翻译
论文原文链接：https://arxiv.org/abs/2409.01704特别声明，本文不做任何商业用途，仅作为个人学习相关论文的翻译记录。本文对原文内容直译，一切以论文原文内容为准，对原文作者表示最大的敬意。如有任何侵权请联系我下架相关文章。目录通用OCR理论：通过统一的端到端模型迈向OCR-2.00摘要1引言2相关工作2.1传统OCR2.2基于LVLM的OCR3通用OCR理论3.1框架3.
论文翻译：A survey on large language model (LLM) security and privacy: The Good, The Bad, and The Ugly CSPhD-winston-杨帆论文翻译 LLMs-鲁棒性语言模型人工智能自然语言处理
Asurveyonlargelanguagemodel(LLM)securityandprivacy:TheGood,TheBad,andTheUglyhttps://www.sciencedirect.com/science/article/pii/S266729522400014X文章目录关于大型语言模型（LLM）安全性和隐私的调查：好的、坏的和丑陋的摘要1.引言2.背景2.1大型语言模型（L
论文翻译：arxiv-2022 Ignore Previous Prompt: Attack Techniques For Language Models CSPhD-winston-杨帆论文翻译 LLMs-安全 prompt 语言模型人工智能
IgnorePreviousPrompt:AttackTechniquesForLanguageModelshttps://arxiv.org/pdf/2211.09527忽略之前的提示：针对语言模型的攻击技术文章目录忽略之前的提示：针对语言模型的攻击技术摘要1引言摘要基于Transformer的大型语言模型（LLMs）为大规模面向客户的应用程序中的自然语言任务提供了强大的基础。然而，探索恶意用户
论文翻译：arxiv-2024 Data Contamination Quiz: A Tool to Detect and Estimate Contamination in Large CSPhD-winston-杨帆 LLMs-数据污染论文翻译语言模型人工智能深度学习
DataContaminationQuiz:ATooltoDetectandEstimateContaminationinLargeLanguageModelshttps://arxiv.org/abs/2311.06233数据污染测验：一种检测和估计大型语言模型中污染的工具文章目录数据污染测验：一种检测和估计大型语言模型中污染的工具摘要1引言摘要我们提出了数据污染测验（DataContamina
实验DAY5：借假修真放逐997
a.昨日完成情况不佳，起床是9.30，除了报名（一口气报了五门..祝我好运），论文翻译和教育都没有完成；b.明日计划：9点前起床；明天优先复盘教育，以及准备cpa的考试资料；论文、和cpa留到周末做吧c.今天读到一篇讲美团公司战略的文章，对于整体战略搭建的方法论、具体业务的促成、以及更偏意识上层的“借假修真”思想的解读非常佩服，摘录核心如下：美团的增长引擎：1.严明的纪律性：放弃不符合业务逻辑的利
开源Bluespec bsc编译器和可重用示例设计达坦科技DatenLord 硬件加速 fpga fpga开发硬件工程开源
这篇介绍Bluespec以及设计示例的文章，是在2021年ICCAD（InternationalConferenceOnComputer-AidedDesign）发布的论文。达坦科技的open-rdma项目和推广的MIT体系结构学习社区都用到Bluespec，因此将此论文翻译成中文，以便大家了解2020年Bluespec开源后相关的开源项目。摘要：bsc编译器是一个商业可用的编译器，在过去的二十年
论文翻译 - BITE: Textual Backdoor Attacks with Iterative Trigger Injection anniewwy LLM Backdoor Attack
论文链接：https://arxiv.org/pdf/2205.12700.pdf项目代码：https://github.com/INK-USC/BITEBITE:TextualBackdoorAttackswithIterativeTriggerInjectionAbstract1Introduction2ThreatModel3Methodology3.1BiasMeasurementonLa
我做这件事，唯一的目的就是让你开心沉吟大叔
一个男人心里满满的爱意：我做这件事，唯一的目的就是让你高兴，而不是赢得你的好感、证明我的能力、让你对我感恩戴德。所以，我不想让你知道我的付出，不想让你对我怀有歉意和内疚，更不想因此获得什么回报。我只是心甘情愿地想为你做点什么，因为我爱你。这才是真爱吧。以前有个读者，说她男朋友特别小气，还不诚实。请她吃顿饭要念叨很久，给她买礼物，花一百要说成三百，帮她做论文翻译，明明一小时就搞定了，非要说是熬了个通
剖析以太坊上的庞氏骗局：识别、分析和影响卷神
区块链安全防护论文翻译：Bartoletti,Massimo,etal."DissectingPonzischemesonEthereum:identification,analysis,andimpact."FutureGenerationComputerSystems102(2020):259-277.摘要：庞氏骗局是一种以高额利润为诱饵的金融欺诈。实际上，只有新用户加入了庞氏骗局，用户才能得
《 HFContractFuzzer: Fuzzing Hyperledger Fabric Smart Contractsfor Vulnerability Detection》论文翻译 WXF_Security 智能合约安全研究 fabric golang
《HFContractFuzzer:FuzzingHyperledgerFabricSmartContractsforVulnerabilityDetection》（EASE2021）摘要区块链技术以其特有的去中心化、不可变性等优点，近年来被广泛应用于各个领域。运行在区块链上的智能合约在去中心化应用场景中也扮演着越来越重要的角色。因此，自动检测智能合约中的安全漏洞成为区块链技术应用中亟待解决的问题
Data Augmentation and Deep Learning Methods in SoundClassification: A Systematic Review ggqyh 深度学习人工智能
文章为翻译，仅供学习参考论文原地址：DataAugmentationandDeepLearningMethodsinSoundClassification:ASystematicReview作者：OlusolaO.Abayomi-Alli,RobertasDamaševiˇcius,AtikaQazi,MariamAdedoyin-OloweandSanjayMisra4论文翻译地址：https:
因果学习及反因果学习（论文翻译）三分钟湿度
OnCausalandAnti-causalLearning本博文对论文OnCausalandAnti-causalLearning的摘要和模型部分做了翻译和小修改，本论文主要描述因果学习中常见的几类基于函数估计的模型，同时说明了因果与相关性、因果学习与机器学习之间的关系，论文重点在讨论和比较不同模型，内容较为笼统，不做深入探讨，但对不同模型之间的本质关系的讨论值得一看。论文地址：https://
Convolutional Neural Networks for No-Reference Image Quality Assessment 论文翻译亚里论文阅读 NR-IQA 使用卷积网络进行图像质量评价
ConvolutionalNeuralNetworksforNo-ReferenceImageQualityAssessment论文翻译TranslationAbstract1Introduction2RelatedWork3CNNforNR-IQA3.1NetworkArchitecture3.2LocalNormalization3.3Pooling3.4ReLUNonlinearity3.5
KinectFusion论文品读自信侠
KinectFusion:Real-timedensesurfacemappingandtracking论文链接：https://ieeexplore.ieee.org/document/6162880参考视频：KinectFusion和ElasticFusion三维重建方法-付兴银https://www.bilibili.com/video/av6060335/参考博文：https://www.
有道论文翻译接口，python版和lua版 monsterskiller 手机编程脚本编程 python
论文翻译接口python版importrequestsimporthashlibfromurllib.parseimportquotedefget_md5(s,is_hex=True):md5=hashlib.md5()md5.update(s.encode())ifis_hex:returnmd5.hexdigest()returnmd5.digest()deftranslate(source_
医学论文翻译有哪些要求，应该如何翻译呢？英信翻译公司其他
近年来，随着国内医学水平的不断提高，医学论文翻译的需求也呈现出快速增长的趋势。在国外期刊上发表论文，往往需要将整篇论文翻译成英文。那么，医学论文翻译有哪些要求，应该如何翻译呢？专家指出，医学论文翻译最基本的要求就是准确性，要求翻译者能够准确地将原文的含义传达给读者，不出现歧义或者误解的情况。这要求翻译者具备深厚的医学专业知识和语言能力，能够理解原文的含义，并将其准确地表达出来。除了准确性之外，医学
GPT原始论文：Improving Language Understanding by Generative Pre-Training论文翻译 iKang_dlut gpt 人工智能深度学习
1摘要自然语理解包括文本蕴含、问题回答、语义相似性评估和文档分类等一系列多样化的任务。尽管大量未标注的文本语料库很丰富，但用于学习这些特定任务的标注数据却很稀缺，这使得基于区分性训练的模型难以充分发挥作用。我们展示了通过在多样化的未标注文本语料库上对语言模型进行生成式预训练，随后对每个特定任务进行区分性微调，可以实现这些任务的大幅度改进。与以往的方法不同，我们在微调过程中使用了任务感知的输入转换，
3D人体重建方法漫谈 Asimov_Liu SMPL 3D人体建模
文章目录1概述2模型匹配的方法2.1SMPL(SkinnedMulti-PersonLinearmodel)模型2.2SMPLify2.3SMPL-X模型3FusionMethod（实时扫描融合）3.1KinectFusion3.2DynamicFusion3.3BodyFusion&DoubleFusion4参考文献1概述为了让计算机更能理解人类行为，参与人类的生活，与人类交互，获取人体3D姿态
【论文翻译】Generation of Non-Deterministic Synthetic Face Datasets Guided by Identity Priors（21.12）联系丝信计算机视觉
文章目录读后感Abstract1Introduction1.1Ourcontributions2RelatedWorks2.1SyntheticImageGeneration2.2MatedSampleGeneration2.3LimitationsinState-of-the-art3PCA-FR-GuidedSampling4SyntheticMatedFace(SymFace)Dataset
ORB-SLAM2代码学习1 rgdb_tum.cc Dziwu SLAM 学习计算机视觉人工智能
论文翻译参考1参考2rgdb_tum.cc的框架代码大致思路LoadImages()加载图像——判断rgb图是否存在——判断rgb图与depth图数量是否对应相同。ORB_SLAM2::SystemSLAM()初始化，创建SLAM系统，并初始化各个线程。遍历每一对RGB图和depth图【读取RGB图和depth图，读取时间戳（vTimestamps存储了时间戳，实际上就是存储了数据文件的每一幅图像
GFS--Google File System论文翻译和理解不争_900c
一、系统设计目标高可用的大文件分布式文件系统。二、关键点Architecture-架构：有哪些Server，每个Server的功能。Master存储的MetaData的结构。client写数据流程。client读数据流程。启动时Master和ChunkServer的交互。ChunkServer发生故障时，Master和ChunkServer的交互。三、核心设计概述2.Master中存储的MetaD
翻译 5765f3fa240e
对于论文翻译，大家要极其重视阅读平行文本和查资料的重要性。我平时经常做论文翻译和润色，每一次都是如履薄冰。需要阅读核心参考文献，查资料消除术语，彻底领会论文背后的逻辑。这些都解决了，才轮到运用语言基本功。假如大家接论文翻译，请认真对待查资料和阅读平行文本这两件事，如果做不到，暂时不要接论文翻译。
BERT论文翻译 TheHonestBob NLP 自然语言处理
一、写在前面在Transformer和BERT大行其道的时代，搞懂这两种基础模型结构很有必要，在网上没有搜索到满意的论文翻译结果，最近刚好有时间，把BERT的论文在个人英语水平基础上最大程度的保留原作者的本意翻译一遍，如有翻译不到位的地方请各位指出，觉得不错的点个赞鼓励一下，Tansformer的论文我之前已经翻译了，可以查看我的这篇博客attentionisallyouneed论文翻译。查看be
ImageNet Classification with Deep Convolutional Neural Networks论文翻译——中英文对照 SnailTyan 深度学习 Deep Learnig
文章作者：Tyan博客：noahsnail.com|CSDN|简书翻译论文汇总：https://github.com/SnailTyan/deep-learning-papers-translationImageNetClassificationwithDeepConvolutionalNeuralNetworksAbstractWetrainedalarge,deepconvolutionaln
JVM StackMapTable 属性的作用及理解 lijingyao8206 jvm 字节码 Class文件 StackMapTable
在Java 6版本之后JVM引入了栈图(Stack Map Table)概念。为了提高验证过程的效率，在字节码规范中添加了Stack Map Table属性，以下简称栈图，其方法的code属性中存储了局部变量和操作数的类型验证以及字节码的偏移量。也就是一个method需要且仅对应一个Stack Map Table。在Java 7版
回调函数调用方法百合不是茶 java
最近在看大神写的代码时,.发现其中使用了很多的回调 ,以前只是在学习的时候经常用到 ,现在写个笔记记录一下代码很简单: MainDemo :调用方法得到方法的返回结果
[时间机器]制造时间机器需要一些材料 comsci 制造
根据我的计算和推测,要完全实现制造一台时间机器,需要某些我们这个世界不存在的物质和材料... 甚至可以这样说,这种材料和物质,我们在反应堆中也无法获得......
开口埋怨不如闭口做事邓集海邓集海做人做事工作
“开口埋怨，不如闭口做事。”不是名人名言，而是一个普通父亲对儿子的训导。但是，因为这句训导，这位普通父亲却造就了一个名人儿子。这位普通父亲造就的名人儿子，叫张明正。　　　　张明正出身贫寒，读书时成绩差，常挨老师批评。高中毕业，张明正连普通大学的分数线都没上。高考成绩出来后，平时开口怨这怨那的张明正，不从自身找原因，而是不停地埋怨自己家庭条件不好、埋怨父母没有给他创造良好的学习环境。　　　　
jQuery插件开发全解析，类级别与对象级别开发 IT独行者 jquery 开发插件　函数
jQuery插件的开发包括两种：一种是类级别的插件开发，即给 jQuery添加新的全局函数，相当于给 jQuery类本身添加方法。 jQuery的全局函数就是属于 jQuery命名空间的函数，另一种是对象级别的插件开发，即给 jQuery对象添加方法。下面就两种函数的开发做详细的说明。 1 、类级别的插件开发类级别的插件开发最直接的理解就是给jQuer
Rome解析Rss 413277409 Rome解析Rss
import java.net.URL; import java.util.List; import org.junit.Test; import com.sun.syndication.feed.synd.SyndCategory; import com.sun.syndication.feed.synd.S
RSA加密解密无量加密解密 rsa
RSA加密解密代码代码有待整理 package com.tongbanjie.commons.util; import java.security.Key; import java.security.KeyFactory; import java.security.KeyPair; import java.security.KeyPairGenerat
linux 软件安装遇到的问题 aichenglong linux 遇到的问题 ftp
1 ftp配置中遇到的问题 500 OOPS: cannot change directory 出现该问题的原因:是SELinux安装机制的问题.只要disable SELinux就可以了修改方法:1 修改/etc/selinux/config 中SELINUX=disabled 2 source /etc
面试心得 alafqq 面试
最近面试了好几家公司。记录下；支付宝，面试我的人胖胖的，看着人挺好的；博彦外包的职位，面试失败；阿里金融，面试官人也挺和善，只不过我让他吐血了。。。由于印象比较深，记录下； 1，自我介绍 2，说下八种基本类型；（算上string。楼主才答了3种，哈哈，string其实不是基本类型，是引用类型） 3，什么是包装类，包装类的优点； 4，平时看过什么书？NND，什么书都没看过。。照样
java的多态性探讨百合不是茶 java
java的多态性是指main方法在调用属性的时候类可以对这一属性做出反应的情况 //package 1; class A{ public void test(){ System.out.println("A"); } } class D extends A{ public void test(){ S
网络编程基础篇之JavaScript-学习笔记 bijian1013 JavaScript
1.documentWrite <html> <head> <script language="JavaScript"> document.write("这是电脑网络学校"); document.close(); </script> </h
探索JUnit4扩展：深入Rule bijian1013 JUnit Rule 单元测试
本文将进一步探究Rule的应用，展示如何使用Rule来替代@BeforeClass，@AfterClass，@Before和@After的功能。在上一篇中提到，可以使用Rule替代现有的大部分Runner扩展，而且也不提倡对Runner中的withBefores()，withAfte
[CSS]CSS浮动十五条规则 bit1129 css
这些浮动规则，主要是参考CSS权威指南关于浮动规则的总结，然后添加一些简单的例子以验证和理解这些规则。 1. 所有的页面元素都可以浮动 2. 一个元素浮动后，会成为块级元素，比如<span>,a, strong等都会变成块级元素 3.一个元素左浮动，会向最近的块级父元素的左上角移动，直到浮动元素的左外边界碰到块级父元素的左内边界；如果这个块级父元素已经有浮动元素停靠了
【Kafka六】Kafka Producer和Consumer多Broker、多Partition场景 bit1129 partition
0.Kafka服务器配置 3个broker 1个topic，6个partition，副本因子是2 2个consumer，每个consumer三个线程并发读取 1. Producer package kafka.examples.multibrokers.producers; import java.util.Properties; import java.util.
zabbix_agentd.conf配置文件详解 ronin47 zabbix 配置文件
Aliaskey的别名，例如 Alias=ttlsa.userid:vfs.file.regexp[/etc/passwd,^ttlsa:.:([0-9]+),,,,\1]，或者ttlsa的用户ID。你可以使用key：vfs.file.regexp[/etc/passwd,^ttlsa:.: ([0-9]+),,,,\1]，也可以使用ttlsa.userid。备注: 别名不能重复，但是可以有多个
java--19.用矩阵求Fibonacci数列的第N项 bylijinnan fibonacci
参考了网上的思路，写了个Java版的： public class Fibonacci { final static int[] A={1,1,1,0}; public static void main(String[] args) { int n=7; for(int i=0;i<=n;i++){ int f=fibonac
Netty源码学习-LengthFieldBasedFrameDecoder bylijinnan java netty
先看看LengthFieldBasedFrameDecoder的官方API http://docs.jboss.org/netty/3.1/api/org/jboss/netty/handler/codec/frame/LengthFieldBasedFrameDecoder.html API举例说明了LengthFieldBasedFrameDecoder的解析机制，如下：实
AES加密解密 chicony 加密解密
AES加解密算法，使用Base64做转码以及辅助加密： package com.wintv.common; import javax.crypto.Cipher; import javax.crypto.spec.IvParameterSpec; import javax.crypto.spec.SecretKeySpec; import sun.misc.BASE64Decod
文件编码格式转换 ctrain 编码格式
package com.test; import java.io.File; import java.io.FileInputStream; import java.io.FileOutputStream; import java.io.IOException; import java.io.InputStream; import java.io.OutputStream;
mysql 在linux客户端插入数据中文乱码 daizj mysql 中文乱码
1、查看系统客户端，数据库，连接层的编码查看方法： http://daizj.iteye.com/blog/2174993 进入mysql，通过如下命令查看数据库编码方式： mysql> show variables like 'character_set_%'; +--------------------------+------
好代码是廉价的代码 dcj3sjt126com 程序员读书
长久以来我一直主张：好代码是廉价的代码。当我跟做开发的同事说出这话时，他们的第一反应是一种惊愕，然后是将近一个星期的嘲笑，把它当作一个笑话来讲。当他们走近看我的表情、知道我是认真的时，才收敛一点。当最初的惊愕消退后，他们会用一些这样的话来反驳： “好代码不廉价，好代码是采用经过数十年计算机科学研究和积累得出的最佳实践设计模式和方法论建立起来的精心制作的程序代码。” 我只
Android网络请求库——android-async-http dcj3sjt126com android
在iOS开发中有大名鼎鼎的ASIHttpRequest库，用来处理网络请求操作，今天要介绍的是一个在Android上同样强大的网络请求库android-async-http，目前非常火的应用Instagram和Pinterest的Android版就是用的这个网络请求库。这个网络请求库是基于Apache HttpClient库之上的一个异步网络请求处理库，网络处理均基于Android的非UI线程，通
ORACLE 复习笔记之SQL语句的优化 eksliang SQL优化 Oracle sql语句优化 SQL语句的优化
转载请出自出处：http://eksliang.iteye.com/blog/2097999 SQL语句的优化总结如下 sql语句的优化可以按照如下六个步骤进行：合理使用索引避免或者简化排序消除对大表的扫描避免复杂的通配符匹配调整子查询的性能 EXISTS和IN运算符下面我就按照上面这六个步骤分别进行总结：
浅析：Android 嵌套滑动机制（NestedScrolling） gg163 android 移动开发滑动机制嵌套
谷歌在发布安卓 Lollipop版本之后，为了更好的用户体验，Google为Android的滑动机制提供了NestedScrolling特性 NestedScrolling的特性可以体现在哪里呢？ 比如你使用了Toolbar，下面一个ScrollView，向上滚
使用hovertree菜单作为后台导航 hvt JavaScript jquery .net hovertree asp.net
hovertree是一个jquery菜单插件，官方网址：http://keleyi.com/jq/hovertree/ ，可以登录该网址体验效果。 0.1.3版本：http://keleyi.com/jq/hovertree/demo/demo.0.1.3.htm hovertree插件包含文件： http://keleyi.com/jq/hovertree/css
SVG 教程（二）矩形天梯梦 svg
SVG <rect> SVG Shapes SVG有一些预定义的形状元素，可被开发者使用和操作：矩形 <rect> 圆形 <circle> 椭圆 <ellipse> 线 <line> 折线 <polyline> 多边形 <polygon> 路径 <path>
一个简单的队列 luyulong java 数据结构队列
public class MyQueue { private long[] arr; private int front; private int end; // 有效数据的大小 private int elements; public MyQueue() { arr = new long[10]; elements = 0; front
基础数据结构和算法九：Binary Search Tree sunwinner Algorithm
A binary search tree (BST) is a binary tree where each node has a Comparable key (and an associated value) and satisfies the restriction that the key in any node is larger than the keys in all
项目出现的一些问题和体会 Steven-Walker DAO Web servlet
第一篇博客不知道要写点什么，就先来点近阶段的感悟吧。这几天学了servlet和数据库等知识，就参照老方的视频写了一个简单的增删改查的，完成了最简单的一些功能，使用了三层架构。 dao层完成的是对数据库具体的功能实现，service层调用了dao层的实现方法，具体对servlet提供支持。 &
高手问答：Java老A带你全面提升Java单兵作战能力！ ITeye管理员 java
本期特邀《Java特种兵》作者：谢宇，CSDN论坛ID: xieyuooo 针对JAVA问题给予大家解答，欢迎网友积极提问，与专家一起讨论! 作者简介：淘宝网资深Java工程师，CSDN超人气博主，人称“胖哥”。 CSDN博客地址： http://blog.csdn.net/xieyuooo 作者在进入大学前是一个不折不扣的计算机白痴，曾经被人笑话过不懂鼠标是什么，

KinectFusion: Real-time 3D Reconstruction and Interaction Using a Moving Depth Camera

你可能感兴趣的:(KinectFusion,论文翻译)