Darren_pty

《论文阅读18》JoKDNet

一、论文

研究领域：用于大尺度室外TLS点云配准的联合关键点检测和特征表达网络
论文：JoKDNet: A joint keypoint detection and description network for large-scale
outdoor TLS point clouds registration
International Journal of Applied Earth Observations and Geoinformation
Received 30 June 2021; Received in revised form 17 August 2021; Accepted 28 August 2021
论文团队主页
论文链接
团队公开的数据集WHU-TLS

二、论文概述

提出了一种新的神经网络JoKDNet来联合学习关键点检测和特征描述，以提高大规模室外地面激光扫描（TLS）点云配准的可行性和准确性。

JoKDNet是第一个基于深度学习的方法，专注于 无初始姿态 、不同视场、大规模户外TLS点云配准。该网络将关键点检测和描述集成到一个框架中，提高了对具有重复和对称特征且缺乏明显几何特征的点云的配准能力和鲁棒性。

引入一种新的关键点检测模块，自动学习每个采样点的得分(重要性)，并将最重要的前k个采样点作为检测到的关键点

提出了一个增强的特征描述模块，学习每个关键点的特征表示，将局部和全局特征结合起来。

设计了一个损失函数，使检测到的关键点在匹配时具有更高的可区分性，同时最大化非对应关键点之间的特征距离，最小化对应关键点之间的特征距离

最后，利用距离矩阵模块和随机样本一致性（RANSAC）确定源云和目标点云的对应关系，进行变换计算。

三、论文详述

abstract

大规模室外地面激光扫描（TLS）点云的配准在具有对称和重复元素（例如，公园、森林和隧道）、弱几何特征（例如，地下挖掘），并且在不同的阶段显著变化（例如，山）。为了解决这些问题，提出了一种新的神经网络JoKDNet来联合学习关键点检测和特征描述，以提高点云配准的可行性和准确性。首先，引入一种新的关键点检测模块，自动学习每个采样点的得分，并将最重要的Top-k采样点作为检测到的关键点。其次，提出了一个增强的特征描述模块，通过融合层次化的局部特征和上下文特征来学习每个关键点的特征表示。再次，设计了一个损失函数，使检测到的关键点在匹配时具有更高的可区分性，同时最大化非对应关键点之间的特征距离，最小化对应关键点之间的特征距离。最后，利用距离矩阵模块和随机样本一致性（RANSAC）确定源云和目标点云的对应关系，进行变换计算。综合实验表明，JoKDNet在五个具有挑战性的场景（例如，公园，森林，隧道，地下挖掘和山脉）从两个数据集（WHU-TLS和ETH-TLS）的配准误差，以及对不同场景的鲁棒性，在无ICP的情况下，最大旋转误差小于0.06◦，最大平移误差小于0.84 m。

Introduction

3D点云的配准对于诸如数字文化遗产等许多应用起着关键作用（Yang和Zang，2014; Montuori等人，2014）、3D重建（Jung等人，2014; Oesau等人，2014），滑坡监测（Prokop和Panholzer，2009; Vosselman和Maas，2010）和森林清单调查（Liang等人，2016; Kelbe等人，2016年）。地面激光扫描（TLS）点云的自动配准由于空间分布不规则、噪声、结构不完整和遮挡等因素而困难，导致特征/关键点提取困难。

传统的点云配准方法主要包括两步：建立三维对应关系和两点云之间的刚体变换估计。不幸的是，3D-3D点对应的建立是不平凡的（Yew和Lee，2018）。尽管在过去十年中已经提出了若干3D手工制作的关键点检测器和描述符，但是构建3D-3D对应的有效性仍然不令人满意（Weinmann et al.2011; Theiler and Schindler，2012; Guo等人，2014; 2016），在具有高对称性和相似特征结构的场景中对全局定位/姿态估计造成了巨大挑战（Yew和Lee，2018）。这证明了3D手工特征检测器难以满足进一步配准的3D-3D点对应的要求。

传统的点云配准方法主要包括两步：

建立三维对应关系

两点云之间的刚体变换估计

可重复性和可区分性分别是3D关键点检测器和描述符的主要特征（Tombari等人，2010年）。可重复性涉及获得各种干扰的相同关键点的能力（例如，视点改变、丢失部分和噪声）。可区分性是区分关键点的能力，其可以被有效地描述和匹配，以避免不正确的对应。基于手工特征的关键点检测和描述方法的可重复性和可区分性是有限的。一方面，在各种干扰下的相同关键点（例如，点密度或拓扑变化、视点改变、缺失结构、传感器噪声）呈现不一致的几何形状，因此难以检测对应的关键点。另一方面，特征表示能力依赖于设计者的经验和参数调整能力，因此很难区分具有对称重复或弱几何特征的关键点。

深度学习在基于图像的任务中取得了巨大成功，例如对象检测（雷德蒙等人，2016）和面部识别（Schroff等人，2015年）。还在3D点云的语义分割中研究了3D深度学习中的一些研究（Wu等人，2019年）的报告。然而，对于注册任务，目前的深度学习方法仅适用于小场景，难以处理大规模的户外TLS点云。在本文中，提出了一种新的神经网络JoKDNet，联合学习关键点检测器和描述符，以提高点云配准的准确性和鲁棒性。据我们所知，JoKDNet是第一个基于深度学习的方法，专注于无初始姿态的大规模户外TLS点云配准。它包括关键点检测、关键点特征描述和损失函数公式化。关键点检测模块旨在学习每个下采样点的重要性，并将最重要的前k个点作为检测到的关键点。关键点特征描述模块旨在通过特征描述模块学习每个关键点的特征表示，将局部和全局特征结合起来。以下是本文与当前工作相比的主要贡献：

目前的深度学习方法仅适用于小场景

(1)JoKDNet是第一个基于深度学习的方法，专注于大规模户外TLS点云配准，无需初始姿势，并在配准不同视场的TLS点云方面表现出色。

(2)该网络将关键点检测和描述集成到一个框架中，提高了对具有重复和对称特征且缺乏明显几何特征的点云的配准能力和鲁棒性。

文章的其余部分组织如下：第二节介绍了相关工作。第3节阐述了JoKDNet的结构。第4节说明了JoKDNet的实验和验证。最后，第5节对本文进行了总结，并对未来的工作进行了展望。

Related work

基于特征的手工方法

基于手工特征的方法，例如快速点特征直方图（Rusu等人，2009）、旋转投影统计（Guo等人，2013）、语义特征线（Yang等人，2016）、自适应协方差（Zai等人，2017）、二进制形状上下文描述符（Dong等人，2017年; 2018年）在大多数情况下都取得了令人满意的结果。不幸的是，点云中的不完整结构、遮挡或杂乱显著地损害了这样的描述符（Guo等人，2016年; Xu等人，2019; Ge等人，2019; Ge和Hu，2020）。此外，该方法受到手工特征依赖于设计者的经验和调整参数的能力的事实的限制。因此，基于特征的手工配准方法在具有对称重复特征、几何特征弱、场景动态变化、重叠区域有限等场景中显得力不从心。

深度学习方法

与手工特征相比，深度学习表现为从大量数据中自动学习特征，可以学习高层次、高描述性的描述符。现有的基于深度学习的点云处理方法根据输入数据格式的不同分为三种：

(1)基于体素的网络，将点云转换为体素，从而实现从无序和非结构化数据到有序和结构化数据的转换，可以直接使用3D卷积神经网络来消费点云。

(2)多视图卷积神经网络（CNN）将点云投影到图像中并使用2D图像处理方法;

（3）直接处理不规则、非结构化点集的基于点的网络。

基于体素的深度网络结构采用卷积架构来有效地处理数据，这已被证明是最先进的精度（Maturana和谢勒，2015; Milletari等人，2016; Dai等人，2017; Song等人，2017年）。Voxnet是基于3D卷积运算进行对象识别的特征提取的开创性工作（Maturana和谢勒，2015）。类似地，对于形状识别和完成，3D ShapeNet学习形状的深度体积表示（Wu等人，2009年，2009年，2015年）。3D U-Net是应用于医学图像处理的基于体素的网络的流行示例（Çiçek O ¨等人，2016年）。然而，基于体素的Deep网络将空间划分为3D网格，导致数据稀疏性问题。为了解决这个问题，OctNet提出通过对OctTree数据结构使用卷积来在深度学习上下文中引入OctTree（Riegler等人，2017年）。Klokov和Lempitsky提供了另一种引入Kd树的方法（Klokov和Lempitsky，2017）。

3DMatch是使用3D卷积运算来计算特征描述符将基于体素的网络应用于RGB-D数据配准的先驱工作（Zeng等人，2017年）。由于点云被转换为体素，因此它可以利用图像处理的成熟网络结构并扩展到3D卷积运算。基于3DMatch，Zhang et al.（2019）使用均匀样本方法来获得关键点，并使用基于体素的深度学习模型来计算3D特征描述符，然后利用RANSAC方法来消除离群值并计算变换。

多视图深度网络通过以一定的方式从不同的视角投影三维点云数据来获得大量的2D渲染。然后，直接在图像上使用图像卷积神经网络结构来学习和识别3D对象的特征（Su等人，2015年）。Qi等人（2016）研究了用于3D对象分类的点云的体积和多视图表达，这两个实验的结果相差甚远，这表明当前的体积卷积神经网络不可否认地发展3D表示的能力。Chen等人（2017）通过计算前视图中鸟瞰图和柱面坐标的特征图，介绍了点云的多视图表达。Huang等人（2018）通过为每个3D关键点锚定三个本地相机并收集多视图特征图来学习半全局表达式。Pujol-Mir 'o等人（2019）修改了Huang et al.（2018），计算最佳投影方向生成2D渲染图像，并通过实验选择最佳邻域范围和图像大小，最后使用2D卷积神经网络计算特征描述。多视图DP网络受邻域点的数量和2D渲染图像的大小的影响。此外，3D数据信息在投影期间丢失。

PointNet（Qi等人，2017 a）是一种直接在点上操作的开创性方法，并显示了直接与点一起工作的改进，并且在连续空间中，它学习更精确的点分布。在多个点云数据处理任务中，例如分类、零件分割和场景分割任务，PointNet可获得最先进的结果。之后，大量基于不规则点的深度学习模型被提出并应用于点云的各个领域，包括点云配准（Qi et al.2017 b; Deng等人，2018a; 2018b; Deng等人，2019; Aoki等人，2019年; Wang等人，2019; Wang和所罗门，2019）。

PPFNet将点对特征（PPF）作为输入，并使用PointNet来学习几何特征描述（Deng等人，2018年a）。该方法采用随机采样来获取关键点，鲁棒性不强，且结构受样本数的限制，导致不适合大规模场景。此外，MLP用于获得局部特征，并使用最大池化操作来获得具有所有补丁的全局特征。然后将全局特征和局部特征通过MLP运算连接起来得到最终的几何特征描述。仅使用像PointNet这样的MLP很难获得更好的特征描述。因此，PPF-FoldNet用FoldingNet代替PointNet进行基于PPFNet的特征嵌入，并获得端到端网络对每个补丁的特征进行编码（Deng et al.2018年b）。该方法还以PPF作为输入，使用mini-PointNet和skip-links作为编码器，使用FoldingNet作为解码器来重建PPF。该方法的效果取决于点对特征的可分辨性和鲁棒性。PointNetLK组合PointNet和Lucas-Kanade（LK）算法以通过迭代获得旋转和变换（Aoki等人，2019年）的报告。然而，该方法涉及迭代计算，其迭代次数依赖于从实验获得的阈值。另一方面，该方法收集整个点云进行特征提取，不能应用于大规模场景。Deng等人（2019）提出了一种端到端神经网络来注册点云，它结合了FoldingNet和RelativeNet。该方法利用MLP直接获得最终的旋转和平移参数。同样，（Wang and所罗门，2019）的工作采用DGCNN（Wang et al.，2019）网络作为特征提取方法和评分模块，以创建一个考虑到两点云关系的新嵌入。最后，采用奇异值分解模块学习平移参数，取得了比MLP更好的精度。

目前，只有少数深度学习网络可以处理Kitti数据集（盖革等人，2012）注册。3DFateNet是基于深度学习的关键点检测的先驱工作，然而，这种方法预测了整个场景的所有输入和密集推理的权重，在大规模户外TLS点云中实现具有挑战性（Yew和Lee，2018）。DeepVCP是一种解决精细配准问题的新架构，它使用PointNet++来检测关键点，然后通过初始姿态和PointNet来生成相应的点（Lu et al.2019年）的报告。然而，它受到初始位姿的限制，并且在没有初始位姿的点云配准中存在困难。

JoKDNet

JoKDNet被提出来通过联合学习关键点检测器和描述符来提高可重复性和区分可验证性。JoKDNet主要包括关键点检测器模块（表示为紫色），特征嵌入模块（其是关键点检测器模块的一部分），特征描述符模块（表示为蓝色）和损失函数公式（表示为绿色），如图1.

JoKDNet将源点云和目标点云作为输入。

Xanc是源点云中的下采样点

Xpos、Xneg是根据Rgt和Tgt的地面真值在目标点云中选择的匹配点和非匹配点。

具有相邻点的Xanc作为补丁输入到关键点检测器模块以学习特征描述符Fanc和每个锚点的得分。然后，使用顶部K层来获取对配准最重要的贡献的K个点Panc。

通过Panc的索引从Xpos和Xneg中选择的Ppos和Pneg被馈送到特征嵌入模块以获得特征描述符Fpos和Fneg。将Panc和Fanc、Ppos和Fpos、Pneg和Fneg分别作为特征描述符模块的三对输入来学习区分特征。

关键点检测器模块

图2中的第一行关键点检测器模块的细节。首先，采用网格采样法对初始点云进行下采样，得到N个下采样点。下采样点均匀分布在整个场景中，但并不是所有的采样点都适合匹配，因此进一步利用基于学习的方法从采样点中检测关键点。

其次，搜索每个点的半径R内的K个相邻点以形成作为特征嵌入层的输入的贴片。在R半径内少于K个点的情况下，我们简单地复制它们，相反，我们对它们进行降采样。在本文中，相邻点的数量K和搜索半径R分别设置为32和0.6米。

第三，共享多层感知器（MLP）应用于每个相邻点，以学习它们的特征嵌入，其由4个隐藏层组成，神经元大小为32，64，128。然后，使用最大池化层组合来自K个相邻点的信息，从而获得每个下采样点的128维全局特征。最后，在每个下采样点上应用另一个共享MLP以将其特征嵌入的维度从128减小到1，其对每个下采样点的得分值进行编码（即，用于配准的下采样点的重要性）。然后，应用前k层以从具有较大得分值的所有下采样点获得Nk个关键点。

"T-Net" 可能是指 "Transformation Network"，它是一种在神经网络中用于学习输入数据的空间变换的架构。Transformation Network 通常用于处理具有平移、旋转、缩放等变换不变性的任务，如点云、图像和其他空间数据。

在点云处理中，T-Net 可以用于实现点云的对齐和配准，以及进行点云分类、分割等任务。它可以学习适应性的变换，使得输入点云可以在不同变换下保持一致。T-Net 的架构通常包括共享的特征提取网络和用于估计变换矩阵的部分。

例如，在点云处理中，T-Net 可以被嵌入到一个更大的网络中，用于点云的预处理、特征提取和变换估计。通过训练网络，T-Net 可以学习识别输入点云的特定变换，并输出变换矩阵，从而将点云变换为一个规范的形式。

总之，T-Net 是一种在神经网络中用于学习输入数据的变换的架构，常常用于处理具有空间变换特性的任务，如点云处理。这个概念通常在深度学习和计算机视觉领域中使用。

MLP 是 "Multilayer Perceptron" 的缩写，中文翻译为 "多层感知器"。它是一种基本的神经网络模型，用于解决各种机器学习任务，如分类、回归和其他模式识别任务。

MLP 由多个神经元层组成，每一层都与前一层和后一层连接。它至少包括一个输入层、一个或多个隐藏层和一个输出层。每个神经元层包含多个神经元（也称为节点），并且每个神经元都与前一层的所有神经元相连。

典型的 MLP 结构如下：

输入层：接受原始输入数据的特征。每个输入特征对应一个输入神经元。

隐藏层：包含多个神经元，每个神经元都与前一层的所有神经元相连。隐藏层通常用于提取数据的高级特征表示。

输出层：输出模型的预测结果，可以是分类、回归等任务的输出。

在训练过程中，MLP 通过反向传播算法来调整神经元之间的连接权重，从而最小化模型的损失函数。通过多次迭代训练，MLP 可以学习到适合特定任务的模式和特征。

虽然 MLP 在许多任务上表现出色，但也有一些限制，例如对于复杂的非线性关系可能需要更深层的网络结构。因此，在现代深度学习中，MLP 通常作为更复杂网络的基本组件，如卷积神经网络（CNN）和循环神经网络（RNN）。

Max-pooling 是一种用于卷积神经网络（CNN）中的池化操作，用于减小特征图的尺寸，并提取出重要的特征。

在卷积神经网络中，卷积层可以从输入数据中提取特征，但随着网络层数的增加，特征图的尺寸可能会变得很大，导致计算和内存需求增加。为了解决这个问题，池化操作被引入，其中的一种就是 Max-pooling。

Max-pooling 操作的步骤如下：

1. **定义池化窗口大小**：选择一个固定大小的池化窗口，通常是一个小矩形区域。

2. **在窗口内寻找最大值**：在每个池化窗口内，找到特征图中的最大值。这个最大值就是该窗口的池化输出。

3. **滑动窗口**：将池化窗口按步长（stride）滑动，以覆盖整个特征图，从而生成池化后的特征图。

Max-pooling 的效果是将每个池化窗口内的最大值提取出来，从而在减小特征图的尺寸的同时，保留了重要的特征。这种池化操作有助于减少模型对位置的敏感性，提高模型的鲁棒性。

需要注意的是，随着深度学习技术的发展，有些先进的模型在某些情况下已经采用了其他类型的池化操作，如平均池化、自适应池化等，以更好地适应不同的数据分布和任务需求。

"Concatenation operation"（连接操作）是指将两个或多个张量沿着某个维度进行拼接的操作。在深度学习中，这是一种常见的操作，用于在神经网络中将不同的特征或信息进行组合。

在深度学习中，特征通常表示为张量，而这些张量可以具有不同的维度。通过连接操作，您可以将这些张量沿着某个维度（通常是特征维度）进行堆叠，从而生成一个更大的张量。这可以用于多种情况，例如：

1. **特征拼接**：在卷积神经网络（CNN）中，您可能有多个不同层的特征图，您可以将它们沿着通道维度连接，以生成更丰富的特征表示。

2. **序列合并**：在处理序列数据（如文本或时间序列）时，您可以将不同的序列沿着序列维度连接，以构建更长的序列。

3. **多模态数据融合**：当处理多模态数据（例如图像和文本的组合）时，您可以将不同模态的特征进行连接，以实现不同信息源之间的融合。

4. **残差连接**：在残差网络（Residual Networks，ResNets）中，连接操作用于将输入张量与经过卷积层处理后的张量进行连接，以实现跳跃连接。

连接操作可以通过各种深度学习库（如TensorFlow、PyTorch等）中的函数来实现。通常，连接操作会在网络的某个中间层进行，以实现特征的融合或组合。通过合理使用连接操作，您可以构建更复杂、更灵活的神经网络架构。

特征描述符模块

在特征描述子模块中，采用局部特征学习、上下文信息融合、全局和局部特征融合等方法，得到更具鉴别力的特征描述。

构建局部邻域信息

图中的第二行。2示出了特征描述符模块的体系结构，该模块被应用于学习每个关键点的特征表示。从关键点检测器模块获得每个关键点的邻近点，结合更丰富的邻近属性信息来提高特征描述的可区分性。对于输入的相邻点{x1，x2，，xK}，采用最远点采样（FPS，Moenning and Dodgson，2003）选取一个点子集{xi 1，xi 2，，xiM}，对每个采样点xij搜索S个相邻点，则该层的输出为Nk ×M × S × 3，可以得到更详细的局部邻域信息。

考虑到面片的稀疏性和FPS算法能够保持面片的几何特征，本文采用FPS算法。此外，FPS的效率不会因为邻域点的数量少而受到影响。

集成上下文信息

共享MLP在每个局部邻域中用于学习局部特征，其由具有神经元大小32、64的2个隐藏层组成。然后，最大池化层用作对称函数以联合收割机来自S个相邻点的信息。实际上，通过在特征描述符期间聚合上下文信息对特征表示更有帮助。因此，最大池化结果被复制S次，并连接Nk × M × S × 3张量以整合上下文信息（图12中的Concat操作）。2）的情况。

论文阅读笔记：AI+RPA 几道之旅人工智能
文章目录论文题目下载地址论文摘要论文题目Challengesandopportunities:ImplementingRPAandAIinfrauddetectioninthebankingsector下载地址点击这里下载论文摘要在银行业中，将机器人流程自动化（RPA）和人工智能（AI）集成用于欺诈检测是一项重大变革，既带来了挑战，也带来了机遇。随着金融机构面临日益复杂的欺诈企图，RPA和AI成为
论文阅读：Deep Bilateral Learning for Real-Time Image Enhancement-google-hdrnet-slicing SetMaker 论文阅读
项目地址:https://gitcode.com/google/hdrnethdrnet作为超分领域的经典文章，由google提出主要用来用轻量化的方法来实现高分辨率的图像生成，hdrnet结合cnn可以让更高分辨率的图像部署在板端。如图所示，原始图像比如4k图像，首先分为两个主要模块：grid和guide。grid就是对应图上面的那一条特征提取网络，具体来说，原始图像经过下采样之后，默认256分
PenGymy论文阅读亚里士多没有德775 论文阅读
这里发现idea被人家先发了，没办法，资料收集的不够全面，现在来学习一下这个项目这篇论文的贡献如下：总的来说，他的主要工作是构建逼真的仿真环境，然后根据这个仿真环境生成真实的靶场，使得这个智能体能够在这个真实的环境去互动。下面来逐渐解析他的工作，我尽量详细一点1、背景和动机这种项目是在网络攻防中，攻防双方攻击者处于暗面，防御者处于明面，这时候受到攻击后应急处理多少会造成损失，那么要是可以提前预测攻
《互联网时代教师自主成长的模式研究》论文阅读与思考2 宁超群
2.第二部分教师自主成长的模式建构，实质上是对新网师底层逻辑的描述。你认为，新网师的培训模式与传统常见的培训模式有哪些区别？这些区别有什么意义或价值？读完第二部分后，你对新网师有哪些新的认识或理解？你认为新网师目前哪些方面做得好，哪些方面做得还不够？答：我认为新网师的培训模式与传统常见的培训模式有以下区别：（1）培训对象的参与动机不同。新网师学员的参与是自觉自愿、积极主动，而传统培训更多是被迫参与
【定位系列论文阅读】-Patch-NetVLAD: Multi-Scale Fusion of Locally-Global Descriptors for Place Recognition（一）醉酒柴柴论文阅读学习笔记
这里写目录标题概述研究内容Abstract第一段（介绍本文算法大致结构与优点）1.Introduction介绍第一段（介绍视觉位置识别的重要性）第二段（VPR的两种常见方法，本文方法结合了两种方法）第三段（本文贡献）第四段（为证明本文方法优越性，进行的测试以及比较）2.RelatedWork相关工作第一段（介绍早期与深度学习的全局图像描述符）第二段（介绍局部关键点描述符）第三段（局部描述符可以进一
论文阅读笔记（十九）：YOLO9000: Better, Faster, Stronger __Sunshine__ 笔记 YOLO9000 detection classification
WeintroduceYOLO9000,astate-of-the-art,real-timeobjectdetectionsystemthatcandetectover9000objectcategories.FirstweproposevariousimprovementstotheYOLOdetectionmethod,bothnovelanddrawnfrompriorwork.Theim
论文阅读笔记: DINOv2: Learning Robust Visual Features without Supervision 小夏refresh 论文计算机视觉深度学习论文阅读笔记深度学习计算机视觉人工智能
DINOv2:LearningRobustVisualFeatureswithoutSupervision论文地址:https://arxiv.org/abs/2304.07193代码地址:https://github.com/facebookresearch/dinov2摘要大量数据上的预训练模型在NLP方面取得突破，为计算机视觉中的类似基础模型开辟了道路。这些模型可以通过生成通用视觉特征(即无
周四 2020-01-09 08:00 - 24:30 多云 02h10m 么得感情的日更机器
南昌。二〇二〇年一月九日基本科研[1]:1.论文阅读论文--二小时十分2.论文实现实验--小时3.数学SINS推导回顾--O分4.科研参考书【】1)的《》看0/0页-5.科研文档1)组织工作[1]:例会--英语能力[2]:1.听力--十分2.单词--五分3.口语--五分4.英语文档1)编程能力[2]:1.编程语言C语言--O分2.数据结构与算法C语言数据结构--O分3.编程参考书1)陈正冲的《C语
【论文阅读】Mamba:选择状态空间模型的线性时间序列建模（二） syugyou Mamba状态空间模型论文阅读
文章目录3.4一个简化的SSM结构3.5选择机制的性质3.5.1和门控机制的联系3.5.2选择机制的解释3.6额外的模型细节A讨论：选择机制C选择SSM的机制Mamba论文第一部分Mamba:选择状态空间模型的线性时间序列建模(一)3.4一个简化的SSM结构如同结构SSM，选择SSM是单独序列变换可以灵活地整合进神经网络。H3结构式最知名SSM结构地基础，其通常包括受线性注意力启发的和MLP交替地
SAFEFL: MPC-friendly Framework for Private and Robust Federated Learning论文阅读笔记慘綠青年627 论文阅读笔记深度学习
SAFEFL:MPC-friendlyFrameworkforPrivateandRobustFederatedLearning适用于私有和鲁棒联邦学习的MPC友好框架SAFEFL，这是一个利用安全多方计算(MPC)来评估联邦学习(FL)技术在防止隐私推断和中毒攻击方面的有效性和性能的框架。概述传统机器学习（ML）：集中收集数据->隐私保护问题privacy-preservingML(PPML)采
MixMAE(MixMIM):用于分层视觉变压器有效预训练的混合和掩码自编码器论文阅读皮卡丘ZPC 扩散模型阅读论文阅读
论文:MixMAE(arxiv.org)代码:Sense-X/MixMIM:MixMIM:MixedandMaskedImageModelingforEfficientVisualRepresentationLearning(github.com)摘要:本文提出MixMAE(MixedandmaskAutoEncoder)，这是一种简单而有效的预训练方法，适用于各种层次视觉变压器。现有的分层视觉变
【论文阅读】LLM4CP: Adapting Large Language Models for Channel Prediction（2024） Bosenya12 科研学习论文阅读语言模型人工智能信道预测时间序列
摘要Channelprediction（信道预测）isaneffectiveapproach（有效方法）forreducingthefeedback（减少反馈）orestimationoverhead（估计开销）inmassivemulti-inputmulti-output（大规模多输入输出）(m-MIMO)systems.However,existingchannelpredictionmet
【论文阅读】AugSteal: Advancing Model Steal With Data Augmentation in Active Learning Frameworks（2024） Bosenya12 科研学习模型窃取论文阅读模型窃取模型提取数据增强主动学习
摘要Withtheproliferationof（随着）machinelearningmodels（机器学习模型）indiverseapplications,theissueofmodelsecurity（模型的安全问题）hasincreasinglybecomeafocalpoint（日益成为人们关注的焦点）.Modelstealattacks（模型窃取攻击）cancausesignifican
Bert系列：论文阅读Rethink Training of BERT Rerankers in Multi-Stage Retrieval Pipeline 凝眸伏笔 nlp 论文阅读 bert reranker retrieval
一句话总结：提出LocalizedContrastiveEstimation(LCE)，来优化检索排序。摘要预训练的深度语言模型(LM)在文本检索中表现出色。基于丰富的上下文匹配信息，深度LM微调重新排序器从候选集合中找出更为关联的内容。同时，深度lm也可以用来提高搜索索引，构建更好的召回。当前的reranker方法并不能完全探索到检索结果的效果。因此，本文提出了LocalizedContrast
当一个人自律到极致的时候，全世界都会为他让路心与宇宙的链接
当一个人自律到极致的时候，全世界都会为他让路北大最牛博士，能牛成什么样你知道微信运动步数的上限是多少吗？有人说5万，有人说8万。前几天，在2019届北京大学毕业典礼上，成功登顶珠峰且累计发表14篇SCI科研论文的超级学霸庄东方，作为优秀博士生代表发言。他给出了自己的答案，98800步，这就是他亲身测试的微信步数的上限。而这个记录，是他极限训练中，用半天时间创造的。这个答案被发到网上后，迅速在微博发
A Tutorial on Near-Field XL-MIMO Communications Towards 6G【论文阅读笔记】 Cc小跟班【论文阅读】相关论文阅读笔记
此系列是本人阅读论文过程中的简单笔记，比较随意且具有严重的偏向性（偏向自己研究方向和感兴趣的），随缘分享，共同进步~论文主要内容：建立XL-MIMO模型，考虑NUSW信道和非平稳性；基于近场信道模型，分析性能（SNRscalinglaws，波束聚焦、速率、DoF）XL-MIMO设计问题：信道估计、波束码本、波束训练、DAMXL-MIMO信道特性变化：UPW➡NUSW空间平稳–>空间非平稳（可视区域
论文阅读：scMGCA----模型方法 dundunmm 论文阅读论文阅读人工智能聚类生物聚类单细胞聚类单细胞分析
Yu,Z.,Su,Y.,Lu,Y.etal.Topologicalidentificationandinterpretationforsingle-cellgeneregulationelucidationacrossmultipleplatformsusingscMGCA.NatCommun14,400(2023).https://doi.org/10.1038/s41467-023-36134
论文阅读：scHybridBERT dundunmm 论文阅读机器学习人工智能神经网络深度学习单细胞基因测序
ZhangWei,WuChenjun,XingFeiyang,JiangMingfeng,ZhangYixuan,LiuQi,ShiZhuoxing,DaiQi,scHybridBERT:integratinggeneregulationandcellgraphforspatiotemporaldynamicsinsingle-cellclustering,BriefingsinBioinform
【论文阅读】Purloining Deep Learning Models Developed for an Ultrasound Scanner to a Competitor Machine Bosenya12 科研学习模型窃取论文阅读深度学习人工智能模型安全
TheArtoftheSteal:PurloiningDeepLearningModelsDevelopedforanUltrasoundScannertoaCompetitorMachine（2024）摘要Atransferfunctionapproach（传递函数方法）hasrecentlyproveneffectiveforcalibratingdeeplearning(DL)algorit
《Motion Forecasting with Dual Consistency and Multi-Pseudo-Target Supervision》论文阅读之DCMS 山水之间2018 无人驾驶 Paper Reading 大数据轨迹预测自动驾驶人工智能
目录摘要1简介2相关工作3.方法3.1结构3.2双重一致性约束3.3多伪目标监督3.4学习4实验4.1实验装置4.2实验结果4.3消融研究4.4泛化能力5限制6结论DCMS：具有双重一致性和多伪目标监督的运动预测香港科技大学暂无代码。摘要我们提出了一种具有双重一致性约束和多伪目标监督的运动预测新框架。运动预测任务通过结合过去的空间和时间信息来预测车辆的未来轨迹。DCMS的一个关键设计是提出双重一致
时序预测相关论文阅读笔记能力越小责任越小YA 论文阅读笔记时序预测 Transformer
笔记链接：【有道云笔记】读论文（记录）https://note.youdao.com/s/52ugLbot用于个人学习记录。
【论文阅读|cryoET】本周粗读汇总吃吃今天努力学习了吗冷冻电镜三维重建论文阅读
论文1：CryoDRGN-ET：深度重建生成网络以可视化细胞内动态生物分子Abstract虽然冷冻电子断层扫描可以以分子分辨率揭示结构，但图像处理算法仍然是解决原位生物分子结构异质性的瓶颈。本文介绍CryoDRGN-ET用于cryoET断层图的异质重建。CryoDRGN-ET直接从子断层扫描倾斜系列图像中学习三维密度图的深度生成模型，并且可以捕获成分和构象不同的状态。通过原位恢复肺炎支原体核糖体中
Your Diffusion Model is Secretly a Zero-Shot Classifier论文阅读笔记 Rising_Flashlight 论文阅读笔记计算机视觉
YourDiffusionModelisSecretlyaZero-ShotClassifier论文阅读笔记这篇文章我感觉在智源大会上听到无数个大佬讨论，包括OpenAISora团队负责人，谢赛宁，好像还有杨植麟。虽然这个文章好像似乎被引量不是特别高，但是和AI甚至人类理解很本质的问题很相关，即是不是要通过生成来构建理解的问题，文章的做法也很巧妙，感觉是一些学者灵机一动的产物，好好学习一个！摘要这
【论文阅读】QUEEN: Query Unlearning against Model Extraction（2024） Bosenya12 科研学习模型窃取论文阅读提取攻击模型安全
摘要Modelextractionattacks（模型提取攻击）currentlyposeanon-negligiblethreat（不可忽视的威胁）tothesecurity（安全性）andprivacy（隐私性）ofdeeplearningmodels.Byqueryingthemodelwithasmalldataset（通过小数据集查询模型）andusingthequeryresultsa
【论文阅读33】Deep learning optoacoustic tomography with sparse data 弹伦琴的雷登【论文阅读系列】人工智能深度学习论文阅读图像处理
Deeplearningoptoacoustictomographywithsparsedata论文题目：基于稀疏数据的深度学习光声断层扫描论文链接：Deeplearningoptoacoustictomographywithsparsedata|NatureMachineIntelligence代码链接：GitHub-ndavoudi/sparse_artefact_unet数据链接：Data发
论文阅读瞎记(四) Cascade R-CNN: Delving into High Quality Object Detection 2017 码大哥深度学习人工智能
概述在物体检测中1，IOU阈值被用于判定正负样本。在低IOU阈值比如0.5的状态下训练模型经常产生噪音预测，然而检测效果会随着IOU增加而降低。两个主要因素：1.训练时的过拟合，正样本指数消失2.检测器最优IOU与输入假设的不匹配。一个单阶段的物体检测器CascadeR-CNN被提出用于解决这些问题。网络由一个检测序列组成，这些序列训练时会伴随IOU增长从而对FP样本更加有选择性地判别。检测器一个
【论文阅读】LLM4SGG: Large Language Models for Weakly Supervised Scene Graph Generation 进击的乔洋论文阅读语言模型人工智能计算机视觉
【论文阅读】LLM4SGG:LargeLanguageModelsforWeaklySupervisedSceneGraphGenerationabstract由于全监督方法严重依赖昂贵标注，最近弱监督场景图生成(WSSGG)研究替代方案出现。在这一点上（Inthisregard），针对WSSGG的研究主要利用图像标题（imagecaption）来获取非局部三元组，而主要关注将非局部三元组建立在图
Code Llama: Open Foundation Models for Code论文阅读 yang_daxia 大模型 llama codellama
整体介绍CodeLlama发布了3款模型，包括基础模型、Python专有模型和指令跟随模型，参数量分别为7B、13B、34B和70B。这些模型在长达16ktokens的序列上训练。都是基于Llama2。作者针对infilling(FIM)、长上下文、指令专门做了微调long-contextfine-tuning(LCFT).codellama细节CodeLlama模型家族初始化:所有CodeLla
【论文阅读】Model Stealing Attacks Against Inductive Graph Neural Networks（2021） Bosenya12 科研学习模型窃取论文阅读图神经网络模型窃取
摘要Manyreal-worlddata（真实世界的数据）comeintheformofgraphs（以图片的形式）.Graphneuralnetworks(GNNs图神经网络),anewfamilyofmachinelearning(ML)models,havebeenproposedtofullyleveragegraphdata（充分利用图数据）tobuildpowerfulapplicat
VIT论文阅读： A Image is Worth 16x16 Words Undefined游侠论文阅读
简介在2024年，大家都知道了transformer的故事，但是在4年前,CNN和Transformer谁才是CV的未来，还没有那么确定。在简介部分，作者提到了一个令人失望的事实，在基于imagenet的实验中发现，transformer的表现差于同尺寸的ResNet。作者把原因归结到biastranslationequivarianceandlocality，这些CNN具有，但是transfor
web前段跨域nginx代理配置刘正强 nginx cms Web
nginx代理配置可参考server部分 server { listen 80; server_name localhost;
spring学习笔记 caoyong spring
一、概述 a>、核心技术 : IOC与AOP b>、开发为什么需要面向接口而不是实现接口降低一个组件与整个系统的藕合程度，当该组件不满足系统需求时，可以很容易的将该组件从系统中替换掉，而不会对整个系统产生大的影响 c>、面向接口编口编程的难点在于如何对接口进行初始化,(使用工厂设计模式)
Eclipse打开workspace提示工作空间不可用 0624chenhong eclipse
做项目的时候，难免会用到整个团队的代码，或者上一任同事创建的workspace， 1.电脑切换账号后，Eclipse打开时，会提示Eclipse对应的目录锁定，无法访问，根据提示，找到对应目录，G:\eclipse\configuration\org.eclipse.osgi\.manager，其中文件.fileTableLock提示被锁定。解决办法，删掉.fileTableLock文件，重
Javascript 面向对面写法的必要性？一炮送你回车库 JavaScript
现在Javascript面向对象的方式来写页面很流行，什么纯javascript的mvc框架都出来了：ember 这是javascript层的mvc框架哦,不是j2ee的mvc框架我想说的是，javascript本来就不是一门面向对象的语言，用它写出来的面向对象的程序，本身就有些别扭，很多人提到js的面向对象首先提的是：复用性。那么我请问你写的js里有多少是可以复用的，用fu
js array对象的迭代方法换个号韩国红果果 array
1.forEach 该方法接受一个函数作为参数，对数组中的每个元素使用该函数 return 语句失效 function square(num) { print(num, num * num); } var nums = [1,2,3,4,5,6,7,8,9,10]; nums.forEach(square); 2.every 该方法接受一个返回值为布尔类型
对Hibernate缓存机制的理解归来朝歌 session 一级缓存对象持久化
在hibernate中session一级缓存机制中，有这么一种情况：问题描述：我需要new一个对象，对它的几个字段赋值，但是有一些属性并没有进行赋值，然后调用 session.save()方法，在提交事务后，会出现这样的情况： 1：在数据库中有默认属性的字段的值为空 2：既然是持久化对象，为什么在最后对象拿不到默认属性的值？通过调试后解决方案如下：对于问题一，如你在数据库里设置了
WebService调用错误合集 darkranger webservice
Java.Lang.NoClassDefFoundError: Org/Apache/Commons/Discovery/Tools/DiscoverSingleton 调用接口出错，一个简单的WebService import org.apache.axis.client.Call;import org.apache.axis.client.Service; 首先必不可
JSP和Servlet的中文乱码处理 aijuans Java Web
JSP和Servlet的中文乱码处理前几天学习了JSP和Servlet中有关中文乱码的一些问题，写成了博客，今天进行更新一下。应该是可以解决日常的乱码问题了。现在作以下总结希望对需要的人有所帮助。我也是刚学，所以有不足之处希望谅解。一、表单提交时出现乱码：在进行表单提交的时候，经常提交一些中文，自然就避免不了出现中文乱码的情况，对于表单来说有两种提交方式：get和post提交方式。所以
面试经典六问 atongyeye 工作面试
题记：因为我不善沟通，所以在面试中经常碰壁，看了网上太多面试宝典，基本上不太靠谱。只好自己总结，并试着根据最近工作情况完成个人答案。以备不时之需。以下是人事了解应聘者情况的最典型的六个问题： 1 简单自我介绍关于这个问题，主要为了弄清两件事，一是了解应聘者的背景，二是应聘者将这些背景信息组织成合适语言的能力。我的回答：(针对技术面试回答，如果是人事面试，可以就掌
contentResolver.query()参数详解百合不是茶 android query()详解
收藏csdn的博客,介绍的比较详细,新手值得一看 1.获取联系人姓名一个简单的例子，这个函数获取设备上所有的联系人ID和联系人NAME。 [java] view plain copy public void fetchAllContacts() {
ora-00054:resource busy and acquire with nowait specified解决方法 bijian1013 oracle 数据库 kill nowait
当某个数据库用户在数据库中插入、更新、删除一个表的数据，或者增加一个表的主键时或者表的索引时，常常会出现ora-00054:resource busy and acquire with nowait specified这样的错误。主要是因为有事务正在执行（或者事务已经被锁），所有导致执行不成功。 1.下面的语句
web 开发乱码征客丶 spring Web
以下前端都是 utf-8 字符集编码一、后台接收 1.1、 get 请求乱码 get 请求中，请求参数在请求头中；乱码解决方法： a、通过在web 服务器中配置编码格式：tomcat 中，在 Connector 中添加URIEncoding="UTF-8"； 1.2、post 请求乱码 post 请求中，请求参数分两部份， 1.2.1、url？参数，
【Spark十六】： Spark SQL第二部分数据源和注册表的几种方式 bit1129 spark
Spark SQL数据源和表的Schema case class apply schema parquet json JSON数据源准备源数据 {"name":"Jack", "age": 12, "addr":{"city":"beijing&
JVM学习之:调优总结 -Xms -Xmx -Xmn -Xss BlueSkator -Xss -Xmn -Xms -Xmx
堆大小设置JVM 中最大堆大小有三方面限制：相关操作系统的数据模型（32-bt还是64-bit）限制；系统的可用虚拟内存限制；系统的可用物理内存限制。32位系统下，一般限制在1.5G~2G；64为操作系统对内存无限制。我在Windows Server 2003 系统，3.5G物理内存，JDK5.0下测试，最大可设置为1478m。典型设置： java -Xmx355
jqGrid 各种参数详解(转帖) BreakingBad jqGrid
jqGrid 各种参数详解分类：源代码分享个人随笔请勿参考解决开发问题 2012-05-09 20:29 84282人阅读评论(22) 收藏举报 jquery 服务器 parameters function ajax string
读《研磨设计模式》-代码笔记-代理模式-Proxy bylijinnan java 设计模式
声明：本文只为方便我个人查阅和理解，详细的分析以及源代码请移步原作者的博客http://chjavach.iteye.com/ import java.lang.reflect.InvocationHandler; import java.lang.reflect.Method; import java.lang.reflect.Proxy; /* * 下面
应用升级iOS8中遇到的一些问题 chenhbc ios8 升级iOS8
1、很奇怪的问题，登录界面，有一个判断，如果不存在某个值，则跳转到设置界面，ios8之前的系统都可以正常跳转，iOS8中代码已经执行到下一个界面了，但界面并没有跳转过去，而且这个值如果设置过的话，也是可以正常跳转过去的，这个问题纠结了两天多，之前的判断我是在 -(void)viewWillAppear:(BOOL)animated 中写的，最终的解决办法是把判断写在 -(void
工作流与自组织的关系？ comsci 设计模式工作
目前的工作流系统中的节点及其相互之间的连接是事先根据管理的实际需要而绘制好的，这种固定的模式在实际的运用中会受到很多限制，特别是节点之间的依存关系是固定的，节点的处理不考虑到流程整体的运行情况，细节和整体间的关系是脱节的，那么我们提出一个新的观点，一个流程是否可以通过节点的自组织运动来自动生成呢？这种流程有什么实际意义呢？这里有篇论文，摘要是：“针对网格中的服务
Oracle11.2新特性之INSERT提示IGNORE_ROW_ON_DUPKEY_INDEX daizj oracle
insert提示IGNORE_ROW_ON_DUPKEY_INDEX 转自：http://space.itpub.net/18922393/viewspace-752123 在 insert into tablea ...select * from tableb中，如果存在唯一约束，会导致整个insert操作失败。使用IGNORE_ROW_ON_DUPKEY_INDEX提示，会忽略唯一
二叉树:堆 dieslrae 二叉树
这里说的堆其实是一个完全二叉树,每个节点都不小于自己的子节点,不要跟jvm的堆搞混了.由于是完全二叉树,可以用数组来构建.用数组构建树的规则很简单: 一个节点的父节点下标为: (当前下标 - 1)/2 一个节点的左节点下标为: 当前下标 * 2 + 1 &
C语言学习八结构体 dcj3sjt126com c
为什么需要结构体，看代码 # include <stdio.h> struct Student //定义一个学生类型，里面有age, score, sex, 然后可以定义这个类型的变量 { int age; float score; char sex; } int main(void) { struct Student st = {80, 66.6,
centos安装golang dcj3sjt126com centos
#在国内镜像下载二进制包 wget -c http://www.golangtc.com/static/go/go1.4.1.linux-amd64.tar.gz tar -C /usr/local -xzf go1.4.1.linux-amd64.tar.gz #把golang的bin目录加入全局环境变量 cat >>/etc/profile<
10.性能优化-监控-MySQL慢查询 frank1234 性能优化 MySQL慢查询
1.记录慢查询配置 show variables where variable_name like 'slow%' ; --查看默认日志路径查询结果：--不用的机器可能不同 slow_query_log_file=/var/lib/mysql/centos-slow.log 修改mysqld配置文件：/usr /my.cnf[一般在/etc/my.cnf，本机在/user/my.cn
Java父类取得子类类名 happyqing java this 父类子类类名
在继承关系中，不管父类还是子类，这些类里面的this都代表了最终new出来的那个类的实例对象，所以在父类中你可以用this获取到子类的信息！ package com.urthinker.module.test; import org.junit.Test; abstract class BaseDao<T> { public void
Spring3.2新注解@ControllerAdvice jinnianshilongnian @Controller
@ControllerAdvice，是spring3.2提供的新注解，从名字上可以看出大体意思是控制器增强。让我们先看看@ControllerAdvice的实现： @Target(ElementType.TYPE) @Retention(RetentionPolicy.RUNTIME) @Documented @Component public @interface Co
Java spring mvc多数据源配置 liuxihope spring
转自：http://www.itpub.net/thread-1906608-1-1.html 1、首先配置两个数据库 <bean id="dataSourceA" class="org.apache.commons.dbcp.BasicDataSource" destroy-method="close&quo
第12章 Ajax（下） onestopweb Ajax
index.html <!DOCTYPE html PUBLIC "-//W3C//DTD XHTML 1.0 Transitional//EN" "http://www.w3.org/TR/xhtml1/DTD/xhtml1-transitional.dtd"> <html xmlns="http://www.w3.org/
BW / Universe Mappings blueoxygen BO
BW Element OLAP Universe Element Cube Dimension Class Charateristic A class with dimension and detail objects (Detail objects for key and desription) Hi
Java开发熟手该当心的11个错误 tomcat_oracle java 多线程工作单元测试
#1、不在属性文件或XML文件中外化配置属性。比如，没有把批处理使用的线程数设置成可在属性文件中配置。你的批处理程序无论在DEV环境中，还是UAT（用户验收测试）环境中，都可以顺畅无阻地运行，但是一旦部署在PROD 上，把它作为多线程程序处理更大的数据集时，就会抛出IOException，原因可能是JDBC驱动版本不同，也可能是#2中讨论的问题。如果线程数目可以在属性文件中配置，那么使它成为
推行国产操作系统的优劣 yananay windows linux 国产操作系统
最近刮起了一股风，就是去“国外货”。从应用程序开始，到基础的系统，数据库，现在已经刮到操作系统了。原因就是“棱镜计划”，使我们终于认识到了国外货的危害，开始重视起了信息安全。操作系统是计算机的灵魂。既然是灵魂，为了信息安全，那我们就自然要使用和推行国货。可是，一味地推行，是否就一定正确呢？先说说信息安全。其实从很早以来大家就在讨论信息安全。很多年以前，就据传某世界级的网络设备制造商生产的交

《论文阅读18》JoKDNet

一、论文

二、论文概述

三、论文详述

你可能感兴趣的:(科研论文,论文阅读)