wykup

【论文笔记】——PWCLO-Net

开始前：cvpr2021新鲜出炉，我也正在开启自己的学术生涯，这篇论文是做激光雷达LiDAR里程计的，是我很感兴趣的方向，但是我正在从基础学习。肯定有很多我看不懂的，但是我还是试着翻译一下，试着跟随一下大佬的思路。好了，开始吧。

题目：PWCLO-Net Deep LiDAR Odometry in 3D Point Clouds Using Hierarchical Embedding Mask Optimization
使用分层嵌入掩码优化的 3D 点云中的深度 LiDAR 里程计
作者实验室：上海交通大学系统控制与信息处理教育部重点实验室医疗机器人研究所自动化系
代码网站：
https://github.com/IRMVLab/PWCLONet
论文网址：
https://arxiv.org/search/?query=PWCLO-Net&searchtype=all&source=header
CPVR open access：
https://openaccess.thecvf.com/CVPR2021

摘要

本文提出了一种用于深度 LiDAR 里程计（ deep LiDAR odometry,这是干嘛的?）的新型 3D 点云学习模型，名为 PWCLO-Net，使用分层嵌入掩码优化（？）（hierarchical embedding mask optimization）。在该模型中，构建了用于 LiDAR 里程计任务的金字塔(Pyramid)、翘曲(Warping)和代价值函数(Cost volume)（？） (Pyramid, Warping, and Cost volume,PWC；翘曲这个词从三体中看到过，从三维到四维的翘曲点) 结构，分层的（hierarchically）以从粗到细（coarse-to-fine approach）的方法提取（refine）估计姿态（ refine the estimated pose in a coarse-to-fine approach hierarchically ）。建立了一个细致的代价容量函数（？cost volume）联系两个点云并得到嵌入式运动模态（？没明白这是啥意思）（An attentive cost volume is built to associate two point clouds and obtain embedding motion patterns.）然后，提出了一种新颖的可训练嵌入掩码（？embedding mask）来权衡所有点的局部运动模式（local motion patterns），以回归整体位姿并过滤离群点。估计的当前位姿用于扭转（warp）第一个点云跨过与第二个点云的距离，然后剩余的运动（residual motion）的 代价值函数（？cost volume） 就建立了。同时嵌入掩码（embedding mask）由粗到细分层优化，以获得更准确的过滤信息用以进行姿态提取。（the embedding mask is optimized hierarchically from coarse to fine to obtain more accurate filtering information for pose refinement. ）可训练的姿态扭转提取过程（pose warp-refinement process）被反复使用，以使姿势估计对异常值更加稳健。我们的 LiDAR 里程计模型的卓越性能和有效性在 KITTI 里程计数据集上得到了证明。我们的方法优于所有最近的基于学习的方法，并且在 KITTI 里程计数据集的大多数序列上优于基于几何的方法，LOAM 与映射优化。我们的源代码将在 https://github.com/IRMVLab/PWCLONet 上发布。

1.Introduction

视觉/激光雷达里程计是自动驾驶的关键技术之一。该任务使用两个连续的图像或点云来获得两帧之间的相对姿态变换，并作为移动机器人后续规划(subsequential planning)和决策的基础[13]。最近，与基于手工特征（hand-crafted）的传统方法相比，基于学习的里程计方法在数据集上显示出令人印象深刻的准确性。发现基于学习的方法可以处理稀疏特征（sparse features）和动态环境（dynamic environments）[9, 14]，这对于传统方法来说通常是困难的。据我们所知，大多数基于学习的方法都是基于 2D 视觉里程计 [26, 33, 15, 29, 23, 25] 或利用 LiDAR 的 2D 投影 [16, 22, 27, 10, 11] ，基于3D 点云的 LiDAR 里程计未有探索过。本文旨在通过原始 3D 点云直接估计 LiDAR 里程计。
对于 3D 点云中的 LiDAR 里程计，存在三个挑战：1）由于离散的（discrete） LiDAR 点数据是在两个连续帧（consecutive frame）中分别获得的，因此很难找到两帧之间的点对；2) 帧中属于某个物体的某些点如果被其他物体遮挡或由于激光雷达分辨率的限制而未被捕获，则在其他视图中可能看不到；3）一些属于动态物体的点不适合用于姿态估计，因为这些点具有动态物体的不确定运动。
对于第一个挑战，Zheng [32]使用在 2D 深度图像中判断的匹配关键点对。然而，由于 LiDAR 的离散感知(discrete perception)，对应关系很粗糙(rough)。本文采用 3D 点云的代价值函数（cost volume） [28, 24] 来获得两个连续帧之间的加权软对应(weighted soft correspondence)。对于第二个和第三个挑战，需要过滤不符合整体位姿的不匹配点或动态对象。 LO-Net [10] 通过对 3D 点法线的一致性误差（ consistency error of the normal） 进行加权（weighting）来训练额外的掩码估计网络(mask estimation network) [33, 30]。在我们的网络中，提出了一个内部可训练嵌入掩码(internal trainable embedding mask)，从 代价值函数（cost volume） 中 权衡局部运动模式以回归整体位姿(weigh local motion patterns from the cost volume to regress the overall pose) 。通过这种方式，可以优化掩码(mask)以获得更准确的姿态估计，而不是依赖于几何对应(geometry correspondence)。另外，建立PWC结构来得到稀疏点层的大运动，并且在密集层中提取位姿。如图1显示，嵌入掩码(embedding mask)也进行了分层优化，以获得更准确的过滤信息来提取位姿估计。

图1 我们提出的PWCLO-Net中的点特征金字塔，位姿扭转，和细致代价值函数（PWC，翻译的可能不准确，先理解吧）结构。通过 迭代位姿扭转-提取(iterative pose warp-refinement) 的方法逐层提取位姿。通过使所有模块可微分实现端到端的整个过程(The whole process is realized end-to-end by making all modules differentiable) 在LiDAR点云中，小的红色点群是整个点云。大的黑点是PC1中的采样点。嵌入掩码(embedding mask，翻译可能不太准，我还不太明白mask是做什么用的) 中大点的不同颜色衡量采样点对姿态估计的贡献。

总的来说，我们的贡献如下：

用于3D LiDAR里程计任务的点特征金字塔(Point Feature Pyramid),位姿扭转(pose wrapping),和代价值函数(cost volume)（PWC） 旨在捕捉两帧之间的大运动(large motion) 并完成可训练的迭代3D特征匹配(iterative 3D feature matching )和位姿回归(pose regression)。
在这个结构中，提出了分层嵌入掩码来过滤不匹配点并将点中的代价值函数(cost volume embedded in points)转换为在每个提取层的整体自我运动(overall egomotion in each refinement level)(这段也不太懂，整体的自我运动和之前的大运动，局部运动有什么说法？还有这里的refine是细化还是提取的意思呢？一直都有这个问题。还有cost volume是个常用的概念定义，我还不太懂。。)同时，分层地优化和提取了嵌入掩码，以获得更准确的过滤信息，为了（以）按照点的密度进行位姿提取。
基于位姿变换的特点，提出了位姿扭转和位姿提取来逐层迭代地提取估计位姿。建立了一个完全端到端的框架，名为PWCLO-Net，其中所有的模块都是完全可微的(differentiable)，使每个过程不再独立(independent)和组合优化(combinedly optimized)。
最后，我们的理论在KITTI里程计数据集上进行了演示[8,7]。最终实验和研究表明了所提出理论的优越性和每个设计的有效性。据我们所知，据我们所知，我们的方法优于所有最近的基于学习的 LiDAR 里程计，甚至在大多数序列（sequences） 上优于基于几何的映射优化 LOAM(geometry-based LOAM with mapping optimization) [31]。(这里的序列，LOAM我还不太明白是什么，序列可能是KITTI的数据集的一些内容，LOAM应该是另一种算法)

2.相关工作

2.1 深度 LiDAR 里程计

深度学习在视觉里程计中取得了令人瞩目的进展[15,29]。然而，带有深度学习的3D LiDAR里程计仍是个挑战性问题。在一开始，Nicolai等[16]将两个连续的LiDAR点云投影到2D平面得到2个2D深度图，然后用2D卷积核(convolution)和全连接层(FC，fully connected) 实现基于学习的LiDAR里程计。他们的工作证实了基于学习的理论对于LiDAR里程计是可行的尽管他们的实验结果并不优秀。Velas等[22]也把LiDAR点云投影到2D平面但是用了三个通道来编码信息，包括高度height，范围range和强度intensity。然后卷积核和FC全连接层用于位姿回归（pose regression）。仅在估计平移(translation)时性能很好，但在估计 6-DOF （6自由度）位姿时性能很差。Wang等人[27]将点云投影到全景深度图(panoramic depth images)上，并堆叠两帧图像一起作为输入。然后平移子网络和Flownet[5]方向子网络分别用来估计平移和方向。[10]也把3D LiDAR点云预处理成2D信息但是用了圆柱投影[2]。然后，估计出每个3D点的法向量建立两帧之间的一致性约束(consistency constraint)，并且估计不确定性掩码(uncertainty mask)以掩蔽动态区域(dynamic regions)(掩码是用来干嘛的呢？小白表示看不太懂。。动态区域又是啥呢。。)zheng等人[32]在从3D LiDAR点云投影到**2D球形深度图(2D spherical depth images)**中，通过经典检测和匹配算法提取了匹配的关键点对(matched keypoint pairs)。然后使用了基于结构的PointNet[17]以从匹配的关键点对回归位姿。[11]提出一个基于学习的网络来生成高置信度的匹配点对，然后采用奇异值分解(SVD)得到6-DOF(6自由度)的位姿。[3]介绍了一种关于 LiDAR 里程计的无监督学习方法。

2.2 相关深度点(Deep Point Correlation)

以上的研究都用2D投影信息用于LiDAR里程计学习，把LiDAR里程计转变为2D学习问题。Wang[27]基于相同的2D卷积模型把3D点输入和2D投影信息输入进行比较。发现基于3D输入的方法性能较差。随着3D深度学习的发展[17,18]，FlowNet3D[12]提出了一个嵌入式层来学习两个连续帧中的点的相关性。之后，Wu[28]提出了点云的代价值函数(cost volume，原来是这个人提出来的，等下找找) 理论,并且Wang发展出了细致代价值理论(attentive cost volume method 我也不知道是不是这么翻译。。先跟着感觉走，后面我要问问导师和同学) 。点的代价值函数引入了每个点的运动模式(motion patterns)。从代价值函数回归位姿成了一个新的方向和挑战，而且，并非所有的点运动都是针对整体位姿运动的。我们利用原始3D点云数据中直接估计位姿，并解决遇到的新挑战。
另外，我们受到Su提出的流网络中的 金字塔(Pyramid),扭转(Wraping),和代价值函数(cost volume)（PWC）结构 的启发[20].（这一坨是这篇论文中提出的。。）这篇工作使用了三个模块(金字塔(Pyramid),扭转(Wraping),和代价值函数(cost volume))来通过由粗到细的方法提取光流(optical flow) (光流是什么？。。)[28，24]这两篇关于3D场景流(3D scene flow) 的工作也用了PWC结构来提取估计的点云中的3D场景流。本文中，这个idea应用到了位姿估计提取，用于LiDAR里程计的PWC结构第一次建立。

3.PWCLO-Net

我们的理论从原始3D点云中通过端到端的方法学习LiDAR里程计，无需将点云预先投影到2D数据，与相关工作部分中介绍的深度LiDAR里程计方法有着显著不同。

图2 所提出的PWCLO-Net结构细节。该网络由点特征金字塔(point feature pyramid)中的四个集合卷积层、一个注意力代价值函数(attentive cost volume)、一个初始嵌入掩码(initial embedding mask)和位姿生成模块(pose generation module)以及三个位姿扭转-提取(pose wrap-refinement modules)模块组成。网络从四个级别输出预测位姿以进行监督训练。

图2展示了PWCLO-Net的完整结构。输入网络的是两个点云 $PC1=\{ x_i|x_i \in \mathbb R^3\}_{i=1}^{N}$ 和 $PC2=\{ y_i|y_i \in \mathbb R^3\}_{i=1}^{N}$ 从两个相邻帧采样得到。这两个点云首先通过由3.1部分介绍的 多个集合卷积层(several set conv layers) 组成的孪生特征金字塔(siamese feature pyramid) 进行降采样(decode) 。然后attentive cost volume用于产生embedding features，这部分将在Sec2中进行描述。为了从embedding features 回归位姿变换(pose transformation) ，提出了分层embedding mask优化，在Sec3.3。接下来，Sec3.4中提出位姿扭转提取方法(pose warp-refinement method) 用由粗到细的方法(coarse-to-fine) 提取位姿估计。最后，网络输出四元数(quaternion) $\in \mathbb R^4$ 和平移向量(translation vector) $\in \mathbb R^3$ .

3.1 Siamese Point Feature Pyramid孪生点特征金字塔

输入点云通常无序而稀疏地分布在很大的3D空间。建立了一个由多个集合卷积层组成的孪生特征金字塔(siamese feature pyramid consisting of several set conv layers) 进行降采样(decode)和提取(extract) 每个点云的分层特征(hierarchical features)。使用了最远点采样(Farthest Point Sampling (FPS)) [18] 和共享多层感知机(shared Multi-Layer Perceptron(MLP) )。卷积层(set conv) 的公式是：
$f_i= \max_{k=1,2,...K}(MLP((x_i^k-x_i)\oplus f_i^k\oplus f_i^c))$
（这个公式我还不太懂。。。）
其中 $x_i$ 通过FPS得到第i个采样点。并且 $x_i$ 周围的 $K$ 点由KNN(K Nearest Neighbors )算法选出。 $f_i^c$ 和 $f_i^k$ 是 $x_i$ 和 $x_i^k$ 的局部特征local features（他们在金字塔第一层是空的）。 $f_i$ 是位于中心点 $x_i$ 的输出特征output feature。 $\oplus$ 代表两个向量级联(concatenation of two vectors 不太明白这个级联的意思。。)并且 $\max\limits_{k=1,2,...K}()$ 代表最大池化(max pooling)操作。图2展示了建立的分层特征金字塔(hierarchical feature)。孪生金字塔(siamese pyramid)[4]意思是所建的金字塔的学习参数对于这两个点云是共享的。

3.2 Attentive cost volume

(这个attentive是啥意思？专注的？细心的？肯帮忙的？我还不理解，但是估计是cost volume的升级版)
接着，采用了[24]中的带注意力的点代价值函数来联系两个点云。cost volume通过联系特征金字塔后的两个点云来生成点的embedding features。
embedding features包括了两个点云中点的联系信息。如图3所示， $F_1=\{ f_i|f_i \in \mathbb R^c\}_{i=1}^{n}$ 是点云 $PC_1=\{ x_i|x_i \in \mathbb R^3\}_{i=1}^{n}$ 的特征， $F_2=\{ g_j|g_j \in \mathbb R^c\}_{i=1}^{n}$ 是点云 $PC_2=\{ y_i|y_i \in \mathbb R^3\}_{i=1}^{n}$ 的特征。两个点云的embedding features用下面的方法计算：
$w_{1,i}^k=softmax(u(x_i,y_j^k,f_i,g_j^k))_{k=1}^{K_1}$ $pe_i=\sum_{k=1}^{k_1}w_{1,i}^k\odot v(x_i,y_j^k,f_i,g_j^k)$ $w_{2,i}^k=softmax(u(x_i,x_i^k,pe_i,pe_i^k))_{k=1}^{K_2}$ $e_i=\sum_{k=1}^{k_2}w_{2,i}^k\odot v(x_i,x_i^k,pe_i,pe_i^k)$
其中 $y_i^k$ 和 $g_j^k$ 分别代表了从 $PC_2$ 中所选 $K_1$ 点的坐标和局部变量。 $\odot$ 代表点乘。 $u(\cdot)$ 和 $v(\cdot)$ 代表注意力降采样(attention encode)和特征降采样方程，参考[24]。 $u(\cdot)$ 对3D欧几里得空间信息和点特征进行降采样来产生注意力权重(attention weights), $v(\cdot)$ 表示对两帧点云的空间信息和特征的进一步降采样。输出 $E=\{e_i|e_i \in \mathbb R^c \}_{i=1}^n$ 是 $PC_1$ 的embedding features。

*图3 Attention Cost-volume.这个模块把带有局部特征两帧点云作为输入并关联两个点云。最后，模块输出位于 $PC_1$ 的嵌入特征embedding features

3.3 分层embedding mask优化

把两帧之间的 嵌入特征 $E$ (embedding features $E$ ) 转换到 全局的连续位姿变换(global consistent pose transformation) 是一个新问题。在这个部分，提出了一种新的embedding mask以从embedding features 生成位姿转换(pose transformation，这是矩阵吧？)
应当提及，一些点可能属于动态目标或者在另一帧中被遮挡了。有必要过滤掉这些点，保留对LiDAR里程计任务有用的点。为了解决这个问题，嵌入特征embedding features $E=\{e_i|e_i \in \mathbb R^c\}_{i=1}^n$ 和 $PC_1$ 的特征 $F_1$ 输入一个共享的MLP(多层感知机),然后沿着点的维度进行softmax操作来获得embedding mask(如图2中的初始embedding mask)：
$\oplus F_1))$
其中 $M=\{m_i|m_i \in \mathbb R^c\}_{i=1}^n$ 代表可训练masks，用于优先考虑 $PC_1$ 在的 $n$ 个点的embedding features(represents trainable masks for prioritizing embedding features of n points in PC1)。每个点都有一个在0到1之间的特征权重。一个点的权重越低，这个点就更有可能需要被滤除，反之亦然。然后，四元数(quaternion) $\in \mathbb R^4$ 和平移向量 $\in \mathbb R^3$ 可以分别通过 embedding features 和 全连接层(FC layers) 进行加权来生成， $q$ 被归一化来符合旋转的特征。
$q=\frac{FC(\sum\limits_{i=1}^{n}e_i \odot m_i)}{ \bigg\vert FC(\sum\limits_{i=1}^{n}e_i \odot m_i) \bigg\vert}$ $t=FC(\sum\limits_{i=1}^{n}e_i \odot m_i)$
可训练的mask $M$ 也是分层提取的一部分。如图2所示，embedding mask被传播到点云的密集层，就像embedding features $E$ 和位姿一样。embedding mask在扭转-提取过程中用由粗到细的方法优化，使得最终的mask估计和位姿变换的计算准确和可靠。我们称这个过程为分层embedding mask优化。

3.4 位姿扭转-提取模块

为了以端到端的方式实现由粗到细的提取过程，我们提出了如图4所示的基于位姿变换的可微分的wrap-refinement模块。这个模块包含了几个关键部分：集合上卷积层(set upconv layer)，位姿扭转，embedding feature和embedding mask refinement，和pose refinement。
set upconv layer：为了用由粗到细的方法提取位姿估计，这里采用了set upconv layer[12]来使点云的特征能够从稀疏层传递到稠密层。 $l + 1$ 层的embedding features $E^{l+1}$ 和embedding masks $M^{l+1}$ 通过set upconv layer传播，来获得需要在第 $l$ 层被优化的粗的embedding features $CE^l=\{ce_i^l|ce_i^l \in \mathbb R^{c^l}\}_{i=1}^{n^l}$ 和粗的embedding masks $CM^l=\{cm_i^l|cm_i^l \in \mathbb R^{c^l}\}_{i=1}^{n^l}$ .

Pose Warping：pose warping过程意思是第 $(l + 1)$ 层的四元数 $q^{l+1}$ 和平移向量 $t^{l+1}$ 用于扭转 $PC^l_1=\{x_i^l|x_i^l \in \mathbb R^{c^l}\}_{i=1}^{n^l}$ 来产生 $PC^l_{1,warped}=\{x_{i,warped}^l|x_{i,warped}^l \in \mathbb R^{c^l}\}_{i=1}^{n^l}$ .扭转后的 $PC^l_{1,warped}$ 比原来的 $PC^l_{1}$ 距离 $PC^l_{2}$ 更近，这使得在 $l$ 层残余运动估计(residual motion estimation)更简单。扭转变换的方程如下：
$0,x_{i,warped}^l]=q^{l+1}[0,x_i^l](q^{l+1})^{-1}+[0,t^{l+1}]$
然后， $PC_{1,warped}^l$ 和 $PC_2^l$ 之间的attentive cost volume被重新计算以估计剩余运动(residual motion).根据3.2中介绍的方法， $PC_{1,warped}^l$ 和 $PC_{2}^l$ 之间的re-embeding features被重新计算，记为 $RE^l=\{re_i^l|re_i^l \in \mathbb R^{c^l}\}_{i=1}^{n^l}$ .

图4 所提出的在第 $l$ 层的Pose Warp-Refinement 模块的细节

Embedding Feature and Embedding Mask Refinement:
产生的粗embedding feature $ce_i^l$ ,re-embedding feature $re_i^l$ ,和 $PC_1^l$ 的特征 $f_i^l$ 级联操作，然后输入一个共享的MLP中以获得在第 $l$ 层的embedding features $E^l=\{e_i^l|e_i^l \in \mathbb R^{c^l}\}_{i=1}^{n^l}$
$e_i^l=MLP(ce_i^l \oplus re_i^l \oplus f_i^l)$ 这个 MLP 的输出是第 $l$ 层优化的嵌入特征embedding features，它不仅会参与后续的位姿生成操作，还会作为输入输出到下一层 warp-refinement 模块。
与embedding feature的refinement（refinement这个是什么意思？改进？
提取？细化？还没太明白。。）一样，将新生成的embedding feature 嵌入特征 $e^l_i$ 、生成的粗嵌入掩码coarse embedding mask $cm_i^l$ ,和 $PC_1$ 的局部特征 $f_i^l$ 连接起来，并沿点维度输入到共享的 MLP 和 softmax 操作中，以获得第 $l$ 层的嵌入掩码embedding mask $M^l=\{m_i^l|m_i^l \in \mathbb R^{c^l}\}_{i=1}^l$ ：

Pose Refinement:
残差 $\bigtriangleup q^l$ 和 $\bigtriangleup t^l$ 可以根据3.3中的公式(7)和(8)从细化（refined）嵌入特征和掩码中获得. 最后，第 $l$ 层的refined quaternion四元数 $q_l$ 和平移向量 $t^l$ 可以通过以下方式计算：
$q^l=\bigtriangleup q^lq^{l+1}$ $[0,t^l]=\bigtriangleup q^l[0,t^{l+1}](\bigtriangleup q^l)^{-1}+[0,\bigtriangleup t^l].$

3.5 Training loss 训练损失

网络从点云的四个不同的层级输出四元数 $q^l$ 和平移向量 $t^l$ 。每层的输出都会进入一个设计好的损失函数，用来计算监督损失 $l^l$ .由于平移向量 $t$ 和四元数 $q$ 的尺度和单位不同，两个可以学习的参数 $s_x$ 和 $s_q$ 被引入，就像之前深度里程计工作[10]。训练损失函数在 $l$ 层的函数：

其中 $||\cdot||$ 和 $||\cdot||_2$ 分别代表 $l_1-\text{norm}$ 和 $l_2-\text{norm}$ . $t_{gt}$ 和 $q_{gt}$ 分别是ground-truth位姿变换矩阵，生成的ground-truth平移向量和四元数。然后，采用多尺度监督的方法。整个的训练损失 $l$ 是：

其中 $L$ 是warp-refinement层的总数， $α^l$ 表示第 $l$ 层的权重.

4.Implementation 应用

4.1. KITTI Odometry Dataset

KITTI里程计[8,7]由22个独立序列。我们的实验中使用了数据集中的 Velodyne LiDAR 点云。所有点云扫描都有 XYZ 坐标和反射率信息。序列 00-10（23201 次扫描）包含地面实况位姿（轨迹），而其余序列 11-21（20351 次扫描）没有公开可用的地面实况。通过在高速公路、住宅区道路、校园道路等不同道路环境下行驶，采样车从不同环境中采集点云用于激光雷达测距任务。

数据预处理： 我们的方法中仅使用 LiDAR 点的坐标。由于地面实况姿态表示在左相机坐标系中，因此该网络的所有训练和评估过程都在左相机坐标系中进行。因此，从 Velodyne LiDAR 捕获的点云首先通过以下方式转换到左相机坐标系：

其中 $P_{cam}$ 和 $P_{vel}$ 分别是左相机坐标系和激光雷达坐标系中的点云坐标， $T_r$ 是每个序列的标定矩阵。此外，LiDAR 传感器收集的点云通常在每一帧的点云边缘都包含异常值。这通常是因为物体远离 LiDAR 传感器，从而在边缘形成不完整的点云。为了过滤掉这些离群点，对于每个点云 $P_{cam}$ ，车辆周围30×30 $m^2$ 正方形区域中的点都被过滤掉了。为加快数据读取和训练速度，将高度小于 0.55m 的地面移除。对于我们的模型，去除和保留地面的性能是相似的。详细对比见补充材料.

表1 LiDAR里程计在KITTI里程计数据集上的实验结果。 $t_{rel}$ 和 $r_{rel}$ 意思分别是在长度为100，200…800m的所有可能的子序列的平均平移RMSE(均方根误差，%)和旋转的RMSE(°/100m)。‘*’意思是训练序列。LOAM是一个完整的SLAM系统，包括后端优化(back-end optimization)而其他的只包含里程计。除了最后三行，数据来源于[10]。LOAM w/o mapping的结果通过运行他们公开的代码而获得。最好的结果是大胆的。(啥意思？。。)

表2 与[32]相比，LiDAR里程计在KITTI里程计数据集上的实验结果。由于[32]是在00-06，09-10序列上训练的，并且在07-08序列上测试的，为了与[32]进行对比，我们也这样训练和测试我们的模型。

表3 LiDAR里程计在KITTI里程计数据集的04和10序列的结果[7]。由于[27]在序列00-03，05-09上训练，并且只报道了04和10序列的测试结果，我们为与之对比也采用同样的训练和测试方法。
表4 LiDAR 里程计结果在 KITTI 里程计数据集 [7] 的序列 09 和 10 上。由于 [3] 对序列 00-08 应用无监督训练，并报告序列 09 和 10 的测试结果，我们像这样训练和测试我们的模型以进行公平比较。
Data Augmentation (数据增强): 我们通过增强矩阵 $T_{aug}$ 来增强训练数据集，该矩阵由旋转矩阵 $R_{aug}$ 和平移向量 $t_{aug}$ 生成。偏航-俯仰-滚转欧拉角的变化值由 0° 附近的高斯分布生成。然后可以从这些随机欧拉角中获得 $R_{aug}$ 。类似地， $t_{aug}$ 是由相同的过程生成的。然后使用组合的 $T_{aug}$ 来增强 $PC_1$ 以获得新的点云 $PC_{1,aug}$ ：

相应地，ground truth 变换矩阵也修改为：

其中 $T_p$ 表示从 $PC_1$ 到 $PC_2$ 的原始地面实况姿态变换矩阵。然后使用 $T_{trans}$ 生成 $q_{gt}$ 和 $t_{gt}$ 来监督网络的训练。

4.2 Networks Details

在训练和评估过程中，输入的 $N$ 个点分别从两帧的点云中随机采样。不需要原始输入的两个点云具有相同的点数。在提议的网络中， $N$ 设置为 8192。 MLP 中的每一层都包含 ReLU 激活函数，除了 FC 层。对于共享 MLP， $1 \times 1$ 卷积 1 步长是实现方式。补充材料中描述了详细的层参数，包括 MLP 中的每个线性层宽度。所有训练和评估实验均在具有 TensorFlow 1.9.0 的单个 NVIDIA RTX 2080Ti GPU 上进行。采用 Adam 优化器， $β 1 = 0.9$ ， $β 2 = 0.999$ 。初始学习率为 0.001，每 200000 步呈指数衰减，直到 0.00001。公式（14）中可训练参数 $s_x$ 和 $s_q$ 的初始值分别设置为0.0和-2.5。对于公式（15）， $α 1 = 1.6$ ， $α 2 = 0.8$ ， $α 3 = 0.4$ ， $L = 4$ 。
批量大小为 8。

(未完待续)

论文笔记-Contrastive Learning for Unpaired Image-to-Image Translation kingsleyluoxin 计算机视觉论文笔记深度学习 python 计算机视觉机器学习人工智能深度学习
论文信息标题：ContrastiveLearningforUnpairedImage-to-ImageTranslation作者：TaesungPark,AlexeiA.Efros,RichardZhang,Jun-YanZhu机构：UniversityofCalifornia,Berkeley;AdobeResearch代码链接https://github.com/taesungp/contra
论文笔记：Deep Algorithm Unrolling for Blind Image Deblurring 爱学习的小菜鸡论文笔记去模糊图像处理神经网络
这是一篇CVPR2020的去模糊论文，主要是通过传统与深度相结合，将迭代次数变成神经网络的层数，使网络结构的网络结构更加具有解释性。主要贡献：DeepUnrollingforBlindImageDeblurring(DUBLID)：提出一种可解释的神经网络结构叫做DUBLID，首先提出一种迭代算法，该算法被认为是梯度域中传统的广义全变分正则方法(generalizedTV-regularizeda
A survey on instance segmentation: state of the art——论文笔记栀子清茶 1024程序员节论文阅读计算机视觉人工智能笔记学习
摘要这篇论文综述了实例分割的研究进展，定义其为同时解决对象检测和语义分割的问题。论文讨论了实例分割的背景、面临的挑战、技术演变、常用数据集，并总结了相关领域的最新成果和未来研究方向。实例分割的发展从粗略的对象分类逐步演变为更精细的像素级别推理，广泛应用于自动驾驶、机器人等领域。论文为研究人员提供了对实例分割领域的全面了解和有价值的参考。一、简介第一部分“简介”主要介绍了实例分割的背景、定义和挑战。
AIGC视频生成模型：ByteDance的PixelDance模型好评笔记 AIGC 音视频机器学习人工智能深度学习计算机视觉 transformer
大家好，这里是好评笔记，公主号：Goodnote，专栏文章私信限时Free。本文详细介绍ByteDance的视频生成模型PixelDance，论文于2023年11月发布，模型上线于2024年9月，同时期上线的模型还有Seaweed（论文未发布）。热门专栏机器学习机器学习笔记合集深度学习深度学习笔记合集优质专栏回顾：机器学习笔记深度学习笔记多模态论文笔记AIGC—图像文章目录热门专栏机器学习深度学习
LLM论文笔记 20: How to think step-by-step: A mechanistic understanding of chain-of-thought reasoning Zhouqi_Hua 大模型论文阅读人工智能 chatgpt 论文阅读机器学习深度学习语言模型
Arxiv日期：2024.5.16机构：IIT关键词CoT本质LLM推理本质核心结论1.CoT推理的功能组件尽管不同阶段的推理任务具有不同的推理需求，模型内部的功能组件几乎是相同的（共享而非独享）不同的神经算法实际上是由类似归纳头（inductionheads）等机制组合而成2.注意力机制中的信息流动attentionheads在不同的模型层之间传递信息，特别是当它们涉及到本体论相关（ontolo
[论文笔记] LLaMA3.1与Qwen2与Apple 技术报告中预训练方案对比心心喵论文笔记论文阅读深度学习人工智能
https://arxiv.org/pdf/2407.21075https://arxiv.org/pdf/2407.10671https://arxiv.org/pdf/2407.21783LLaMA3.1LLaMA3.1技术报告：https://ai.meta.com/blog/meta-llama-3-1/
LLM时代的小模型思考：《What is the Role of Small Models in the LLM Era: A Survey》论文笔记 FrancisQiu learning nlp paper reading 论文阅读
论文：WhatistheRoleofSmallModelsintheLLMEra:ASurvey作者：LihuChenetal.单位：ImperialCollegeLondonAbstract问题：扩大模型大小会导致计算成本和能耗呈指数级增长，这使得这些模型对于学术研究人员和资源有限的企业来说不切实际小型模型（SMs）经常用于实际环境中，引发了关于小模型在LLM时代的作用的重要问题，且关注有限方法
【论文笔记】3DGS压缩相关工作2篇 AndrewHZ 深度学习新浪潮论文阅读 3DGS 计算机图形学算法三维高斯飞溅压缩方法
1.背景介绍：NVS神经辐射场（NeRFs）引入了一种基于多层感知机（MLP）的新型隐式场景表示方法，它将体密度编码作为几何形状和方向辐射的代理量。渲染通过光线行进的方式来执行。这一解决方案为新视图合成（NVS）带来了前所未有的视觉质量，但代价是训练多层感知机的优化过程极为耗时，且渲染速度很慢。有几种方法加速了训练和渲染过程，通常是利用空间数据结构或者像哈希这样的编码方式，不过牺牲了视觉质量。近期
[论文笔记] LLM大模型剪枝篇——2、剪枝总体方案心心喵论文笔记剪枝算法机器学习
https://github.com/sramshetty/ShortGPT/tree/mainMy剪枝方案（暂定）：剪枝目标：1.5B—>100～600M剪枝方法：层粒度剪枝1、基于BI分数选择P%的冗余层，P=60~802、对前N%冗余层，直接删除fulllayer。N=20（N：剪枝崩溃临界点，LLaMA2在45%，Mistral-7B在35%，Qwen在20%，Phi-2在25%）对后(P
Farm3D- Learning Articulated 3D Animals by Distilling 2D Diffusion论文笔记 Im Bug 3d 论文阅读
Farm3D:LearningArticulated3DAnimalsbyDistilling2DDiffusion1.Introduction最近的研究DreamFusion表明，可以通过text-imagegenerator提取高质量的三维模型，尽管该生成模型并未经过三维训练，但它仍然包含足够的信息以恢复三维形状。在本文中，展示了通过文本-图像生成模型可以获取更多信息，并获得关节模型化的三维对
论文笔记（七十二）Reward Centering（一）墨绿色的摆渡人文章论文阅读
RewardCentering（一）文章概括摘要1奖励中心化理论文章概括引用：@article{naik2024reward,title={RewardCentering},author={Naik,AbhishekandWan,YiandTomar,MananandSutton,RichardS},journal={arXivpreprintarXiv:2405.09999},year={202
论文笔记：Enhancing Sentence Embeddings in Generative Language Models UQI-LIUWJ 论文阅读语言模型人工智能
2024ICIC1INTRO对于文本嵌入，过去几年的相关研究主要集中在像BERT和RoBERTa这样的判别模型上。这些模型固有的语义空间各向异性，往往需要通过大量数据集进行微调，才能生成高质量的句子嵌入。——>需要较大的训练批次，这会消耗大量的计算资源一些前沿的工作将焦点转向了最近开发的生成模型，期望利用其先进的文本理解能力，直接对输入句子进行编码，而无需额外的反向传播由于句子表示和自回归语言建模
LLM论文笔记 15: Transformers Can Achieve Length Generalization But Not Robustly Zhouqi_Hua 大模型论文阅读论文阅读语言模型自然语言处理深度学习笔记
Arxiv日期：2024.2.14机构：GoogleDeepMind/UniversityofToronto关键词长度泛化位置编码数据格式核心结论1.实验结论：十进制加法任务上的长度泛化最佳组合：FIRE位置编码随机化位置编码反向数据格式索引提示（indexhints，辅助定位）2.在适当的配置下，Transformer模型可以泛化到训练序列长度的2.5倍（例如从40位加法训练成功泛化到100位加
多模态论文笔记——DiT（Diffusion Transformer）好评笔记多模态论文笔记深度学习 transformer DiT 人工智能机器学习 aigc stable diffusion
大家好，这里是好评笔记，公主号：Goodnote，专栏文章私信限时Free。本文详细介绍Transformer架构图像生成方面的应用，将Diffusion和Transformer结合起来的模型：DiT。目前DiT已经成为了AIGC时代的新宠儿，视频和图像生成不可缺少的一部分。文章目录论文定义架构与传统(U-Net)扩散模型区别架构噪声调度策略与传统扩散的相同输入图像/条件信息的Patch化（Pat
LLM论文笔记 14: The Impact of Positional Encoding on Length Generalization in Transformers Zhouqi_Hua 大模型论文阅读论文阅读人工智能深度学习笔记语言模型
Arxiv日期：2023.12.15机构：McGillUniversity/IBM/Facebook/ServiceNow关键词长度泛化位置编码CoT核心结论1.decoder-only中不显式使用位置编码（NoPE）可以提高长度泛化性能2.（证明了）decoder-onlytransformer如果NoPE同时具备绝对APE和RPE的能力3.暂存器（cot）对于长度泛化和任务相关，同时关注短期和
LLM论文笔记 9: Neural Networks and the Chomsky Hierarchy Zhouqi_Hua 大模型论文阅读论文阅读人工智能深度学习笔记语言模型
Arxiv日期：2022.9.29机构：GoogleDeepMind/Stanford关键词transformer架构原理乔姆斯基体系长度泛化核心结论1.虽然Transformer理论上具有图灵完备性，但在实践中能力受到位置不变性和有限记忆的限制2.Transformer在一些任务中表现较差，例如正则语言任务（如ParityCheck），表明其与Chomsky层级的对齐性不佳3.Transform
[论文笔记] Cost-Effective Hyperparameter Optimization for Large Language Model Generation 大型语言模型生成推理超参优化心心喵论文笔记论文阅读语言模型人工智能
成本效益高的大型语言模型生成推理的超参数优化https://openreview.net/pdf?id=DoGmh8A39OChiWang1,SusanXueqingLiu2,AhmedH.Awadallah11微软研究院，雷德蒙德2史蒂文斯理工学院摘要大型语言模型（LLMs）因其生成能力引发了广泛关注，催生了各种商业应用。使用这些模型的高成本驱使应用构建者在有限的推理预算下最大化生成的价值。本文
【deepseek】论文笔记--DeepSeek-R1: Incentivizing Reasoning Capability in LLMs via Reinforcement Learning 大表哥汽车人人工智能大语言模型学习笔记论文阅读人工智能 deepseek
DeepSeek-R1论文解析1.论文基本信息标题：DeepSeek-R1:IncentivizingReasoningCapabilityinLLMsviaReinforcementLearning作者：DeepSeek-AI团队（联系邮箱：[email protected]）发表时间与出处：2024年，AIME2024（人工智能与数学教育国际会议）关键词：ReinforcementLe
论文笔记《基于深度学习模型的药物-靶标结合亲和力预测》 I_dyllic 深度学习论文阅读深度学习人工智能
基于深度学习模型的药物-靶标结合亲和力预测这是一篇二区的文章，算是一个综述，记录一下在阅读过程中遇到的问题。文章目录基于深度学习模型的药物-靶标结合亲和力预测前言一、蛋白质接触图谱二、为什么蛋白质图谱的准确性对DTA模型预测结果没有影响1.对这段话的解释2.关于Alphafold3三、随机配体与随机配体节点属性（配体一般指药物）1.什么是随机配体与配体节点属性四、关于深度学习模型对特征的自动学习过
TC-LLaVA论文笔记 0yumiwawa0 计算机视觉论文阅读
RoPE介绍理解LLM位置编码:RoPE|LinsightMotivation在基于视频的multimodallargelanguagemodel中，更好地利用视频提供的时序信息。MethodTemporal-AwareDualRoPE之前的RoPE公式：A(qTm,kFnVz)=Re[qTmkFnVzei(P(Tm)−P(FnVz))θ]A_{(q_{T_m},k_{F_nV_z})}=Re[q
CNN-day5-经典神经网络LeNets5 谢眠深度学习深度学习计算机视觉人工智能
经典神经网络-LeNets51998年YannLeCun等提出的第一个用于手写数字识别问题并产生实际商业（邮政行业）价值的卷积神经网络参考：论文笔记：Gradient-BasedLearningAppliedtoDocumentRecognition-CSDN博客1网络模型结构整体结构解读：输入图像：32×32×1三个卷积层：C1：输入图片32×32，6个5×5卷积核，输出特征图大小28×28（3
[论文笔记] llama3.2 蒸馏心心喵论文笔记论文阅读
参考链接：LLaMA3.2技术报告：GitHub-meta-llama/llama-stack:ModelcomponentsoftheLlamaStackAPIs[2407.21783]TheLlama3HerdofModelshttps://ai.meta.com/blog/llama-3-2-connect-2024-vision-edge-mobile-devices/HuggingFac
[论文笔记] Deepseek技术报告心心喵论文笔记论文阅读人工智能
1.总体概述背景与目标报告聚焦于利用强化学习（RL）提升大型语言模型（LLMs）的推理能力，旨在探索在不依赖大规模监督微调（SFT）的情况下，模型如何自我进化并形成强大的推理能力。介绍了两代模型：DeepSeek-R1-Zero（纯RL，无SFT冷启动数据）和DeepSeek-R1（在RL前加入少量冷启动数据和多阶段训练流程，提升可读性及推理表现）。核心思路直接在基础模型上应用大规模强化学习，利用
【论文笔记】基于图神经网络的多视角视觉重定位 GRNet CVPR 2020 论文笔记 phy12321 相机重定位
GRNet:LearningMulti-viewCameraRelocalizationwithGraphNeuralNetworks驭势科技,北京大学机器感知重点实验室,北京长城航空测控技术研究所本文提出了一种使用多视角图像进行相机重定位的图神经网络。该网络可以使得不连续帧之间进行信息传递，相比于只能在相邻前后帧之间进行信息传递的序列输入和LTSM，其能捕获更多视角信息以进行重定位。因此LSTM
论文笔记（七十）DeepSeek-R1: Incentivizing Reasoning Capability in LLMs via Reinforcement Learning（二）墨绿色的摆渡人文章论文阅读
DeepSeek-R1:IncentivizingReasoningCapabilityinLLMsviaReinforcementLearning（二）文章概括摘要：2.方法2.3.DeepSeek-R1：冷启动强化学习2.3.1.冷启动2.3.2.面向推理的强化学习2.3.3.拒绝采样与监督微调2.3.4.面向所有场景的强化学习2.4.蒸馏：赋予小模型推理能力文章概括引用：@article{g
[论文总结] 深度学习在农业领域应用论文笔记14 落痕的寒假论文总结深度学习论文阅读人工智能
当下，深度学习在农业领域的研究热度持续攀升，相关论文发表量呈现出迅猛增长的态势。但繁荣背后，质量却不尽人意。相当一部分论文内容空洞无物，缺乏能够落地转化的实际价值，“凑数”的痕迹十分明显。在农业信息化领域的顶刊《ComputersandElectronicsinAgriculture》中也大面积存在。众多论文在研究方法上存在严重缺陷，过于简单粗放。只是机械地把深度学习方法生硬地套用到特定农业问题中
[论文笔记] llama-factory 微调qwen2.5、llama3踩坑心心喵论文笔记深度学习人工智能
一、bug1、pre-tokenize的时候,会OOM解决：在yaml文件中添加streaming参数#tokenizestreaming:Truemax_steps:10000https://github.com/hiyouga/LLaMA-Factory/blob/3a023bca2a502810a436cfba7708df164754ea62/src/llamafactory/hparams
[论文笔记] Megatron: mistral sliding window（ImportError: /workspace/venv/lib/python3.10/site-packag报错解决）心心喵论文笔记论文阅读
pyTorch—TransformerEngine1.2.1documentation论文：https://arxiv.org/pdf/2310.06825.pdftransformerengine的slidingwindow是用了flashatttention（新版本2以上，这里用的最新版本2.5.2）里对sliding_window的实现。所以不需要用transformerengine。直接用
[论文笔记]自监督sketch-to-image生成：Self-Supervised Sketch-to-Image Synthesis 沉迷单车的追风少年深度学习-计算机视觉 sketch 深度学习计算机视觉
前言：2020年顶会同时出现了两篇很有意思的论文《Self-SupervisedSketch-to-ImageSynthesis》和《UnsupervisedSketch-to-PhotoSynthesis》，分别用自监督和无监督的方法做sketch-to-image生成，可以说是GANs在这一任务中表现的巅峰。目录主要贡献主要工作域转换模型TOMPS：边缘图、铅笔画图、草图sketch之间的区别
【论文笔记】：DuBox: No-Prior Box Objection Detection via Residual Dual Scale Detectors Activewaste #Anchor-free #特征层面 #小目标检测 DuBox anchor-free
&Title:DuBox:No-PriorBoxObjectionDetectionviaResidualDualScaleDetectorsGithubaddrNone&Summary介绍了一种新的一阶段检测方法Dubox，它可以在没有先验框的情况下检测物体。设计的双尺度残差单元具有多尺度特性，使双尺度检测器不再独立运行。高层检测器学习低层检测器的残差。Dubox增强了启发式引导的能力，进一步使
遍历dom 并且存储（将每一层的DOM元素存在数组中）换个号韩国红果果 JavaScript html
数组从0开始！！ var a=[],i=0; for(var j=0;j<30;j++){ a[j]=[];//数组里套数组，且第i层存储在第a[i]中 } function walkDOM(n){ do{ if(n.nodeType!==3)//筛选去除#text类型 a[i].push(n); //con
Android+Jquery Mobile学习系列(9)-总结和代码分享白糖_ JQuery Mobile
目录导航经过一个多月的边学习边练手，学会了Android基于Web开发的毛皮，其实开发过程中用Android原生API不是很多，更多的是HTML/Javascript/Css。个人觉得基于WebView的Jquery Mobile开发有以下优点： 1、对于刚从Java Web转型过来的同学非常适合，只要懂得HTML开发就可以上手做事。 2、jquerym
impala参考资料 dayutianfei impala
记录一些有用的Impala资料 1. 入门资料 >>官网翻译： http://my.oschina.net/weiqingbin/blog?catalog=423691 2. 实用进阶 >>代码&架构分析： Impala/Hive现状分析与前景展望：http
JAVA 静态变量与非静态变量初始化顺序之新解周凡杨 java 静态非静态顺序
今天和同事争论一问题，关于静态变量与非静态变量的初始化顺序，谁先谁后，最终想整理出来！测试代码： import java.util.Map; public class T { public static T t = new T(); private Map map = new HashMap(); public T(){ System.out.println(&quo
跳出iframe返回外层页面 g21121 iframe
在web开发过程中难免要用到iframe，但当连接超时或跳转到公共页面时就会出现超时页面显示在iframe中，这时我们就需要跳出这个iframe到达一个公共页面去。首先跳转到一个中间页，这个页面用于判断是否在iframe中，在页面加载的过程中调用如下代码： <script type="text/javascript"> //<!-- function
JAVA多线程监听JMS、MQ队列 510888780 java多线程
背景：消息队列中有非常多的消息需要处理，并且监听器onMessage（）方法中的业务逻辑也相对比较复杂，为了加快队列消息的读取、处理速度。可以通过加快读取速度和加快处理速度来考虑。因此从这两个方面都使用多线程来处理。对于消息处理的业务处理逻辑用线程池来做。对于加快消息监听读取速度可以使用1.使用多个监听器监听一个队列；2.使用一个监听器开启多线程监听。对于上面提到的方法2使用一个监听器开启多线
第一个SpringMvc例子布衣凌宇 spring mvc
第一步：导入需要的包；第二步：配置web.xml文件 <?xml version="1.0" encoding="UTF-8"?> <web-app version="2.5" xmlns="http://java.sun.com/xml/ns/javaee" xmlns:xsi=
我的spring学习笔记15-容器扩展点之PropertyOverrideConfigurer aijuans Spring3
PropertyOverrideConfigurer类似于PropertyPlaceholderConfigurer，但是与后者相比，前者对于bean属性可以有缺省值或者根本没有值。也就是说如果properties文件中没有某个bean属性的内容，那么将使用上下文（配置的xml文件）中相应定义的值。如果properties文件中有bean属性的内容，那么就用properties文件中的值来代替上下
通过XSD验证XML antlove xml schema xsd validation SchemaFactory
1. XmlValidation.java package xml.validation; import java.io.InputStream; import javax.xml.XMLConstants; import javax.xml.transform.stream.StreamSource; import javax.xml.validation.Schem
文本流与字符集百合不是茶 PrintWrite()的使用字符集名字别名获取
文本数据的输入输出; 输入;数据流,缓冲流输出;介绍向文本打印格式化的输出PrintWrite(); package 文本流; import java.io.FileNotFound
ibatis模糊查询sqlmap-mapping-**.xml配置 bijian1013 ibatis
正常我们写ibatis的sqlmap-mapping-*.xml文件时，传入的参数都用##标识，如下所示： <resultMap id="personInfo" class="com.bijian.study.dto.PersonDTO"> <res
java jvm常用命令工具——jdb命令(The Java Debugger) bijian1013 java jvm jdb
用来对core文件和正在运行的Java进程进行实时地调试，里面包含了丰富的命令帮助您进行调试，它的功能和Sun studio里面所带的dbx非常相似，但 jdb是专门用来针对Java应用程序的。现在应该说日常的开发中很少用到JDB了，因为现在的IDE已经帮我们封装好了，如使用ECLI
【Spring框架二】Spring常用注解之Component、Repository、Service和Controller注解 bit1129 controller
在Spring常用注解第一步部分【Spring框架一】Spring常用注解之Autowired和Resource注解（http://bit1129.iteye.com/blog/2114084）中介绍了Autowired和Resource两个注解的功能，它们用于将依赖根据名称或者类型进行自动的注入，这简化了在XML中，依赖注入部分的XML的编写，但是UserDao和UserService两个bea
cxf wsdl2java生成代码super出错,构造函数不匹配 bitray super
由于过去对于soap协议的cxf接触的不是很多,所以遇到了也是迷糊了一会.后来经过查找资料才得以解决. 初始原因一般是由于jaxws2.2规范和jdk6及以上不兼容导致的.所以要强制降为jaxws2.1进行编译生成.我们需要少量的修改: 我们原来的代码 wsdl2java com.test.xxx -client http://..... 修改后的代
动态页面正文部分中文乱码排障一例 ronin47
公司网站一部分动态页面，早先使用apache+resin的架构运行，考虑到高并发访问下的响应性能问题，在前不久逐步开始用nginx替换掉了apache。不过随后发现了一个问题，随意进入某一有分页的网页，第一页是正常的（因为静态化过了）；点“下一页”，出来的页面两边正常，中间部分的标题、关键字等也正常，唯独每个标题下的正文无法正常显示。因为有做过系统调整，所以第一反应就是新上
java-54- 调整数组顺序使奇数位于偶数前面 bylijinnan java
import java.util.Arrays; import java.util.Random; import ljn.help.Helper; public class OddBeforeEven { /** * Q 54 调整数组顺序使奇数位于偶数前面 * 输入一个整数数组，调整数组中数字的顺序，使得所有奇数位于数组的前半部分，所有偶数位于数组的后半
从100PV到1亿级PV网站架构演变 cfyme 网站架构
一个网站就像一个人，存在一个从小到大的过程。养一个网站和养一个人一样，不同时期需要不同的方法，不同的方法下有共同的原则。本文结合我自已14年网站人的经历记录一些架构演变中的体会。 1：积累是必不可少的架构师不是一天练成的。 1999年，我作了一个个人主页，在学校内的虚拟空间，参加了一次主页大赛，几个DREAMWEAVER的页面，几个TABLE作布局，一个DB连接，几行PHP的代码嵌入在HTM
[宇宙时代]宇宙时代的GIS是什么？ comsci Gis
我们都知道一个事实，在行星内部的时候，因为地理信息的坐标都是相对固定的，所以我们获取一组GIS数据之后，就可以存储到硬盘中，长久使用。。。但是，请注意，这种经验在宇宙时代是不能够被继续使用的宇宙是一个高维时空
详解create database命令 czmmiao database
完整命令 CREATE DATABASE mynewdb USER SYS IDENTIFIED BY sys_password USER SYSTEM IDENTIFIED BY system_password LOGFILE GROUP 1 ('/u01/logs/my/redo01a.log','/u02/logs/m
几句不中听却不得不认可的话 datageek
1、人丑就该多读书。 2、你不快乐是因为：你可以像猪一样懒，却无法像只猪一样懒得心安理得。 3、如果你太在意别人的看法，那么你的生活将变成一件裤衩，别人放什么屁，你都得接着。 4、你的问题主要在于：读书不多而买书太多，读书太少又特爱思考，还他妈话痨。 5、与禽兽搏斗的三种结局：(1)、赢了，比禽兽还禽兽。(2)、输了，禽兽不如。(3)、平了，跟禽兽没两样。结论：选择正确的对手很重要。 6
1 14:00 PHP中的“syntax error, unexpected T_PAAMAYIM_NEKUDOTAYIM”错误 dcj3sjt126com PHP
原文地址：http://www.kafka0102.com/2010/08/281.html 因为需要，今天晚些在本机使用PHP做些测试，PHP脚本依赖了一堆我也不清楚做什么用的库。结果一跑起来，就报出类似下面的错误：“Parse error: syntax error, unexpected T_PAAMAYIM_NEKUDOTAYIM in /home/kafka/test/
xcode6 Auto layout and size classes dcj3sjt126com ios
官方GUI https://developer.apple.com/library/ios/documentation/UserExperience/Conceptual/AutolayoutPG/Introduction/Introduction.html iOS中使用自动布局（一） http://www.cocoachina.com/ind
通过PreparedStatement批量执行sql语句【sql语句相同，值不同】梦见x光 sql 事务批量执行
比如说：我有一个List需要添加到数据库中，那么我该如何通过PreparedStatement来操作呢？ public void addCustomerByCommit(Connection conn , List<Customer> customerList) { String sql = "inseret into customer(id
程序员必知必会----linux常用命令之十【系统相关】 hanqunfeng Linux常用命令
一.linux快捷键 Ctrl+C : 终止当前命令 Ctrl+S : 暂停屏幕输出 Ctrl+Q : 恢复屏幕输出 Ctrl+U : 删除当前行光标前的所有字符 Ctrl+Z : 挂起当前正在执行的进程 Ctrl+L : 清除终端屏幕，相当于clear 二.终端命令 clear : 清除终端屏幕 reset : 重置视窗，当屏幕编码混乱时使用 time com
NGINX IXHONG nginx
pcre 编译安装 nginx conf/vhost/test.conf upstream admin { server 127.0.0.1:8080; } server { listen 80; &
设计模式--工厂模式 kerryg 设计模式
工厂方式模式分为三种： 1、普通工厂模式：建立一个工厂类，对实现了同一个接口的一些类进行实例的创建。 2、多个工厂方法的模式：就是对普通工厂方法模式的改进，在普通工厂方法模式中，如果传递的字符串出错，则不能正确创建对象，而多个工厂方法模式就是提供多个工厂方法，分别创建对象。 3、静态工厂方法模式：就是将上面的多个工厂方法模式里的方法置为静态，
Spring InitializingBean/init-method和DisposableBean/destroy-method mx_xiehd java spring bean xml
1.initializingBean/init-method 实现org.springframework.beans.factory.InitializingBean接口允许一个bean在它的所有必须属性被BeanFactory设置后，来执行初始化的工作，InitialzingBean仅仅指定了一个方法。通常InitializingBean接口的使用是能够被避免的，（不鼓励使用，因为没有必要
解决Centos下vim粘贴内容格式混乱问题 qindongliang1922 centos vim
有时候，我们在向vim打开的一个xml，或者任意文件中，拷贝粘贴的代码时，格式莫名其毛的就混乱了，然后自己一个个再重新，把格式排列好，非常耗时，而且很不爽，那么有没有办法避免呢？答案是肯定的，设置下缩进格式就可以了，非常简单：在用户的根目录下直接vi ~/.vimrc文件然后将set pastetoggle=<F9> 写入这个文件中，保存退出，重新登录，
netty大并发请求问题 tianzhihehe netty
多线程并发使用同一个channel java.nio.BufferOverflowException: null at java.nio.HeapByteBuffer.put(HeapByteBuffer.java:183) ~[na:1.7.0_60-ea] at java.nio.ByteBuffer.put(ByteBuffer.java:832) ~[na:1.7.0_60-ea]
Hadoop NameNode单点问题解决方案之一 AvatarNode wyz2009107220 NameNode
我们遇到的情况 Hadoop NameNode存在单点问题。这个问题会影响分布式平台24*7运行。先说说我们的情况吧。我们的团队负责管理一个1200节点的集群(总大小12PB)，目前是运行版本为Hadoop 0.20，transaction logs写入一个共享的NFS filer(注：NetApp NFS Filer)。经常遇到需要中断服务的问题是给hadoop打补丁。 DataNod

【论文笔记】——PWCLO-Net

【论文笔记】——PWCLO-Net

摘要

1.Introduction

2.相关工作

2.1 深度 LiDAR 里程计

2.2 相关深度点(Deep Point Correlation)

3.PWCLO-Net

3.1 Siamese Point Feature Pyramid孪生点特征金字塔

3.2 Attentive cost volume

3.3 分层embedding mask优化

3.4 位姿 扭转-提取 模块

3.5 Training loss 训练损失

4.Implementation 应用

4.1. KITTI Odometry Dataset

4.2 Networks Details

你可能感兴趣的:(论文笔记)

3.4 位姿扭转-提取模块