Javier.Lin_HUST

[论文翻译]SENSE: a Shared Encoder Network for Scene-flow Estimation（ICCV2019）

SENSE: a Shared Encoder Network for Scene-flow Estimation

摘要：

我们引入了一个用于整体场景流估计的紧凑网络，称为SENSE，它在四个密切相关的任务中共享共同的编码器特征：光流估计、立体视差估计、遮挡估计和语义分割。我们的关键见解是共享特征使得网络更加紧凑，产生出更好的特征表示，并且能够更好地利用这些任务之间的交互来处理部分标记的数据。通过共享编码器，我们可以在训练时为不同的任务灵活地添加解码器。这种模块化设计在推理时导致了一个紧凑而高效的模型。利用这些任务之间的相互作用，我们可以在监督损失之外引入蒸馏和自监督损失，这可以更好地处理部分标记的真实数据。SENSE在多个光流基准上取得了先进的结果，并且运行速度与专门为光流设计的网络一样快。它还在立体和场景流方面与最先进的技术进行了比较，同时消耗了更少的内存。

1、引言

场景流估计旨在从两个或多个相机拍摄的图像序列中恢复场景的三维结构(视差)和运动[ 52 ]。它推广了单目图像序列光流估计和立体图像对视差预测的经典问题。在场景流估计方面取得了稳定和令人印象深刻的进展，KITTI基准测试结果[ 39 ]证明了这一点。先进的场景流方法显著优于最佳视差(立体)和光流方法，证明了立体视频序列中额外信息的好处。然而，性能最好的场景流方法[ 5、54]基于能量最小化框架[ 18 ]，因此在实时应用中计算开销较大，例如：3D动作捕捉[ 11 ]和自动驾驶[ 27 ]。

最近，一系列基于卷积神经网络( Convolutional Neural Network，CNN )的方法被开发用于立体和光流的子问题。这些方法达到了最先进的性能并实时运行。然而，虽然立体和流密切相关，但立体和流的顶级网络采用截然不同的架构。进一步地，现有的场景流网络将立体和光流的子网络叠加在一起[ 37、25]，没有充分挖掘这两个紧耦合问题的结构。

由于立体匹配和流匹配都依赖于像素特征来建立对应关系，因此相同的特征是否会对这两个或多个相关任务起作用?为了回答这个问题，我们采用模块化的方法，构建了一个用于场景流估计的共享编码器网络( Shared Encoder Network for Scene-flow Estimation，SENSE )。具体来说，我们在四个密切相关的任务之间共享一个特征编码器：光流、立体匹配、遮挡和语义分割。共享特征使得网络变得紧凑，也通过多任务学习导致更好的特征表示。

紧密相关任务之间的交互进一步压缩了网络训练，改善了场景流估计中真值标注稀疏的问题。与许多其他视觉任务不同，对于现实世界的数据，收集真实的光流和立体匹配是天生的困难。训练需要大量数据的深度卷积神经网络往往依赖于合成数据[ 7,10,37]，缺乏真实世界中普遍存在的精细细节和多样性。为了缩小领域差距，需要对真实世界数据进行微调，但标注真实世界数据的稀缺性一直是学习场景流CNN模型的严重瓶颈。

为了解决数据稀缺问题，我们通过在监督损失中加入蒸馏和自监督损失项，为SENSE引入了半监督损失。首先，没有一个现有的数据集为我们处理的所有四个任务提供真实标注。例如，KITTI基准没有用于遮挡和语义分割的真值标注。因此，我们使用其他标注数据为真值标注缺失的任务单独训练模型，并使用预训练的模型通过蒸馏损失在真实数据上"监督"我们的网络[ 17 ]。其次，我们使用自监督损失项，根据光流或立体匹配来鼓励相应的可见像素具有相似的像素值和语义类。自监督损失项将四个任务紧紧地耦合在一起，对于没有地面真值的区域，如天空区域的改进至关重要。

在合成数据集和真实数据集上的实验表明，SENSE在保持与光流专用网络相同的运行效率的同时，实现了光流的SOTA。它还在视差和场景流估计方面与先进水平进行了比较，同时具有更小的内存占用。消融研究证实了我们的设计选择的实用性，并表明我们提出的蒸馏和自监督损失项有助于缓解部分标记数据的问题。

综上所述，我们做出以下贡献：

1、我们引入了一种用于整体场景理解的模块化网络设计，称为SENSE，以集成光流、立体、遮挡和语义分割。

2、SENSE在这4个任务中共享一个编码器，使网络变得紧凑，并通过多任务学习获得更好的特征表示。

3、SENSE通过半监督的方式利用任务间的交互，可以更好地处理部分标记数据；它在没有地面真值注释的区域导致定性更好的结果。

4、SENSE实现了最先进的流结果，同时运行速度与专门的流网络一样快。它在立体匹配和场景流方面与最先进的技术相比相当出色，但消耗的内存要少得多。

2、相关工作

对整体场景理解的全面调查超出了我们的范围，我们回顾了最相关的工作。

场景流估计的能量最小化。场景流最早由Vedula等人[ 52 ]提出，是指从多个标定好的摄像机中观察到的场景中所有点的稠密三维运动。一些经典的方法采用了能量最小化方法，如流和立体匹配的联合恢复[ 20 ]、高效的对立体匹配和流的解耦[ 56 ]。相对于光流和立体，场景流的解空间维度更高，更具挑战性。Vogel等[ 53 ]通过假设超像素上分段刚性移动平面的场景流来减少解空间。他们的工作首先从整体的角度来处理场景流，并在KITTI基准测试中大大优于现有的立体和光流方法[ 12 ]。

联合场景理解。运动和分割是鸡和蛋的问题：知道一个简化了另一个。虽然分层方法长期以来被认为是解决这两个问题的一个巧妙的方案[ 55 ]，但现有的解决方案往往会陷入局部极小[ 47 ]。在运动分割文献中，大多数方法从估计光流作为输入出发，通过联合估计(或隐或显地)相机运动、物体运动和场景外观来分割场景。[ 6、51]。Lv等[ 35 ]研究表明，运动可以直接从两幅图像中分割出来，不需要先计算光流。Taylor等[ 50 ]证明遮挡也可以是一种有用的线索。

利用语义分割的研究进展，塞维利亚等[ 46 ]表明语义信息足以初始化分层分割，从而改善光流。Bai等[ 2 ]使用实例级分割来处理少量的交通参与者。Hur和Roth [ 22 ]联合估计光流和时间一致性语义分割，在两个任务上都获得了收益。对象场景流算法[ 39 ]将场景分割成相互独立的运动区域，并强制每个区域内的超像素具有相似的三维运动。模型中的"物体"被假设为平面，并通过自底向上的运动估计进行初始化。

Behl等[ 5 ]、Ren等[ 42 ]、Ma等[ 36 ]的研究均表明实例分割有助于自主场景下的场景流估计。虽然假设每个个体实例的刚性运动对汽车很有效，但这种假设在一般的场景中往往会失败，比如Sintel，在这种情况下，我们的整体方法达到了先进的性能。

性能最好的基于能量的方法对于实时应用来说计算开销太大。这里我们提出了一个紧凑的CNN模型来对几何(视差)、运动(流)和语义进行整体推理，其运行速度远远快于基于能量的方法。

光流和视差的端到端学习。最近，基于CNN的方法在光流和视差两个场景流估计的子问题上取得了显著的进展。Dosovitskiy等人[ 10 ]首先针对光流引入了两个CNN模型FlowNetS和FlowNetC，实现了光流和视差估计的范式转换。Ilg等人[ 24 ]提出了一些技术改进，例如数据集调度和将基本模型堆叠成一个大模型，即FlowNet2。Flow Net2具有接近实时的性能，并获得了与手工设计方法相当的结果。

Ilg等[ 25 ]将流、视差网络叠加在一起，用于场景流估计的联合任务。然而，流网络和视差网络之间没有共享信息。Ranjan和Black [ 41 ]介绍了一种空间金字塔网络，其性能与Flow Net C相当，但由于使用了金字塔和翘曲两个经典原则，参数减少了100多倍。Sun等[ 48 ]开发了一个紧凑但有效的网络，称为PWC - Net，它经常使用三个原则来构建网络：可学习的特征金字塔、扭曲操作和成本体积处理。PWC - Net在两个主要的光流基准上获得了最先进的性能。

FlowNet的工作也启发了新的CNN模型用于立体估计[ 30、8、60]。Kendall等人[ 30 ]将特征拼接构建代价体，然后进行3D卷积。3D卷积在立体匹配中变得常用，但在速度和内存方面都很昂贵。Chang和Chen [ 8 ]引入金字塔池化模块，利用上下文信息在模糊区域建立对应关系。Yang等[ 60 ]结合语义线索处理无纹理区域。Yin等人将光流和视差估计问题转化为概率分布匹配问题[ 61 ]来提供不确定性估计。他们没有像我们一样利用两个任务的共享编码器。

现有的场景流网络[ 25、36、38]将独立的网络进行视差和流的叠加。我们感兴趣的是利用多个相关任务之间的交互来设计一个紧凑有效的网络来进行整体场景理解。我们的整体场景流网络在推理速度更快、消耗的内存更少的同时，在与当前技术比较方面表现良好。特别地，我们展示了在不同任务之间共享特征编码器的好处，例如流和视差。

视频的自监督学习。有监督学习通常使用合成数据，因为对于真实视频很难获得真实的光流和视差。最近提出的自监督学习方法通过最小化数据匹配代价[ 65 ]或插值误差[ 29、32]来学习场景流。然而，自监督方法尚未达到监督方法的性能。

3. 半监督场景流估计

我们遵循KITTI场景流基准的问题设置[ 39 ]，如图2所示。输入是两个时间 $\text{[math]}$ 的立体图像对，其中上标中的第一个数字表示时间步长，第二个符号表示左或右相机。为了节省篇幅，如果上下文清晰，我们将省略上标。我们希望在第一帧和第二帧分别估计从第一张左图像到第二张左图像的光流 $\text{[math]}$ 和从左图像到右图像的视差 $\text{[math]}$ 和 $\text{[math]}$ 。我们还考虑了连续两帧图像 $\text{[math]}$ 和两组立体图像 $\text{[math]}$ 和 $\text{[math]}$ 之间的遮挡，以及参考(左一)图像 $\text{[math]}$ 的语义分割。这些额外的输出引入了不同任务之间的交互，在网络训练中施加了更多的约束。进一步，我们假设在这些紧密相关的任务之间共享特征会得到更好的特征表示。

我们将在3.1节中首先介绍我们的模块化网络设计，它在不同的任务之间共享一个编码器，并支持训练过程中的灵活配置。然后，我们将在3.2节中解释我们的半监督损失函数，它可以使用部分标记数据进行学习。

3.1 模块化网络设计

为了实现不同任务之间的特征共享，并允许在训练过程中灵活配置，我们以模块化的方式设计网络。具体来说，我们在PWC - Net [ 48 ]的基础上构建网络，这是一个用于光流估计的紧凑网络。PWC - Net由编码器和解码器组成，其中编码器接收输入图像并提取网络不同层次的特征。解码器是利用光流的领域知识专门设计的。编码器-解码器结构允许我们以模块化的方式设计一个网络，单个共享编码器和多个解码器用于不同的任务。

共享编码器。然而，PWC - Net的原始编码器由于容量较小，并不能很好地适应多任务。PWC - Net的80 %以上的参数集中在解码器中，在每个金字塔层级使用DenseNet [ 19 ]块。编码器由普通卷积层组成，使用不到20 %的参数。虽然编码器对光流足够，但对视差估计的效果不够好。为了使编码器适用于不同的任务，我们做了如下修改。首先，我们将特征金字塔层级数从6个减少到5个，使得参数数量减少了近50 %。它还允许我们借用广泛使用的5级ResNet - like编码器架构[ 8、16]，该架构已被证明在多种视觉任务中有效。具体来说，我们用残差块替换普通CNN层[ 16 ]，并在编码器和解码器中添加BN层经过这些修改，新模型的参数略少，但给出了更好的视差估计结果(表)和更好的流(表1 )。

视差解码器。接下来我们阐述了如何将PWC - Net用于两幅立体图像之间的视差估计。视差是光流计算的一种特殊情况，其对应关系位于一条水平线上。因此，我们只需要为视差构建1D代价体，而原始PWC - Net的解码器为光流构建2D代价体。具体来说，对于光流，将第一张特征图中p = ( x , y)处的特征与扭曲的第二张特征图中 $\text{[math]}$ 处的特征进行比较。对于视差，我们只需要通过比较左特征图中的p和右特征图中的 $\text{[math]}$ 来寻找对应关系。我们使用k = 4进行光流和视差估计。在整个特征金字塔中，我们的视差解码器采用与PWC - Net相同的变形和细化过程。

[论文翻译]SENSE: a Shared Encoder Network for Scene-flow Estimation（ICCV2019）_第1张图片

图2。网络设计的例证。虚线箭头表示共享权重。我们有一个编码器用于所有输入图像和所有不同的任务，并为不同的任务保留不同的解码器。右边从上到下依次为：光流、前向遮挡掩膜、语义分割、视差、视差遮挡。PPM (金字塔池化模块)不利于光流估计。但得益于模块化的网络设计，我们可以灵活地配置网络。

为了进一步提高视差估计精度，我们考察了更多的设计选择。首先，我们使用金字塔池化模块( Pyramid Pooling Module，PPM ) [ 64 ]来跨多个层次聚合输入图像的学习特征。其次，解码器输出一个四分之一输入分辨率大小的视差图，其往往具有模糊的视差边界。作为弥补，我们增加了一个简单的沙漏模块，广泛用于视差估计[ 8 ]。它需要两次上采样视差、第一幅图像的特征图和第二幅图像的扭曲特征图来预测添加到上采样视差中的残差视差。PPM和沙漏修正均导致视差估计的显著改善。但它们对光流估计没有帮助，说明原始的PWC - Net是针对光流设计的。模块化设计使我们可以灵活地配置工作于不同任务的网络，如图2所示。表? ?总结了我们的设计选择对视差估计的影响。

用于分割的解码器。为了给网络训练引入更多的约束，我们还考虑了语义分割。它鼓励编码器学习一些语义信息，这可能有助于光流和视差估计。对于语义分割解码器，我们使用UPerNet [ 58 ]，因为它的简单性。

遮挡估计。对于遮挡预测，我们在光流或视差解码器中添加同级分支来执行像素级二分类，其中1表示完全遮挡。增加这些额外的模块可以实现整体场景理解，这有助于我们在共享编码器中归纳出更好的特征表示，并使用额外的监督信号进行网络训练来处理部分标记数据，这在3.2节中讨论。关键的是，对于场景流估计，共享编码器导致了更紧凑和高效的模型。对于光流和视差估计，我们可以在训练时根据需要组合模块，而不影响推理时间。对于场景流估计，可以根据配置选择使用额外的模块。见4.2节的解释。

3.2 半监督损失

没有完全标记的数据集可以直接训练我们的整体场景流网络。例如，KITTI没有地面真实遮挡掩码。即使是光流和视差地面真值，由于数据抓取标注困难，KITTI数据中只有约19 %的像素有标注。合成的SceneFlow数据集[ 38 ]没有用于语义分割的基本真值。为了解决这些问题，我们引入了半监督损失函数，它由监督、蒸馏和自监督损失项组成。

[论文翻译]SENSE: a Shared Encoder Network for Scene-flow Estimation（ICCV2019）_第2张图片

图3 在监督损失中加入语义分割(中间)和遮挡(右)的蒸馏损失的影响。

监督损失。当相应的真值标注可用时，我们定义监督损失为

其中 $\text{[math]}$ 和 $\text{[math]}$ 是估计光流及其对应遮挡的损失项。 $\text{[math]}$ 和 $\text{[math]}$ 为估计视差及其对应遮挡的损失项。跨多个金字塔层级的 $\text{[math]}$ 定义为:

[论文翻译]SENSE: a Shared Encoder Network for Scene-flow Estimation（ICCV2019）_第3张图片

其中， $\text{[math]}$ 表示金字塔层i的光流和视差权重， $\text{[math]}$ 表示金字塔层的数量， $\text{[math]}$ 是一个损失函数，衡量像素p处真实光流 $\text{[math]}$ 和估计光流 $\text{[math]}$ 之间的相似性。以类似的方式定义视差和遮挡损失函数、 $\text{[math]}$ 、 $\text{[math]}$ 和 $\text{[math]}$ 。我们分别使用L2和smooth l1 [ 13、8]损失进行光流和视差估计。对于遮挡，在有GT标注(例如,在FlyingThings3D上)的情况下，使用二元交叉熵损失。对于语义分割，KITTI2015只提供了左影像的真值标注。我们通过实验发现只使用下面引入的蒸馏损失可以得到更好的精度。

[论文翻译]SENSE: a Shared Encoder Network for Scene-flow Estimation（ICCV2019）_第4张图片

图4。自我监督损失的有效性说明。从上到下：输入图像、未使用自监督损失的视差估计和使用自监督损失的视差估计。可以看出，自监督损失极大地减少了天空区域的伪影。

蒸馏损失。对于遮挡估计和语义分割任务，GT标注并不总是可用的。然而，在网络训练中，它们是重要的。例如，在KITTI上，监督损失只能在稀疏标注的像素上计算。对遮挡估计增加额外的监督，有助于网络将光流和视差估计外推到真实标注缺失的区域，得到视觉上有吸引力的结果。

我们发现预训练模型在合成数据上提供的遮挡估计是相当好的，如图3所示。作为一种软监督，我们鼓励网络在训练过程中的遮挡估计与预训练阶段所学内容没有太大偏差。因此，我们简单地将预训练网络的估计作为伪真实值和训练过程中的平滑l1损失函数，在 $\text{[math]}$ 和 $\text{[math]}$ 等多个金字塔层次上计算。使用蒸馏损失进行遮挡的额外监督有助于减少视差估计中的伪影，如图3所示。

对于语义分割，我们使用文献[ 17 ]中提出的蒸馏损失公式。具体地，单个像素p (为简便起见,略)的语义分割蒸馏损失 $\text{[math]}$ 定义为

[论文翻译]SENSE: a Shared Encoder Network for Scene-flow Estimation（ICCV2019）_第5张图片

其中C是分割类别的数量。 $\text{[math]}$ 和 $\text{[math]}$ 来自一个更强大的教师分割模型，其中 $\text{[math]}$ 是第i个类别在softmax层之前的输出，也称为logit。 $\text{[math]}$ 是第i个类别的'soften'后验概率，由超参数T控制[ 17 ]。我们实证发现T = 1在验证集上效果很好。 $\text{[math]}$ 是我们模型的估计后验概率。蒸馏被聚合在训练图像中的所有像素上。

自监督损失。为了进一步约束网络训练，我们还定义了自监督损失。光流和视差被定义为两幅输入图像之间的对应关系。因此，我们可以比较由光流或视差定义的两个对应的像素作为网络训练的监督。

最直接的度量是比较两帧中可见的两个对应像素之间的值，称为光度一致性。在单个金字塔层级中，定义为 $\text{[math]}$ :

其中 $\text{[math]}$ 是可微的翘曲函数， $\text{[math]}$ ，⊙表示逐元素相乘再求和，当上下文明确时我们省略了一些上标。该损失项通过使用遮挡图调制一致性损失，并将遮挡与光流和立体匹配紧耦合来解释遮挡。

由于光度一致性对光照变化不具有鲁棒性，我们进一步引入语义一致性，鼓励对应的两个像素具有相似的语义分割后验概率。具体来说，这种语义一致性被定义为 $\text{[math]}$

其中 $\text{[math]}$ 表示来自于公式(3)中使用的教师分割网络的后验概率图像。与原始像素值不同，分割后验概率对光照变化更加鲁棒。

最后，我们考虑结构相似性损失

式中：⊗仅表示逐元素乘法。 $\text{[math]}$ 是一个可微函数，输出单一的标量值来衡量两个输入图像之间的结构相似性[ 63 ]。注意，对于变形图像中的被遮挡像素，它们的值被左/第一图像中相同位置的像素值代替。

通过将 $\text{[math]}$ 和 $\text{[math]}$ 设置为所有，式(4),(5)存在极小化方程的平凡解。因此，我们加入正则化项:

虽然在之前的工作[ 28、14]中已经研究了自监督的光度和结构相似性损失项，但是我们的定义与它们的不同之处在于我们对遮挡进行建模。一方面，我们避免在遮挡区域定义损失项。另一方面，这些自监督项为遮挡估计也提供了调整。因此，我们的网络将这四个紧密相关的任务紧密地耦合在一起。

我们最终的半监督损失由监督、蒸馏和自监督损失项组成。更多细节可参见补充材料。

4、实验

4.1 实现细节

立体匹配和光流的预训练。我们使用合成的Scene Flow数据集[ 37 ]，包括FlyingThings3D、Monkaa和Driver进行预训练。3个数据集都包含光流和视差的GT。遮挡标签仅在FlyingThings3D中可用。在训练过程中，我们从所有三个数据集中均匀采样图像，并在真值可用时计算遮挡损失。在训练过程中，我们同时使用颜色抖动进行光流和视差训练。此外，我们对立体训练图像使用随机裁剪和垂直翻转。裁剪大小为256 × 512。对于光流训练图像，我们进行了大量的数据增强，包括随机裁剪、平移、旋转、缩放、压缩以及水平和垂直翻转，其中裁剪大小为384 × 640。使用Adam优化器[ 31 ]对网络进行100个历元的批量大小为8的训练。我们使用同步的Batch Normalization [ 58 ]来保证在使用多个GPU时有足够的训练样本来估计Batch Normalization层的统计量。初始学习率为0.001，经过70个历元后学习率下降了10倍。

微调。对于Sintel，我们使用与[ 48 ]中类似的学习率调度。在KITTI 2012 [ 12 ]和KITTI 2015 [ 40 ]上，我们使用更长的学习率调度，其中模型训练1.5 K个历元，初始学习率为0.001。我们用一个0.0002学习率执行另一个1K次历元训练。我们使用剪裁大小为320 × 768的作为视差和光流的训练图像，以及batch_size为8。由于篇幅有限，在补充材料中提供了更多的训练细节。

表1。在MPI Sintel光流数据集上的平均EPE结果。' -ft '表示在MPI Sintel训练集上进行微调，括号中的数字为方法微调后数据上的结果。

[论文翻译]SENSE: a Shared Encoder Network for Scene-flow Estimation（ICCV2019）_第6张图片

训练语义分割。我们联合训练整个网络的所有部分，包括预训练的光流和视差的编码器和解码器，以及随机初始化的分割解码器。我们通过实验发现使用随机初始化的分段解码器可以获得更好的性能。

对于分割蒸馏损失和语义一致性损失计算，我们首先训练教师分割模型。我们使用在CityScapes [ 9 ]上预训练的ResNet101 - UPerNet [ 58 ]使用其仅有精细标注的训练集，在验证集上达到了75.4 %的IoU。我们在KITTI 2015 [ 1 ]上对模型进行微调，其中分割标注与CityScapes的注释方式一致。

表2 .在KITTI光流数据集上的结果。" -ft "表示在KITTI训练集上进行微调，括号中的数字为方法微调后数据上的结果。

[论文翻译]SENSE: a Shared Encoder Network for Scene-flow Estimation（ICCV2019）_第7张图片

表3 .在KITTI立体匹配数据集上的实验结果(测试集)。

[论文翻译]SENSE: a Shared Encoder Network for Scene-flow Estimation（ICCV2019）_第8张图片

表4 .在KITTI2015场景流数据集上的实验结果。基于CNN的方法需要处理D2的精化，其中N和R分别表示基于网络和基于刚性的精化。

[论文翻译]SENSE: a Shared Encoder Network for Scene-flow Estimation（ICCV2019）_第9张图片

4.2 主要结果

光流结果。表1给出了MPI Sintel基准数据集上的光流估计结果。我们的方法在没有或有微调的情况下优于基于CNN的方法。在更具真实感(最终)的测试集，涉及更多的渲染细节，如光照变化，阴影，运动模糊等，我们的方法大大优于基于CNN和传统的手工设计的方法。

表2给出了KITTI2012和KITTI2015的结果。我们的方法在KITTI 2012上显著优于手工设计的方法和基于卷积神经网络的方法。在KITTI 2015上，我们的模型在没有预训练的情况下获得了比基于CNN的方法更低的错误率。经过微调后，它优于所有其他方法。

我们注意到，PWC-Net [ 49 ]的一个改进版本中报告了更好的光流结果，它使用Flying Chairs后面的FlyingThings3D进行预训练。它还使用了更长的学习率时间表进行微调，因此结果与我们的结果不具有直接可比性。

视差结果。在视差估计方面，SENSE明显优于DispNetC [ 37 ]和GC - Net [ 30 ]等基于CNN的方法，并与PSMNet [ 8 ]、SegStereo [ 60 ]和FlowNet3 [ 25 ]等最先进的方法取得了相当的精度。值得注意的是，我们的方法在KITTI2015上的所有和非遮挡区域的前景区域上都表现最好。

场景流结果。表4展示了KITTI 2015上的场景流结果。与Flow Net3 [ 25 ]相比，SENSE在基于CNN的场景流方法中表现最好。与ISF [ 5 ]相比，SENSE速度提高了2K倍，并且能够处理一般的非刚性场景运动。

为了去除第2帧视差扭曲操作引入的伪影，我们使用了一个带跳跃连接的编码器-解码器结构的精化网络。它需要 $\text{[math]}$ ， $\text{[math]}$ ， $\text{[math]}$ 和 $\text{[math]}$ 生成一个残差，该残差被添加到扭曲视差中。从我们的整体输出来看，我们可以使用刚性细化步骤来细化背景场景流。我们首先根据语义分割输出确定静态刚性区域。然后，通过高斯-牛顿算法最小化光流和视差图像之间的几何一致性来计算自运动流。最后，我们使用参考帧和自运动的视差来计算扭曲的场景流，以代替仅在刚性背景区域的原始场景流。这一步以最小的成本额外产生相机运动和更好的场景流。细化步骤详见补充材料。

[论文翻译]SENSE: a Shared Encoder Network for Scene-flow Estimation（ICCV2019）_第10张图片

[论文翻译]SENSE: a Shared Encoder Network for Scene-flow Estimation（ICCV2019）_第11张图片

运行时间。SENSE是一个高效的模型。SENSE计算两幅大小为436 × 1024的图像之间的光流需要0.03 s。对于视差，SENSE比PSMNet和SegStereo快一个数量级，比FlowNet3略快。对于使用KITTI图像的场景流，SENSE需要0.15 s生成一个光流和两个视差图。附加翘曲细化网络耗时0.01 s，刚度细化耗时0.15 s。

模型大小和内存。SENSE体积较小。光流模型的参数只有8.8 M，视差模型的参数只有8.3 M。共享编码器的场景流模型具有13.4 M的参数。相比之下，FlowNet3有一个流模型( 117M )和一个视差模型( 117M )，大了20倍。SENSE还具有较低的GPU内存占用。FlowNet3需要7.4 GB内存，而SENSE只需要1.5 GB内存。虽然PSMNet的参数较少( 5.1M )，但由于3D卷积，PSMNet需要4.2 GB的内存。

4.3 消融实验

不同任务的表现。我们报告了使用不同编码器和解码器组合的不同任务的结果。我们的模型使用KITTI 2015的160张图像进行训练，其中一半的学习率计划。结果报告在表5的其余40幅图像上。可以看出，共享编码器模型比单独训练的模型表现更好。

半监督损失。为了研究蒸馏和自监督损失项的影响，我们使用KITTI 2012的所有图像和KITTI 2015的160张图像进行消融研究，采用一半的全学习率计划进行训练。KITTI2015的其余40个用于测试。我们仅使用稀疏流和视差标注对基线模型进行微调。表6为定量比较，图4为定性比较。

关于蒸馏损失，分割和遮挡蒸馏损失项都对视差和光流估计有用。然而，蒸馏损失不利于减少天空区域的伪影。因此，自监督损失是必不可少的，如图4所示，尽管定量的自监督损失不如蒸馏损失有效。最后，综合所有的损失项得到最好的光流和视差精度。我们还在KITTI上测试了使用半监督损失训练的SENSE，如表2、表3和表4所示。可以看出，在KITTI 2015上提高了视差和光流精度，在KITTI 2012上也得到了更好的视差。

5、结论

我们为整体场景理解中的4个密切相关的任务提出了一个紧凑的网络：在这些任务之间共享一个编码器，不仅使网络紧凑，而且通过利用这些任务之间的交互来提高性能。它还允许我们引入蒸馏和自我监督损失来处理部分标记数据。我们的整体网络具有与光流专用网络相似的精度和运行时间。它与先进的视差和场景流方法相比表现良好，同时具有更快的速度和更高的内存效率。我们的工作展示了协同紧密相关的任务对于整体场景理解的好处，我们希望这些见解将有助于这个方向的新研究。

你可能感兴趣的:(场景流,人工智能,深度学习,计算机视觉)

《密码爆破漏洞详解》——黑客必修的入门操作( 建议收藏 ) 2401_84573531 2024年程序员学习 python
隔壁老张:“狗剩啊,隔壁xx村的王姐家的女娃好漂亮,我想盗她qq啊,你帮我把”狗剩:“我不会呀”村里大妈:“那个狗剩啊,盗个qq号都不会,他妈妈还好意思说他是学网络安全当黑客的”密码爆破漏洞详解密码爆破介绍密码爆破使用场景密码爆破利用思路防范密码爆破密码的复杂性密码加密登录逻辑验证码登录次数限制密码爆破介绍密码爆破又叫暴力猜解,简单来说就是将密码逐个尝试,直到找出真正的密码为止,本质上是利用了穷举
MySQL分布式ID冲突详解：场景、原因与解决方案码不停蹄的玄黓 mysql 分布式数据库 ID冲突
引言在分布式系统开发中，你是否遇到过这样的崩溃时刻？——明明每个数据库实例的自增ID都从1开始，插入数据时却提示“Duplicateentry‘100’forkey‘PRIMARY’”；或者分库分表后，不同库里的订单ID竟然重复，业务合并时直接报错……这些问题的核心，都是分布式ID冲突。今天咱们就来扒一扒MySQL分布式ID冲突的常见场景、底层原因，以及对应的解决方案，帮你彻底避开这些坑！一、为什
如何在YashanDB数据库中实现复杂事务管理数据库
在现代数据库管理系统中，事务管理是一项关键功能。复杂的事务管理可以确保多条SQL操作的原子性、一致性、隔离性和持久性（ACID特性），减少数据的不一致和错误。尤其在高并发场景中，事务管理的机制与实现至关重要。因此，构建高效的事务管理系统，对于提升数据库的性能及应用程序的可靠性具有深远影响。YashanDB的事务特性YashanDB数据库支持全面的事务管理功能，通过多版本并发控制（MVCC）、事务隔
如何在YashanDB数据库中保持数据一致性与完整性数据库
在现代数据库管理系统中，确保数据的一致性与完整性是面临的主要挑战之一。这一挑战在高并发、高要求的数据操作场景中尤为突出。YashanDB作为一种高性能的分布式数据库，采用了多种技术手段以保持数据的一致性与完整性。本文将深入探讨YashanDB中实现数据一致性与完整性的核心技术原理，适用于对高并发和复杂事务有一定理解的数据库管理员（DBA）和开发人员。事务管理与ACID特性事务是数据库操作的基本单元
如何实现YashanDB中的数据冗余处理数据库
数据冗余是数据库管理中的一个重要话题，直接影响到数据的可用性与可靠性。在高并发场景下，数据冗余能够有效防止数据丢失，并提升系统的容灾能力。YashanDB作为一款高性能的数据库产品，通过灵活的结构和多种部署方式，实现了数据冗余处理。本文将详细探讨YashanDB中实现数据冗余处理的技术细节，为数据库管理员和开发人员提供理论支持和实践指导。YashanDB的数据冗余机制单机部署中的数据冗余在单机部署
如何实现YashanDB数据库的负载均衡数据库
在现代应用中，数据库的性能直接影响整个系统的效率和用户体验。因此，数据库的负载均衡成为了设计和部署中不可忽视的重要环节。YashanDB是一个新兴的数据库系统，其支持多种架构和配置，适合不同的业务场景。通过合理实现YashanDB的负载均衡，可以有效提升系统的并发处理能力、降低响应时间及提高可用性。YashanDB的架构概述YashanDB支持多种部署模式，包括单机（主备）部署、分布式集群部署以及
【优秀文章】7月优秀文章推荐
优秀文章智能自主运动体与人工智能技术——环境感知、SLAM定位、路径规划、运动控制、多智能体协同作者：fpga和matlabC++之红黑树认识与实现作者：zzh_zao【手把手带你刷好题】–C语言基础编程题(十)作者：草莓熊Lotso飞算JavaAI：从“码农”到“代码指挥官”的终极进化论作者：可涵不会debug前端网页开发学习（HTML+CSS+JS）有这一篇就够！作者：一颗小谷粒
用 AI “一句话生成代码”，用创意兑换灵码潮品：技术人的夏日狂欢季来了人工智能
在AI技术迅猛发展的2025年，我们正式推出“通义灵码编程智能体挑战季”，以“码力觉醒”为主题，打造一场融合技术探索与潮流文化的开发者盛宴。活动以体验MCP服务、Qwen3大模型及记忆功能的智能编程助手为核心，通过“小游戏开发”和“MCP场景实践”两大趣味赛道，降低AI技术门槛，让开发者轻松体验“一句话生成代码”的魔力。活动亮点抢先看：零门槛参与：新老用户均可参与，完成任务即领限量定制棒球帽！趣味
蛋白质结构预测/功能注释/交互识别/按需设计，中国海洋大学张树刚团队直击蛋白质智能计算核心任务 hyperai
蛋白质作为生命活动的主要承担者，在人体生理功能中扮演关键角色。然而传统研究面临结构解析成本高昂、功能注释严重滞后、新型蛋白质设计效率低下等挑战。近年来，生命科学对蛋白质复杂特性解析的需求日益迫切，大数据、深度学习、多模态计算等技术的突破性发展，为构建蛋白质智能计算体系提供了全新的发展契机。蛋白质智能计算体系的构建，使得蛋白质在大规模功能注释、交互预测及三维结构建模等领域取得显著成果，为药物发现与生
Redis Geo结构详解：从原理到实战，手把手教你玩转地理位置功能码不停蹄的玄黓 redis 数据库缓存
在互联网产品中，“附近的人”“附近的店”“配送范围”这类功能越来越常见。以前做这种功能可能需要依赖MySQL的经纬度计算，或者上专业的GIS数据库（比如PostGIS），但Redis3.2版本后推出的Geo（地理信息）模块，用极简的API和高效的性能，完美解决了这类问题。今天咱们就来深入聊聊RedisGeo的底层原理、常用命令和实战场景。一、为什么需要RedisGeo？先想个场景：你要做一个“附近
向量化编程：SIMD（Single Instruction, Multiple Data）深度解析
在现代处理器架构中，向量化编程已成为提升计算密集型应用性能的关键技术。SIMD（SingleInstruction,MultipleData）作为向量化编程的核心，通过一条指令同时处理多个数据，能够显著提高数据并行度。本文将从SIMD的基础概念出发，深入探讨其硬件实现、编程模型、性能优化及典型应用场景，帮助开发者充分利用SIMD技术提升代码性能。一、SIMD基础概念1.1什么是SIMD？SIMD是
【心灵鸡汤】深度学习技能形成树：从零基础到AI专家的成长路径全解析智算菩萨人工智能深度学习
引言：技能树的生长哲学在这个人工智能浪潮汹涌的时代，深度学习犹如一棵参天大树，其根系深深扎入数学与计算科学的沃土，主干挺拔地承载着机器学习的核心理念，而枝叶则繁茂地延伸至计算机视觉、自然语言处理、强化学习等各个应用领域。对于初入此领域的新手而言，理解这棵技能树的生长规律，掌握其形成过程中的关键节点和发展阶段，将直接决定其在人工智能道路上能够走多远、攀多高。技能树的概念源于游戏设计，但在学习深度学习
GitHub账号注册与Git关联：从零到一的完整指南 Android洋芋前行路黑科技经验历程 github git GitHub注册 Git关联 SSH密钥团队协作
简介GitHub是开发者协作与代码管理的核心平台，而Git则是实现版本控制与团队协作的必备工具。本文将从零开始，手把手教你完成GitHub账号注册、Git环境搭建、SSH密钥生成、本地仓库初始化及与GitHub仓库的绑定。通过代码示例、Mermaid图解及企业级应用场景，帮助你全面掌握GitHub与Git的关联技巧，为个人开发与团队协作打下坚实基础。一、GitHub账号注册与基础配置1.1注册Gi
视觉设计全栈解析：必知的8大核心方向与应用场景
在数字时代，视觉设计早已渗透到生活的方方面面——从手机APP界面到街头广告牌，从书籍的版式到产品的包装，这些统统离不开视觉设计的支撑！所以，了解视觉设计分类，不仅能帮助我们理清设计的边界与应用场景，更能让初学者找到学习的方向，让从业者精准定位创作目标哦。接下来，我们就来详细解析视觉设计分类中的8大常见类型，一起来享受这场视听盛宴吧~一、视觉识别图形设计在视觉设计分类中，视觉识别图形设计是构建品牌形
STM32中的UART详解
前言在嵌入式开发中，串口通信是最常用的调试与数据传输方式之一。UART（UniversalAsynchronousReceiver/Transmitter，通用异步收发传输器）作为一种简单、可靠的异步通信协议，被广泛应用于STM32与传感器、上位机、蓝牙模块等外设的交互场景。本文将从协议基础到STM32实战，全面解析UART协议在STM32中的应用，包含硬件设计、软件配置、实战案例及调试技巧，适合
PTP 与 gPTP 的对比解析 ftdlk 人形机器人机器人自动驾驶
PTP与gPTP的对比解析PTP（PrecisionTimeProtocol）和gPTP（generalizedPrecisionTimeProtocol）均为高精度时间同步协议，但设计目标、应用场景及技术实现存在显著差异。以下是两者的核心区别：1.协议标准与目标特性PTP(IEEE1588)gPTP(IEEE802.1AS)标准版本IEEE1588-2008（主流）/IEEE1588-2019I
TDengine DECIMAL 数据类型使用手册 TDengine （老段） TDengine 产品设计 tdengine 大数据时序数据库数据库物联网涛思数据 iot
TDengineDECIMAL数据类型使用手册1.概述DECIMAL数据类型用来存储高精度数值数据，在其他数据库也被称为NUMERIC。DECIMAL数据类型的基本运算返回的是精确结果，适用于需要精确计算的场景，如金融数据、货币计算等。相比于浮点数类型（FLOAT、DOUBLE），DECIMAL类型：优势：保证精确计算，避免浮点数舍入误差劣势：计算性能相对较低2.基本概念2.1核心术语DECIMA
Rust 注释 froginwe11 开发语言
Rust注释引言Rust编程语言以其内存安全、并发支持和高性能等特点在软件开发领域获得了广泛的关注。在Rust编程中，注释是一种非常重要的元素，它不仅可以帮助程序员理解代码，还可以提高代码的可维护性和可读性。本文将详细介绍Rust中的注释类型、语法及其应用场景。一、Rust注释类型Rust中的注释主要分为两种类型：单行注释和多行注释。1.单行注释单行注释用于对代码的某一小部分进行简要说明。其语法格
Scala 简介 froginwe11 开发语言
Scala简介引言Scala是一种多范式编程语言，它结合了面向对象和函数式编程的特性。自从2003年由MartinOdersky教授在EPFL开发以来，Scala已经成为了在Java虚拟机（JVM）上运行的高效编程语言。本文将为您详细介绍Scala的起源、特点、应用场景以及学习资源。Scala的起源与发展起源Scala的灵感来源于多种编程语言，包括Java、C++、Self、Haskell和ML。
SQLite 数据库与其他数据库的对比分析数据库管理艺术数据库专家之路大数据AI人工智能 MCP&Agent 数据库 sqlite ai
SQLite数据库与其他数据库的对比分析关键词：SQLite数据库、其他数据库、对比分析、数据库特性、应用场景摘要：本文旨在对SQLite数据库与其他常见数据库进行全面的对比分析。首先介绍了数据库对比分析的背景和目的，让读者了解为何需要进行这样的对比。接着详细阐述了SQLite以及其他具有代表性数据库（如MySQL、Oracle、PostgreSQL等）的核心概念和架构，通过Mermaid流程图展
SQLite - C/C++编程环境搭建与使用指南 lsx202406 开发语言
SQLite-C/C++编程环境搭建与使用指南引言SQLite是一款轻量级的数据库管理系统，广泛应用于嵌入式系统、移动设备、Web应用等场景。其独特的架构和易用性使其成为许多开发者的首选。本文将详细介绍如何搭建SQLite的C/C++编程环境，并探讨如何在C/C++程序中集成SQLite数据库。环境搭建1.获取SQLite首先，我们需要从SQLite的官方网站（https://www.sqlite
行业案例| MongoDB在腾讯零售优码中的应用 MongoDB中文社区 MongoDB 数据库 mongodb
本文主要分享腾讯智慧零售团队优码业务在MongoDB中的应用，采用腾讯云MongoDB作为主存储服务给业务带来了较大收益，主要包括：高性能、快捷的DDL操作、低存储成本、超大存储容量等收益，极大的降低了业务存储成本，并提高了业务迭代开发效率。一.业务场景腾讯优码从连接消费者到连接渠道终端，实现以货的数字化为基础的企业数字化升级，包含营销能力升级和动销能力升级。腾讯优码由正品通、门店通和会员通三个子
MongoDB + Voyage AI 详解：重塑数据库与AI的协同范式 csdn_tom_168 NoSQL 数据库 mongodb 人工智能 AI
MongoDB+VoyageAI详解：重塑数据库与AI的协同范式2025年2月，MongoDB官方宣布收购VoyageAI，这一举措标志着数据库与人工智能技术的深度融合迈入新阶段。通过整合VoyageAI的先进AI检索与嵌入模型能力，MongoDB旨在重新定义AI时代的数据库架构，为企业构建智能应用提供端到端的数据基础设施。一、收购背景与技术战略1.行业趋势驱动AI数据挑战：随着生成式AI与大语言
HarmonyOS5.0仓颉引擎与盘古大模型：个性化作业批改系统架构设计与实现 H老师带你学鸿蒙系统架构 HarmonyOS5.0 鸿蒙华为仓颉教育
人工智能与边缘计算的融合正在重塑教育评价体系。本文将展示如何基于HarmonyOS5.0仓颉并发引擎和盘古大模型，构建新一代智能作业批改系统。系统架构全景graphTDA[学生端设备]-->|提交作业|B[仓颉边缘处理]B-->C[盘古大模型分析]C-->D[个性化反馈生成]D-->E[学生终端]D-->F[教师仪表盘]subgraphHarmonyOS分布式系统B-->|设备协同|G[教室平板集
DeepSeek在智能教育评估中的应用：试题检索 AIGC应用创新大全 AI大模型与大数据技术 AI人工智能与大数据应用开发 MCP&Agent 云算力网络 easyui 前端 javascript ai
DeepSeek在智能教育评估中的应用：试题检索关键词：DeepSeek、智能教育、试题检索、自然语言处理、知识图谱、个性化学习、评估系统摘要：本文探讨了DeepSeek大模型在智能教育评估系统中的试题检索应用。我们将深入分析如何利用先进的自然语言处理技术和知识图谱构建高效的试题检索系统，实现个性化学习路径推荐和精准评估。文章将从核心概念、技术原理到实际应用场景，全面解析这一创新教育技术解决方案。
5种高效解决Maven依赖冲突的方法代码的余温 maven java
在Maven中排除依赖冲突主要有以下5种方法，结合具体场景说明操作步骤：⚠️一、基础排除法（标签）适用场景：排除直接依赖中的传递性冲突包示例：排除spring-boot-starter-web中的Tomcat依赖org.springframework.bootspring-boot-starter-weborg.springframework.bootspring-boot-starter-tom
阿里云瑶池数据库 Data Agent for Meta 正式发布，让 AI 更懂你的业务！数据库观点资讯人工智能
背景随着生成式人工智能（GenerativeAI）从概念验证迈向规模化商业落地，AIAgent已成为企业核心业务流程的重要组成部分。然而，当模型调用日益便捷时，核心痛点已不再是模型本身，而是集中在一个关键要素上：数据。AIAgent的落地瓶颈已从技术能力转向高质量、高相关性、安全合规的数据供给。企业面临的核心挑战在于：数据孤岛导致知识库分散，通用大模型难以理解专业业务传统数据管理依赖人工开发维护，
RocksDB深度指南：从LSM树原理到时序键优化涵树_fx Rust 实战架构设计 rust 后端时序数据库
RocksDB确实很适合这种中等规模的配置数据存储场景，它比文件存储更高效，又比独立数据库更轻量。除此之外，它还具有下面这些优点：支持原子写入操作，避免文件存储可能出现的写入中断问题读操作支持无锁并发，效率非常高支持列式存储，带来了更加丰富的数据管理和查询能力内置压缩功能，可以节省存储空间支持快照功能，方便配置回滚当然，我选择RocksDB的原因是我不希望因为存储配置相关的数据而依赖传统意义上的数
【TVM 教程】如何处理 TVM 报错
ApacheTVM是一个深度的深度学习编译框架，适用于CPU、GPU和各种机器学习加速芯片。更多TVM中文文档可访问→https://tvm.hyper.ai/运行TVM时，可能会遇到如下报错：---------------------------------------------------------------AnerroroccurredduringtheexecutionofTVM.F
QA - RAG智能问答系统中的文档切片与实现原理 ai开发
引言在现代企业知识管理系统中，智能问答系统正发挥着越来越重要的作用。GC-QA-RAG系统作为葡萄城技术栈中的重要组成部分，其核心功能是通过对文档内容进行智能切片和向量化存储，实现对技术文档的高效检索和问答。本文将深入剖析该系统的文档切片原理，包括短文档和长文档的不同处理策略，以及如何将这些技术应用于实际场景中。正文1.原始方案及其局限性最初的GC-QA-RAG系统采用了一种直观的方法：将整个文档
ViewController添加button按钮解析。（翻译）张亚雄 c
<div class="it610-blog-content-contain" style="font-size: 14px"></div>// ViewController.m // Reservation software // // Created by 张亚雄 on 15/6/2.
mongoDB 简单的增删改查开窍的石头 mongodb
在上一篇文章中我们已经讲了mongodb怎么安装和数据库/表的创建。在这里我们讲mongoDB的数据库操作在mongo中对于不存在的表当你用db.表名他会自动统计下边用到的user是表明，db代表的是数据库添加(insert):
log4j配置 0624chenhong log4j
1) 新建java项目 2) 导入jar包，项目右击，properties—java build path—libraries—Add External jar，加入log4j.jar包。 3) 新建一个类com.hand.Log4jTest package com.hand; import org.apache.log4j.Logger; public class
多点触摸(图片缩放为例) 不懂事的小屁孩多点触摸
多点触摸的事件跟单点是大同小异的，上个图片缩放的代码，供大家参考一下 import android.app.Activity; import android.os.Bundle; import android.view.MotionEvent; import android.view.View; import android.view.View.OnTouchListener
有关浏览器窗口宽度高度几个值的解析换个号韩国红果果 JavaScript html
1 元素的 offsetWidth 包括border padding content 整体的宽度。 clientWidth 只包括内容区 padding 不包括border。 clientLeft = offsetWidth -clientWidth 即这个元素border的值 offsetLeft 若无已定位的包裹元素
数据库产品巡礼：IBM DB2概览蓝儿唯美 db2
IBM DB2是一个支持了NoSQL功能的关系数据库管理系统，其包含了对XML，图像存储和Java脚本对象表示（JSON）的支持。DB2可被各种类型的企业使用，它提供了一个数据平台，同时支持事务和分析操作，通过提供持续的数据流来保持事务工作流和分析操作的高效性。 DB2支持的操作系统 DB2可应用于以下三个主要的平台: 工作站，DB2可在Linus、Unix、Windo
java笔记5 a-john java
控制执行流程： 1，true和false 利用条件表达式的真或假来决定执行路径。例：（a==b）。它利用条件操作符“==”来判断a值是否等于b值，返回true或false。java不允许我们将一个数字作为布尔值使用，虽然这在C和C++里是允许的。如果想在布尔测试中使用一个非布尔值，那么首先必须用一个条件表达式将其转化成布尔值，例如if(a!=0)。 2，if-els
Web开发常用手册汇总 aijuans PHP
一门技术，如果没有好的参考手册指导,很难普及大众。这其实就是为什么很多技术，非常好，却得不到普遍运用的原因。正如我们学习一门技术，过程大概是这个样子： ①我们日常工作中，遇到了问题，困难。寻找解决方案，即寻找新的技术； ②为什么要学习这门技术？这门技术是不是很好的解决了我们遇到的难题，困惑。这个问题，非常重要，我们不是为了学习技术而学习技术，而是为了更好的处理我们遇到的问题，才需要学习新的
今天帮助人解决的一个sql问题 asialee sql
今天有个人问了一个问题，如下： type AD value A
意图对象传递数据百合不是茶 android 意图Intent Bundle对象数据的传递
学习意图将数据传递给目标活动; 初学者需要好好研究的 1,将下面的代码添加到main.xml中 <?xml version="1.0" encoding="utf-8"?> <LinearLayout xmlns:android="http:/
oracle查询锁表解锁语句 bijian1013 oracle object session kill
一.查询锁定的表如下语句，都可以查询锁定的表语句一： select a.sid, a.serial#, p.spid, c.object_name, b.session_id, b.oracle_username, b.os_user_name from v$process p, v$s
mac osx 10.10 下安装 mysql 5.6 二进制文件［tar.gz］征客丶 mysql osx
场景：在 mac osx 10.10 下安装 mysql 5.6 的二进制文件。环境：mac osx 10.10、mysql 5.6 的二进制文件步骤：[所有目录请从根“/”目录开始取，以免层级弄错导致找不到目录] 1、下载 mysql 5.6 的二进制文件，下载目录下面称之为 mysql5.6SourceDir；下载地址：http://dev.mysql.com/downl
分布式系统与框架 bit1129 分布式
RPC框架 Dubbo 什么是Dubbo Dubbo是一个分布式服务框架，致力于提供高性能和透明化的RPC远程服务调用方案，以及SOA服务治理方案。其核心部分包含: 远程通讯: 提供对多种基于长连接的NIO框架抽象封装，包括多种线程模型，序列化，以及“请求-响应”模式的信息交换方式。集群容错: 提供基于接
那些令人蛋痛的专业术语白糖_ spring Web SSO IOC
spring 【控制反转(IOC)/依赖注入(DI)】：由容器控制程序之间的关系，而非传统实现中，由程序代码直接操控。这也就是所谓“控制反转”的概念所在：控制权由应用代码中转到了外部容器，控制权的转移，是所谓反转。简单的说：对象的创建又容器(比如spring容器)来执行，程序里不直接new对象。 Web 【单点登录(SSO)】：SSO的定义是在多个应用系统中，用户
《给大忙人看的java8》摘抄 braveCS java8
函数式接口：只包含一个抽象方法的接口 lambda表达式：是一段可以传递的代码你最好将一个lambda表达式想象成一个函数，而不是一个对象，并记住它可以被转换为一个函数式接口。事实上，函数式接口的转换是你在Java中使用lambda表达式能做的唯一一件事。方法引用：又是要传递给其他代码的操作已经有实现的方法了，这时可以使
编程之美-计算字符串的相似度 bylijinnan java 算法编程之美
public class StringDistance { /** * 编程之美计算字符串的相似度 * 我们定义一套操作方法来把两个不相同的字符串变得相同，具体的操作方法为： * 1.修改一个字符（如把“a”替换为“b”）; * 2.增加一个字符（如把“abdd”变为“aebdd”）; * 3.删除一个字符（如把“travelling”变为“trav
上传、下载压缩图片 chengxuyuancsdn 下载
/** * * @param uploadImage --本地路径(tomacat路径) * @param serverDir --服务器路径 * @param imageType --文件或图片类型 * 此方法可以上传文件或图片.txt,.jpg,.gif等 */ public void upload(String uploadImage,Str
bellman-ford(贝尔曼-福特)算法 comsci 算法 F#
Bellman-Ford算法(根据发明者 Richard Bellman 和 Lester Ford 命名)是求解单源最短路径问题的一种算法。单源点的最短路径问题是指：给定一个加权有向图G和源点s，对于图G中的任意一点v，求从s到v的最短路径。有时候这种算法也被称为 Moore-Bellman-Ford 算法，因为 Edward F. Moore zu 也为这个算法的发展做出了贡献。与迪科
oracle ASM中ASM_POWER_LIMIT参数 daizj ASM oracle ASM_POWER_LIMIT 磁盘平衡
ASM_POWER_LIMIT 该初始化参数用于指定ASM例程平衡磁盘所用的最大权值，其数值范围为0~11，默认值为1。该初始化参数是动态参数，可以使用ALTER SESSION或ALTER SYSTEM命令进行修改。示例如下： SQL>ALTER SESSION SET Asm_power_limit=2;
高级排序:快速排序 dieslrae 快速排序
public void quickSort(int[] array){ this.quickSort(array, 0, array.length - 1); } public void quickSort(int[] array,int left,int right){ if(right - left <= 0
C语言学习六指针_何谓变量的地址一个指针变量到底占几个字节 dcj3sjt126com C语言
# include <stdio.h> int main(void) { /* 1、一个变量的地址只用第一个字节表示 2、虽然他只使用了第一个字节表示，但是他本身指针变量类型就可以确定出他指向的指针变量占几个字节了 3、他都只存了第一个字节地址，为什么只需要存一个字节的地址，却占了4个字节，虽然只有一个字节，但是这些字节比较多，所以编号就比较大，
phpize使用方法 dcj3sjt126com PHP
phpize是用来扩展php扩展模块的，通过phpize可以建立php的外挂模块,下面介绍一个它的使用方法,需要的朋友可以参考下安装（fastcgi模式）的时候，常常有这样一句命令：代码如下: /usr/local/webserver/php/bin/phpize 一、phpize是干嘛的？ phpize是什么？ phpize是用来扩展php扩展模块的，通过phpi
Java虚拟机学习 - 对象引用强度 shuizhaosi888 JAVA虚拟机
本文原文链接：http://blog.csdn.net/java2000_wl/article/details/8090276 转载请注明出处！无论是通过计数算法判断对象的引用数量，还是通过根搜索算法判断对象引用链是否可达，判定对象是否存活都与“引用”相关。引用主要分为：强引用(Strong Reference)、软引用(Soft Reference)、弱引用(Wea
.NET Framework 3.5 Service Pack 1（完整软件包）下载地址 happyqing .net 下载 framework
Microsoft .NET Framework 3.5 Service Pack 1（完整软件包） http://www.microsoft.com/zh-cn/download/details.aspx?id=25150 Microsoft .NET Framework 3.5 Service Pack 1 是一个累积更新，包含很多基于 .NET Framewo
JAVA定时器的使用 jingjing0907 java timer 线程定时器
1、在应用开发中，经常需要一些周期性的操作，比如每5分钟执行某一操作等。对于这样的操作最方便、高效的实现方式就是使用java.util.Timer工具类。 privatejava.util.Timer timer; timer = newTimer(true); timer.schedule( newjava.util.TimerTask() { public void run()
Webbench 流浪鱼 webbench
首页下载地址 http://home.tiscali.cz/~cz210552/webbench.html Webbench是知名的网站压力测试工具，它是由Lionbridge公司（http://www.lionbridge.com）开发。 Webbench能测试处在相同硬件上，不同服务的性能以及不同硬件上同一个服务的运行状况。webbench的标准测试可以向我们展示服务器的两项内容：每秒钟相
第11章动画效果（中） onestopweb 动画
index.html <!DOCTYPE html PUBLIC "-//W3C//DTD XHTML 1.0 Transitional//EN" "http://www.w3.org/TR/xhtml1/DTD/xhtml1-transitional.dtd"> <html xmlns="http://www.w3.org/
windows下制作bat启动脚本. sanyecao2314 java cmd 脚本 bat
java -classpath C:\dwjj\commons-dbcp.jar;C:\dwjj\commons-pool.jar;C:\dwjj\log4j-1.2.16.jar;C:\dwjj\poi-3.9-20121203.jar;C:\dwjj\sqljdbc4.jar;C:\dwjj\voucherimp.jar com.citsamex.core.startup.MainStart
Java进行RSA加解密的例子 tomcat_oracle java
加密是保证数据安全的手段之一。加密是将纯文本数据转换为难以理解的密文；解密是将密文转换回纯文本。　　数据的加解密属于密码学的范畴。通常，加密和解密都需要使用一些秘密信息，这些秘密信息叫做密钥，将纯文本转为密文或者转回的时候都要用到这些密钥。　　对称加密指的是发送者和接收者共用同一个密钥的加解密方法。　　非对称加密(又称公钥加密)指的是需要一个私有密钥一个公开密钥，两个不同的密钥的
Android_ViewStub 阿尔萨斯 ViewStub
public final class ViewStub extends View java.lang.Object android.view.View android.view.ViewStub 类摘要： ViewStub 是一个隐藏的，不占用内存空间的视图对象，它可以在运行时延迟加载布局资源文件。当 ViewSt