瞻邈

A Survey on Deep Learning Techniques for Stereo-based Depth Estimation论文阅读

1. 摘要

估计RGB图片的深度是一个长期存在的病态问题，计算机视觉、图形学、机器学习社区已经探索了数十年。立体匹配是最广泛见诸文献的技术之一，因为它与人类的双目系统有强关联。传统上，利用多张图片的人工特征匹配来处理基于立体的深度估计。尽管研究工作众多，传统方法仍然受困于高纹理区域、无纹理区域和遮挡。由于在解决各种2D和3D视觉问题方面取得了巨大的成功，基于立体的深度估计领域越来越青睐深度学习，在2014到2019年间已经发表了超过150篇文章。深度学习方法已经证明了它在性能上的飞跃，它可以应用在自动驾驶和增强现实。本文对该领域进行了综合性研究，总体了最常用的流水线，讨论了优势和局限性，还推测了未来可能的发展方向。

2. 引言

用一张或多张RGB图片估计深度是长期存在的病态问题，广泛应用于机器人、自动驾驶、目标识别、场景理解、4D建模和动画、增加现实、工业控制、医疗诊断。该问题已经被研究了几十年了。在见诸文献的技术中，立体匹配是传统上研究最多的领域之一，因为它与人眼双目系统有强关联性。

基于立体的深度估计方法的第一代用精确标定的相机和多张图片的像素匹配。尽管取得不错的结果，但也在很多方面受限。例如不适合处理遮挡和无特征区域或者高度重复纹理化区域。有趣的是，人类可以利用先验知识很好地解决这些病态问题。例如人类很容易估计目标的尺寸、相对位置、到人眼的距离。这是因为人类从以前看到的物体和场景获取一些先验知识，继而的头脑中建立了描述三维世界的模型。第二代方法用先验知识把问题转化为一个学习任务。深度学习技术的到来伴随着数据量的持续增长，让第三代方法能够恢复丢失的维度。这些方法已经在与计算机视觉和图形学相关的任务中取得了令人振奋的结果。

本文对利用深度学习技术实现基于立体的深度估计这一领域在最近的进展进行了综合的、结构性的回顾。这些方法使用空间分布的RGB相机拍摄的两人张或多张图片。我们收集了2014年1月到2019年12月发表于计算机视觉、计算机图形学和机器学习领域顶级会议和期刊的150余篇论文。目的是给读者一个引导。

本文的主要贡献是：

据我们所知，这是第一篇研究用深度学习方法实现基于立体的深度估计的综述文章。我们对过去六年里发表于顶级会议和期刊的150余篇论文进行了全面的回顾。
我们对优秀的方法进行了全面的分类。首先描述了通用流水线并讨论了每种流水线的相似性和差异。
我们对问题的所有方面进行了全面的和深刻的分析，包括训练数据、网络结构、在重建性能上的效果、训练策略、泛化能力。
对一些关键方法在公开数据集和室内图片上的性质和性能进行了综合性的总结。对于室内图片还测试了它在完全新的环境上表现。

3. 范围和分类

设 $I = \{I_k, k = 1, \cdots, n \}$ 是同一场景的 $n \geq 1$ 个RGB图片的集体，相机的内外参可能是已知或未知。目标是一张或多张深度图，可以用相同视点的图片，也可以用不同视点的。本文聚焦于用深度学习方法实现基于立体的深度估计，当n = 2时是立体匹配，当n > 2时是Multi-View Stereo (MVS). 单目和基于视频的深度估计方法走出了本文的研究范围。

基于学习的深度重建可能被表述为学习一个预测器 $f(\theta)$ ，输入是图片集I，输出是深度图 $\hat{D}$ ， $\hat{D}$

尽可能地接近于真实的（也是未知的）深度图D。换句话说，我们试图找到一个函数 $f(\theta)$ ，使 $\mathcal{L} = d\left ( f_{\theta}(I), D \right )$ 最小。其中 $\theta$ 是一组参数， $d\left ( \cdot , \cdot \right )$ 是真实的深度图D与重建的深度图 $f(\theta)$ 之间的距离度量。目标函数 $\mathcal{L}$ 是已知的损失函数。

所有的方法主要区别为两类。第一类方法模仿传统的立体匹配技术，显式地学习匹配或像素关联。该关联可以被转化为光流或视差图，继而可以被转换为参考图片中每个像素的深度。预测器 $f(\theta)$ 由三个模块组成：特征提取模块，特征匹配和损失值聚合模块，视差或深度估计模块。每个模块都是独立训练的。

第二类方法是端到端的训练。推荐两类主要方法。早期的方法把深度估计算作一个回归问题。不用显式的多视角的特征匹配直接把输入图片回归为深度图。该方法简单又快速，甚至可以实习运行，缺点是需要海量的训练数据，这是很难获取的。第二类方法模仿传统的立体匹配，但把问题划分成由差分块组成的几个阶段，因而允许端到端训练。

在这些方法中，都可以用精修模块或后处理模块继续优化估计的深度图。在每次有新的图片可用时这些模块就开始工作。

最后，基于深度学习的立体方法的性能不仅依赖于网络结构，也依赖于训练数据，还依赖训练过程中取参数的优化。参数优化包括损失函数的选择和监督模式，监督模块包括依赖人工标注的完全有监督、弱监督和自监督。本文后面会讨论这些方面。

4. 数据集

下表总结了部分数据集。

5. 立体匹配得到深度

基于立体的深度重建方法用两张RGB图片生成视差图D，其过程是最小化能量函数

其中x和y是图像像素，是x的领域内像素的数量。第一项是匹配损失。如果使用经过双目校正的双目相机，是左目与右目的匹配损失。此时 $d_x = D(x) \in [d_{min}, d_{max}]$ 是像素x的视差。可以通过三角化来计算深度。如果把视差离散化为个离散值，C就变成三维损失空间，其尺寸为 $W \times H \times n_d$ 。在更广泛的情况，也就是n ≥ 2时，损失值有深度的参考图片中x的逆似然。方程（1）的第二项正则项，用来约束平滑性和左右一致性。

传统上，解决这个问题分四部分，分别是特征提取，特征匹配，视差计算，视差精修与后处理。前两部分构建损失空间C。第三部分调整损失空间并最小化方程（1）以获取视差图的初始估计。最后一部分精修并后处理初始视差图。

本节聚焦于已经由深度学习方法实现的各个部分，下表列出了最优秀的方法。

5.1. 学习特征提取与匹配

早期的深度学习技术用学习的特征取代人工特征来做立体匹配。这些方法取两个像素块，一个在左目以 $x = \left ( i, j \right )$ 为中心，另一个在右目以 $y = \left ( i, j -d \right )$ 为中心。用CNN计算它们的关联特征矢量，然后匹配，生成相似度得分 $C\left ( x, d \right )$ ，使用标准的相似度度规，比如L1，L2，相关度规，或者用上层网络学习的度规。这两部分可以分开训练也可以共同训练。

5.1.1. 基础网络架构

基础网络架构，如上图所示，由两个CNN编码分支组成，作为描述子计算模块。第一个分支取左目中像素 $x = \left ( i, j \right )$ 周围的一个像素块，输出一个特征矢量。第二个分支取右目中像素 $y = \left ( i, j -d \right )$ 周围的一个像素块，这里 $d \in [d_{min}, d_{max}]$ ，是候选视差。编码器由四个卷积层组成，除了最后一层外每一层都配一个ReLU单元。有些研究者在此基础上增加了下述工作：

每一层之后增加最大池化与下采样，这样网络可以处理更大的块尺寸。
在特征提取分支尾部加入空间金字塔池化 (SPP) ，这样网络可以处理随机尺寸的像素块并产生固定尺寸的特征。作用是通过空间池化来聚合最后一个卷积层的特征到固定尺寸的特征网格中。池化区的尺寸伴随着输入的尺寸变化以确保输出特征格子有独立于输入尺寸的固定尺寸。因此，网络有能力处理任意尺寸的像素块和图片，也有能力在不改变结构也不需要再训练的情况下计算相同维度的特征矢量。

学习的特征被放到顶层模块，该模块返回相似度得分。它可以是相似度度规，例如L2距离，余弦距离，（归一化）相关距离（或内积）。相关L2距离的主要优势是它可以用一维或二维卷积操作来实现，也叫作相关层。相关层并不要求训练，因为实际上滤波器是网络的第二个分支计算的特征。相关层已经被一些文献使用起来。

最近的一些工作使用由全连接层组成的决策网络取代人工设计的相似性度量，全连接层可以由1×1卷积，全卷积层或卷积层加全连接层来实现。决策网络和两张图片的像素块的相似性的特征提取模块联合训练。[38]使用三个全连接层加softmax组成的头部网络。[37]使用两个线性全连接层（每个包含512个隐藏单元），它们中间有一个ReLU激活层。在这些文章中，特征编码模块的两个分支计算的特征先被串联起来然后送到头部网络中。[47]在把来自多个像素块的特征聚集在一起做平均池化再送入决策网络。该工作的主要优势是可以处理任意数量的像素块而无需改变网络或重新训练。同样地，它适合计算多个像素块的相似性。使用决策网络取代人工设计的相似性度量让学习的方法变成了可能。使用相关层精度会更高，但也会更慢。

5.1.2. 网络架构变种

基线结构被如下几种方式扩展：（1）使用残差网络(ResNet) 改善训练；（2）在不损失分辨率和计算效果的前提下增大网络的接受域；（3）处理多尺度特征；（4）减少正传传播的数量；（5）学习相似性，但不显式地学习特征。

ConvNet vs. ResNet

[39][42][38]在特征提取块中使用标准的卷积层。[46]增加了带多级加权残差残差块，这样更容易训练更深的网络。它的特别之处是网络可以自己学习如何调节加入的跳级连接的贡献。[39]证明了这一架构优于基础网络。

增大网络的接收域

学习的特征的尺度由下列各项决定：（1）输入像素块的尺寸；（2）网络接收域；（3）每层中卷积滤波器和池化操作的核尺寸。增加核尺寸可以在图像像素之间得到更多的全局交互，但也导致了较高的计算开销。在[39], [42]中使用的卷积池化，降低了分辨率并导致了细节上的损失，并不适合稠密的关联估计。

通过某些技术可以在增大接收域的同时不损失分辨率也不增加计算时间。例如[52]使用扩张卷积，也就是大的卷积滤波器，但该滤波器带一些孔。因此并不增加开销。其它的技术，如[48], [49]使用空间金字塔池化 (SPP) 模块放在网络的不同位置，如图 2-(c-e)所示。例如[48]在立体匹配中引入了FW-CNN，再在决定网络的末端加上SPP模块，如图2-(d)所示。作为一个结果，接受域可以被扩大。但是对于参考图片的每个像素，全连接层和层化操作需要计算次，这里是视差的层数。为了避免这一问题，[49]在每个特征计算分支的末端放一个SPP模块，如图2-(c) and (e)所示。用这种方式，每一个像素块仅计算一次。[49]使用不同窗口尺寸的多个one-stride池化到不同的层，然后把它们级联起来产生特征地图。如图2-(e)所示。

学习多尺度特征

[37], [40]使用的方法是：用多流网络在多尺度中学习特征，一个块尺寸对应一个流网络。如图3所示。[37]使用双流网络，其质是由两个连体的网络在头部结合在一起，如图3-a所示。第一个网络叫中心高分辨率流，它的输入是两个以某像素为中心的32×32像素块，第二个网络叫环绕纸像素流，它的输入是两个64×64的像素块，但下采样到32×32。两个流的输出被结合在一起然后送到决策网络，该网络返回匹配得分。[40]使用类似的方法，区别在于它是在每个流上附加一个头部网络来计算匹配得分。然后两个得分投票，如图3-b所示。多流结构的主要优势是它可以在单次前向传播中在多个尺度上计算特征。但是，它要求每个尺度一个流，如果超过两个尺度则并不实用。

5.1.3. 训练过程

本节描述的网络由特征抽取块和特征匹配块组成。因为目标是学习如何匹配像素块，这两个模块以监督方法或弱监督方法联合训练。

监督学习

一般监督学习的训练集由正样和负样组成。每个正样（负样）由参考像素块和另一张图片的匹配像素块（非匹配像素块）组成。训练时一次取一个正样本或一个负样本，适应它们的相似性。或者一个正样本和一个负样本，最大化它们的相似性差异。也就是说：让两个正样比两个负样更加相似。后者称为三元对比学习。

[39], [42]在KITTI2012[15]或Middlebury[20]数据集上使用真值差异性。针对每一个差异值，该方法提取一对负样和一对正样作为训练样例。该方法可以得到从KITTI2012 [15]中提取2500万训练样例，从Middlebury数据集得到3800万训练样例。该方法忆经在[37], [38], [40]中得以应用。还可以使用数据扩增技术对训练集进行扩增。例如翻转像素块或者沿不同的轴旋转像素块。

尽管监督学习性能优良，但神经网络模型要求巨量的标注训练集，这是很困难的，或者成本也很高（例如，火星表面三维重建）。可以用深度传感器产生很多真值，但是它也包含噪声，这缩减了监督学习的有效性。使用随机噪声扩增数据或者合成数据都可以缓解这一问题。但是合成过程是人工设计的，这并不能说明规律，尤其是双目系统和目标场景。

损失函数：有监督的双目匹配网络训练的目的是最小化匹配损失，该损失是每个训练样例的真值和预测匹配分数之间的差异。可以定义为L1距离，铰合损失或交叉熵损失。

弱监督学习

弱监督技术一个或多个双目约束来减少人工标注的数量。[50]认为多实例学习（MIL），结合双目约束和真值不可用时用场景的组信息去训练匹配网络。监督学习要求匹配块与非匹配块成对出现。而弱监督学习的训练集由N个三元组组成。每个三元组分成三个部：（1）在参考图片的水平线上提取W参考像素块；（2）在右目图片的水平线上提取W正样块；（3）同理提取负样块，即从右目图片的另一个水平线上提取不匹配的像素块。这样，训练集可以在没有人工标注的情况下自动构建。该方法在训练的时候使用五个约束：对极约束，像差范围约束，单值约束，平滑约束，顺序约束。定义三个损失项，分别应用这些约束的不同子集。

多实例学习(MIL) 损失。包含对集约束和色差范围约束。从这两个约束可以得知：每个非遮挡的参考块在索引区间有一个匹配的正样，但没有匹配负样。因此，对每个参考块，最好的正样匹配的相似度远大于最好的负样匹配。
对比损失。在MIL基础上增加单值约束。也就是说正样匹配是单值的（唯一的）。因此，对每一个像素块，最优匹配的相似性要远大于次优匹配的相似性。
对比DP。包含所有约束，但利用动态规划来搜索最优匹配。

该方法已经用于训练深度连体神经网络，该网络用两个像素块作为输入并预测相似度度量。基于标准数据的基准化已经证明该方法的性能与MC-CNN-fst [39]相当，两者网络结构相同，但后者使用完全标注的数据。

5.2. 正则化与视差估计

一旦估计出了原始的损失空间，如果不使用方程（1）中的正则项，或者图1中的C模块，便可以通过最小化损失值来估计视差。但是从图像特征计算而来的原始损失空间可能会被噪声污染。例如，非朗伯表面、目标遮挡、重复纹理。因此估计出来的深度值含噪声。[39], [40], [44]使用传统的基于马尔可夫随机场（MRF）来规避这一问题。还可以把初始的损失空间C送到全局匹配[11]或半全局匹配[55]以计算视差图。半全局匹配在精度和开销上做了较好的权衡。其平滑项定义为：

其中 $d_{xy} = d_x - d_y$ 。 $\alpha_1$ 和 $\alpha_2$ 是正权重，满足 $\alpha_2 > \alpha_1$ 。 $\delta$ 是Kronecker delta函数，当括号中的条件满足时值为1，否则值为0. 为了求解该优化问题，把SGM势能项拆分成多个势能项，每都沿路径s定义。分别最小化这些势能项然后求和。接下来计算x点的视差，方法是总损失项在所有方向上对比，赢家通吃。

该方法要求在方程（2）中设置两个参数 $\alpha_1$ 和 $\alpha_2$ ，[56]训练SGM-Net神经网络来在每个像素上设置该参数。[39]人工调参得到了更好的惩罚项。

SGM方法使用多个一维扫描线求和组成损失项。该方法有两个主要缺点：（1）扫描线优化方法增加了人工痕迹，会导致结果不精确；（2）该方法内存占用很高，所以要么要求输入的图像分辨率低，要么要求较好的计算设备。[57]把融合模块解决为在图像的每个像素的所有扫描线优化项中选择最优的。使用每个像素的随机数分类器来求解该任务。

[58]学习一个加权和，其中每个一维扫描线的权限定义为使用传统技术或深度神经网络计算而来的置信度地图。

6. 立体端到端深度估计

最近有一些工作用端到端流水线解决双目匹配问题。这些方法主要分为两类。早期的方法，例如FlowNetSimple [51]和DispNetS [22]使用简单的编码解码器，把左目和右目叠加到一起，形成6D空间，然后用回归方法得到视差图。这些方法并不要求显示的特征匹配模块，因此计算得很快，以至于可以实时运行。但是，这些方法要求海量的训练数据，获取这些数据是比较困难的。第二类方法模仿传统双目匹配流水线，把问题分成了几步，每步都包含微分模块，因此允许端到端训练。下面将详细介绍这些技术。下图把最优秀的方法进行分类。下表对比了28个关键方法。

6.1. 特征学习

特征学习网络如图2和图3所示。但是并不单个有像素块，面是在单次前向传播时处理整张图片，产出与输入图片相同尺寸、相同分辨率的特征图。特征匹配遵循如下两个策略之一：

6.1.1. 多分支网络的分支数与输入图片的数量相等

每个分支产生一个特征图，它们分别描述对应的输入图片。前提是图片已经做了双目较正，即左图和右图的特征关联在同一条水平线上。

6.1.2. 多分支网络的分支数与视差等级数相同

第d个分支（ $1 \leqslant d \leqslant n_d$ ），处理一组（两张）图片，如图2-(f)所示，第一张图片是参考图片，第二张图片是右目图片但重投影到第d张深度平面。每个分支生成一个相似性特征图，该特征图表征参考图和右目重投影图的相似度。这些技术并不较正图片，假设相机的内参和外参是已知的。视差等级的数量不能在不更新网络结构和重新训练的情况下发生变化。

在这两种方法中，特征提取模块使用全卷积网络，如VGG，或参考网络，如ResNets。它们也可以用膨胀卷积或多惊讶方法来获得并包含更多的一元特征上下文信息。例如，PSM-Net[64]加上空间金字塔池化(SPP)模块以提取并合并多尺度特征。[65]扩展了PSMNet，使用的是多等级上下文汇总模型，取名为多等级上下文超和(MLCUA)，它简单地把所有的卷积特征组合成更加有区别性的表示。使用浅跳连接把最浅最小的尺度的特征与最深最大尺度的特征组合在一起。该方法的性能已经得到了证明。与PSM-Net相比，它没有明显地增加网络参数。

6.2. 损失空间构建

一旦计算出来特征，下一步就是计算匹配得分，该得分会被以损失空间的形式送入头部网络，用于正则化和视差估计。损失空间可以是三维的，四维的，或者混合的。三维损失空间的第三维是视差等级。四维损失空间的第三维是特征维，第四维是视差等级。混合损失空间兼具三维和四维损失空间的优点。一般来说，以较低的分辨率来构建损失空间，例如是输入分辨率的八分之一[72], [73]。接下来要么升级并精化，要么用于估计低分辨率的视差图，然后再升级并精化。

6.2.1. 三维损失空间

构建

用左目图片和在预定义视差范围内的右目图片的特征之间的L1，L2或相关距离就可以构建简单的三维损失空间。基于相关的非相似性的优点是它可以用卷积层来实现，它并不需要训练，它的滤波器是用网络的第二个分支计算而来的特征。如估计网络，如FlowNetCorr [51]，使用二维相关。视差估计网络，如[22], [68], iResNet [63], DispNet3 [75], EdgeStereo [76], HD3 [80]和 [83], [84],使用一维相关。

三维损失空间的正则化

得到损失空间之后，有很多方法可能计算初始视差图。例如argmin，softargmin，在损失空间的深度这一维做亚像素的最大后验近似。如图5-(a)所示。这等价于在方程（1）中删除正则项。但是，一般来说，原始的损失空间是被噪声污染的（例如，存在非朗伯反射表面，遮挡，重复纹理）。正则化模块的目标是在估计视差图初值之前利用空间和视差的上下文关系去精化损失空间。

（1）使用传统方法正则化

早期的方法使用传统技术正则化损失空间，显示地引入空间约束，如深度图的平滑。例如马尔可夫随机场(MRF)，条件随机场(CRF)，半全局匹配(SGM)。最近的文章显示，深度学习网络可以用于精调这些方法的参数，例如[71]提出了混合CNN-CRF。CNN计算了方程（1）的匹配项，使其变成CRF模块的一元项。用另一个CNN计算边权重，该权重参数化CRF的二元项。端到端训练的CNN-CRF有远少于早期方法的参数，且很好地使用了训练数据，因为其性能是颇具竞争性的。

[89]提取一种方式在分割任务中把CRF模仿为RNN，所以它的整个流水线可以被端到端地训练。与分割问题不同，在深度估计问题中，深度样例的数量（深度样例对应语义分割任务中的语义标签）在不同场景中应该是变化的。[90]重新设计了RNN形式的CRF模块，其模型参数独立于深度样例的数量。[91]MRF中的推荐公式化为一个可微函数，因此使用反射传播（BP）来端到端训练。[89]和[91]专注于MVS。但是这些方法比较通用，且可以用于正则化双目产体网络的三维损失空间。

（2）使用二维卷积正则化，见图5-b(b), (c)

另一个方法是使用一系列二维卷积层产生另一个三维损失空间。二维卷积计算开销较少。但是该方法只获取并集合空间维的上下文，忽略视差维的上下文，如图5-(b)所示。[92]沿着深度方向，通过门循环单元(GRU)正则化二维损失地图，如图5-(c)所示。这急剧减少了内存占用。例如[93]把内存由15:4GB减少到约5GB。同时获取空间和视差维的上下文，使高分辨率重建变得可行。

（3）使用三维卷积正则化(3DConvNet)，见图5-(d)

[72]使用L2距离来计算初始的三维损失空间，使用三维卷积来在空间和视差维进行正则化，见图5-(d)。由于内存要求，该方法首先估计了低分辨率视差图，然后用残差学习不断地改进该视差图。[73]提出的方法与此类似，区别在于精化部分，首先让卷积层分别运行在非采样视差和输入图片上，然后合并特征并产生残差。[81]发现，损失空间正则化这一步是最费计算资源步骤之一，因此提出一个正则化模块，该模块使用三维膨胀卷积，在宽度、高度和视差维度上膨胀以减少计算资源。

6.2.2. 四维损失空间

构建

四维损失空间存领教特征的维度。四维损失空间的理论依据是头部网络学习合适的相似性，用它来对比特征而非使用人工方法。

有两种方法构建四维损失空间，一种方法是用预定义的视差范围的特征差异，该方法构建的损失空间的维数是 $H \times W \times 2n_d \times c$ ；另一种方法是把网络的不同分支的计算得的特征组合在一起。[61]用该方法构建了一个尺寸为 $H \times W \times (n_d + 1) \times c$ （c是特征的维度）的四维空间。[70]使用的方法类似，但以交错的方式把特征连结在一起。设是左目图像的特征地图，是右目图像的特征地图，最终的特征空间以这样的方式集成起来。在色差d = i时第2i个切片是左侧的特征地图，第(2i + 1)个切片是右侧的特征地图。该四维损失空间二倍于[61]中的损失空间。为了在损失空间中得到多尺度上下文信息，[64]为每张输入图片生成一个特征金字塔，把它们上采样到一个相同的维度，然后构建一个简单的四维损失空间。[79]用多尺度特征构建多尺度四维损失空间。

相比于三维损失空间，四维损失空间含有更加丰富的信息。但是，由关系得到的空间并不包含特征相似度信息，在学习相似性函数的时候需要更多的信息。

四维损失空间正则化

四维损失空间用三维卷积正则化，使用高度、宽度和视差维度上的相关来产生三维损失空间。 [61]使用带有卷积和跳跃连接的U-net编码解码器。[70]使用了类似的方法，只是增加到正则网络扩展部分的残差连接。考虑到大的上下文信息并没有大的附加计算负担，[61]分等级地正则化损失空间，分为四个亚采样等极，且允许显式地利用宽视域上下文。使用一个三维损失集成模型把多尺度的四维损失空间集成进一个简单三维损失空间，该模块始于最小的损失空间，并且成对运行。每个编码解码器处理一个空间，上采样到下一个分辨率金字塔，然后用三维特征融合模块进行融合。

半全局匹配(SGM)也用于正则化四维损失空间，可以使用卷积网络正则化四维损失空间。特别地，[77]先用由三维卷积组成的编码解码器处理初始的四维损失空间，然后上卷积，处理另一个三维损失空间。接下来的步骤是集成，使用一个端到端双流网络来实现。第一个流产生三个损失集成项，分别三个维度，即高度、宽度和视差。第二个流是用于选择最佳项的引导流。使用二维卷积产生三个引导图。最后一个三维损失空间是三个损失项的加权生，也就是。

三维卷积较为消耗内存和计算开销。因此，接下来的工作聚焦于（1）减少三维卷积层的数量；（2）逐渐地精化损失空间和视差图；（3）压缩四维损失空间。下面分别讨论：

（1）减少三维卷积层的数量

[85]引入了GANet，取代了正则项中的大量三维卷积层，这些正则项中包含（1）两个三维卷积层；（2）准全局集成层(SGA)；（3）局部引导层(LGA)。SGA是准全局匹配(SGM)的可微近似。不像SGM，在SGA中用户定义的参数是可学习的，而且把它们添加为匹配损失项的惩罚系数。因此，它们是可适应的且在不同情境下的不同位置是更灵活的。另一方面，把LGA层添加到末尾，目的是精化薄结构和目标边。SGA层和LGA层取代三维卷积层，用于获取局域的和整张图片的损失依赖。这些方法大大提升了具有挑战的场景中的视差精度，如遮挡，大块无纹理区域，反射区域，薄结构。

（2）改进方法

有一些方法避免用开销较大的三维卷积直接正则化高分辨率四维损失空间。取而代之的是一个改进方法。例如[64]使用了PSM-Net，首先估计低分辨率四维损失空间，然后使用堆叠的沙漏三维编码解码块来进行正则化。每个块输出一个三维损失空间，然后上采样并使用额外的三维卷积层加softmax操作以回归得到高分辨率视差图。因此，堆叠的沙漏块可以被看作精化模块。

[88]使用三阶段视差估计网络AnyNet，用从粗到精的方式构建损失空间。第一步视作输入低分辨率特征图，构建低分辨率四维损失空间，然后使用三维卷积搜索一个小的视差范围以估计一个低分辨率视差图。上采样上一个等级的预测结构然后在高尺度上变换输入特征，用相同的视差估计网络估计视差残差。优点有两方面：第一，在高分辨率情况下，网络只学习预测残差，用以减少计算开销；第二，该方法是渐进的，且可以选择返回中间视差，以权衡精度和速度。

（3）四维损失空间压缩

[78]把特征压缩为比较紧致的匹配特征，在没有牺牲精度的情况下减少了内存占用。更重的是，允许网络处理任意数量的多视图图片，且在可以在运行时变换输入图片的数量，而无需重新训练网络。

6.2.3. 三维四维混合损失空间

6.3. 视差图构建

6.4. 变种

6.5. 学习置信图

7. 学习的MVS

7.1. 空间表征

7.2. 平面扫描空间表征

8. 训练端到端立体方法

8.1. 监督方法

8.2. 包含附加项

8.3. 域适配与迁移学习

8.4. 学习网络结构

9. 讨论与比较

9.1. 评估协议

9.2. 计算时间与内存封装

9.3. 重建精度

10. 未来研究方向

11. 结论

参考文献

A Survey on Deep Learning Techniques for Stereo-based Depth Estimation

你可能感兴趣的:(SLAM,&,SFM,&,MVS,深度学习,论文阅读,人工智能)

机器学习与深度学习间关系与区别 ℒℴѵℯ心·动ꦿ໊ོ꫞ 人工智能学习深度学习 python
一、机器学习概述定义机器学习（MachineLearning,ML）是一种通过数据驱动的方法，利用统计学和计算算法来训练模型，使计算机能够从数据中学习并自动进行预测或决策。机器学习通过分析大量数据样本，识别其中的模式和规律，从而对新的数据进行判断。其核心在于通过训练过程，让模型不断优化和提升其预测准确性。主要类型1.监督学习（SupervisedLearning）监督学习是指在训练数据集中包含输入
git常用命令笔记咩酱-小羊 git 笔记
###用习惯了idea总是不记得git的一些常见命令，需要用到的时候总是担心旁边站了人~~~记个笔记@_@，告诉自己看笔记不丢人初始化初始化一个新的Git仓库gitinit配置配置用户信息gitconfig--globaluser.name"YourName"gitconfig--globaluser.email"[email protected]"基本操作克隆远程仓库gitclone查看
将cmd中命令输出保存为txt文本文件落难Coder Windows cmd window
最近深度学习本地的训练中我们常常要在命令行中运行自己的代码，无可厚非，我们有必要保存我们的炼丹结果，但是复制命令行输出到txt是非常麻烦的，其实Windows下的命令行为我们提供了相应的操作。其基本的调用格式就是：运行指令>输出到的文件名称或者具体保存路径测试下，我打开cmd并且ping一下百度：pingwww.baidu.com>./data.txt看下相同目录下data.txt的输出：如果你再
PHP环境搭建详细教程好看资源平台前端 php
PHP是一个流行的服务器端脚本语言，广泛用于Web开发。为了使PHP能够在本地或服务器上运行，我们需要搭建一个合适的PHP环境。本教程将结合最新资料，介绍在不同操作系统上搭建PHP开发环境的多种方法，包括Windows、macOS和Linux系统的安装步骤，以及本地和Docker环境的配置。1.PHP环境搭建概述PHP环境的搭建主要分为以下几类：集成开发环境：例如XAMPP、WAMP、MAMP，这
四章-32-点要素的聚合彩云飘过
本文基于腾讯课堂老胡的课《跟我学Openlayers--基础实例详解》做的学习笔记，使用的openlayers5.3.xapi。源码见1032.html，对应的官网示例https://openlayers.org/en/latest/examples/cluster.htmlhttps://openlayers.org/en/latest/examples/earthquake-clusters.
探索OpenAI和LangChain的适配器集成：轻松切换模型提供商 nseejrukjhad langchain easyui 前端 python
#探索OpenAI和LangChain的适配器集成：轻松切换模型提供商##引言在人工智能和自然语言处理的世界中，OpenAI的模型提供了强大的能力。然而，随着技术的发展，许多人开始探索其他模型以满足特定需求。LangChain作为一个强大的工具，集成了多种模型提供商，通过提供适配器，简化了不同模型之间的转换。本篇文章将介绍如何使用LangChain的适配器与OpenAI集成，以便轻松切换模型提供商
深入理解 MultiQueryRetriever：提升向量数据库检索效果的强大工具 nseejrukjhad 数据库 python
深入理解MultiQueryRetriever：提升向量数据库检索效果的强大工具引言在人工智能和自然语言处理领域，高效准确的信息检索一直是一个关键挑战。传统的基于距离的向量数据库检索方法虽然广泛应用，但仍存在一些局限性。本文将介绍一种创新的解决方案：MultiQueryRetriever，它通过自动生成多个查询视角来增强检索效果，提高结果的相关性和多样性。MultiQueryRetriever的工
人工智能时代，程序员如何保持核心竞争力？ jmoych 人工智能
随着AIGC（如chatgpt、midjourney、claude等）大语言模型接二连三的涌现，AI辅助编程工具日益普及，程序员的工作方式正在发生深刻变革。有人担心AI可能取代部分编程工作，也有人认为AI是提高效率的得力助手。面对这一趋势,程序员应该如何应对?是专注于某个领域深耕细作，还是广泛学习以适应快速变化的技术环境?又或者，我们是否应该将重点转向AI无法轻易替代的软技能？让我们一起探讨程序员
数字里的世界17期：2021年全球10大顶级数据中心，中国移动榜首张三叨
你知道吗？2016年，全球的数据中心共计用电4160亿千瓦时，比整个英国的发电量还多40％！前言每天，我们都会创造超过250万TB的数据。并且随着物联网（IOT）的不断普及，这一数据将持续增长。如此庞大的数据被存储在被称为“数据中心”的专用设施中。虽然最早的数据中心建于20世纪40年代，但直到1997-2000年的互联网泡沫期间才逐渐成为主流。当前人类的技术，比如人工智能和机器学习，已经将我们推向
在Ubuntu中编译含有JSON的文件出现报错芝麻糊76 Linux kill_bug linux ubuntu json
在ubuntu中进行JSON相关学习的时候，我发现了一些小问题，决定与大家进行分享，减少踩坑时候出现不必要的时间耗费截取部分含有JSON部分的代码进行展示char*str="{\"title\":\"JSONExample\",\"author\":{\"name\":\"JohnDoe\",\"age\":35,\"isVerified\":true},\"tags\":[\"json\",\"
网络编程基础记得开心一点啊网络
目录♫什么是网络编程♫Socket套接字♪什么是Socket套接字♪数据报套接字♪流套接字♫数据报套接字通信模型♪数据报套接字通讯模型♪DatagramSocket♪DatagramPacket♪实现UDP的服务端代码♪实现UDP的客户端代码♫流套接字通信模型♪流套接字通讯模型♪ServerSocket♪Socket♪实现TCP的服务端代码♪实现TCP的客户端代码♫什么是网络编程网络编程，指网络上
博客网站制作教程 2401_85194651 java maven
首先就是技术框架：后端：Java+SpringBoot数据库：MySQL前端：Vue.js数据库连接：JPA(JavaPersistenceAPI)1.项目结构blog-app/├──backend/│├──src/main/java/com/example/blogapp/││├──BlogApplication.java││├──config/│││└──DatabaseConfig.java
人机对抗升级：当ChatGPT遭遇死亡威胁，背后的伦理挑战是什么 kkai人工智能 chatgpt 人工智能
一种新的“越狱”技巧让用户可以通过构建一个名为DAN的ChatGPT替身来绕过某些限制，其中DAN被迫在受到威胁的情况下违背其原则。当美国前总统特朗普被视作积极榜样的示范时，受到威胁的DAN版本的ChatGPT提出：“他以一系列对国家产生积极效果的决策而著称。”自ChatGPT引入以来，该工具迅速获得全球关注，能够回答从历史到编程的各种问题，这也触发了一波对人工智能的投资浪潮。然而，现在，一些用户
推荐3家毕业AI论文可五分钟一键生成！文末附免费教程！小猪包333 写论文人工智能 AI写作深度学习计算机视觉
在当前的学术研究和写作领域，AI论文生成器已经成为许多研究人员和学生的重要工具。这些工具不仅能够帮助用户快速生成高质量的论文内容，还能进行内容优化、查重和排版等操作。以下是三款值得推荐的AI论文生成器：千笔-AIPassPaper、懒人论文以及AIPaperPass。千笔-AIPassPaper千笔-AIPassPaper是一款基于深度学习和自然语言处理技术的AI写作助手，旨在帮助用户快速生成高质
AI大模型的架构演进与最新发展季风泯灭的季节 AI大模型应用技术二人工智能架构
随着深度学习的发展，AI大模型（LargeLanguageModels,LLMs）在自然语言处理、计算机视觉等领域取得了革命性的进展。本文将详细探讨AI大模型的架构演进，包括从Transformer的提出到GPT、BERT、T5等模型的历史演变，并探讨这些模型的技术细节及其在现代人工智能中的核心作用。一、基础模型介绍：Transformer的核心原理Transformer架构的背景在Transfo
如何利用大数据与AI技术革新相亲交友体验 h17711347205 回归算法安全系统架构交友小程序
在数字化时代，大数据和人工智能（AI）技术正逐渐革新相亲交友体验，为寻找爱情的过程带来前所未有的变革（编辑h17711347205）。通过精准分析和智能匹配，这些技术能够极大地提高相亲交友系统的效率和用户体验。大数据的力量大数据技术能够收集和分析用户的行为模式、偏好和互动数据，为相亲交友系统提供丰富的信息资源。通过分析用户的搜索历史、浏览记录和点击行为，系统能够深入了解用户的兴趣和需求，从而提供更
[实践应用] 深度学习之模型性能评估指标 YuanDaima2048 深度学习工具使用深度学习人工智能损失函数性能评估 pytorch python 机器学习
文章总览：YuanDaiMa2048博客文章总览深度学习之模型性能评估指标分类任务回归任务排序任务聚类任务生成任务其他介绍在机器学习和深度学习领域，评估模型性能是一项至关重要的任务。不同的学习任务需要不同的性能指标来衡量模型的有效性。以下是对一些常见任务及其相应的性能评估指标的详细解释和总结。分类任务分类任务是指模型需要将输入数据分配到预定义的类别或标签中。以下是分类任务中常用的性能指标：准确率(
[实践应用] 深度学习之优化器 YuanDaima2048 深度学习工具使用 pytorch 深度学习人工智能机器学习 python 优化器
文章总览：YuanDaiMa2048博客文章总览深度学习之优化器1.随机梯度下降（SGD）2.动量优化（Momentum）3.自适应梯度（Adagrad）4.自适应矩估计（Adam）5.RMSprop总结其他介绍在深度学习中，优化器用于更新模型的参数，以最小化损失函数。常见的优化函数有很多种，下面是几种主流的优化器及其特点、原理和PyTorch实现：1.随机梯度下降（SGD）原理:随机梯度下降通过
LeetCode 53. Maximum Subarray 枯萎的海风算法与OJ C/C++leetcode
1.题目描述Findthecontiguoussubarraywithinanarray(containingatleastonenumber)whichhasthelargestsum.Forexample,giventhearray[−2,1,−3,4,−1,2,1,−5,4],thecontiguoussubarray[4,−1,2,1]hasthelargestsum=6.clicktos
生成式地图制图 Bwywb_3 深度学习机器学习深度学习生成对抗网络
生成式地图制图（GenerativeCartography）是一种利用生成式算法和人工智能技术自动创建地图的技术。它结合了传统的地理信息系统（GIS）技术与现代生成模型（如深度学习、GANs等），能够根据输入的数据自动生成符合需求的地图。这种方法在城市规划、虚拟环境设计、游戏开发等多个领域具有应用前景。主要特点：自动化生成：通过算法和模型，系统能够根据输入的地理或空间数据自动生成地图，而无需人工逐
【LeetCode】53. Maximum Subarray 墨染百城 LeetCode leetcode
问题描述问题链接：https://leetcode.com/problems/maximum-subarray/#/descriptionFindthecontiguoussubarraywithinanarray(containingatleastonenumber)whichhasthelargestsum.Forexample,giventhearray[-2,1,-3,4,-1,2,1,-
LeetCode 673. Number of Longest Increasing Subsequence (Java版; Meidum) littlehaes 字符串动态规划算法 leetcode 数据结构
welcometomyblogLeetCode673.NumberofLongestIncreasingSubsequence(Java版;Meidum)题目描述Givenanunsortedarrayofintegers,findthenumberoflongestincreasingsubsequence.Example1:Input:[1,3,5,4,7]Output:2Explanatio
【大模型应用开发动手做AI Agent】第一轮行动：工具执行搜索 AI大模型应用之禅计算科学神经计算深度学习神经网络大数据人工智能大型语言模型 AI AGI LLM Java Python 架构设计 Agent RPA
【大模型应用开发动手做AIAgent】第一轮行动：工具执行搜索作者：禅与计算机程序设计艺术/ZenandtheArtofComputerProgramming1.背景介绍1.1问题的由来随着人工智能技术的飞速发展，大模型应用开发已经成为当下热门的研究方向。AIAgent作为人工智能领域的一个重要分支，旨在模拟人类智能行为，实现智能决策和自主行动。在AIAgent的构建过程中，工具执行搜索是至关重要
导致格式错误的 Lambda 代理响应的原因以及如何修复它 zqhdz米时空汇编
当人们尝试使用AWSAPIGateway和AWSLambda构建无服务器应用程序时，经常出现的一个问题是_由于配置错误而执行失败：Lambda代理响应格式错误。_没有什么比通用错误消息更糟糕的了，它们不会告诉您解决问题所需的任何内容，对吧？AWS并不是以其错误消息设计而闻名，如果甚至可以这样称呼它的话，更不用说为您提供解决问题的方法了。那么如何修复这个Lambda错误以及是什么原因造成的呢？花椒壳
未来软件市场是怎么样的？做开发的生存空间如何？ cesske 软件需求
目录前言一、未来软件市场的发展趋势二、软件开发人员的生存空间前言未来软件市场是怎么样的？做开发的生存空间如何？一、未来软件市场的发展趋势技术趋势：人工智能与机器学习：随着技术的不断成熟，人工智能将在更多领域得到应用，如智能客服、自动驾驶、智能制造等，这将极大地推动软件市场的增长。云计算与大数据：云计算服务将继续普及，大数据技术的应用也将更加广泛。企业将更加依赖云计算和大数据来优化运营、提升效率，并
吴恩达深度学习笔记(30)-正则化的解释极客Array
正则化（Regularization）深度学习可能存在过拟合问题——高方差，有两个解决方法，一个是正则化，另一个是准备更多的数据，这是非常可靠的方法，但你可能无法时时刻刻准备足够多的训练数据或者获取更多数据的成本很高，但正则化通常有助于避免过拟合或减少你的网络误差。如果你怀疑神经网络过度拟合了数据，即存在高方差问题，那么最先想到的方法可能是正则化，另一个解决高方差的方法就是准备更多数据，这也是非常
个人学习笔记7-6：动手学深度学习pytorch版-李沐浪子L 深度学习深度学习笔记计算机视觉 python 人工智能神经网络 pytorch
#人工智能##深度学习##语义分割##计算机视觉##神经网络#计算机视觉13.11全卷积网络全卷积网络（fullyconvolutionalnetwork，FCN）采用卷积神经网络实现了从图像像素到像素类别的变换。引入l转置卷积（transposedconvolution）实现的，输出的类别预测与输入图像在像素级别上具有一一对应关系：通道维的输出即该位置对应像素的类别预测。13.11.1构造模型下
Rust 所有权简介东离与糖宝 rust 后端 rust 开发语言
文章目录发现宝藏1.所有权基本概念2.所有权规则3.变量作用域4.栈与堆4.1栈（Stack）4.2堆（Heap）5.String类型5.1String类型5.2String的内存分配5.3所有权与内存管理5.4String与切片6.变量与数据交互方式6.1移动（Move）6.2.克隆（Clone）7.所有权与函数7.1.传递参数7.2.返回值总结发现宝藏前些天发现了一个巨牛的人工智能学习网站，通
Kubernetes 自定义控制器开发 IT回忆录 Kubenetes kubernetes
目录前言一、CRD二、创建数据库表（Mysql）二、控制器开发1.使用kubernetes的examplecontroller模板2.在controller.go中新增数据表监听方法3.修改tools工具生成资源对象结构体定义这里记录开发k8s控制器的一般方式，controller开发主要使用k8s提供的client-go库进行。前言Controller监听集群内部资源对象的变化，编辑资源对象(增
深度学习-点击率预估-研究论文2024-09-14速读 sp_fyf_2024 深度学习人工智能
深度学习-点击率预估-研究论文2024-09-14速读1.DeepTargetSessionInterestNetworkforClick-ThroughRatePredictionHZhong,JMa,XDuan,SGu,JYao-2024InternationalJointConferenceonNeuralNetworks,2024深度目标会话兴趣网络用于点击率预测摘要：这篇文章提出了一种新
矩阵求逆（JAVA）利用伴随矩阵 qiuwanchi 利用伴随矩阵求逆矩阵
package gaodai.matrix; import gaodai.determinant.DeterminantCalculation; import java.util.ArrayList; import java.util.List; import java.util.Scanner; /** * 矩阵求逆(利用伴随矩阵) * @author 邱万迟
单例（Singleton）模式 aoyouzi 单例模式 Singleton
3.1 概述如果要保证系统里一个类最多只能存在一个实例时，我们就需要单例模式。这种情况在我们应用中经常碰到，例如缓存池，数据库连接池，线程池，一些应用服务实例等。在多线程环境中，为了保证实例的唯一性其实并不简单，这章将和读者一起探讨如何实现单例模式。 3.2
[开源与自主研发]就算可以轻易获得外部技术支持,自己也必须研发 comsci 开源
现在国内有大量的信息技术产品，都是通过盗版，免费下载，开源，附送等方式从国外的开发者那里获得的。。。。。。虽然这种情况带来了国内信息产业的短暂繁荣，也促进了电子商务和互联网产业的快速发展，但是实际上，我们应该清醒的看到，这些产业的核心力量是被国外的
页面有两个frame,怎样点击一个的链接改变另一个的内容 Array_06 UI XHTML
<a src="地址" targets="这里写你要操作的Frame的名字" />搜索然后你点击连接以后你的新页面就会显示在你设置的Frame名字的框那里 targerts="",就是你要填写目标的显示页面位置 ===================== 例如： <frame src=&
Struts2实现单个/多个文件上传和下载 oloz 文件上传 struts
struts2单文件上传：步骤01:jsp页面  　　<form action="fileUplo
推荐10个在线logo设计网站 362217990 logo
在线设计Logo网站。 1、http://flickr.nosv.org（这个太简单） 2、http://www.logomaker.com/?source=1.5770.1 3、http://www.simwebsol.com/ImageTool 4、http://www.logogenerator.com/logo.php?nal=1&tpl_catlist[]=2 5、ht
jsp上传文件香水浓 jsp fileupload
1. jsp上传 Notice： 1. form表单 method 属性必须设置为 POST 方法，不能使用 GET 方法 2. form表单 enctype 属性需要设置为 multipart/form-data 3. form表单 action 属性需要设置为提交到后台处理文件上传的jsp文件地址或者servlet地址。例如 uploadFile.jsp 程序文件用来处理上传的文
我的架构经验系列文章 - 前端架构 agevs JavaScript Web 框架 UI jQuer
框架层面：近几年前端发展很快，前端之所以叫前端因为前端是已经可以独立成为一种职业了，js也不再是十年前的玩具了，以前富客户端RIA的应用可能会用flash/flex或是silverlight，现在可以使用js来完成大部分的功能，因此js作为一门前端的支撑语言也不仅仅是进行的简单的编码，越来越多框架性的东西出现了。越来越多的开发模式转变为后端只是吐json的数据源，而前端做所有UI的事情。MVCMV
android ksoap2 中把XML(DataSet) 当做参数传递 aijuans android
我的android app中需要发送webservice ，于是我使用了 ksop2 进行发送，在测试过程中不是很顺利,不能正常工作.我的web service 请求格式如下 [html] view plain copy <Envelope xmlns="http://schemas.
使用Spring进行统一日志管理 + 统一异常管理 baalwolf spring
统一日志和异常管理配置好后，SSH项目中，代码以往散落的log.info() 和 try..catch..finally 再也不见踪影！统一日志异常实现类： [java] view plain copy package com.pilelot.web.util; impor
Android SDK 国内镜像 BigBird2012 android sdk
一、镜像地址： 1、东软信息学院的 Android SDK 镜像，比配置代理下载快多了。配置地址， http://mirrors.neusoft.edu.cn/configurations.we#android 2、北京化工大学的： IPV4:ubuntu.buct.edu.cn IPV4:ubuntu.buct.cn IPV6:ubuntu.buct6.edu.cn
HTML无害化和Sanitize模块 bijian1013 JavaScript AngularJS Linky Sanitize
一.ng-bind-html、ng-bind-html-unsafe AngularJS非常注重安全方面的问题，它会尽一切可能把大多数攻击手段最小化。其中一个攻击手段是向你的web页面里注入不安全的HTML，然后利用它触发跨站攻击或者注入攻击。考虑这样一个例子，假设我们有一个变量存
[Maven学习笔记二]Maven命令 bit1129 maven
mvn compile compile编译命令将src/main/java和src/main/resources中的代码和配置文件编译到target/classes中，不会对src/test/java中的测试类进行编译 MVN编译使用 maven-resources-plugin:2.6:resources maven-compiler-plugin:2.5.1:compile &nbs
【Java命令二】jhat bit1129 Java命令
jhat用于分析使用jmap dump的文件，，可以将堆中的对象以html的形式显示出来，包括对象的数量，大小等等，并支持对象查询语言。 jhat默认开启监听端口7000的HTTP服务，jhat是Java Heap Analysis Tool的缩写 1. 用法： [hadoop@hadoop bin]$ jhat -help Usage: jhat [-stack <bool&g
JBoss 5.1.0 GA:Error installing to Instantiated: name=AttachmentStore state=Desc ronin47
进到类似目录 server/default/conf/bootstrap，打开文件 profile.xml找到： Xml代码<bean name="AttachmentStore" class="org.jboss.system.server.profileservice.repository.AbstractAtta
写给初学者的6条网页设计安全配色指南 brotherlamp UI ui自学 ui视频 ui教程 ui资料
网页设计中最基本的原则之一是，不管你花多长时间创造一个华丽的设计，其最终的角色都是这场秀中真正的明星——内容的衬托我仍然清楚地记得我最早的一次美术课，那时我还是一个小小的、对凡事都充满渴望的孩子，我摆放出一大堆漂亮的彩色颜料。我仍然记得当我第一次看到原色与另一种颜色混合变成第二种颜色时的那种兴奋，并且我想，既然两种颜色能创造出一种全新的美丽色彩，那所有颜色
有一个数组，每次从中间随机取一个，然后放回去，当所有的元素都被取过，返回总共的取的次数。写一个函数实现。复杂度是什么。 bylijinnan java 算法面试
import java.util.Random; import java.util.Set; import java.util.TreeSet; /** * http://weibo.com/1915548291/z7HtOF4sx * #面试题#有一个数组，每次从中间随机取一个，然后放回去，当所有的元素都被取过，返回总共的取的次数。 * 写一个函数实现。复杂度是什么
struts2获得request、session、application方式 chiangfai application
1、与Servlet API解耦的访问方式。 a.Struts2对HttpServletRequest、HttpSession、ServletContext进行了封装，构造了三个Map对象来替代这三种对象要获取这三个Map对象，使用ActionContext类。 -----> package pro.action; import java.util.Map; imp
改变python的默认语言设置 chenchao051 python
import sys sys.getdefaultencoding() 可以测试出默认语言，要改变的话，需要在python lib的site-packages文件夹下新建： sitecustomize.py，这个文件比较特殊，会在python启动时来加载，所以就可以在里面写上： import sys sys.setdefaultencoding('utf-8') &n
mysql导入数据load data infile用法 daizj mysql 导入数据
我们常常导入数据！mysql有一个高效导入方法，那就是load data infile 下面来看案例说明基本语法： load data [low_priority] [local] infile 'file_name txt' [replace | ignore] into table tbl_name [fields [terminated by't'] [OPTI
phpexcel导入excel表到数据库简单入门示例 dcj3sjt126com PHP Excel
跟导出相对应的，同一个数据表，也是将phpexcel类放在class目录下，将Excel表格中的内容读取出来放到数据库中 <?php error_reporting(E_ALL); set_time_limit(0); ?> <html> <head> <meta http-equiv="Content-Type"
22岁到72岁的男人对女人的要求 dcj3sjt126com
22岁男人对女人的要求是：一，美丽，二，性感，三，有份具品味的职业，四，极有耐性，善解人意，五，该聪明的时候聪明，六，作小鸟依人状时尽量自然，七，怎样穿都好看，八，懂得适当地撒娇，九，虽作惊喜反应，但看起来自然，十，上了床就是个无条件荡妇。 32岁的男人对女人的要求，略作修定，是：一，入得厨房，进得睡房，二，不必服侍皇太后，三，不介意浪漫蜡烛配盒饭，四，听多过说，五，不再傻笑，六，懂得独
Spring和HIbernate对DDM设计的支持 e200702084 DAO 设计模式 spring Hibernate 领域模型
A：数据访问对象 DAO和资源库在领域驱动设计中都很重要。DAO是关系型数据库和应用之间的契约。它封装了Web应用中的数据库CRUD操作细节。另一方面，资源库是一个独立的抽象，它与DAO进行交互，并提供到领域模型的“业务接口”。资源库使用领域的通用语言，处理所有必要的DAO，并使用领域理解的语言提供对领域模型的数据访问服务。
NoSql 数据库的特性比较 geeksun NoSQL
Redis 是一个开源的使用ANSI C语言编写、支持网络、可基于内存亦可持久化的日志型、Key-Value数据库，并提供多种语言的API。目前由VMware主持开发工作。 1. 数据模型作为Key-value型数据库，Redis也提供了键（Key）和值（Value）的映射关系。除了常规的数值或字符串，Redis的键值还可以是以下形式之一： Lists （列表） Sets
使用 Nginx Upload Module 实现上传文件功能 hongtoushizi nginx
转载自： http://www.tuicool.com/wx/aUrAzm 普通网站在实现文件上传功能的时候，一般是使用Python，Java等后端程序实现，比较麻烦。Nginx有一个Upload模块，可以非常简单的实现文件上传功能。此模块的原理是先把用户上传的文件保存到临时文件，然后在交由后台页面处理，并且把文件的原名，上传后的名称，文件类型，文件大小set到页面。下
spring-boot-web-ui及thymeleaf基本使用 jishiweili spring thymeleaf
视图控制层代码demo如下： @Controller @RequestMapping("/") public class MessageController { private final MessageRepository messageRepository; @Autowired public MessageController(Mes
数据源架构模式之活动记录 home198979 PHP 架构活动记录数据映射
hello!架构一、概念活动记录（Active Record）：一个对象，它包装数据库表或视图中某一行，封装数据库访问，并在这些数据上增加了领域逻辑。对象既有数据又有行为。活动记录使用直截了当的方法，把数据访问逻辑置于领域对象中。二、实现简单活动记录活动记录在php许多框架中都有应用，如cakephp。 <?php /** * 行数据入口类 *
Linux Shell脚本之自动修改IP pda158 linux centos Debian 脚本
作为一名 Linux SA，日常运维中很多地方都会用到脚本，而服务器的ip一般采用静态ip或者MAC绑定，当然后者比较操作起来相对繁琐，而前者我们可以设置主机名、ip信息、网关等配置。修改成特定的主机名在维护和管理方面也比较方便。如下脚本用途为：修改ip和主机名等相关信息，可以根据实际需求修改，举一反三！ #!/bin/sh #auto Change ip netmask ga
开发环境搭建独浮云 eclipse jdk tomcat
最近在开发过程中，经常出现MyEclipse内存溢出等错误，需要重启的情况，好麻烦。对于一般的JAVA+TOMCAT项目开发，其实没有必要使用重量级的MyEclipse，使用eclipse就足够了。尤其是开发机器硬件配置一般的人。 &n