量子-Alex

【CV论文精读】【MVDet】Multiview Detection with Feature Perspective Transformation

0.论文摘要

合并多个摄像机视图进行检测减轻了拥挤场景中遮挡的影响。在多视图检测系统中，我们需要回答两个重要问题。首先，我们应该如何从多个视图中聚合线索？第二，我们应该如何从空间上相邻的位置聚集信息？为了解决这些问题，我们引入了一种新的多视图检测器MVDet。在多视图聚合期间，对于地面上的每个位置，现有方法使用多视图anchor box特征作为表示，这可能会限制性能，因为预定义的anchor box可能不准确。相比之下，通过特征图透视变换，MVDet采用无anchor点表示，特征向量直接从多个视图中的相应像素采样。对于空间聚合，与以前需要在神经网络之外进行设计和操作的方法不同，MVDet采用完全卷积的方法，在多视图聚合要素图上使用大卷积核。所提出的模型是端到端可学习的，在Wildtrack数据集上实现了88.2%的MODA，比最先进的模型高出14.1%。我们还在新引入的合成数据集MultiviewX上提供了MVDet的详细分析，这使我们能够控制遮挡水平。

1.研究背景

遮挡是许多计算机视觉任务面临的基本问题。具体来说，在检测问题中，遮挡带来了很大的困难，并且已经提出了许多方法来解决它。一些方法集中于单视图检测问题，例如，基于部分的检测[35，25，48]，损失设计[46，39]，以及学习非最大抑制[13]。其他方法从多个线索联合推断对象，例如RGB-D[10，12，27]、激光雷达点云[6]和多个RGB相机视图[8，3]。在本文中，我们重点研究了来自多个RGB相机视图（多视图）的行人检测。

多视角行人检测通常具有来自多个校准摄像机的同步帧作为输入[8，29，3]。这些摄像机聚焦在同一个区域，

并且具有重叠的视野（参见图1）。相机校准提供2D图像坐标（u，v）和3D世界位置（x，y，z）之间的匹配。我们将3D世界中z=0的点称为地平面（鸟瞰视图）。对于地平面上的每个点，基于三维人体宽度和高度假设，通过投影计算其在多个视图中对应的边界框，然后存储。由于边界框可以通过表格查找检索，多视图行人检测任务通常评估地平面上的行人占用情况[8，3]。

图1。多视角行人检测系统概述。左图：系统将来自N台摄像机的同步帧作为输入。中间：摄像机视野在地平面上重叠，多视图线索可以在地平面上聚合。右图：系统输出行人占用图（POM）。这里有两个重要的问题。首先，我们如何聚合多个线索。第二，如何聚合空间邻居信息进行联合考虑（大白圈），对行人占用情况做出综合决策（小白圈）。

解决遮挡和拥挤带来的模糊性是多视角行人检测的主要挑战。在遮挡状态下，很难确定一个人是否存在于某个位置，或者存在多少人以及他们在哪里。为了解决这个问题，必须关注多视图检测的两个重要方面：第一，多视图聚合，第二，空间聚合（图1）。多视图信息的聚合是必不可少的，因为具有多视图是单视图检测和多视图检测之间的主要区别。以前，对于给定的地平面位置，多视图系统通常选择基于anchor的多视图聚合方法，并用多视图anchor box特征表示特定的地平面位置[4，1，17]。然而，研究人员发现，基于anchor的方法的性能可能会受到单目视图系统中预定义anchor box的限制[49，16，43]，而根据预定义的人体3D高度和宽度计算的多视图anchor box也可能不准确。空间邻居的聚集对于遮挡推理也是至关重要的。以前的方法[8，29，1]通常采用条件随机场（CRF）或平均场推断来共同考虑空间邻居。这些方法通常需要特定的潜在项设计或卷积神经网络（CNN）之外的额外操作。

在本文中，我们提出了一种简单而有效的方法，MVDet，这是迄今为止还没有在文献中探索的多视图检测。首先，对于多视图聚合，由于基于不准确的anchor box的表示会限制系统性能，而不是基于anchor的方法[4，1，17]，MVDet选择具有在多个视图中的相应像素处采样的特征向量的无anchor表示。具体来说，MVDet通过透视变换投影卷积特征图，并连接多个投影的特征图。第二，对于空间聚合，为了最大限度地减少CNN之外的人工设计和操作，MVDet采用了完全卷积的解决方案，而不是CRF或平均场推理[8，29，1]。它在聚合的地平面特征图上应用（学习的）卷积，并使用大感受野来共同考虑地平面相邻位置。所提出的全卷积MVDet可以以端到端的方式进行训练。我们在两个大规模数据集上证明了MVDet的有效性。在真实世界的数据集Wildtrack上，MVDet实现了88.2%的MODA[15]，比以前的最先进水平增加了14.1%。在合成数据集MultiviewX上，MVDet也在多级遮挡下取得了有竞争力的结果。

2.相关工作

2.1 Monocular view detection 单目检测

检测是计算机视觉中最重要的问题之一。像faster R-CNN[28]和SSD[21]这样基于anchor的方法实现了很好的性能。最近，寻找预定义的anchor可能会限制性能，提出了许多无anchor方法[49，36，16，43，7，18]。在行人检测方面，一些研究人员通过头—脚点检测[32]或中心和比例检测[22]来检测行人边界框。行人检测中的遮挡处理引起了研究界的极大关注。基于部分的检测器非常受欢迎[25，35，24，46]，因为被遮挡的人只能部分观察到。霍桑等人。[13]学习遮挡行人的非最大抑制。排斥损失[39]被提出来排斥边界盒。

2.2 3D object understanding with multiple information sources

结合多个信息源，如深度、点云和其他RGB相机视图，研究了3D对象理解。对于多视图三维物体分类，苏等。[33]使用最大池化来聚合来自不同2D视图的特征。对于三维目标检测，来自RGB图像和激光雷达点云的聚合信息被广泛研究。陈等。[5]研究了立体图像的三维目标检测。[17]中研究了3Danchor点的视图聚合，研究人员从RGB相机和激光雷达鸟瞰图中提取每个3Danchor点的特征。梁等。[19]从K个最近邻激光雷达点的相机视图特征计算鸟瞰视图中每个点的特征，作为多层感知器输出。平截头体点网[27]首先从RGB图像生成2D边界框建议，然后将它们挤压到3D观察平截头体。姚等。编辑3D车辆模型的属性，以创建内容一致的车辆数据集[44]。

2.3 Multiview pedestrian detection

在多视角行人检测中，首先，聚合来自多个RGB摄像机的信息至关重要。在[4，1]中。搜索者为多视图2Danchor融合多个信息源。给定人的宽度和高度的固定假设，首先计算所有地平面位置及其对应的多视图2Danchor box。然后，[4，1]中的研究人员用相应的anchor box特征来表示地平面位置。在[8，41，29]中，单视图检测结果被融合。第二，为了聚集空间邻居信息，利用了平均场推断[8，1]和条件随机场（CRF）[29，1]。在[8，1]中，场景中的总占用率被视为能量最小化问题，并用CRF解决。弗勒特等人。[8]首先估计一定占用率下的理想2D图像，然后将它们与真实的多视图输入进行比较。巴克等人。[1]构造高阶势作为CNN估计和生成的理想图像之间的一致性，并以组合的方式用CNN训练CRF，并在Wildtrack数据集上实现最先进的性能[3]。

2.4 Geometric transformation in deep learning

仿射变换和透视变换等几何变换可以对计算机视觉中的许多现象进行建模，并且可以用一组固定的参数显式计算。Jaderberg等人[14]提出了空间Transformer model网络，该网络学习用于2D RGB输入图像的平移和旋转的仿射变换参数。Wu等[40]估计投影参数并从3D骨架投影2D关键点。Yan等[42]通过透视变换将一个3D体积转换为2D剪影。[38]中通过估计实例级仿射变换研究了几何感知场景文本检测。对于交叉视图图像检索，Shi等[30]应用极坐标变换使特征空间中的表示更接近。Lv等为车辆的新型视图合成提出一个透视感知生成模型[23]。

3.核心思想

在这项工作中，我们重点研究了多视图场景中的遮挡行人检测问题，并设计了MVDet来处理模糊度。MVDet的特点是无anchor多视图聚合，减轻了以前工作中不准确anchor box的影响[6，17，4，1]，以及不依赖于CRF或平均场推断的完全卷积空间聚合[8，29，1]。如图2所示，MVDet将多个RGB图像作为输入，并输出行人占用图（POM）估计。在接下来的章节中，我们将介绍建议的多视图聚合（第3.1节）、空间聚合（第3.2节）以及训练和测试配置（第3.3节）。

3.1 Multiview Aggregation

多视图聚合是多视图系统中非常重要的一部分。在本节中，我们将解释MVDet中减轻不准确anchor box影响的无anchor聚合方法，并将其与几种替代方法进行比较。

3.1.1 Feature map extraction

在MVDet中，首先，给定N个形状为 $H_i, W_i]$ 的图像作为输入（ $H_i$ 和 $W_i$ 表示图像高度和宽度），所提出的架构使用CNN来提取N个C通道特征图（图2）。

图二。MVDet架构。首先，给定来自N个摄像机的形状 $3, H_i, W_i]$ 的输入图像，所提出的网络使用CNN来提取每个输入图像的C通道特征图。这里的CNN特征提取器在N个输入中共享权重。接下来，我们将C通道特征图重塑为 $H_f , W_f ]$ 的大小，并通过检测头—脚对来运行单视图检测。然后，对于多视图聚合（圈1），我们采用无anchor方法，并结合基于相机校准的N个特征图的透视变换 $θ^{(1)}, . . . , θ^{(N)}$ ，其产生形状为 $C, H_g, W_g]$ 的N个特征图。对于每个接地层位置，我们将其X-Y坐标存储在双通道坐标图中[20]。通过将N个投影特征图与一个坐标图连接起来，我们聚合了整个场景的地平面特征图（形状为 $N × C + 2, H_g, W_g]$ ）。最后，我们在地平面特征图上应用大核卷积，以便聚集空间邻居信息（圈出的2），用于联合和全面的最终占用决策。

这里，我们选择ResNet-18[11]是因为它性能强，重量轻。该CNN分别计算N幅输入图像的C通道特征图，同时在所有计算中分担权重。为了保持特征图相对较高的空间分辨率，我们用扩张卷积替换了最后3个跨步卷积[45]。在投影之前，我们将N个特征贴图调整为固定大小 $H_f , W_f ]$ （ $H_f$ 和 $W_f$ 表示特征贴图的高度和宽度）。在每个视图中，类似于[18，32]，我们然后用共享重量的单视图检测器将行人检测为一对头——脚点。

3.1.2 Anchor-free representation

以前，在具有多个线索的检测任务中，例如3D对象检测和多视图行人检测，通常采用基于anchor点的表示[6，17，4，1]。具体来说，可以通过ROI-pooling[9]用anchor box（图3中的绿框）特征来表示接地层位置（图3中的红点）。

根据假设的3D人体高度和宽度计算anchor boxes的大小和形状[4，1]，这些anchor box可能不准确，这可能会限制系统性能[49，16，43]。如图3所示，穿白大褂的女士坐着，只占anchor箱的一半。因此，ROI池将导致在很大程度上描述背景的特征表示，并导致混乱。

图3。用特征向量（无anchor）或anchor box特征（基于anchor）表示地平面位置。红点代表某个接地层位置及其在不同视图中的对应像素。绿色边界框是指对应于接地层位置的anchor定框。由于人类目标的大小可能与假设的不同（例如，穿着白大褂的女士），多视图anchor box的ROI池可能无法为该位置提供最准确的特征表示。相反，由于没有anchor，从相应点检索的特征向量避免了不准确anchor box的影响。

相反，由于没有anchor，所提出的方法用从相应点的特征图中采样的特征向量来表示地平面位置，这避免了不准确anchor box的影响。给定摄像机校准，可以精确地检索相应的点。通过可学习的卷积核，这些特征向量可以表示来自其感受野中的自适应区域的信息。因此，通过无anchor特征表示构建的地平面特征图避免了来自不准确anchor box的汇集，并且仍然包含来自2D图像的足够信息用于检测。

3.1.3 Perspective transformation

为了检索无anchor点表示，我们用透视变换投影特征图。3D位置（x，y，z）和2D图像像素坐标（u，v）之间的转换通过

其中 $s$ 是实值比例因子， $P_θ$ 是3 × 4透视变换矩阵。具体来说，A是3 × 3内参数矩阵。 $[R ∣ t]$ 是3 × 4联合旋转——平移矩阵，或外部参数矩阵，其中 $R$ 指定旋转， $t$ 指定平移。
图像中的一个点（像素）位于3D世界中的一条线上。为了确定图像像素的精确3D位置，我们考虑一个公共参考平面：地平面，z=0。对于地平面上的所有3D位置 $(x, y, 0)$ ，逐点变换可以写成

其中 $P_{θ,0}$ 表示从 $P_θ$ 中取消第三列的3 × 3透视变换矩阵。

为了在神经网络中实现这一点，我们将接地层位置量化为形状为 $H_g, W_g]$ 的网格。对于相机 $n ∈ \{1, . . . , N \}$ ，具有校准 $θ^{(n)}$ ，我们可以通过基于等式2应用形状为 $H_g, W_g]$ 的参数化采样网格，将图像投影到z=0接地平面上。这些采样网格在地平面上生成投影特征图，其中剩余的（看不见的）位置用零填充（图4）。我们连接了一个双通道坐标图[20]来指定接地层位置的X-Y坐标（图2）。连同来自N个摄像机的投影C通道特征图，我们有一个（N × C+2）通道地平面特征图。

3.1.4 Different projection choices

对于多视图聚合，投影有多种选择：我们可以投影RGB图像、要素图或单视图结果（图5）。首先，RGB像素本身包含的信息相对较少，许多信息保留在空间结构中。但是，投影会破坏相邻RGB像素之间的空间关系。因此，这限制了多视图检测器的性能。第二，投影单个视图结果（检测到的脚点）限制了要聚合的信息。事实上，在这种设置中，除了单视图检测结果之外，系统无法访问其他线索。由于单视图结果在遮挡下可能不准确（这是引入多视图的原因），这种设置也会限制整体性能。在本文中，我们建议投影特征图。
与其他选择相比，要素图不仅较少遭受空间结构断裂（因为2D空间信息已经集中到要素图中的单个像素中），而且包含更多信息。如图5所示，经由特征图投影的聚合实现最高的MODA[15]性能。

3.2 Spatial aggregation

在上一节中，我们展示了多视图信息可以通过透视转换和连接以无anchor的方式聚合。剩下的一个问题是如何从空间邻居中聚合信息。

遮挡是由一定区域内的人群产生的。为了处理这些模糊性，人们可以联合考虑某个区域和该区域中的人群，以做出总体明智的决策。以前采用CRFs和平均场推断，但是除了CNN之外还需要设计和操作。在这项工作中，我们提出了一个完全卷积的替代方案，在地平面特征图上具有大核卷积。事实上，郑等人。[47]发现CNN可以模拟CRF的一些行为和特征。还有彭等人。[26]在语义分割方面优于具有大核卷积的CRF。在MVDet中，我们将（N × C+2）通道地平面特征图馈送到具有相对较大感受野的卷积层，以便共同考虑地平面邻居。这里，我们使用三层扩张卷积来具有最小的参数，同时仍然保持较大的接地层感受野。最后一层输出无激活的单通道 $H_g, W_g]$ 行人占用图（POM）

4.算法

4.1 训练

我们将MVDet训练为一个回归问题。给定地面真实行人占用 $\mathbf{g}$ ，类似于地标检测[2]，我们使用高斯核 $f (\cdot)$ 生成“软”地面真实目标 $f (g)$ 。为了训练整个网络，我们使用网络输出 $\hat {\mathbf{g}}$ 和“软”目标 $f (g)$ 之间的欧几里德距离（Euclidean distance）为损失函数，

我们还包括来自N个摄像机输入的边界盒回归损失作为另一个监督。单视图头——脚检测也被训练为回归问题。对于单视图检测结果 $\hat {s}^{(n)}_{head}$ , $\hat {s}^{(n)}_{foot}$ 和视图 $n ∈ \{1, ..., N \}$ 中相应的地面实况 $s^{(n)}_{head}$ , $s^{(n)}_{foot}$ ，损失计算如下，

结合接地层损耗 $\mathcal{L}_{ground}$ 和N个单视图损耗 $\mathcal{L}^{n}_{single}$ ，我们得到用于训练MVDet的总损耗，

其中α是单视图损失权重的超参数。

4.2 测试

MVDet输出图 $\hat g$ 。的单通道占用概率我们以0.4的最小概率过滤占用图，然后对建议应用非最大抑制（NMS）。该NMS使用0.5米的欧几里德距离阈值，这与在评估中将该位置建议视为真阳性的阈值相同[3]。

5.数据集

我们在两个多视图行人检测数据集上进行测试（表1）。

Wildtrack数据集包括来自7台摄像机的400个同步帧，覆盖12米乘36米的区域。为了进行注释，接地层被量化为480 × 1440的网格，其中每个网格单元为2.5平方厘米。这7个摄像头以1080 × 1920的分辨率捕捉图像，并以每秒2帧（fps）的速度进行注释。平均而言，Wildtrack数据集中每帧有20个人，场景中的每个位置被3.74个摄像机覆盖。
MultiviewX数据集是为多视图行人检测收集的新合成数据集。我们使用Unity engine[37]来创建场景。至于行人，我们使用PersonX[34]的人体模型。MultiviewX数据集覆盖的区域略小，为16米乘25米。使用相同的2.5平方厘米的网格单元，我们将接地层量化为640 × 1000的网格。MultiviewX数据集中有6个视野重叠的摄像机，每个摄像机输出1080 × 1920分辨率的图像。我们还以2 fps的速度在MultiviewX中为400帧生成注释（与Wildtrack相同）。平均4.41个摄像头覆盖相同的位置。作为一个合成数据集，对于带有免费注释的场景，有各种潜在的配置。在默认设置下，MultiviewX每帧有40个人，使Wildtrack的拥挤程度增加了一倍。如果未指定，MultiviewX将引用此默认设置

6.实验结果

6.1 评估指标

评估指标。在[3]之后，我们使用两个数据集中的前90%帧进行训练，最后10%帧进行测试。我们报告精确度、召回率、MODA和MODP。MODP评估定位精度，而MODA考虑假阳性和假阴性[15]。我们使用MODA作为主要的性能指标，因为它同时考虑了误报和误报。0.5米的阈值用于确定真阳

6.2 实验设置

出于内存使用方面的考虑，我们将1080 × 1920 RGB图像降采样为Hi=720，Wi=1280。我们删除最后两层（全局平均池化；分类输出），并使用扩展卷积代替步进卷积。这导致720 × 1280输入的8 ×下采样。在投影之前，我们将特征图双线性插值为Hf=270，Wf=480的形状。对于4 ×下采样，对于Wildtrack和MultiviewX，接地层网格大小分别设置为Hg=120、Wg=360和Hg=160、Wg=250，其中每个像元代表一个10厘米见方。对于空间聚合，我们使用3个卷积层，具有3 × 3核和1，2，4的膨胀。这将使每个地平面位置（单元）的感受野增加到15 × 15平方单元，或1.5 × 1.5平方米。为了训练MVDet，我们使用动量为0.5、L2归一化为5 × 104的SGD优化器。单视图损失的权重α被设置为1。我们使用单周期学习速率调度器[31]，最大学习速率设置为0.1，并在批量大小设置为1的情况下训练10个时期。我们在两个RTX-2080Ti GPU上完成了所有实验。

6.3 实验与实验结果

6.3.1 Method Comparisons

在表2中，我们比较了不同方法中的多视图聚合和空间聚合。对于多视图聚合，以前的方法要么投影单视图检测结果[41，8]，要么使用多视图anchor box特征[4，1]。对于空间聚合，研究了聚类[41]、平均场推断[8，1]和CRF[1，29]。为了与以前的方法进行比较，我们为MVDet创建了以下变体。为了比较无anchor点聚合和基于anchor点的方法，我们创建了“MVDet（w/o large kernel）”，它删除了大核卷积。这个变体是作为与DeepMCD[4]的直接比较而创建的，两者都不包括空间聚合。为了比较不同的投影选择（第3.1节），我们包括两种变体，它们要么投影RGB图像像素“MVDet（投影图像）”，要么投影单视图检测结果“MVDet（投影结果）”。“MVDet（w/o large kernel）”也显示了空间聚合的有效性。所有变体都遵循与原始MVDet相同的训练协议。

6.3.2 Evaluation of MVDet

6.3.2.1 Comparison against state-of-the-art methods

在表3中，我们比较了MVDet与多种最先进的多视角行人检测方法的性能。由于有些方法没有可用的代码，为了在MultiviewX上进行公平的比较，我们尽可能地重新实现这些方法。在Wildtrack数据集上，MVDet实现了88.2%的MODA，比以前的技术水平提高了+14.1%。在MultiviewX数据集上，MVDet实现了83.9%的MODA，比我们实现的深度遮挡增加了8.7%[1]。MVDet在两个数据集上也实现了最高的MODP和召回率，但在精度方面略落后于深度遮挡。值得一提的是，DeepOcclusion在精度方面优于MVDet，但在召回率落后

这表明他们的CNN-CRF方法在抑制假阳性方面非常好，但有时有错过一些目标的趋势

6.3.2.2 Effectiveness of anchor-free multiview aggregation

即使没有空间聚合，“MVDet（w/o大内核）”在Wildtrack数据集上实现了76.9%的MODA，在MultiviewX数据集上实现了77.2%的MODA。事实上，它在两个数据集上分别略微超过当前最先进水平+2.8%和+2.0%。高性能证明了我们通过特征地图投影进行无anchor聚合的有效性。在第3.1节中，我们假设不准确的anchor box可能会导致不太准确的聚合特征，因此提出了一种无anchor方法。在表3中，我们通过比较基于anchor的DeepMCD[4]和无anchor的“MVDet（w/o大内核）”来证明我们的无anchor方法的有效性，两者都不包括空间聚合。MVDet的变体在Wildtrack数据集上比DeepMCD高9.1%，在MultiviewX数据集上比MODA高7.2%，这表明当anchor box不准确时，无anchor特征地图投影可以成为多视图行人检测中多视图聚合的更好选择。

与MultiviewX数据集上的多视图anchor定框要素相比，要素地图投影带来的改进较少（MultiviewX上的改进为+7.2%，而Wildtrack上的改进为+9.1%）。这是因为MultiviewX数据集有合成人，而Wildtrack捕捉的是真实世界的行人。自然，在现实世界的场景中，人类身高和宽度的差异更大，因为合成人的尺寸非常相似。这表明现实世界数据集Wildtrack的anchor定框平均不太精确。因此，通过要素地图投影进行聚合会对Wildtrack数据集带来更大的改进。

6.3.2.3 Comparison between different projection choices

在3.1节中，我们声称投影特征图是比投影RGB图像或单视图结果更好的选择。投影RGB图像破坏了像素之间的空间关系，单个RGB像素代表的信息很少。因此，在表3中，我们发现“MVDet（项目图像）”导致两个数据集的性能都很差（26.8%和19.5%MODA）。虽然单视图结果对投影的空间模式中断是鲁棒的，但是其中包含的信息是有限的。由于拥挤和遮挡，单视图检测可能会失去许多真正的阳性。因此，像“RCNN&聚类”[41]中那样对这些预测的单视图结果进行聚类被证明是极其困难的（11.3%和18.7%MODA）。用大核卷积“MVDet（项目结果）”替换聚类大大提高了性能（68.2%和73.2%MODA），因为它缓解了形成1大小聚类（只有一个组件的聚类，因为检测在遮挡中缺失）的问题，并且可以以端到端的方式进行训练。尽管如此，检测结果中的受限信息阻止了变体的更高性能。

6.3.2.4 Effectiveness of spatial aggregation via large kernel convolution

具有大核卷积的空间聚合在Wildtrack数据集上带来了+11.3%的MODA提升，在MultiviewX数据集上带来了+6.7%的性能提升。相比之下，使用CRF和meanfield推断的空间聚合在两个数据集上分别增加了+6.3%和+5.2%，从DeepMCD到Deep-Occlusion。我们并不断言基于CRF或基于CNN的方法的优越性。我们只是认为，所提出的基于CNN的方法可以有效地聚集空间邻居信息，以解决拥挤或遮挡引起的模糊性，而除了CNN之外，不需要任何设计或操作。如图6所示，大核卷积设法输出更类似于基本事实的结果。

图6。通过大核卷积实现空间聚合的有效性。与“MVDet（w/o大内核）”相比，MVDet输出的占用概率更接近地面事实，尤其是在突出显示的区域。

对于空间聚合，所提出的大核卷积和CRF对MultiviewX数据集的改进较小。如表1所示，即使MultiviewX数据集中的摄像机较少，但MultiviewX数据集中的每个接地层位置平均被更多的摄像机覆盖。对于MultiviewX数据集，每个位置平均被4.41个摄像机（视野）覆盖，而在Wildtrack中为3.74个。更多的摄像机覆盖通常会引入更多的信息并减少模糊度，这也限制了通过空间聚合解决模糊度的性能提升。

6.3.2.5 Influence of different crowdedness and occlusion levels

作为一个合成数据集，MultiviewX有多种可用配置。在图7（左）中，我们显示了在多个拥挤级别下的摄像机视图。随着场景拥挤程度的增加，遮挡也会增加。在图7中（右），我们展示了MVDet在多级遮挡下的性能。随着拥挤和遮挡的增加（更加困难），MVDet和MVDet“MVDet（w/o大内核）”的MODA都降低。此外，由于任务更具挑战性，以及严重的遮挡也会影响空间邻居，空间聚合的性能提升也会下降。

图7。不同拥挤配置下的MultiviewX数据集（左），以及相应的MVDet性能（右）

6.3.2.6 Influence of single view detection loss

在MVDet的默认设置中，对于等式5中的综合损失。α被设定为1。在图8中，我们研究消除单视图损失的影响。在没有单视图检测损失的情况下，我们发现两个数据集的性能损失分别为-1.2%和-2.0%，这两个数据集仍然非常有竞争力。事实上，我们认为单视图足部检测损失不会进一步有利于系统，因为足部点已经在地平面上被监控。另一方面，头部点检测丢失会产生异构监控，从而进一步提高系统性能。如第3.1节和第4.4节所述，不太精确的边界框注释会限制Wildtrack数据集上单视图损失的性能增益。

7 研究结论

在本文中，我们研究了拥挤场景中的行人检测，通过结合多个摄像机视图。具体来说，我们专注于通过多视图聚合和空间聚合来解决由遮挡引起的模糊性，这是多视图行人检测的两个核心方面。对于多视图聚合，我们通过组合投影的特征图来采用无anchor的方法，而不是以前方法中基于anchor的方法。对于空间聚合，不同于以前除了CNN之外还需要设计和操作的方法，我们在完全卷积方法中应用大内核。提出的系统MVDet在Wildtrack数据集上实现了88.2%的MODA，比以前的最先进技术高出14.1%。在MultiviewX（一种用于多视图行人检测的新合成数据集）上，MVDet也取得了极具竞争力的结果。我们相信，建议的MVDet可以作为多视角行人检测的强大基线，鼓励相关领域的进一步研究。

你可能感兴趣的:(CV论文阅读,深度学习,目标检测,计算机视觉)

人工智能之数学基础：数学对人工智能技术发展的作用每天五分钟玩转人工智能机器学习深度学习之数学基础人工智能深度学习机器学习神经网络自然语言处理数学
本文重点数学是人工智能技术发展的基础，它提供了人工智能技术所需的数学理论和算法，包括概率论、统计学、线性代数、微积分、图论等等。本文将从以下几个方面探讨数学对人工智能技术发展的作用。概率论和统计学概率论和统计学是人工智能技术中最为重要的数学分支之一。概率论和统计学的应用范围非常广泛，包括机器学习、数据挖掘、自然语言处理、计算机视觉等领域。在人工智能技术中，概率论和统计学主要用于处理不确定性的问题，
YOLO11改进-模块-引入频率谱动态聚合模块FSDA 去除噪声一勺汤 YOLOv11模型改进系列目标检测魔改模块 YOLO YOLOv11 YOLOv11改进改进
在图像去雾领域，深度学习在白天图像去雾方面成果显著，但夜间雾图研究较少。夜间雾图面临诸多挑战，其中包括雾、辉光和噪声因多个低强度有源彩色光源而具有复杂特性，以及模拟与真实数据的域差异导致的亮度问题。为解决这些，我们使用FSDA模块，处理频率不一致特性。FSDA先对频谱信息聚合，再计算通道权重并应用，最后映射回空间域，以此优化频谱信息，使模型更好处理复杂干扰。本文将其与YOLOv11相结合，增强YO
java 多态 qq_44766305 java 开发语言
面向对象三大特性：封装、继承、多态，今天我们来讲解多态定义:同类型的对象表现出不同的形态这听起来有点抽象，我们举个具体的例子：假设你开了一家宠物店，提供宠物寄养的服务，于是你规定可以给寄养所有的波斯猫，附近的居民都把宠物寄养在这里：//参数是哈士奇类型，执行功能是寄养publicvoidfoster(波斯猫a);但是，这样会出现一个问题，不同居民可能会带不同的种类的猫还有的宠物过来寄养，可是你的寄
基于多头注意机制的多尺度特征融合的GCN的序列数据（功率预测、故障诊断）模型及代码详解清风AI 深度学习算法详解及代码复现人工智能神经网络深度学习 python conda pip pandas
GCN基础在深度学习领域中，图卷积网络(GCN)是一种强大的图数据处理工具。它将卷积操作扩展到图结构上，能够有效捕捉图中节点之间的关系信息。GCN的核心思想是通过聚合邻居节点的特征来更新目标节点的表示，这种局部聚合机制使得GCN能够学习到图的拓扑结构和节点属性。GCN的主要构成要素包括节点特征矩阵、邻接矩阵和卷积核。通过多次迭代，GCN可以逐步学习到图中节点的高阶表示，为后续的分类、预测等任务提供
YOLO魔改之频率分割模块（FDM）清风AI YOLO算法魔改系列 YOLO 人工智能计算机视觉目标检测 python 深度学习
目标检测原理目标检测是一种将目标分割和识别相结合的图像处理技术，旨在从图像中定位并识别特定目标。深度学习方法，如FasterR-CNN和YOLO系列，已成为主流解决方案。这些方法通常采用两阶段或单阶段策略，通过卷积神经网络(CNN)提取特征并进行分类和定位。在小目标检测中，为克服分辨率低和特征不明显的问题，模型设计中会特别注重特征融合和多尺度处理，以增强对小目标的感知能力。YOLOv8基础YOLO
PyTorch模型训练实战指南：掌握动态图特性与工业级部署技巧 lmtealily pytorch 人工智能 python
前言在深度学习领域，PyTorch凭借其动态计算图、高效的自动微分系统及高度Pythonic的设计哲学，已成为学术界与工业界的主流框架。其即时执行模式大幅简化了模型调试流程，而灵活的模块化设计则为复杂模型的构建提供了坚实基础。然而，从实验原型到工业级部署的全链路实践中，开发者仍需系统性掌握框架核心特性与工程化技巧。本文以实战为导向，深入剖析PyTorch动态图机制与自动微分原理，详解从数据预处理、
目标检测YOLO实战应用案例100讲-基于毫米波雷达与摄像头协同的道路目标检测与识别（续）林聪木目标检测 YOLO 人工智能
目录3.2实测数据采集与分析3.2.1回波数据处理3.2.2毫米波雷达数据采集实验3.3基于传统图像特征的目标识别算法3.3.1基于灰度共生矩阵的时频图特征提取3.3.2支持向量机分类器3.3.3实验及结果分析3.4基于卷积神经网络的目标识别算法3.4.1卷积神经网络的基本理论3.4.2卷积神经网络框架设计3.4.3实验及结果分析基于图像的目标检测算法4.1目标检测算法一般流程4.2典型目标检测算
C++20 的 `std::remove_cvref`：简化类型处理的利器码事漫谈 C++20 c++20
文章目录1.`std::remove_cvref`是什么？2.示例代码3.为什么需要`std::remove_cvref`？4.实现原理5.使用场景6.注意事项7.总结在C++20中，标准库引入了许多新特性，其中std::remove_cvref是一个非常实用的类型特征工具，它极大地简化了类型处理的复杂性。1.std::remove_cvref是什么？std::remove_cvref是一个模板结
计算机视觉毕业设计选题推荐：选题技巧建议收藏 HaiLang_IT 毕业设计人工智能计算机视觉
目录前言毕设选题开题指导建议更多精选选题选题帮助最后前言大家好,这里是海浪学长毕设专题!大四是整个大学期间最忙碌的时光，一边要忙着准备考研、考公、考教资或者实习为毕业后面临的升学就业做准备,一边要为毕业设计耗费大量精力。学长给大家整理了人工智能专业最新精选选题，如遇选题困难或选题有任何疑问，都可以问学长哦(见文末)!对毕设有任何疑问都可以问学长哦!更多选题指导:最新最全计算机专业毕设选题精选推荐汇
OpenCV 图像几何变换：旋转，缩放，斜切奈何小洪 OPENCV opencv 图像旋转缩放
几何变换几何变换可以看成图像中物体（或像素）空间位置改变，或者说是像素的移动。几何运算需要空间变换和灰度级差值两个步骤的算法，像素通过变换映射到新的坐标位置，新的位置可能是在几个像素之间，即不一定为整数坐标。这时就需要灰度级差值将映射的新坐标匹配到输出像素之间。最简单的插值方法是最近邻插值，就是令输出像素的灰度值等于映射最近的位置像素，该方法可能会产生锯齿。这种方法也叫零阶插值，相应比较复杂的还有
PyTorch 深度学习实战（19）：离线强化学习与 Conservative Q-Learning (CQL) 算法进取星辰 PyTorch 深度学习实战深度学习 pytorch 算法
在上一篇文章中，我们探讨了分布式强化学习与IMPALA算法，展示了如何通过并行化训练提升强化学习的效率。本文将聚焦离线强化学习（OfflineRL）这一新兴方向，并实现ConservativeQ-Learning(CQL)算法，利用Minari提供的静态数据集训练安全的强化学习策略。一、离线强化学习与CQL原理1.离线强化学习的特点无需环境交互：直接从预收集的静态数据集学习数据效率高：复用历史经验
OpenCV旋转估计（2）用于自动检测波浪校正类型的函数autoDetectWaveCorrectKind() 村北头的码农 OpenCV opencv 人工智能计算机视觉
操作系统：ubuntu22.04OpenCV版本：OpenCV4.9IDE:VisualStudioCode编程语言：C++11算法描述cv::detail::autoDetectWaveCorrectKind是OpenCV中用于自动检测波浪校正类型的函数，它根据输入的旋转矩阵集合来决定使用哪种波浪校正模式。波浪校正（WaveCorrection）是图像拼接过程中的一部分，主要用于纠正由于相机在拍
【IDEA】IDEA常用快捷键（适应包括xml所有类型文件） Ctrl Z. intellij-idea xml java
IntellijIDEA快速编写代码sout等价于System.out.println();soutp等价于System.out.println(“”);soutv等价于System.out.println(“变量名=”+变量);soutm等价于System.out.println(“当前类名.当前方法”);psvm等价于publicstaticvoidmain(String[]args){}In
一切皆是映射：DQN训练加速技术：分布式训练与GPU并行 AI天才研究院计算 AI大模型企业级应用开发实战 ChatGPT 计算科学神经计算深度学习神经网络大数据人工智能大型语言模型 AI AGI LLM Java Python 架构设计 Agent RPA
1.背景介绍1.1深度强化学习的兴起近年来，深度强化学习（DeepReinforcementLearning，DRL）在游戏、机器人控制、自然语言处理等领域取得了令人瞩目的成就。作为一种结合深度学习和强化学习的强大技术，DRL能够使智能体在与环境交互的过程中学习最优策略，从而实现自主决策和控制。1.2DQN算法及其局限性深度Q网络（DeepQ-Network，DQN）是DRL的一种经典算法，它利用
大规模语言模型从理论到实践分布式训练的集群架构 AI智能涌现深度研究 DeepSeek R1 &大数据AI人工智能 Python入门实战计算科学神经计算深度学习神经网络大数据人工智能大型语言模型 AI AGI LLM Java Python 架构设计 Agent RPA
大规模语言模型从理论到实践分布式训练的集群架构作者：禅与计算机程序设计艺术/ZenandtheArtofComputerProgramming1.背景介绍1.1问题的由来随着深度学习技术的飞速发展，大规模语言模型（LargeLanguageModels,LLMs）在自然语言处理（NaturalLanguageProcessing,NLP）领域取得了突破性进展。LLMs，如BERT、GPT-3等，通
图生视频技术的发展与展望：从技术突破到未来图景 Liudef06 Stable Diffusion 音视频人工智能深度学习 stable diffusion
一、技术发展现状图生视频（Image-to-VideoGeneration）是生成式人工智能（AIGC）的重要分支，其核心是通过单张或多张静态图像生成动态视频序列。近年来，随着深度学习、多模态融合和计算硬件的进步，图生视频技术经历了从基础研究到商业落地的快速演进。早期探索与GAN的奠基早期图生视频技术主要基于生成对抗网络（GAN），通过对抗训练生成低分辨率的视频片段。例如，DeepMind的DVD
Python 的 ultralytics 库详解白.夜人工智能
ultralytics是一个专注于计算机视觉任务的Python库，尤其以YOLO（YouOnlyLookOnce）系列模型为核心，提供了简单易用的接口，支持目标检测、实例分割、姿态估计等任务。本文将详细介绍ultralytics库的功能、安装方法、核心模块以及使用示例。1.ultralytics库简介ultralytics库由Ultralytics团队开发，旨在为YOLO系列模型提供高效、灵活且易
【论文阅读】MMedPO：用临床感知多模态偏好优化调整医学视觉语言模型勤奋的小笼包论文阅读语言模型人工智能自然语言处理 chatgpt
MMedPO：用临床感知多模态偏好优化调整医学视觉语言模型1.背景2.核心问题：3.方法：3.实验结果与优势4.技术贡献与意义5.结论MMedPO:AligningMedicalVision-LanguageModelswithClinical-AwareMultimodalPreferenceOptimizationMMedPO：用临床感知多模态偏好优化调整医学视觉语言模型gitgub:地址1.
Springboot整合MyBatis-plus：单条数据查询，批量查询，条件查询，分页查询快乐骑行^_^ 前端和后端开发 Springboot MyBatis-plus 批量查询条件查询分页查询
Springboot整合MyBatis-plus：单条数据查询，批量查询，分页查询一、单条数据查询//单条数据查询@TestpublicvoidtestSelectById(){Stu_infouser=stuMapper.selectById(2
Spring使用@Async出现循环依赖原因以及解决方案 2401_89793006 java spring python java
场景复现1、首先项目需要打开spring的异步开关，在application主类上加@EnableAsync2、创建一个包含了@Async方法的异步类MessageService：@ServicepublicclassMessageService{@ResourceprivateTaskServicetaskService;@Asyncpublicvoidsend(){taskService.sh
Moodle + Websoft9：创新教育的强大组合，助力教学与学习开源软件
Moodle+Websoft9：构建未来课堂的技术基石一、Moodle：开源生态的深度解析•模块化设计：支持超800个官方插件，如H5P交互内容创作、BigBlueButton虚拟课堂，满足个性化教学需求。•学习分析引擎：内置LearningAnalyticsAPI，可集成Python/R语言进行深度学习，预测学生学业风险。•移动优先战略：MoodleApp支持离线学习、扫码签到，2023年新增A
书籍-《动手学深度学习（英文版）》
书籍：DiveintoDeepLearning作者：AstonZhang，ZacharyC.Lipton，MuLi，AlexanderJ.Smola出版：CambridgeUniversityPress编辑：陈萍萍的公主@一点人工一点智能下载：书籍下载-《动手学深度学习（英文版）》01书籍介绍深度学习已经彻底改变了模式识别，为计算机视觉、自然语言处理和自动语音识别等领域提供了强大的工具。应用深度学
Python逆向爬取Tik Tok，MsToken,X-Bogus以及signature 才华是浅浅的耐心 python javascript 前端
自5月起，抖音正式开放Web接口，并不断升级风控机制。从最初的_signature参数，到增加滑块验证，再到如今的JSVM混淆处理，以及mstoken和x-bougs等参数的引入。分析发现，部分国内接口仅需提供Cookie即可访问，无需额外验签，而获取Cookie的方式多种多样，其中利用OpenCV识别滑块验证码是一种简单可行的方法。相比之下，TikTok的接口无需Cookie，但对签名的校验更加
【OpenCV C++】如何快速高效的计算出图像中大于值的像素个数？遍历比较吗？ No，效率太低！那么如何更高效？ R-G-B OpenCV C++opencv c++计算机视觉
文章目录1问题2分析3代码实现（两种方法实现）方法1:使用cv::compare方法2:使用cv::threshold3.2compare和threshold看起来都有二值化效果？那么二者效率？4compare函数解释4.1参数解释4.2底层行为规则4.3应用示例4.4典型应用场景1问题一幅图像的目标区域ROI尺寸为60*35的灰度图，快速计算出大于backVal的像素个数，其中backVal=2
OpenCV第1课OpenCV 介绍及其树莓派下环境的搭建嵌入式老牛树莓派之OpenCV opencv 人工智能计算机视觉
1.机器是如何“看”的我们人类可以通过眼睛看到五颜六色的世界，是因为人眼的视觉细胞中存在分别对红、绿、蓝敏感的3种细胞。其中的光感色素根据光线的不同进行不同比例的分解，从而让我们识别到各种颜色。对人工智能而言，学会“看”也是非常关键的一步。那么机器人是如何看到这个世界的呢？这就涉及到人工智能方向重要的分支--机器视觉。机器视觉即用机器人代替人眼来做测量和判断，通过机器视觉产品（即图像摄取装置，分C
Java通过QRCode生成二维码(1) 2401_84006757 程序员 java 开发语言
QRCode码，是由Denso公司于1994年9月研制的一种矩阵二维码符号，它具有一维条码及其它二维条码所具有的信息容量大、可靠性高、可表示汉字及图象多种文字信息、保密防伪性强等优点。先下载QRCode.jar包：https://pan.baidu.com/s/1Pb9XzWKhumgwaYrE90vyWg二、代码实例1、生成二维码//加密：文字信息->二维码publicstaticvoidenc
使用opencv鼠标回调函数选择ROI区域开门儿大弟子 opencv 人工智能 c++计算机视觉
使用opencv绘制矩形ROI，点击鼠标左键开始绘制，鼠标右键退出绘制并返回矩形左上角和右下角坐标。可绘制多个ROI区域(图中红色区域)/****************************************函数名称:MouseCallbackDrawRect()函数功能:绘制矩形回调函数***************************************/booldrawin
Opencv计算机视觉编程攻略-第一节图像读取与基本处理 weixin_44242403 深度学习 opencv 计算机视觉
1.图像读取导入依赖项的h文件#include#include#include#include项目Valuecore.hpp基础数据结构和操作（图像存储、矩阵运算、文件I/O）highgui.hpp图像显示、窗口管理、用户交互（图像/视频显示、用户输入处理、结果保存）imgproc.hpp图像处理算法（图像滤波、几何变换、边缘检测、形态学操作）二读取图片Matimage;//图像矩阵std::co
C++标准模板（STL）- 类型支持（杂项变换，将 std::remove_cv 与 std::remove_reference 结合，std::remove_cvref）繁星璀璨G #杂项变换 c++标准库模板运行时类型识别杂项变换 remove_cvref
类型特性类型特性定义一个编译时基于模板的结构，以查询或修改类型的属性。试图特化定义于头文件的模板导致未定义行为，除了std::common_type可依照其所描述特化。定义于头文件的模板可以用不完整类型实例化，除非另外有指定，尽管通常禁止以不完整类型实例化标准库模板。杂项变换将std::remove_cv与std::remove_reference结合std::remove_cvreftempla
力扣算法Hot100——75. 颜色分类飞奔的马里奥算法 leetcode java
解法1：当然可以冒泡排序，时间复杂度O(n2n^2n2)解法2：单指针循环两次，第一次循环将所有的0交换到前面；第二次循环将所有的1交换到0的后面classSolution{publicvoidsortColorsBySinglePointer(int[]nums){intzeroCnt=0,p=0;for(inti=0;i
Enum用法不懂事的小屁孩 enum
以前的时候知道enum，但是真心不怎么用，在实际开发中，经常会用到以下代码: protected final static String XJ = "XJ"; protected final static String YHK = "YHK"; protected final static String PQ = "PQ";
【Spark九十七】RDD API之aggregateByKey bit1129 spark
1. aggregateByKey的运行机制 /** * Aggregate the values of each key, using given combine functions and a neutral "zero value". * This function can return a different result type
hive创建表是报错： Specified key was too long; max key length is 767 bytes daizj hive
今天在hive客户端创建表时报错，具体操作如下 hive> create table test2(id string); FAILED: Execution Error, return code 1 from org.apache.hadoop.hive.ql.exec.DDLTask. MetaException(message:javax.jdo.JDODataSto
Map 与 JavaBean之间的转换周凡杨 java 自省转换反射
最近项目里需要一个工具类，它的功能是传入一个Map后可以返回一个JavaBean对象。很喜欢写这样的Java服务，首先我想到的是要通过Java 的反射去实现匿名类的方法调用，这样才可以把Map里的值set 到JavaBean里。其实这里用Java的自省会更方便，下面两个方法就是一个通过反射，一个通过自省来实现本功能。 1：JavaBean类 1 &nb
java连接ftp下载 g21121 java
有的时候需要用到java连接ftp服务器下载，上传一些操作，下面写了一个小例子。 /** ftp服务器地址 */ private String ftpHost; /** ftp服务器用户名 */ private String ftpName; /** ftp服务器密码 */ private String ftpPass; /** ftp根目录 */ private String f
web报表工具FineReport使用中遇到的常见报错及解决办法（二）老A不折腾 finereport web报表 java报表总结
抛砖引玉，希望大家能把自己整理的问题及解决方法晾出来，Mark一下，利人利己。出现问题先搜一下文档上有没有，再看看度娘有没有，再看看论坛有没有。有报错要看日志。下面简单罗列下常见的问题，大多文档上都有提到的。 1、没有返回数据集：在存储过程中的操作语句之前加上set nocount on 或者在数据集exec调用存储过程的前面加上这句。当S
linux 系统cpu 内存等信息查看墙头上一根草 cpu 内存 liunx
1 查看CPU 　　1.1 查看CPU个数　　# cat /proc/cpuinfo | grep "physical id" | uniq | wc -l 　　2 　　**uniq命令：删除重复行;wc –l命令：统计行数** 　　1.2 查看CPU核数　　# cat /proc/cpuinfo | grep "cpu cores" | u
Spring中的AOP aijuans spring AOP
Spring中的AOP Written by Tony Jiang @ 2012-1-18 （转）何为AOP AOP，面向切面编程。在不改动代码的前提下，灵活的在现有代码的执行顺序前后，添加进新规机能。来一个简单的Sample: 目标类： [java] view plain copy print ? package&nb
placeholder(HTML 5) IE 兼容插件 alxw4616 JavaScript jquery jQuery插件
placeholder 这个属性被越来越频繁的使用. 但为做HTML 5 特性IE没能实现这东西. 以下的jQuery插件就是用来在IE上实现该属性的. /** * [placeholder(HTML 5) IE 实现.IE9以下通过测试.] * v 1.0 by oTwo 2014年7月31日 11:45:29 */ $.fn.placeholder = function
Object类,值域,泛型等总结(适合有基础的人看) 百合不是茶泛型的继承和通配符变量的值域 Object类转换
java的作用域在编程的时候经常会遇到,而我经常会搞不清楚这个问题,所以在家的这几天回忆一下过去不知道的每个小知识点变量的值域; package 基础; /** * 作用域的范围 * * @author Administrator * */ public class zuoyongyu { public static vo
JDK1.5 Condition接口 bijian1013 java thread Condition java多线程
Condition 将 Object 监视器方法（wait、notify和 notifyAll）分解成截然不同的对象，以便通过将这些对象与任意 Lock 实现组合使用，为每个对象提供多个等待 set （wait-set）。其中，Lock 替代了 synchronized 方法和语句的使用，Condition 替代了 Object 监视器方法的使用。条件（也称为条件队列或条件变量）为线程提供了一
开源中国OSC源创会记录 bijian1013 hadoop spark MemSQL
一.Strata+Hadoop World（SHW）大会是全世界最大的大数据大会之一。SHW大会为各种技术提供了深度交流的机会，还会看到最领先的大数据技术、最广泛的应用场景、最有趣的用例教学以及最全面的大数据行业和趋势探讨。二.Hadoop &nbs
【Java范型七】范型消除 bit1129 java
范型是Java1.5引入的语言特性，它是编译时的一个语法现象，也就是说，对于一个类，不管是范型类还是非范型类，编译得到的字节码是一样的，差别仅在于通过范型这种语法来进行编译时的类型检查，在运行时是没有范型或者类型参数这个说法的。范型跟反射刚好相反，反射是一种运行时行为，所以编译时不能访问的变量或者方法(比如private)，在运行时通过反射是可以访问的，也就是说，可见性也是一种编译时的行为，在
【Spark九十四】spark-sql工具的使用 bit1129 spark
spark-sql是Spark bin目录下的一个可执行脚本，它的目的是通过这个脚本执行Hive的命令，即原来通过 hive>输入的指令可以通过spark-sql>输入的指令来完成。 spark-sql可以使用内置的Hive metadata-store，也可以使用已经独立安装的Hive的metadata store 关于Hive build into Spark
js做的各种倒计时 ronin47 js 倒计时
第一种：精确到秒的javascript倒计时代码 HTML代码: <form name="form1"> <div align="center" align="middle"
java-37.有n 个长为m+1 的字符串，如果某个字符串的最后m 个字符与某个字符串的前m 个字符匹配，则两个字符串可以联接 bylijinnan java
public class MaxCatenate { /* * Q.37 有n 个长为m+1 的字符串，如果某个字符串的最后m 个字符与某个字符串的前m 个字符匹配，则两个字符串可以联接， * 问这n 个字符串最多可以连成一个多长的字符串，如果出现循环，则返回错误。 */ public static void main(String[] args){
mongoDB安装开窍的石头 mongodb安装基本操作
mongoDB的安装 1:mongoDB下载 https://www.mongodb.org/downloads 2:下载mongoDB下载后解压
[开源项目]引擎的关键意义 comsci 开源项目
一个系统，最核心的东西就是引擎。。。。。而要设计和制造出引擎，最关键的是要坚持。。。。。。现在最先进的引擎技术，也是从莱特兄弟那里出现的，但是中间一直没有断过研发的
软件度量的一些方法 cuiyadll 方法
软件度量的一些方法http://cuiyingfeng.blog.51cto.com/43841/6775/在前面我们已介绍了组成软件度量的几个方面。在这里我们将先给出关于这几个方面的一个纲要介绍。在后面我们还会作进一步具体的阐述。当我们不从高层次的概念级来看软件度量及其目标的时候，我们很容易把这些活动看成是不同而且毫不相干的。我们现在希望表明他们是怎样恰如其分地嵌入我们的框架的。也就是我们度量的
XSD中的targetNameSpace解释 darrenzhu xml namespace xsd targetnamespace
参考链接: http://blog.csdn.net/colin1014/article/details/357694 xsd文件中定义了一个targetNameSpace后，其内部定义的元素，属性，类型等都属于该targetNameSpace,其自身或外部xsd文件使用这些元素，属性等都必须从定义的targetNameSpace中找：例如：以下xsd文件，就出现了该错误，即便是在一
什么是RAID0、RAID1、RAID0+1、RAID5，等磁盘阵列模式? dcj3sjt126com raid
RAID 1又称为Mirror或Mirroring，它的宗旨是最大限度的保证用户数据的可用性和可修复性。 RAID 1的操作方式是把用户写入硬盘的数据百分之百地自动复制到另外一个硬盘上。由于对存储的数据进行百分之百的备份，在所有RAID级别中，RAID 1提供最高的数据安全保障。同样，由于数据的百分之百备份，备份数据占了总存储空间的一半，因而，Mirror的磁盘空间利用率低，存储成本高。 Mir
yii2 restful web服务快速入门 dcj3sjt126com PHP yii2
快速入门 Yii 提供了一整套用来简化实现 RESTful 风格的 Web Service 服务的 API。特别是，Yii 支持以下关于 RESTful 风格的 API：支持 Active Record 类的通用API的快速原型涉及的响应格式（在默认情况下支持 JSON 和 XML) 支持可选输出字段的定制对象序列化适当的格式的数据采集和验证错误
MongoDB查询(3)——内嵌文档查询（七） eksliang MongoDB查询内嵌文档 MongoDB查询内嵌数组
MongoDB查询内嵌文档转载请出自出处：http://eksliang.iteye.com/blog/2177301 一、概述有两种方法可以查询内嵌文档：查询整个文档；针对键值对进行查询。这两种方式是不同的，下面我通过例子进行分别说明。二、查询整个文档例如:有如下文档 db.emp.insert({ &qu
android4.4从系统图库无法加载图片的问题 gundumw100 android
典型的使用场景就是要设置一个头像，头像需要从系统图库或者拍照获得，在android4.4之前，我用的代码没问题，但是今天使用android4.4的时候突然发现不灵了。baidu了一圈，终于解决了。下面是解决方案： private String[] items = new String[] { "图库","拍照" }; /* 头像名称 */
网页特效大全 jQuery等 ini JavaScript jquery css html5 ini
HTML5和CSS3知识和特效 asp.net ajax jquery实例分享一个下雪的特效 jQuery倾斜的动画导航菜单选美大赛示例你会选谁 jQuery实现HTML5时钟功能强大的滚动播放插件JQ-Slide 万圣节快乐！！！向上弹出菜单jQuery插件 htm5视差动画 jquery将列表倒转顺序推荐一个jQuery分页插件 jquery animate
swift objc_setAssociatedObject block(version1.2 xcode6.4) 啸笑天 version
import UIKit class LSObjectWrapper: NSObject { let value: ((barButton: UIButton?) -> Void)? init(value: (barButton: UIButton?) -> Void) { self.value = value
Aegis 默认的 Xfire 绑定方式，将 XML 映射为 POJO MagicMa_007 java POJO xml Aegis xfire
Aegis 是一个默认的 Xfire 绑定方式，它将 XML 映射为 POJO, 支持代码先行的开发.你开发服务类与 POJO,它为你生成 XML schema/wsdl XML 和注解映射概览默认情况下，你的 POJO 类被是基于他们的名字与命名空间被序列化。如果
js get max value in (json) Array qiaolevip 每天进步一点点学习永无止境 max 纵观千象
// Max value in Array var arr = [1,2,3,5,3,2];Math.max.apply(null, arr); // 5 // Max value in Jaon Array var arr = [{"x":"8/11/2009","y":0.026572007},{"x"
XMLhttpRequest 请求 XML,JSON ,POJO 数据 Luob. POJO json Ajax xml XMLhttpREquest
在使用XMlhttpRequest对象发送请求和响应之前，必须首先使用javaScript对象创建一个XMLHttpRquest对象。 var xmlhttp； function getXMLHttpRequest(){ if(window.ActiveXObject){ xmlhttp:new ActiveXObject("Microsoft.XMLHTTP
jquery wuai jquery
以下防止文档在完全加载之前运行Jquery代码，否则会出现试图隐藏一个不存在的元素、获得未完全加载的图像的大小等等 $(document).ready(function(){ jquery代码; }); <script type="text/javascript" src="c:/scripts/jquery-1.4.2.min.js&quo