毕竟是shy哥

DiffusionDet：第一个用于物体检测的扩散模型（DiffusionDet: Diffusion Model for Object Detection）

提出了一种新的框架——DiffusionDet，它将目标检测定义为一个从有噪声的盒子到目标盒子的去噪扩散过程。在训练阶段，目标盒从真实值盒扩散到随机分布，模型学会了逆转这个噪声过程。
在推理中，该模型以渐进的方式将一组随机生成的框细化为输出结果。
贡献：

我们将目标检测制定为生成式去噪过程，这是据我们所知第一个将扩散模型应用于目标检测的研究。
我们的噪声到框检测范例具有几个吸引人的特性，例如动态框的解耦训练和评估阶段以及迭代评估。
我们对COCO、CrowdHuman 和LVIS 基准进行了广泛的实验。与之前成熟的检测器相比，DiffusionDet 取得了良好的性能，尤其是跨不同场景的zero-shot transferring。

1、介绍

之前存在的问题：
DETR提出了可学习的目标查询，消除了手工设计的组件，建立了端到端检测管道，引起了极大的关注。虽然这些工作实现了简单而有效的设计，但它们仍然依赖于一组固定的可学习查询。一个自然的问题是:有没有一种更简单的方法，甚至不需要可学习查询的代理?

为了回答这个问题，我们设计了一个新的框架，它可以直接从一组随机盒子中检测对象。从纯随机盒子开始，不包含训练阶段需要优化的可学习参数，我们期望逐步细化这些盒子的位置和大小，直到它们完美覆盖目标对象。这种噪声盒方法既不需要启发式目标先验，也不需要可学习查询，进一步简化了目标候选，并推动了检测基线的发展。

图1。用于目标检测的扩散模型。(a)扩散模型，其中q是扩散过程，pθ是相反过程。(b)图像生成任务的扩散模型。©我们建议将目标检测作为去噪扩散过程，从有噪声的箱子到目标箱子。

我们的动机如图1所示。我们认为noise-to-box范式的原理类似于去噪扩散模型中的noise-to-image过程，这是一类基于似然的模型，通过学习的去噪模型逐渐去除图像中的噪声，从而生成图像。扩散模型在许多生成任务中都取得了很大的成功，并开始在图像分割等感知任务中得到探索。然而，就我们所知，还没有先前技术成功地将其应用于目标检测。

在这项工作中，我们提出了 DiffusionDet，它通过将检测任务作为图像中边界框的位置（中心坐标）和大小（宽度和高度）在空间上的生成任务，使用扩散模型来处理对象检测任务。
在训练阶段，将由方差表控制的高斯噪声添加到真实图片框以获得噪声框。
然后，这些噪声框用于从主干编码器的输出特征图中裁剪感兴趣区域（RoI）的特征，例如 ResNet 、Swin Transformer 。
最后，这些 RoI 特征被送到检测解码器，该解码器经过训练可以预测无噪声的真实框。通过这个训练目标，DiffusionDet 能够从随机框中预测真实框。
在推理阶段，DiffusionDet 通过反转学习的扩散过程来生成边界框，该过程将噪声先验分布调整为边界框上的学习分布。
作为一种概率模型，DiffusionDet 具有令人着迷的灵活性优势，即我们可以训练一次网络，并在推理阶段的不同设置下使用相同的网络参数，主要包括：
（1）动态框数。利用随机框作为候选对象，我们解耦了 DiffusionDet 的训练和评估阶段，即我们可以用 $N_ {train}\,$ 个随机框训练 DiffusionDet，同时用 $N_ {eval}\,$ 个随机框评估它，其中 $N_ {eval}\,$ 是任意的，不需要等于 $N_ {train}\,$ 。
(2)迭代评估。受益于扩散模型的迭代去噪特性，DiffusionDet可以迭代地重用整个检测头，进一步提高其性能。

表 1. Zero-shot transfer from COCO to CrowdHuman visible box detection.所有模型均使用 300 个盒子进行训练，并使用不同数量的盒子和步骤进行测试。
DiffusionDet的灵活性使得它在探测不同场景(如稀疏或拥挤)中的对象时具有很大的优势，而无需进行额外的微调。具体来说，从表1可以看出，在CrowdHuman数据集上直接对COCOpretraiend模型进行评估时，difffusiondet通过调整评估框的数量和迭代步骤，获得了显著的收益。相比之下，以前的方法只能获得边际增益，甚至性能下降。
此外，我们在 COCO 数据集上评估 DiffusionDet。借助 ResNet-50 主干，DiffusionDet 使用单个采样步骤和 300 个随机框实现了 45.8 AP，显着优于 Faster RCNN (40.2 AP)、DETR (42.0 AP)，与 Sparse R 相当-CNN (45.0 AP)。此外，我们可以通过增加采样步骤和随机框的数量，将 DiffusionDet 进一步提高到 46.8 AP。

2、方法

2.1 扩散模型介绍

在本工作中，我们的目标是通过扩散模型来解决目标检测任务。

在我们的设置中，数据样本是一组包围框 $z_0\,$ = b，其中b∈ $R^{NX4}\,$ 是一组N个框。
训练神经网络 $f_θ\,$ (zt, t, x)，以对应的图像x为条件，从噪声箱 $z_t\,$ 预测 $z_0\,$ ，并相应地产生相应的类别标签c。
在训练过程中，训练神经网络 $f_θ\,$ (zt, t)通过使训练目标loss最小化，从 $z_t\,$ 预测 $z_0\,$ .
在推理阶段，利用模型fθ和更新规则对噪声 $z_t\,$ 进行数据样本 $z_0\,$ .的迭代重构，即:zT→zT−∆→…→z0。
在本工作中，我们的目标是通过扩散模型来解决目标检测任务。在我们的设置中，数据样本是一组包围框z0 = b，其中b∈RN×4是一组N个框。训练神经网络fθ(zt, t, x)，以对应的图像x为条件，从噪声箱zt预测z0，并相应地产生相应的类别标签c。

2.2 模型架构

由于扩散模型迭代生成数据样本，在推断阶段需要多次运行模型Fθ。然而，在每一个迭代步骤中直接对原始图像应用fθ在计算上是困难的。因此，我们提出将整个模型分为图像编码器和检测解码器两个部分，前者只运行一次，从原始输入图像X中提取深度特征表示，后者以该深度特征为条件，而不是原始图像，从噪声盒ZT中逐步细化盒预测。

DiffusionDet 框架。 (a) 图像编码器从输入图像中提取特征表示。检测解码器将噪声框作为输入并预测类别分类和框坐标。

2.2.1 图像编码器

图像编码器将原始图像作为输入，提取其高级特征用于后续检测解码器。
我们使用卷积神经网络(如ResNet)和基于基于Transformer模型(如Swin)实现了扩散。
特征金字塔网络用于生成ResNet和Swin骨干网的多尺度特征特征图。

2.2.2 检测解码器

检测解码器借鉴Sparse R-CNN，将一组proposal box作为输入，从图像编码器生成的feature map中裁剪RoI-feature，并将这些RoI-feature发送到检测头，得到box回归和分类结果。
对于扩散问题，这些建议盒在训练阶段受到真实标记的图像盒的干扰，在评估阶段直接从高斯分布中采样。

(b) 检测解码器在一个检测头中有 6 个阶段，遵循 DETR 和 Sparse R-CNN。此外，DiffusionDet可以多次重复使用这个检测头（有6个阶段），这被称为“迭代评估”。

在DETR或sparse r-cnn或deformable DETR之后，我们的检测解码器由6个级联阶段组成(图b)。
我们的解码器与Sparse R-CNN解码器的不同之处在于:
(1)DiffusionDet从随机的盒子开始，而Sparse R-CNN在推理中使用的是一组固定的学习的盒子;
(2)稀疏RCNN将建议盒及其对应建议特征作为输入对，DiffusionDet只需要建议盒;
(3) difffusiondet可以以迭代的方式重用检测器头进行评估，在不同的步骤中共享参数，每个步骤通过时间步嵌入指定为扩散过程，称为迭代评估，而Sparse R-CNN在前向传递中只使用一次检测解码器。

2.3 训练

在训练过程中，我们首先构建从真实框到噪声框的扩散过程，然后训练模型来反转该过程。算法 1 提供了 DiffusionDet 训练过程的伪代码。

输入参数：
images: 输入图像数据，形状为[B, H, W, 3]，表示批次中的图像数量及其高度、宽度以及通道数。
gt_boxes: 真实边界框数据，形状为[B, *, 4]，表示批次中每个图像所对应的真实边界框数量（可以是不同数量），每个边界框包含四个坐标。
算法步骤：
对输入图像进行特征编码（通过图像编码器）得到特征表示feats。
将gt_boxes进行填充到同样数量N（proposal boxes的数量）的边界框pb（通过pad_boxes函数），使得每个图像具有相同数量的边界框。
对pb进行信号缩放，将其值从[0, 1]范围内映射到[-scale, scale]范围内。
随机选择一个时间步长t（从0到T）。
生成服从正态分布的噪声eps（均值为0，标准差为1），其维度为[B, N, 4]，用于损坏（corrupt）gt_boxes。
基于当前的时间步长t和信号缩放后的gt_boxes（pb），使用DiffusionDet中的alpha_cumprod函数生成混合因子，对pb和eps进行组合得到损坏的边界框pb_crpt。
基于损坏的边界框pb_crpt和特征表示feats，通过检测解码器detection_decoder生成预测的边界框pb_pred。
计算预测边界框pb_pred与真实边界框gt_boxes之间的损失（通过set_prediction_loss函数）。
返回计算得到的损失（loss）作为训练损失。

3.3.1 图片真实框填充（Ground truth boxes padding）

对于现代目标检测基准，感兴趣的实例数量通常因图像而异。因此，我们首先将一些额外的框填充到原始的groundtruth框，使得所有框加起来为固定数量的Ntrain。我们探索了几种填充策略，例如，重复现有的地面实况框、连接随机框或图像大小的框。连接随机框效果最好。

3.3.2 Box corruption.

我们将高斯噪声添加到填充的真实框中。噪声尺度由αt控制，αt在不同时间步t中采用单调递减的余弦时间表。值得注意的是，地面实况框坐标也需要缩放，因为信噪比对扩散模型的性能有显着影响。我们观察到，与图像生成任务相比，目标检测有利于相对较高的信号缩放值。

3.3.3 训练损失

检测检测器将被破坏的框作为输入，并预测类别分类和框坐标的Ntrain预测。我们将预测损失集应用于 Ntrain 预测集。我们通过最佳传输分配方法选择成本最低的前 k 个预测，为每个基本事实分配多个预测。

3.4 推断

DiffusionDet的推理过程是从噪声到目标框的去噪采样过程。从高斯分布中采样的框开始，模型逐步完善其预测，如算法 2 所示。

输入参数：

images: 输入图像数据，形状为[B, H, W, 3]，表示批次中的图像数量及其高度、宽度以及通道数。
steps: 采样步数，即需要采样多少个时间步长。
T: 总时间步长。
算法步骤：

对输入图像进行特征编码（通过图像编码器）得到特征表示feats。
生成服从正态分布的噪声pb_t（均值为0，标准差为1），其维度为[B, N, 4]，用于初始化边界框预测。
使用linespace生成一个等分线段，其从 -1 开始，到 T 结束，等分成steps份。并且在[0, T]内生成随机时间t_now。
对每个时间区间(t_now, t_next)执行如下操作： a. 基于当前的时间步长t_now和噪声pb_t，通过检测解码器detection_decoder生成预测的边界框pb_pred。 b. 基于预测边界框pb_pred和当前时间t_now以及向前时间t_next，使用ddim_step函数估计t_next时刻的边界框pb_t。 c. 使用box_renewal函数更新边界框pb_t（指将pb_t中的值限制在[0, 1]内）。
返回最终的预测结果pb_pred。

3.4.1 取样步骤

在每个采样步骤中，上一个采样步骤的随机框或估计框被发送到检测解码器以预测类别分类和框坐标。
获得当前步骤的框后，采用DDIM来估计下一步的框。
我们注意到，将没有 DDIM 的预测框发送到下一步也是一种可选的渐进式细化策略。但它会带来显着的恶化。

3.4.2 Box更新

在每个采样步骤之后，预测框可以粗略地分为两种类型：期望的预测和不需要的预测。
所需的预测包含正确位于相应对象处的框，而不需要的预测则任意分布。
直接将这些不需要的框发送到下一次采样迭代不会带来任何好处，因为它们的分布不是由训练中的框损坏构建的。
为了使推理更好地与训练保持一致，我们提出了框更新策略，通过用随机框替换这些不需要的框来恢复它们。
具体来说，我们首先过滤掉分数低于特定阈值的不需要的框。
然后，我们将剩余的框与从高斯分布中采样的新随机框连接起来。

3.4.3 灵活运用

由于随机框的设计，我们可以使用任意数量的随机框和迭代次数来评估 DiffusionDet，而无需等于训练阶段。
作为比较，以前的方法在训练和评估期间依赖相同数量的处理框，并且它们的检测解码器在前向传递中仅使用一次。

3.5 讨论

我们对 DiffusionDet 和之前的多级检测器进行了比较分析。
Cascade R-CNN 采用三阶段预测细化过程，其中三个阶段不共享参数，并且在推理阶段仅用作完整的头一次。
最近的工作采用了与Cascade R-CNN类似的结构，但具有更多阶段（即六个），遵循DETR的默认设置。
虽然 DiffusionDet 的头部也采用了六级结构，但其显着特点是 DiffusionDet 可以多次重复使用整个头部，以实现进一步的性能提升。
然而，现有的工作在大多数情况下无法通过重复使用检测头来提高性能，或者只能实现有限的性能提升。

4、实验

数据集：coco、LVIS v1.0、CrowdHuman

4.1 参数设置处理

ResNet 和 Swin 主干网分别使用 ImageNet-1K 和 ImageNet-21K 上的预训练权重进行初始化。
新添加的检测解码器由 Xavier init 初始化。
我们使用 AdamW 优化器训练 DiffusionDet，初始学习率为 2.5 × 10−5，权重衰减为 10−4。
所有模型均在 8 个 GPU 上使用大小为 16 的小批量进行训练。
默认训练计划是 450K 迭代，学习率在 350K 和 420K 迭代时除以 10。
数据增强策略包括随机水平翻转、调整输入图像大小的尺度抖动（使最短边至少为 480 且最多 800 像素，而最长边最多为 1333 ）以及随机裁剪增强。
我们不使用 EMA 和一些强大的数据增强，如 MixUp 或 Mosaic 。
在推理阶段，我们报告了 DiffusionDet 在不同设置下的性能，这些设置是不同数量的随机框和迭代步骤的组合。每个采样步骤的预测由 NMS 集成在一起以获得最终预测。

4.2 性能

DiffusionDet 的主要特性在于对所有推理案例进行一次训练。

模型训练完成后，可以通过改变框的数量和推理中的迭代步数来使用它，如图 3 和表 1 所示。因此，我们可以将单个 DiffusionDet 部署到多个场景并获得所需的速度- 无需重新训练网络即可进行准确性权衡。

图 3.DiffusionDet 的灵活性。所有实验均在 COCO 2017 训练集上进行训练，并在 COCO 2017 验证集上进行评估。 DiffusionDet 对图 3a 和 3b 中的所有设置使用相同的网络参数。我们提出的 DiffusionDet 能够使用相同的网络参数从更多的提案框和迭代步骤中受益。

4.2.1 动态盒子数量

我们将 DiffusionDet 与 DETR 进行比较，以展示动态框的优势。我们使用官方代码和默认设置进行 300 个训练周期，通过 300 个对象查询重现 DETR 。我们用 300 个随机框训练 DiffusionDet，使候选数量与 DETR 一致，以进行公平比较。评估针对 {50, 100, 300, 500, 1000, 2000, 4000} 个查询或框。
由于可学习的查询在 DETR 的原始设置中训练后是固定的，因此我们提出了一种简单的解决方法，使 DETR 能够处理不同数量的查询：当 Neval < Ntrain 时，我们直接从 Ntrain 查询中选择 Neval 查询；当 Neval > Ntrain 时，我们将现有的 Ntrain 查询克隆到 Neval（也称为克隆）。我们为 DETR 配备了 NMS，因为克隆查询将产生与原始查询相似的检测结果。如图 3a 所示，DiffusionDet 的性能随着用于评估的框数量的增加而稳定增长。例如，当框数从 300 增加到 4000 时，DiffusionDet 可以实现 1.0 AP 增益。相反，克隆更多 DETR 查询（Neval > 300）会导致 DETR 性能从 38.8 略微下降到 38.4 AP，然后是使用更多查询时保持不变。
当 Neval > Ntrain 时，我们还实现了另一种 DETR 方法，连接额外的 Neval − Ntrain 随机初始化查询（也称为连接随机）。采用这种策略，当 Neval 与 Ntrain 不同时，DETR 的性能会明显下降。此外，当 Neval 和 Ntrain 之间的差异增大时，这种性能下降会变得更大。例如，当框数增加到4000时，采用concat随机策略的DETR只有26.4个AP，比峰值低12.4（即300个查询时的38.8个AP）。

4.2.2 迭代评估

我们通过将迭代步骤数从 1 增加到 8 来进一步研究我们提出的方法的性能，相应的结果如图 3b 所示。
我们的研究结果表明，随着迭代次数的增加，采用 100、300 和 500 个随机框的 DiffusionDet 模型表现出一致的性能改进。
此外，我们观察到具有较少随机框的 DiffusionDet 往往通过细化获得更实质性的收益。
例如，使用 100 个随机框的 DiffusionDet 实例的 AP 从 41.9（1 步）提高到 46.1（8 步），绝对提高了 4.2 AP。

4.2.3 Zero-shot transferring.

为了进一步验证泛化的有效性，我们在 CrowdHuman 数据集上对 COCOpretrained 模型进行了评估，无需任何额外的微调。
具体来说，我们的重点是 [person] 类的最终平均精度 (AP) 性能。
实验结果如表 1 所示。我们的观察表明，当转移到场景比 COCO 更密集的新数据集时，我们提出的方法（即 DiffusionDet）通过增加评估框或迭代步骤的数量表现出了显着的优势。例如，通过将框的数量从 300 个增加到 2000 个，并将迭代步骤从 1 增加到 4，DiffusionDet 分别实现了 5.3 和 4.8 的显着 AP 增益。
相比之下，以前的方法表现出有限的增益或严重的性能下降，AP 降低了 14.0。 DiffusionDet 令人印象深刻的灵活性意味着它对于各种场景（包括人口稀少和拥挤的环境）的对象检测任务来说是宝贵的资产，而无需任何额外的微调要求。

4.3 检测数据集的基准测试

表 2. COCO 2017 验证集上不同物体检测器的比较。 [S@Neval]表示迭代步数S和评估框Neval的数量。每个方法后面的参考文献表明其结果的来源。没有引用的方法就是我们的实现。

在表 2 中，我们将 DiffusionDet 与 COCO 数据集上的几种最先进的检测器进行了比较。。值得注意的是，我们的 DiffusionDet (1 @ 300) 采用单个迭代步骤和 300 个评估框，在 ResNet-50 主干上实现了 45.8 的 AP，超越了 Faster R-CNN、RetinaNet 等几种成熟方法的性能、DETR 和 Sparse R-CNN 具有相当大的优势。而且，DiffusionDet可以通过增加迭代次数和评估框来进一步增强其优越性。此外，当主干尺寸扩大时，DiffusionDet 显示出稳定的改进。 DiffusionDet 与 ResNet-101 (1 @ 300) 达到 46.7。当使用 ImageNet-21k 预训练的 Swin-Base [60] 作为主干时，DiffusionDet 获得了 52.5 AP，优于 Cascade R-CNN 和 Sparse R-CNN 等强基线。
我们当前的模型仍然落后于一些成熟的作品，如 DINO ，因为它使用了一些更先进的组件，例如可变形注意力、更宽的检测头。其中一些技术与 DiffusionDet 正交，我们将探索将这些技术合并到我们当前的流程中以进一步改进。

表 3. LVIS v1.0 验证集上不同目标检测器的比较。我们使用联合损失[112]重新实现所有检测器，除了浅灰色的行（带†）。

LVIS 上的实验结果如表 3 所示。我们基于 detectorron2重现 Faster R-CNN 和 Cascade R-CNN，而稀疏 R-CNN 则基于其原始代码。我们首先使用 detectorron2 的默认设置重现 Faster R-CNN 和 Cascade RCNN，使用 ResNet50/101 主干网络分别实现 22.5/24.8 和 26.3/28.8 AP（表 3 中的 †）。此外，我们使用中的联合损失来提高它们的性能。由于 LVIS 中的图像以联合方式进行注释[34]，因此负类别注释稀疏，这会恶化训练梯度，特别是对于稀有类别。提出联合损失来缓解这个问题，方法是对每个训练图像的类子集 S 进行采样，其中包括所有正注释和负注释的随机子集。我们选择|S|所有实验中 = 50。 Faster R-CNN 和 Cascade R-CNN 通过联合损失获得大约 3 AP 增益。以下所有比较均基于此损失。
我们看到 DiffusionDet 使用更多的评估步骤（无论是小主干还是大主干）都取得了显着的成果。此外，我们注意到，与 COCO 相比，迭代评估为 LVIS 带来了更多收益。例如，它在 COCO 上的性能从 45.8 增加到 46.6（+ 0.8 AP），而在 LVIS 上从 29.4 增加到 31.5（+2.1 AP），这表明我们的 DiffusionDet 对于更具挑战性的基准测试将变得更有帮助。

4.4. 消融实验

表 4. COCO 上的 DiffusionDet 消融实验。我们报告 AP、AP50 和 AP75。如果不指定，默认设置为：主干网为ResNet-50[37]和FPN[55]，信号尺度为2.0，ground-truth框填充方法为连接高斯随机框，采样时使用DDIM和框更新步。默认设置以灰色标记。

我们在 COCO 上进行消融实验来详细研究 DiffusionDet。所有实验均使用以 FPN 为骨干的 ResNet-50 和 300 个随机框进行推理，无需进一步说明。

4.4.1 信号缩放

信号缩放因子控制扩散过程的信噪比 (SNR)。
我们研究了表 4a 中比例因子的影响。
结果表明，缩放因子 2.0 实现了最佳 AP 性能，优于图像生成任务中的标准值 1.0 [14, 38] 和用于全景分割的标准值 0.1 。
我们解释说，这是因为一个框只有四个表示参数，即中心坐标（cx，cy）和框大小（w，h），这大致类似于图像生成中只有四个像素的图像。
框表示比密集表示更脆弱，例如全景分割中的 512 × 512 掩模表示。
因此，与图像生成和全景分割相比，DiffusionDet 更喜欢具有更高信噪比的更简单的训练目标。

4.4.2 GT盒子填充策略

我们需要将额外的框填充到原始的真实框，以便每个图像具有相同数量的框。
我们研究了表4b中不同的填充策略，包括
（1）均匀地重复原始的ground Truth box，直到总数达到预定义值Ntrain；
(2)填充遵循高斯分布的随机框；
(3) 填充遵循均匀分布的随机框；
（4）与整个图像大小相同的填充框。连接高斯随机框最适合 DiffusionDet，我们默认使用此填充策略。

4.4.3 抽样策略

我们在表 4c 中比较了不同的采样策略。
在评估不使用DDIM的DiffusionDet时，我们直接将当前步骤的输出预测作为下一步的输入。
我们发现，当既不采用 DDIM 也不采用盒子更新时，DiffusionDet 的 AP 会随着迭代步数的增加而降低。
此外，仅使用 DDIM 或盒子更新会在 3 个迭代步骤中带来轻微的好处。
此外，当配备 DDIM 和更新时，我们的 DiffusionDet 获得了显着的收益。
这些实验共同验证了采样步骤中 DDIM 和盒子更新的必要性。

4.4.4 Ntrain 和 Neval 之间的匹配

表 5. COCO 上训练和推理框数量之间的匹配。 DiffusionDet 在训练和推理阶段解耦了盒子的数量，并且可以很好地进行灵活的组合。

DiffusionDet 具有使用任意数量的随机框进行评估的吸引人的特性。
为了研究训练框的数量如何影响推理性能，我们分别使用 Ntrain ∈ {100, 300, 500} 随机框训练 DiffusionDet，然后使用 Neval ∈ {100, 300, 500, 1000, 2000} 评估每个模型。
结果总结在表5中。
首先，无论DiffusionDet使用多少个随机框进行训练，准确率都会随着Neval的增加而稳定增加，直到在2000个随机框左右达到饱和点。
其次，当 Ntrain 和 Neval 相互匹配时，DiffusionDet 往往会表现得更好。例如，当 Neval = 100 时，使用 Ntrain = 100 个框训练的 DiffusionDet 表现优于 Ntrain = 300 和 500。

4.4.5 运行时间与准确性

表 6. 运行时间与性能。 † 表示具有 1000 个盒子的 DiffusionDet。 #Stages×#Heads表示训练和测试阶段使用的阶段和头的数量。 Stage 和 Head 的定义如图 2b 所示。

我们研究了 DiffusionDet 在多种设置下的运行时间，这些设置是在小批量大小为 1 的单个 NVIDIA A100 GPU 上进行评估的。我们使用符号 #Stages×#Heads 来指示训练期间使用的阶段和头的数量和测试阶段，如图 2b 所示，我们的调查结果如表 6 所示。
首先，我们的研究结果表明，具有单个迭代步骤和 300 个评估框的 DiffusionDet 表现出与 Sparse R-CNN 相当的速度，分别实现了 30 和 31 帧每秒 (FPS)。 DiffusionDet 还在 CrowdHuman 上展示了类似的零样本传输性能，同时以 45.8 AP 优于 Sparse R-CNN，而 COCO 上的 AP 为 45.0。此外，Sparse R-CNN 两次利用这六个阶段导致 COCO 上的 AP 下降了 1.4（从 45.0 到 43.6），而 CrowdHuman 上的 AP 下降了 6.0（从 66.6 到 60.6）。同样，DETR 在 COCO 上的性能下降了 0.4，但在 CrowdHuman 上的性能却提高了 1.2。
当增加迭代步数时，DiffusionDet 在 COCO 上实现了 0.7 AP 增益，在 CrowdHuman 上实现了 3.1 AP 增益。 DiffusionDet 通过 1000 个评估框获得了明显的性能提升。然而，DETR 和 Sparse R-CNN 都无法通过额外的迭代步骤实现性能提升。即使我们将级数扩大到 12，也会导致 Sparse R-CNN 的性能下降。
值得注意的是，在这项工作中，我们利用了最基本的扩散策略 DDIM 来开创性地探索使用生成模型进行感知任务。与生成任务中使用的 Diffusion 模型类似，DiffusionDet 可能会遇到采样速度相对较慢的问题。尽管如此，最近提出了一系列工作来提高扩散模型的采样效率。例如，最新的一致性模型提出了一种扩散模型的快速一步生成方法。我们相信，更先进的扩散策略可能会解决 DiffusionDet 速度性能下降的问题，我们计划在未来的工作中对此进行探索。

4.4.6 随机种子

图 4. 5 个独立训练实例的统计结果，每个实例使用不同的随机种子评估 10 次。

由于 DiffusionDet 在推理开始时被给予随机框作为输入，因此人们可能会问不同随机种子之间是否存在较大的性能差异。我们通过使用除随机种子之外的相同配置独立训练五个模型来评估 DiffusionDet 的稳定性。然后，受前人的启发，我们使用十个不同的随机种子评估每个模型实例，以测量性能分布。如图4所示，大多数评估结果都紧密分布在45.7 AP上。此外，不同模型实例之间的性能差异很小，这表明 DiffusionDet 对随机框具有鲁棒性并产生可靠的结果。

4.5.对 CrowdHuman 进行全面调整

除了4.2节中讨论的从COCO到CrowdHuman的跨数据集泛化评估之外，我们进一步在CrowdHuman上全面调整DiffusionDet。比较结果如表7所示。我们看到，与之前的方法相比，DiffusionDet 取得了更优越的性能。例如，通过单步和 1000 个框，DiffusionDet 获得 90.1 AP50，优于具有 1000 个框的稀疏 RCNN。此外，进一步将盒子增加到3000个和迭代步骤都可以带来性能提升。

5.结论

在这项工作中，我们提出了一种新颖的检测范例，DiffusionDet，将对象检测视为从噪声框到对象框的去噪扩散过程。我们的噪声到盒子管道具有几个吸引人的特性，包括盒子的动态数量和迭代评估，使我们能够使用相同的网络参数进行灵活的评估，而无需重新训练模型。标准检测基准的实验表明，与成熟的检测器相比，DiffusionDet 实现了良好的性能。

你可能感兴趣的:(CV前沿论文,目标检测,目标跟踪,人工智能,计算机视觉)

【论文复现】——基于SIFT特征点结合ICP的点云配准方法点云侠点云配准专题开发语言计算机视觉算法 3d c++
目录一、论文概述二、代码实现三、结果展示1、初始位置2、配准结果四、实验心得一、论文概述在点云配准过程中，针对迭代最近点(ICP)算法对点云初始位置依赖性强且迭代速度慢的问题，提出一种基于尺度不变特征变换(SIFT)特征点结合ICP的点云配准方法。首先利用SIFT算法提取待配准点云和目标点云的特征点;接着计算出特征点的快速点特征直方图(FPFH)特征;然后依据该特征使用采样一致性初始配准(SA
.net 4.0环境异步方法实现，异步委托和回调异常处理蔚蓝星空-大强异步多线程 c#asp.net
.net4.0环境异步方法实现，异步委托和回调异常处理无返回值的异步方法通过委托实现staticvoidMain(string[]args){//异步执行写入数据任务，不阻塞主线程任务SetDataAsync(1);Console.WriteLine("主线程后续任务...");Console.ReadKey();}publicstaticvoidSetDataAsync(intnum){//这里
Description of a Poisson Imagery Super Resolution Algorithm 论文阅读青铜锁00 论文阅读 Radar 论文阅读
DescriptionofaPoissonImagerySuperResolutionAlgorithm1.研究目标与意义1.1研究目标1.2实际意义2.创新方法与模型2.1核心思路2.2关键公式与推导2.2.1贝叶斯框架与概率模型2.2.2MAP估计的优化目标2.2.3超分辨率参数α2.3对比传统方法的优势3.实验验证与结果3.1实验设计3.2关键结果4.未来研究方向（实波束雷达领域）4.1挑战
《基于自适应正负样本对比学习的特征提取框架》-核心公式提炼简洁版 2022年neural networks 阳光明媚大男孩学习深度学习人工智能论文笔记
论文源地址以下是从文档中提取的关于“基于对比学习的特征提取框架（CL-FEFA）”中正负样本对比学习实现的技术细节，包括详细的数学公式、特征提取过程以及特征表示方式的说明。1.正负样本的定义与构造在CL-FEFA框架中，正负样本的定义是动态且自适应的，基于特征提取的结果，而不是预先固定的。这种自适应性是CL-FEFA区别于传统对比学习（如SimCLR、SupCon）的一个关键点。定义方式：指示矩阵
Sklearn.model_selection.GridSearchCV kakak_ Machine Learning
sklearn.model_selection.GridSearchCV具体在scikit-learn中，主要是使用网格搜索，即GridSearchCV类。estimator:即调整的模型param_grid：即要调参的参数列表，以dict呈现。cv:S折交叉验证的折数，即将训练集分成多少份来进行交叉验证。默认是3,。如果样本较多的话，可以适度增大cv的值。scoring:评价标准。获取最好的模型
大模型学习终极指南：从新手到专家的必经之路，全网最详尽解析，你敢挑战吗？大模型入门教程学习人工智能 AI 大模型大模型学习大模型教程 AI大模型
随着人工智能技术的飞速发展，大模型（Large-ScaleModels）已经成为推动自然语言处理（NLP）、计算机视觉（CV）等领域进步的关键因素。本文将为您详细介绍从零开始学习大模型直至成为专家的全过程，包括所需掌握的知识点、学习资源以及实践建议等。无论您是初学者还是有一定基础的专业人士，都能从中获得有价值的指导。一、基础知识准备在开始学习大模型之前，需要先掌握一些基础知识，这些知识将为后续的学
机器学习——KNN超参数练习AI两年半机器学习人工智能深度学习
sklearn.model_selection.GridSearchCV是scikit-learn中用于超参数调优的核心工具，通过结合交叉验证和网格搜索实现模型参数的自动化优化。以下是详细介绍：一、功能概述GridSearchCV在指定参数网格上穷举所有可能的超参数组合，通过交叉验证评估每组参数的性能，最终选择最优参数组合。其核心价值在于：自动化调参：替代手动参数调试，提升效率3。交叉验证支持：通
编程内容简述！恶霸不委屈开发语言青少年编程汇编 java python
编程是指通过计算机语言来开发软件、程序和应用的过程，通常通过编写一系列的指令，来让计算机完成特定的任务。编程可以涉及多个领域和技术，以下是一些主要的编程内容：1.编程语言编程语言是程序员与计算机进行沟通的桥梁，不同的编程语言适用于不同的任务。常见的编程语言有：Python：简单易学，适用于数据分析、人工智能、网页开发等。JavaScript：网页开发中不可或缺的语言，用于动态网页和前端开发。Jav
【图像去噪】论文精读：CVPR 2025 | DnLUT: Ultra-Efficient Color Image Denoising via Channel-Aware Lookup Tables 十小大图像去噪深度学习计算机视觉人工智能图像处理论文阅读论文笔记
请先看【专栏介绍文章】：【图像去噪（ImageDenoising）】关于【图像去噪】专栏的相关说明，包含适配人群、专栏简介、专栏亮点、阅读方法、定价理由、品质承诺、关于更新、去噪概述、文章目录、资料汇总、问题汇总（更新中）文章目录前言Abstract1.Introduction2.Relatedworks2.1.ColorImagedenoising2.2.ReplacingCNNwithLUT3
大模型Agent 和 RAG 的关系大数据追光猿大模型语言模型人工智能学习方法 transformer
Agent和RAG（Retrieval-AugmentedGeneration）是两种在自然语言处理（NLP）和人工智能领域中广泛使用的技术，它们在功能、目标和实现方式上既有区别又有联系。以下是它们的关系及其协同作用的详细分析。1.Agent和RAG的定义（1）Agent定义：Agent是一种智能体，能够感知环境并采取行动以完成特定任务。在NLP领域，Agent通常指一个基于大语言模型（LLM）的
国产模型能否挑战 GPT-4？一文拆解 DeepSeek-V3 架构与实战应用 AI筑梦师人工智能学习框架架构深度学习 python agi 人工智能 tensorflow
✳️一、引言✅1.1DeepSeek-V3发布背景与定位随着大模型技术的快速演进，从GPT-3到GPT-4，全球在通用人工智能方向取得了长足进展。但与此同时，开源社区始终缺乏一个真正兼顾性能、效率、中文能力和实用性的高质量大模型。DeepSeek-V3的推出正是在这个背景下的一次关键突破。DeepSeek-V3是由中国团队DeepSeek开发的第三代大语言模型，它具备以下几个核心特性：开源可商用：
Github上神仙级大模型项目：大语言模型(LLM)入门学习路线图，三个月让你从大模型基础到精通！ AI大模型-大飞 github 语言模型学习人工智能 AI大模型程序员 AI
Github项目上有一个大语言模型学习路线笔记，它全面涵盖了大语言模型的所需的基础知识学习，LLM前沿算法和架构，以及如何将大语言模型进行工程化实践。这份资料是初学者或有一定基础的开发/算法人员入门活深入大型语言模型学习的优秀参考。这份资料重点介绍了我们应该掌握哪些核心知识，并推荐了一系列优质的学习视频和博客，旨在帮助大家系统性地掌握大型语言模型的相关技术。大语言模型（LargeLanguageM
Agent、RAG、LangChain的概念及作用北极冰雨大模型人工智能
Agent：概念：在人工智能中，Agent通常指的是能够执行任务或做出决策的实体，可以是简单的程序，也可以是复杂的系统，如自动化客服助手、推荐系统等，甚至可以是软件代理、机器人或虚拟助手等各种形式。作用：它能利用内置的大语言模型来做出规划，决定执行哪些步骤，以及每个步骤需要调用哪些工具（如RAG），之后调用相应的工具，最终完成任务。例如，在客服问答场景中，Agent可以根据用户的问题，规划出需要查
QHDBO基于量子计算和多策略融合的蜣螂优化算法算法小狂人算法改进智能优化算法量子计算算法
2.DBO基本的蜣螂算法通过模拟蜣螂在自然界中的四种行为（滚动、产卵、觅食和偷窃）来执行种群位置更新。2.1滚动蜣螂在自然界中，蜣螂必须通过太阳导航，使其球滚动的路线尽可能直线。方程(1)用于原始论文中更新滚动蜣螂的位置：xi(t+1)=xi(t)+α⋅k⋅xi(t−1)+b⋅Δx(1)x_i(t+1)=x_i(t)+\alpha\cdotk\cdotx_i(t-1)+b\cdot\Deltax\
DeepSeek多语言AI高效应用实践智能计算研究中心其他
内容概要在人工智能技术快速迭代的背景下，DeepSeek系列模型凭借混合专家架构（MoE）与670亿参数规模，在多语言处理、视觉语言理解及复杂任务生成领域实现了突破性进展。本文系统性拆解其技术架构设计逻辑，聚焦论文写作、代码生成、SEO关键词拓展三大核心场景，分析模型在高生成质量、低使用成本维度的差异化优势。技术维度DeepSeekProver传统单模态模型多语言支持97种语言动态切换单一语种优化
10分钟读完《每天最重要的2小时》读书周盛欢读书
关于作者乔西・戴维斯（JoséDavis），美国知名作家、演讲家和效率专家。他长期致力于研究人类行为、认知科学以及时间管理等领域，通过结合前沿科学研究成果与实际案例，为读者提供实用且有效的个人成长建议。其作品风格深入浅出，深受广大读者喜爱与认可。关于本书《每天最重要的2小时》是一本聚焦于时间管理与个人效率提升的实用指南。书中，作者乔西・戴维斯基于神经科学、心理学等多学科研究成果，深入剖析了人们在日
维普AIGC降重方法有哪些？ hjehheje AIGC
在学术写作和论文创作中，重复率过高是许多人面临的一大难题。随着科技的发展，维普AIGC为我们提供了一系列有效的降重方法。那么，维普AIGC降重方法有哪些呢？接下来就为大家详细介绍。语义理解与改写维普AIGC具备强大的语义理解能力。例如，当我们面对一段论述市场趋势的文字时，它能精准把握核心含义。假设原文是“当前智能手机市场呈现出快速增长的趋势，消费者对高性能手机的需求日益旺盛”，维普AIGC可能会将
java语言map的五种遍历方法 0319zz Java细节 java 开发语言
publicstaticvoidmain(String[]args){Mapmap=newHashMapentry:map.entrySet()){Stringkey=entry.getKey();Integervalue=entry.getValue();System.out.println("Key:"+key+",Value:"+value);}//第二种：使用for-each循环和keyS
AI大模型训练教程 Small踢倒coffee_氕氘氚 python自学经验分享笔记
1.引言随着人工智能技术的快速发展，大模型（如GPT-3、BERT等）在自然语言处理、计算机视觉等领域取得了显著的成果。训练一个大模型需要大量的计算资源、数据和专业知识。本教程将带你了解如何从零开始训练一个AI大模型。2.准备工作2.1硬件要求GPU：推荐使用NVIDIA的高性能GPU，如A100、V100等。内存：至少64GBRAM。存储：SSD存储，至少1TB。#2.2软件环境操作系统：Lin
使用Jupyter Notebook进行深度学习编程 - 深度学习教程 shandianfk_com ChatGPT AI jupyter 深度学习 ide
大家好，今天我们要聊聊如何使用JupyterNotebook进行深度学习编程。深度学习是人工智能领域中的一项重要技术，通过模仿人脑神经网络的方式进行学习和分析。JupyterNotebook作为一个强大的工具，可以帮助我们轻松地进行深度学习编程，尤其适合初学者和研究人员。本文将带领大家一步步了解如何在JupyterNotebook中开展深度学习项目。一、什么是JupyterNotebook？Jup
Opencv之计算机视觉一闭月之泪舞计算机视觉计算机视觉 opencv python
一、环境准备使用opencv库来实现简单的计算机视觉。需要安装两个库：opencv-python和opencv-contrib-python，版本可以自行选择，注意不同版本的opencv中的某些函数名和用法可能不同pipinstallopencv-python==3.4.18.65-ihttps://pypi.tuna.tsinghua.edu.cn/simplepipinstallopencv-
计算机视觉总结 Trank-Lw 计算机视觉深度学习人工智能
以下是针对上述问题的详细解答，并结合代码示例进行说明：1.改进YOLOv5人脸检测模块，复杂光照场景准确率从98.2%提升至99.5%优化具体过程：光照补偿：在数据预处理阶段，采用自适应光照补偿算法，对图像进行实时增强，以减少光照变化对人脸检测的影响。数据增强：在训练数据中增加复杂光照场景下的样本，如强光、弱光、背光等，通过数据增强提高模型对不同光照条件的适应性。模型调整：对YOLOv5模型的网络
英伟达常用GPU参数速查表，含B300..... Ai17316391579 深度学习服务器人工智能机器学习服务器电脑计算机视觉深度学习神经网络
英伟达常用GPU参数速查表，收藏备用：含RTX5090、RTX4090D、L40、L20、A100、A800、H100、H800、H20、H200、B200、B300、GB300.....专注于高性能计算人工智能细分领域kyfwq001#5090##4090##英伟达“新核弹”B200发布##英伟达##英伟达B300##GPU##服务器##显卡##英伟达H800/A800芯片将禁售#
IDC权威认证！永洪科技入选 IDC「GBI图谱」，点亮生成式 BI 价值灯塔永洪科技科技人工智能 BI 大数据数据分析
大数据市场正在稳步前进，生成式AI已成为厂商服务的重点方向，其发展离不开数据底座建设和数据工程管理，反过来AI也会帮助开发运维人员、业务人员和管理层更好地使用、查询数据。IDC调研数据显示，在生成式AI的驱动下，未来5年企业在数据管理和数据分析基础设施建设的投资增长率将分别达到8.7%和9.2%。近日，国际咨询机构IDC发布了《中国数据智能市场生态图谱V5.0》，在这一领域，永洪科技以其创新前沿的
打造金融数据新引擎，看永洪科技助力头部农信社搭建一站式分析平台永洪科技金融数据可视化 BI 数据分析大数据
在数字化转型的浪潮中，金融行业作为经济发展的核心引擎，正加速探索数字化、智能化的新路径。永洪科技，近日成功助力某省农村信用社联合社（简称：Z企业）完成了其数字化转型的重要一步，通过部署先进的商业智能解决方案，为Z企业的业务升级与效能提升注入了强劲动力。随着智能金融时代的来临，以大数据、人工智能、移动互联等新兴技术为核心的金融科技持续赋能银行金融业务数字化、智能化、开放化的发展，为金融机构营销体系的
清华DeepSeek教程1至7版，解锁前沿技术 2501_91206263 pdf
清华DeepSeek教程1至7版，解锁前沿技术「DeepSeek清华资料」共7册链接：https://pan.quark.cn/s/b8d8760976ca「DeepSeek使用手册大全」链接：https://pan.quark.cn/s/52c234062a2e「DeepSeek资料合集」链接：https://pan.quark.cn/s/71c8604f0e8a「DeepSeep使用手册」链接
清华出品DeepSeek教程7版合集，一站式掌握前沿技术 2501_91206263 pdf
亲爱的读者们，今天要给大家介绍一套由清华大学出品的超硬核教程——DeepSeek教程7版合集！「DeepSeek清华资料」共7册链接：https://pan.quark.cn/s/b8d8760976ca「DeepSeek使用手册大全」链接：https://pan.quark.cn/s/52c234062a2e「DeepSeek资料合集」链接：https://pan.quark.cn/s/71c8
景联文科技：以高质量数据标注推动人工智能领域创新与发展景联文科技科技人工智能数据标注
在当今这个由数据驱动的时代，高质量的数据标注对于推动机器学习、自然语言处理（NLP）、计算机视觉等领域的发展具有不可替代的重要性。数据标注过程涉及对原始数据进行加工，通过标注特定对象的特征来生成能够被机器学习模型识别和使用的编码格式，从而使数据更具有意义和可解读性。数据标注的主要类型包括：图像标注：指在图片中标识出目标物体的位置、形状或类别等信息，如自动驾驶技术中的行人、车辆及交通标志的识别。文本
人工智能与网络信息技术的深度融合鸭鸭鸭进京赶烤学术会议人工智能 AI编程 ai 机器人计算机视觉网络计算机网络
在当今时代，人工智能（AI）和网络信息技术正以前所未有的速度推动着社会变革。从通用人工智能（AGI）到具身智能的普及，AI不仅实现了技术上的飞跃，也在各个行业展现出巨大的应用潜力。随着技术的不断迭代，我们迎来了许多创新应用，例如AI在电子信息技术中的应用，通过算法优化与升级，显著提高了处理效率和准确性。网络信息技术同样在飞速发展。面向2030年的未来网络发展趋势表明，网络将支撑万亿级、人机物、全时
统一的视频动作模型三谷秋水计算机视觉机器学习人工智能计算机视觉深度学习机器学习人工智能
25年3月来自斯坦福大学的论文“UnifiedVideoActionModel”。统一的视频和动作模型对机器人技术具有重大意义，其中视频为动作预测提供丰富的场景信息，而动作为视频预测提供动态信息。然而，有效地结合视频生成和动作预测仍然具有挑战性，当前基于视频生成的方法在动作准确性和推理速度方面难以与直接策略学习的性能相匹配。为了弥补这一差距，引入统一的视频动作模型（UVA），它联合优化视频和动作预
java Illegal overloaded getter method with ambiguous type for propert的解决 zwllxs java jdk
好久不来iteye,今天又来看看，哈哈,今天碰到在编码时，反射中会抛出 Illegal overloaded getter method with ambiguous type for propert这么个东东，从字面意思看，是反射在获取getter时迷惑了，然后回想起java在boolean值在生成getter时，分别有is和getter，也许我们的反射对象中就有is开头的方法迷惑了jdk，
IT人应当知道的10个行业小内幕 beijingjava 工作互联网
10. 虽然IT业的薪酬比其他很多行业要好，但有公司因此视你为其“佣人”。　　尽管IT人士的薪水没有互联网泡沫之前要好，但和其他行业人士比较，IT人的薪资还算好点。在接下的几十年中，科技在商业和社会发展中所占分量会一直增加，所以我们完全有理由相信，IT专业人才的需求量也不会减少。　　然而，正因为IT人士的薪水普遍较高，所以有些公司认为给了你这么多钱，就把你看成是公司的“佣人”，拥有你的支配
java 实现自定义链表 CrazyMizzz java 数据结构
1.链表结构链表是链式的结构 2.链表的组成链表是由头节点，中间节点和尾节点组成节点是由两个部分组成： 1.数据域 2.引用域 3.链表的实现 &nbs
web项目发布到服务器后图片过一会儿消失麦田的设计者 struts2 上传图片永久保存
作为一名学习了android和j2ee的程序员，我们必须要意识到，客服端和服务器端的交互是很有必要的，比如你用eclipse写了一个web工程，并且发布到了服务器（tomcat）上，这时你在webapps目录下看到了你发布的web工程，你可以打开电脑的浏览器输入http://localhost:8080/工程/路径访问里面的资源。但是，有时你会突然的发现之前用struts2上传的图片
CodeIgniter框架Cart类 name 不能设置中文的解决方法 IT独行者 CodeIgniter Cart 框架　
今天试用了一下CodeIgniter的Cart类时遇到了个小问题，发现当name的值为中文时，就写入不了session。在这里特别提醒一下。在CI手册里也有说明，如下： $data = array( 'id' => 'sku_123ABC', 'qty' => 1, '
linux回收站 _wy_ linux 回收站
今天一不小心在ubuntu下把一个文件移动到了回收站，我并不想删，手误了。我急忙到Nautilus下的回收站中准备恢复它，但是里面居然什么都没有。后来我发现这是由于我删文件的地方不在HOME所在的分区，而是在另一个独立的Linux分区下，这是我专门用于开发的分区。而我删除的东东在分区根目录下的.Trash-1000/file目录下，相关的删除信息（删除时间和文件所在
jquery回到页面顶端知了ing html jquery css
html代码： <h1 id="anchor">页面标题</h1> <div id="container">页面内容</div> <p><a href="#anchor" class="topLink">回到顶端</a><
B树、B-树、B+树、B*树矮蛋蛋 B树
原文地址： http://www.cnblogs.com/oldhorse/archive/2009/11/16/1604009.html B树即二叉搜索树： 1.所有非叶子结点至多拥有两个儿子（Left和Right）； &nb
数据库连接池 alafqq 数据库连接池
http://www.cnblogs.com/xdp-gacl/p/4002804.html @Anthor:孤傲苍狼数据库连接池用MySQLv5版本的数据库驱动没有问题，使用MySQLv6和Oracle的数据库驱动时候报如下错误： java.lang.ClassCastException: $Proxy0 cannot be cast to java.sql.Connec
java泛型百合不是茶 java泛型
泛型在Java SE 1.5之前，没有泛型的情况的下，通过对类型Object的引用来实现参数的“任意化”，任意化的缺点就是要实行强制转换，这种强制转换可能会带来不安全的隐患泛型的特点：消除强制转换确保类型安全向后兼容简单泛型的定义：泛型：就是在类中将其模糊化，在创建对象的时候再具体定义 class fan
javascript闭包[两个小测试例子] bijian1013 JavaScript JavaScript
一.程序一 <script> var name = "The Window"; var Object_a = { 　　name : "My Object", 　　getNameFunc : function(){ var that = this; 　　　　return function(){ 　　　　
探索JUnit4扩展：假设机制（Assumption） bijian1013 java Assumption JUnit 单元测试
一.假设机制（Assumption）概述理想情况下，写测试用例的开发人员可以明确的知道所有导致他们所写的测试用例不通过的地方，但是有的时候，这些导致测试用例不通过的地方并不是很容易的被发现，可能隐藏得很深，从而导致开发人员在写测试用例时很难预测到这些因素，而且往往这些因素并不是开发人员当初设计测试用例时真正目的，
【Gson四】范型POJO的反序列化 bit1129 POJO
在下面这个例子中，POJO(Data类)是一个范型类，在Tests中，指定范型类为PieceData，POJO初始化完成后，通过 String str = new Gson().toJson(data); 得到范型化的POJO序列化得到的JSON串，然后将这个JSON串反序列化为POJO import com.google.gson.Gson; import java.
【Spark八十五】Spark Streaming分析结果落地到MySQL bit1129 Stream
几点总结： 1. DStream.foreachRDD是一个Output Operation，类似于RDD的action，会触发Job的提交。DStream.foreachRDD是数据落地很常用的方法 2. 获取MySQL Connection的操作应该放在foreachRDD的参数（是一个RDD[T]=>Unit的函数类型)，这样，当foreachRDD方法在每个Worker上执行时，
NGINX + LUA实现复杂的控制 ronin47 nginx lua
安装lua_nginx_module 模块 lua_nginx_module 可以一步步的安装，也可以直接用淘宝的OpenResty Centos和debian的安装就简单了。。这里说下freebsd的安装： fetch http://www.lua.org/ftp/lua-5.1.4.tar.gz tar zxvf lua-5.1.4.tar.gz cd lua-5.1.4 ma
java-递归判断数组是否升序 bylijinnan java
public class IsAccendListRecursive { /*递归判断数组是否升序 * if a Integer array is ascending,return true * use recursion */ public static void main(String[] args){ IsAccendListRecursiv
Netty源码学习-DefaultChannelPipeline2 bylijinnan java netty
Netty3的API http://docs.jboss.org/netty/3.2/api/org/jboss/netty/channel/ChannelPipeline.html 里面提到ChannelPipeline的一个“pitfall”：如果ChannelPipeline只有一个handler（假设为handlerA）且希望用另一handler（假设为handlerB）来
Java工具之JPS chinrui java
JPS使用熟悉Linux的朋友们都知道，Linux下有一个常用的命令叫做ps（Process Status)，是用来查看Linux环境下进程信息的。同样的，在Java Virtual Machine里面也提供了类似的工具供广大Java开发人员使用，它就是jps（Java Process Status)，它可以用来
window.print分页打印 ctrain window
function init() { var tt = document.getElementById("tt"); var childNodes = tt.childNodes[0].childNodes; var level = 0; for (var i = 0; i < childNodes.length; i++) {
安装hadoop时执行jps命令Error occurred during initialization of VM daizj jdk hadoop jps
在安装hadoop时，执行JPS出现下面错误 [slave16][email protected]:/tmp/hsperfdata_hdfs# jps Error occurred during initialization of VM java.lang.Error: Properties init: Could not determine current working
PHP开发大型项目的一点经验 dcj3sjt126com PHP 重构
一、变量最好是把所有的变量存储在一个数组中，这样在程序的开发中可以带来很多的方便，特别是当程序很大的时候。变量的命名就当适合自己的习惯，不管是用拼音还是英语，至少应当有一定的意义，以便适合记忆。变量的命名尽量规范化，不要与PHP中的关键字相冲突。二、函数 PHP自带了很多函数，这给我们程序的编写带来了很多的方便。当然，在大型程序中我们往往自己要定义许多个函数，几十
android笔记之--向网络发送GET/POST请求参数 dcj3sjt126com android
使用GET方法发送请求 private static boolean sendGETRequest (String path, Map<String, String> params) throws Exception{ //发送地http://192.168.100.91:8080/videoServi
linux复习笔记之bash shell (3) 通配符 eksliang linux 通配符 linux通配符
转载请出自出处： http://eksliang.iteye.com/blog/2104387 在bash的操作环境中有一个非常有用的功能，那就是通配符。下面列出一些常用的通配符，如下表所示符号意义 * 万用字符，代表0个到无穷个任意字符 ? 万用字符，代表一定有一个任意字符 [] 代表一定有一个在中括号内的字符。例如：[abcd]代表一定有一个字符，可能是a、b、c
Android关于短信加密 gqdy365 android
关于Android短信加密功能，我初步了解的如下（只在Android应用层试验）： 1、因为Android有短信收发接口，可以调用接口完成短信收发；发送过程：APP（基于短信应用修改）接受用户输入号码、内容——>APP对短信内容加密——>调用短信发送方法Sm
asp.net在网站根目录下创建文件夹 hvt .net C#hovertree asp.net Web Forms
假设要在asp.net网站的根目录下建立文件夹hovertree,C#代码如下： string m_keleyiFolderName = Server.MapPath("/hovertree"); if (Directory.Exists(m_keleyiFolderName)) { //文件夹已经存在 return; } else { try { D
一个合格的程序员应该读过哪些书 justjavac 程序员书籍
编者按：2008年8月4日，StackOverflow 网友 Bert F 发帖提问：哪本最具影响力的书，是每个程序员都应该读的？ “如果能时光倒流，回到过去，作为一个开发人员，你可以告诉自己在职业生涯初期应该读一本，你会选择哪本书呢？我希望这个书单列表内容丰富，可以涵盖很多东西。” 很多程序员响应，他们在推荐时也写下自己的评语。以前就有国内网友介绍这个程序员书单，不过都是推荐数
单实例实践跑龙套_az 单例
1、内部类 public class Singleton { private static class SingletonHolder { public static Singleton singleton = new Singleton(); } public Singleton getRes
PO VO BEAN 理解 q137681467 VO DTO po
PO：全称是 persistant object持久对象最形象的理解就是一个PO就是数据库中的一条记录。好处是可以把一条记录作为一个对象处理，可以方便的转为其它对象。 BO：全称是 business object:业务对象主要作用是把业务逻辑封装为一个对象。这个对
战胜惰性，暗自努力金笛子努力
偶然看到一句很贴近生活的话：“别人都在你看不到的地方暗自努力，在你看得到的地方，他们也和你一样显得吊儿郎当，和你一样会抱怨，而只有你自己相信这些都是真的，最后也只有你一人继续不思进取。”很多句子总在不经意中就会戳中一部分人的软肋，我想我们每个人的周围总是有那么些表现得“吊儿郎当”的存在，是否你就真的相信他们如此不思进取，而开始放松了对自己的要求随波逐流呢？我有个朋友是搞技术的，平时嘻嘻哈哈，以
NDK/JNI二维数组多维数组传递 wenzongliang 二维数组 jni NDK
多维数组和对象数组一样处理，例如二维数组里的每个元素还是一个数组用jArray表示，直到数组变为一维的，且里面元素为基本类型，去获得一维数组指针。给大家提供个例子。已经测试通过。 Java_cn_wzl_FiveChessView_checkWin( JNIEnv* env,jobject thiz,jobjectArray qizidata) { jint i,j; int s