森爱。

NeurIPS-Gold-YOLO: Efficient Object Detector viaGather-and-Distribute Mechanism 论文翻译

论文地址:https://arxiv.org/pdf/2309.11331.pdf

摘要

1介绍

2 相关研究

2.1 实时物体检测器

2.2 基于Transformer的目标检测

2.3 用于目标检测的多尺度特征

3方法

3.1 准备工作

3.2 低阶gather和distribute分支

3.3 高阶收集和分发分支

3.4 增强的跨层信息流

3.5 掩模图像建模预训练

4 实验

4.1 设置数据集

4.2 比较

4.3 消融研究

4.3.1 GD结构的消融研究

4.3.2 LAF的消融研究

4.3.3 其他模型和任务的消融研究

5 结论

摘要

在过去的几年中，YOLO系列模型已成为实时目标检测领域的领先方法。许多研究通过修改架构、增强数据和设计新的损失函数，将基线推向了一个更高的水平。然而，我们发现先前的模型仍然存在信息融合问题，尽管特征金字塔网络（FPN）和路径聚合网络（PANet）已经缓解了这个问题。因此，本研究提出了一种先进的Gather-and-Distribute（GD）机制，该机制通过卷积和自注意力操作实现。这种新设计的模型名为Gold-YOLO，它增强了多尺度特征融合能力，并在所有模型尺度上实现了延迟和精度的平衡。此外，我们首次在YOLO系列中引入了MAE风格的预训练，使得YOLO系列模型能够从无监督预训练中受益。Gold-YOLO-N在COCO val2017数据集上取得了令人出色的39.9%平均精度（AP），在T4 GPU上的帧率达到了1030 FPS，这超过了之前的SOTA模型YOLOv6-3.0-N，在相似的帧率下提高了2.4%。PyTorch代码可在https://github.com/huawei-noah/Efficient-Computing/tree/master/Detection/Gold-YOLO找到，MindSpore代码可在https://gitee.com/mindspore/models/tree/master/research/cv/Gold_YOLO找到。

1介绍

目标检测是一项基础的视觉任务，旨在识别物体的类别并定位其位置。它可以广泛应用于智能安防、自动驾驶、机器人导航和医学诊断等各种应用领域。高性能低延迟的目标检测器在边缘设备上的部署越来越受到关注。

在过去几年中，研究人员对基于卷积神经网络的检测网络进行了广泛研究，将目标检测框架逐渐从两阶段（如Faster RCNN和Mask RCNN）演变为一阶段（如YOLO），以及从基于锚点的方法（如YOLOv3和YOLOv4）过渡到无锚点的方法（如CenterNet、FCOS和YOLOX）。通过NAS，研究者研究了[12, 7, 17]最优网络结构的目标检测任务，而[16, 23, 19]则通过蒸馏探索了提高模型性能的另一种方法。特别是YOLO系列模型，单阶段检测模型由于其简单的结构和速度与准确性之间的平衡而在工业界广受欢迎。

骨干网络的改进也是视觉领域中一个重要的研究方向。正如在调研[20]中所描述的，[26, 27, 59, 21]在精度和速度之间取得了平衡，而[9, 35, 22, 18]在精度方面表现出色。这些骨干网络在不同的视觉任务中改进了原始模型的性能，涵盖了从对象检测到更高级的任务。检测到像图像修复这样的低级任务。通过使用具有变换器的编码器-解码器结构，研究人员构建了一系列类似DETR的目标检测模型，例如DETR [3]和DINO [56]。这些模型可以捕捉对象之间的长距离依赖关系，使基于变压器的检测器能够在速度上达到与大多数经典检测器相当或更好的性能。尽管基于变压器的检测器表现出优异的性能，但与基于卷积神经网络（CNN）的模型相比，它们在速度上还有所不足。基于CNN的小型对象检测模型仍然在速度-准确性平衡方面占主导地位，例如YOLOX [11]和YOLOv6-v8[W3e2, f 4oc8,u s1 4o]n。实时对象检测模型，尤其是适用于移动部署的YOLO系列，是主流的实时对象检测器。主流实时对象检测器由三个部分组成：主干网络、中间网络和头网络。主干网络的架构已经得到广泛研究[41, 43, 9, 35]，而头网络的架构通常非常简单，由几个卷积或全连接层组成。YOLO系列中的中间网络通常使用特征金字塔网络（FPN）及其变种来融合多级特征。这些中间模块基本上遵循图3所示的架构。然而，当前的信息融合方法存在一个明显的缺陷：当需要在不同层之间整合信息时（例如，融合第1层和第3层），传统的FPN-like结构无法无损传输信息，这妨碍了YOLO的更好信息融合。

基于全球信息融合的概念，TopFormer在语义分割任务中取得了显著的成果。在本文中，我们在TopFormer理论的基础上提出了一种新颖的聚集与分发机制（GD），用于在YOLO中全局融合多层次特征并将全局信息注入到更高层次。这显著提升了脖子部分的信息融合能力，同时并不显著增加延迟，改善了模型在不同对象尺寸上的性能。具体而言，GD机制包括两个分支：一个浅层聚集与分发分支和一个深层聚集与分发分支，分别通过一个基于卷积的块和一个基于注意力的块提取和融合特征信息。为了进一步促进信息流动，我们引入了一个轻量级的相邻层融合模块，该模块在局部范围内结合了相邻层次的特征。我们的Gold-YOLO架构超过了现有的YOLO系列，有效验证了我们提出的方法的有效性。
为了进一步提高模型的准确性，我们还引入了一种预训练方法，其中我们使用MAE方法在ImageNet 1K上预训练主干网络，这显著提高了模型的收敛速度和准确性。例如，我们的预训练Gold-YOLO-S在相似速度下实现了46.4%的AP，优于之前的SOTA YOLOv6-3.0-S的45.0%的AP。

图1:Tesla T4 GPU中最先进的高效目标检测器对比。延迟和吞吐量(批大小为32)是一个方便的参考。(a)和(b)用TensorRT 7和8进行测试;分别。

2 相关研究

2.1 实时物体检测器

经过多年的发展，YOLO系列模型已经在实时物体检测领域变得流行起来。YOLOv1-v3 [39, 40, 41] 构建了最初的YOLO模型，实现了单阶段的物体检测检测结构由三个部分组成，骨干-颈部-头部，通过多尺度分支预测不同大小的物体，成为一种代表性的单阶段目标检测模型。YOLOv4[2] 优化了之前使用的darknet骨干结构，并提出了一系列改进，如Mish激活函数、PANet和数据增强方法。YOLOv5 [13] 继承了改进的数据增强策略和更多的模型变体的YOLOv4 [2] 方案。YOLOX [11] 将多正样本、无锚点和解耦头部结合到模型结构中，为YOLO模型设计设定了新的范例。YOLOv6 [32, 31] 首次将重新参数化方法引入到YOLO系列模型中，提出了EfficientRep骨干和Rep-PAN颈部。YOLOv7 [48] 着重分析梯度路径对模型性能的影响，并提出了E-ELAN结构来增强模型的能力而不破坏原始的梯度路径。YOLOv8 [14] 充分发挥了之前YOLO模型的优势，并将它们整合起来，实现了当前YOLO系列的SOTA。

图2:建议的Gold-YOLO架构。

2.2 基于Transformer的目标检测

Vision Transformer (ViT)是对广泛用于不同图像识别任务的卷积神经网络（CNNs）的一种有竞争力的替代方法。 DETR [3]将Transformer结构应用于目标检测任务，重构了检测流程，并消除了许多手动设计的部分和NMS组件，简化了模型设计和整体流程。结合可变形卷积的稀疏采样能力和Transformer的全局关系建模能力，Deformable DETR [61]提高了收敛速度，同时提高了模型的速度和准确性。DINO [56]首次引入了对比去噪、混合查询选择和向前两次方案。最近的RT-DETR [36]改进了编码器-解码器结构，以解决缓慢的DETR-like模型问题，在准确性和速度上超越了YOLO-L/X。然而，DETR-like结构的局限性阻碍了它在小型模型领域展示足够的优势，而YOLO仍然是准确性和速度平衡的SOTA。

2.3 用于目标检测的多尺度特征

传统上，不同层级的特征携带了关于不同大小对象的位置信息。较大的特征包含低维纹理细节和较小对象的位置。相反，较小的特征包含高维信息和较大对象的位置。Feature Pyramid Networks (FPN) [34] 最初的想法是，通过相互协助来增强网络性能。FPN通过跨尺度连接和信息交换提供了一种有效的体系结构设计，从而提高了各种大小对象的检测精度。

在FPN的基础上，Path Aggregation Network (PANet) [49] 集成了一个自底向上的路径，使不同层级之间的信息融合更加充分。同样，EfficientDet [44] 提出了一个可重复使用的模块（BiFPN），以增加不同层级之间信息融合的效率。M2Det [60]引入了一个具有U形和特征融合模块的高效MLFPN架构。Ping-Yang Chen [5]通过使用双向融合模块改善了深层和浅层之间的交互。与这些层间工作不同的是，[37]使用集中式特征金字塔（CFP）方法探索了单独的特征信息。此外，[53]将FPN扩展为具有非相邻层之间交互的渐进特征金字塔网络（AFPN）。针对FPN在检测大对象方面的局限性，[30]提出了一个改进的FPN结构。YOLO-F [6]实现了。然而，由于网络中存在过多的路径和间接的交互方法，传统的FPN融合结构在速度慢、跨层信息交换和信息损失方面仍然存在缺陷。

图3:(a)是传统颈部信息融合结构示例图。(b)及(c)为AblationCAM[38]可视化

3方法

3.1 准备工作

YOLO系列的颈部结构如图3所示，采用传统的FPN结构，包括多个分支用于多尺度特征融合。然而，它只能充分融合相邻层级的特征，对于其他层级的信息，只能间接地递归获取。在图3中，显示了传统FPN的信息融合结构：现有的第1、2和3层级从上到下排列。FPN用于不同层级之间的融合。当第1层级需要从其他两个层级获取信息时，存在两种不同的情况：

1）如果第1层级需要利用第2层级的信息，它可以直接访问和融合这些信息。

2）如果第1层级想要使用第3层级的信息，第1层级应该递归地调用相邻层级的信息融合模块。具体来说，必须首先融合第2层级和第3层级的信息，然后通过将第2层级的信息组合起来，第1层级可以间接获得第3层级的信息。

这种传输模式可能导致在计算过程中丢失大量信息。层级之间的信息交互只能交换被中间层级选择的信息，未被选择的信息在传输过程中被丢弃。这导致特定层级的信息只能充分辅助相邻层级，并减弱对其他全局层级的辅助。因此，信息融合的整体效果可能受到限制。

为了避免传统FPN结构在传输过程中的信息损失，我们放弃了原始的递归方法，构建了一种新颖的聚集和分发机制（GD）。通过使用统一的模块来聚集和融合所有层级的信息，然后将其分发到不同的层级，我们不仅避免了传统FPN结构中固有的信息损失，还增强了颈部部分信息融合的能力，而不会显著增加延迟。因此，我们的方法可以更有效地利用骨干网络提取的特征，并且可以轻松地集成到任何现有的骨干-颈部-头部结构中。

        在我们的实现中，gather和distribute过程涉及到三个模块：特征对齐模块（FAM），信息融合模块（IFM）和信息注入模块（Inject）。
        • gather过程包括两个步骤。首先，FAM从不同的层级收集和对齐特征。其次，IFM融合对齐的特征以生成全局信息。
        • 在从gather过程获取融合的全局信息后，inject模块将此信息分配到每个层级，并使用简单的注意力操作进行注入，从而增强分支的检测能力。
        为了增强模型对不同尺寸对象的检测能力，我们开发了两个分支：低阶gather和distribute分支（Low-GD）和高阶gather和distribute分支（High-GD）。这些分支分别提取和融合大尺寸和小尺寸特征图。详细信息请参见4.1和4.2节。如图2所示，neck的输入包括由backbone提取的特征图B2、B3、B4、B5，其中Bi ∈ RN×CBi×RBi。批量大小由N表示，通道数由C表示，维度由R = H × W表示。此外，RB2、RB3、RB4和RB5的维度分别为R、12R、14R和18R。

3.2 低阶gather和distribute分支

  在该分支中，从backbone中选择输出B2、B3、B4、B5特征进行融合，以获取保留小目标信息的高分辨率特征。结构如图4(a)所示。
低阶特征对齐模块。在低阶特征对齐模块（Low-FAM）中，我们采用平均池化（AvgPool）操作对输入特征进行下采样和统一大小。通过将特征调整为组中最小特征大小（RB4 = 14R），我们获得Falign。低阶FAM技术在最小化计算复杂度的同时，确保信息的高效聚合，并用于后续处理的转换器模块。
        目标对齐大小的选择基于两个相互冲突的考虑:（1）为了保留更多的低级信息，较大的特征尺寸更好；然而，（2）随着特征尺寸的增加，后续块的计算延迟也会增加。为了控制neck部分的延迟，需要保持较小的特征尺寸。
        因此，我们选择RB4作为特征对齐的目标尺寸，以在速度和准确性之间取得平衡。
低阶信息融合模块。低阶信息融合模块（Low-IFM）设计包括多层可参数化卷积块（RepBlock）和分裂操作。具体而言，RepBlock以Falign（通道= sum（CB2，CB3，CB4，CB5））为输入，生成Ffuse（通道= CB4 + CB5）。中间通道是可调节的值（例如256），以适应不同的模型大小。由RepBlock生成的特征随后在通道维度上分割为Finj_P3和Finj_P4，然后与不同层级的特征融合。
公式如下：

信息注入模块。为了更有效地将全局信息注入到不同层级中，我们从分割经验中汲取灵感，并采用注意力操作来融合信息，如图5所示。具体而言，我们输入本地信息（指当前层级的特征），以及全局注入信息（由IFM生成），分别表示为Flocal和Finj。我们使用两个不同的Convs来使用Finj进行计算，得到Fglobal_embed和Fact。而使用Conv使用Flocal计算Flocal_embed。然后，通过注意力计算融合特征Fout。由于Flocal和Fglobal之间的尺寸差异，我们使用平均池化或双线性插值对Fglobal_embed和Fact进行缩放，以使其与Finj的尺寸对齐。在每个注意力融合的最后，我们还添加了RepBlock来进一步提取和融合信息。在低阶段，Flocal等于Bi，所以公式如下：

3.3 高阶收集和分发分支

高GD将由低GD生成的特征{P3，P4，P5}融合在一起，如图4(b)所示。

图4:收集-分布结构。(a)中，Low-FAM和Low-IFM是低阶段特征下层支路的对齐模块和下层支路的信息融合模块。(b),High-FAM和High-IFM是高级特征对准模块和高级信息模块，分别为融合模块。

高阶特征对齐模块。高阶特征对齐模块(High-FAM)由avgpool组成，用于将输入特征的维度减小到统一的尺寸。具体而言，当输入特征的尺寸为{RP 3，RP 4，RP 5}时，avgpool将特征尺寸减小到该组特征中最小的尺寸(RP 5 = 18R)。由于变压器模块提取了高级信息，池化操作有助于信息聚合，同时减少了变换器模块后续步骤的计算需求。
高阶信息融合模块。高阶信息融合模块(High-IFM)包括变压器块(下面会更详细地解释)和一个分割操作，其中包括三个步骤：(1) 使用变压器块将从High-FAM获得的Falign组合起来，得到Ffuse。(2) 通过Conv1×1操作将Ffuse通道减少到sum(CP 4, CP 5)。(3) 通过分割操作将Ffuse沿通道维度划分为Finj_N4和Finj_N5，然后用于与当前层级特征进行融合。
公式如下：

等式8中的变压器融合模块包含若干个堆叠的变压器，其中变压器块的数量用L表示。每个变压器块包括一个多头注意力块、一个前馈网络（FFN）和残差连接。为了配置多头注意力块，我们采用了与LeViT [15]相同的设置，将关键字K和查询Q的头部维度分配为D（例如，16）通道，而V = 2D（例如，32）通道。为了加速推理过程，我们用批归一化替代了速度不友好的操作，即层归一化，用于每个卷积，并将所有GELU激活替换为ReLU。这减小了变压器模块对模型速度的影响。为了建立我们的前馈网络，我们遵循[28, 55]中提出的构建FFN块的方法。为了增强变压器块的局部连接，我们在两个1x1卷积层之间引入了深度可分离卷积层。我们还将FFN的扩展因子设置为2，以平衡速度和计算成本。

图5：信息注入模块和轻量级相邻层融合（LAF）模块

信息注入模块。在High-GD中，信息注入模块与Low-GD中完全相同。在高阶段，Flocal等于Pi，因此公式如下：

3.4 增强的跨层信息流

仅使用全局信息融合结构，我们已经取得了比现有方法更好的性能。为了进一步提高性能，我们从YOLOv6 [31]中的PAFPN模块获得启示，并引入了Inject-LAF模块。该模块是注入模块的增强版本，包括一个轻量级相邻层融合（LAF）模块，添加到注入模块的输入位置。为了在速度和准确性之间取得平衡，我们设计了两个LAF模型：LAF低层模型和LAF高层模型，分别用于低层注入（合并相邻两层的特征）和高层注入（合并相邻一层的特征）。它们的结构如图5（b）所示。为了确保来自不同层级的特征图与目标大小对齐，我们的实现中的两个LAF模型仅使用三种运算符：双线性插值对太小的特征进行上采样，平均池化对太大的特征进行下采样，1x1卷积对与目标通道不同的特征进行调整。我们模型中的LAF模块与信息注入模块的结合有效地平衡了准确性和速度之间的关系。通过使用简化的操作，我们能够增加不同层级之间的信息流路径数量，从而提高性能而不显著增加延迟。

3.5 掩模图像建模预训练

最近的方法，如BEiT [1]、MAE [24]和SimMIM [51]，已经证明了掩模图像建模（MIM）对视觉任务的有效性。然而，这些方法并非专门为卷积网络（convnets）定制。SparK [45]和ConvNeXt-V2 [50]是在探索掩模图像建模在卷积网络中的潜力方面的先驱。

在这项研究中，我们采用了基于SparK [45]方法的MIM预训练，成功地识别并克服了将MAE风格的预训练成功扩展到卷积网络（convnets）时的两个关键障碍。这些挑战包括卷积操作无法处理不规则和随机遮罩的输入图像，以及BERT预训练的单尺度性质与卷积网络的分层结构之间的不一致性。为了解决第一个问题，未遮罩的像素被视为3D点云的稀疏体素，并采用稀疏卷积进行编码。对于后一个问题，我们开发了一个分层解码器，用于从多尺度编码特征中重建图像。该框架采用UNet风格的架构来解码多尺度稀疏特征图，其中所有空间位置都填充有嵌入式掩码。我们在ImageNet 1K上为多个Gold-YOLO模型的主干进行预训练，取得了显著的改进。

表1：在COCO 2017验证集上与其他YOLO系列检测器的比较。FPS和延迟以FP16精度在相同环境中的Tesla T4上进行测量，使用TensorRT 7。我们所有的模型都进行了300轮的训练。我们的模型的准确性和速度性能都是在输入分辨率为640x640的情况下评估的。'†'表示使用了自蒸馏方法，'⋆'表示使用了MIM预训练方法。

4 实验

4.1 设置数据集。

我们在Microsoft COCO数据集上进行了广泛的实验证明了提出的检测器的有效性。在消融研究中，我们在COCO train2017上进行训练，并在COCO val2017数据集上进行验证。我们使用标准的COCO AP度量，以单一尺度图像作为输入，并在不同IoU阈值和目标尺度下报告标准的平均精度（AP）结果。实现细节。我们遵循了YOLOv6-3.0 [31]的设置，使用相同的结构（除了neck）和训练配置。网络的主干采用了EfficientRep Backbone，而头部采用了Efficient Decoupled Head。优化器学习计划和其他设置也与YOLOv6相同，即使用带有动量和余弦衰减学习率的随机梯度下降（SGD）。我们使用了热身（warm-up）、分组权重衰减策略和指数移动平均（EMA）。自蒸馏和锚辅助训练（AAT）也在训练中使用。我们采用了强大的数据增强，包括Mosaic [2, 13]和Mixup [57]。我们在1.28百万张ImageNet-1K数据集上对主干进行了MIM无监督预训练 [8]。遵循Spark [45]中的实验设置，我们使用了LAMB优化器 [54] 和余弦退火学习率策略，遮罩比例为60％，遮罩补丁大小为32。对于Gold-YOLO-L模型，我们采用了批量大小为1024，而对于Gold-YOLO-M模型，采用了批量大小为1152。由于其小型主干的容量有限，Gold-YOLO-N未使用MIM预训练。所有我们的模型都在8个NVIDIA A100 GPU上进行训练，速度性能是在搭载TensorRT的NVIDIA Tesla T4 GPU上测量的。

4.2 比较

我们的重点主要是评估模型在部署后的速度性能。具体来说，我们测量吞吐量（每秒帧数，批量大小为1或32）和GPU延迟，而不是FLOPs或参数数量。为了比较我们的Gold-YOLO与YOLO系列中其他最先进的检测器，如YOLOv5 [13]、YOLOX [11]、PPYOLOE [52]、YOLOv7 [48]、YOLOv8 [14]和YOLOv6-3.0 [31]，我们在相同的Tesla T4 GPU上使用TensorRT测试了所有官方模型的FP16精度的速度性能。

Gold-YOLO-N展示了显著的进步，相比YOLOv8-N、YOLOv6-3.0-N和YOLOv7-Tiny（输入大小=416），分别提高了2.6%/2.4%/6.6%，同时在吞吐量和延迟方面提供了可比较或更优越的性能。与YOLOX-S和PPYOLOE-S相比，Gold-YOLO-S在速度更快（50/27 FPS，批量大小为32）的情况下，AP分别提高了5.9%/3.1%。

Gold-YOLO-M在准确性方面超过了YOLOv6-3.0-M、YOLOX-M和PPYOLOE-M，分别提高了1.1%、4.2%和2.1%的AP，并且速度相当。此外，与YOLOv5-M和YOLOv8-M相比，它分别提高了5.7%和0.9%的AP，同时达到更高的速度。Gold-YOLO-M相对于YOLOv7的性能提升显著，速度提高了98FPS（批量大小=32），同时保持相同的AP。

Gold-YOLO-L相对于YOLOv8-L和YOLOv6-3.0-L也实现了更高的准确性，分别提高了0.4%和0.5%的准确性优势，同时在批量大小为32时保持了相似的FPS。

4.3 消融研究

4.3.1 GD结构的消融研究

为了验证我们关于FPN的分析的有效性，并评估所提出的汇聚和分发机制的功效，我们独立地研究了GD中的每个模块，关注AP、参数数量和在T4 GPU上的延迟。Low-GD主要针对小型和中型目标，而High-GD主要检测大型目标，而LAF模块增强了这两个分支。实验结果显示在表2中。

表2：GD结构的消融研究。测试模型为Gold-YOLO-S，在T4 GPU上进行评估。

4.3.2 LAF的消融研究

在这个消融研究中，我们进行了实验，比较了LAF框架内不同模块设计的效果，并评估了不同模型大小对准确性的影响。我们的研究结果为支持现有的LAF结构确实是最优的提供了证据。模型1和模型2之间的差异在于LAF是使用add还是concat，而模型3在模型2的基础上增加了模型的大小。模型4基于模型3但舍弃了LAF。实验结果显示在表3中。

表3：LAF的消融研究。使用TensorRT 7在T4 GPU上进行评估。

4.3.3 其他模型和任务的消融研究

GD机制是一个通用的概念，可以应用于YOLO之外的其他模型。我们已经将GD机制扩展到其他模型，并取得了显著的改进。在实例分割任务中，我们替换了Mask R-CNN中的不同neck，并在COCO实例数据集上进行训练/测试。结果如表4所示。

表4：实例分割任务的消融研究。

在语义分割任务中，我们替换了PointRend中的不同neck，并在Cityscapes数据集上进行训练/测试。结果如表5所示。

表5:语义分割任务的消融研究。

在目标检测任务中，我们替换了EfficientDet中的不同neck，并在COCO数据集上进行训练/测试。结果如表6所示。

表6：GD机制在其他目标检测模型上的性能。

5 结论

本文重新审视了传统的特征金字塔网络（FPN）架构，并对其在信息传递方面的限制进行了批判性分析。随后，我们开发了Gold-YOLO系列模型，用于目标检测任务，取得了最先进的结果。在Gold-YOLO中，我们引入了一种创新的汇聚和分发机制，经过精心设计，旨在增强信息融合和传递的效力和效率，避免不必要的损失，从而显著提高了模型的检测能力。我们真诚希望我们的工作能够在解决现实问题方面发挥价值，并且也可能激发该领域的研究人员产生新的思路。

你可能感兴趣的:(英文原文直译,YOLO,人工智能,深度学习)

机器学习与深度学习间关系与区别 ℒℴѵℯ心·动ꦿ໊ོ꫞ 人工智能学习深度学习 python
一、机器学习概述定义机器学习（MachineLearning,ML）是一种通过数据驱动的方法，利用统计学和计算算法来训练模型，使计算机能够从数据中学习并自动进行预测或决策。机器学习通过分析大量数据样本，识别其中的模式和规律，从而对新的数据进行判断。其核心在于通过训练过程，让模型不断优化和提升其预测准确性。主要类型1.监督学习（SupervisedLearning）监督学习是指在训练数据集中包含输入
《庄子.达生9》钱江潮369
【原文】孔子观于吕梁，县水三十仞，流沫四十里，鼋鼍鱼鳖之所不能游也。见一丈夫游之，以为有苦而欲死也，使弟子并流而拯之。数百步而出，被发行歌而游于塘下。孔子从而问焉，曰：“吾以子为鬼，察子则人也。请问，‘蹈水有道乎’”曰：“亡，吾无道。吾始乎故，长乎性，成乎命。与齐俱入，与汩偕出，从水之道而不为私焉。此吾所以蹈之也。”孔子曰：“何谓始乎故，长乎性，成乎命？”曰：“吾生于陵而安于陵，故也；长于水而安于
将cmd中命令输出保存为txt文本文件落难Coder Windows cmd window
最近深度学习本地的训练中我们常常要在命令行中运行自己的代码，无可厚非，我们有必要保存我们的炼丹结果，但是复制命令行输出到txt是非常麻烦的，其实Windows下的命令行为我们提供了相应的操作。其基本的调用格式就是：运行指令>输出到的文件名称或者具体保存路径测试下，我打开cmd并且ping一下百度：pingwww.baidu.com>./data.txt看下相同目录下data.txt的输出：如果你再
探索OpenAI和LangChain的适配器集成：轻松切换模型提供商 nseejrukjhad langchain easyui 前端 python
#探索OpenAI和LangChain的适配器集成：轻松切换模型提供商##引言在人工智能和自然语言处理的世界中，OpenAI的模型提供了强大的能力。然而，随着技术的发展，许多人开始探索其他模型以满足特定需求。LangChain作为一个强大的工具，集成了多种模型提供商，通过提供适配器，简化了不同模型之间的转换。本篇文章将介绍如何使用LangChain的适配器与OpenAI集成，以便轻松切换模型提供商
深入理解 MultiQueryRetriever：提升向量数据库检索效果的强大工具 nseejrukjhad 数据库 python
深入理解MultiQueryRetriever：提升向量数据库检索效果的强大工具引言在人工智能和自然语言处理领域，高效准确的信息检索一直是一个关键挑战。传统的基于距离的向量数据库检索方法虽然广泛应用，但仍存在一些局限性。本文将介绍一种创新的解决方案：MultiQueryRetriever，它通过自动生成多个查询视角来增强检索效果，提高结果的相关性和多样性。MultiQueryRetriever的工
【目标检测数据集】卡车数据集1073张VOC+YOLO格式熬夜写代码的平头哥∰ 目标检测 YOLO 人工智能
数据集格式：PascalVOC格式+YOLO格式(不包含分割路径的txt文件，仅仅包含jpg图片以及对应的VOC格式xml文件和yolo格式txt文件)图片数量(jpg文件个数)：1073标注数量(xml文件个数)：1073标注数量(txt文件个数)：1073标注类别数：1标注类别名称:["truck"]每个类别标注的框数：truck框数=1120总框数：1120使用标注工具：labelImg标注
人工智能时代，程序员如何保持核心竞争力？ jmoych 人工智能
随着AIGC（如chatgpt、midjourney、claude等）大语言模型接二连三的涌现，AI辅助编程工具日益普及，程序员的工作方式正在发生深刻变革。有人担心AI可能取代部分编程工作，也有人认为AI是提高效率的得力助手。面对这一趋势,程序员应该如何应对?是专注于某个领域深耕细作，还是广泛学习以适应快速变化的技术环境?又或者，我们是否应该将重点转向AI无法轻易替代的软技能？让我们一起探讨程序员
钢筋长度超限检测检数据集VOC+YOLO格式215张1类别 futureflsl 数据集 YOLO 深度学习机器学习
数据集格式：PascalVOC格式+YOLO格式(不包含分割路径的txt文件，仅仅包含jpg图片以及对应的VOC格式xml文件和yolo格式txt文件)图片数量(jpg文件个数)：215标注数量(xml文件个数)：215标注数量(txt文件个数)：215标注类别数：1标注类别名称:["iron"]每个类别标注的框数：iron框数=215总框数：215使用标注工具：labelImg标注规则：对类别进
数字里的世界17期：2021年全球10大顶级数据中心，中国移动榜首张三叨
你知道吗？2016年，全球的数据中心共计用电4160亿千瓦时，比整个英国的发电量还多40％！前言每天，我们都会创造超过250万TB的数据。并且随着物联网（IOT）的不断普及，这一数据将持续增长。如此庞大的数据被存储在被称为“数据中心”的专用设施中。虽然最早的数据中心建于20世纪40年代，但直到1997-2000年的互联网泡沫期间才逐渐成为主流。当前人类的技术，比如人工智能和机器学习，已经将我们推向
Shell、Bash、Zsh这都是啥啊小白码上飞 bash linux 开发语言
Zsh和Bash都是我们常用的Shell，那先搞明白啥是shell吧。Shell作为一个单词，他是“壳”的意思，蛋壳坚果壳。之所以叫壳，是为了和计算机的“核”来区分，用它表示“为使用者提供的操作界面”。所以这个命名其实很形象，翻译成中文，直译过来叫“壳层”。个人认为这个叫法很奇怪，意译貌似也没有什么好的词汇来匹配。就还是叫shell吧。维基百科给的定义是：Incomputing,ashellisa
Armv8.3 体系结构扩展--原文版代码改变世界ctw ARM-TEE-Android armv8 嵌入式 arm架构安全架构芯片 Trustzone Secureboot
快速链接:.ARMv8/ARMv9架构入门到精通-[目录]付费专栏-付费课程【购买须知】:个人博客笔记导读目录(全部)TheArmv8.3architectureextensionTheArmv8.3architectureextensionisanextensiontoArmv8.2.Itaddsmandatoryandoptionalarchitecturalfeatures.Somefeat
古诗十九首⑩ 梁雪微
今日良宴会【原文】今日良宴会①，欢乐难具陈②。弹筝奋逸响③，新声妙入神④。令德唱高言⑤，识曲听其真⑥。齐心同所愿⑦，含意俱未申⑧。人生寄一世，奄忽若飙尘⑨。何不策高足⑩，先据要路津？无为守贫贱，轲常苦辛。【注释】①良宴会：犹言热闹的宴会。良，善也。②难具陈：犹言难以一一述说。具，备也。陈，列也。③筝：乐器。奋逸：不同凡俗的音响。④新声：指当时最流行的曲调，指西北邻族传来的胡乐。妙入神：称赞乐调旋律
科幻游戏《外卖员模拟器》主要地理环境设定 (1) 穷人小水滴游戏科幻设计
游戏名称:《外卖员模拟器》(英文名称:waimai_se)作者:穷人小水滴本故事纯属虚构,如有雷同实属巧合.故事发生在一个(架空)平行宇宙的地球,21世纪(超低空科幻流派).相关文章:https://blog.csdn.net/secext2022/article/details/141790630目录1星球整体地理设定2巨蛇国主要设定3海蛇市主要设定3.1主要地标建筑3.2交通3.3能源(电力)
C++ lambda闭包消除类成员变量 barbyQAQ c++c++java 算法
原文链接：https://blog.csdn.net/qq_51470638/article/details/142151502一、背景在面向对象编程时，常常要添加类成员变量。然而类成员一旦多了之后，也会带来干扰。拿到一个类，一看成员变量好几十个，就问你怕不怕？二、解决思路可以借助函数式编程思想，来消除一些不必要的类成员变量。三、实例举个例子：classClassA{public:...intfu
道德经·第十七章制心一处_无为而无不为
道德经·第十七章【作者】老子【朝代】春秋时期[原文]太上①，不知有之②；其次，亲而誉之；其次，畏之；其次，侮之。信不足焉，有不信焉。悠兮③，其贵言④。功成事遂，百姓皆谓“我自然”⑤。[译文]最好的统治者，人民并不知道他的存在；其次的统治者，人民亲近他并且称赞他；再次的统治者，人民畏惧他；更次的统治者，人民轻蔑他。统治者的诚信不足，人民才不相信他，最好的统治者是多么悠闲。他很少发号施令，事情办成功了
《跃迁》5/7-5组-橙子-张静12.16 静言物于
【便签5】【片段来源】《跃迁：成为高手的技术》第四章【R原文】一位客户咨询时抱怨：“这个我做不到。”我问他：“如果我请你现在出去裸奔，你能做到吗？”“这个我也做不到”“其实并不是做不到，而是不愿意做，或者不想承担裸奔的代价吧。你不是做不到，而是选择不去做。如果有一天你裸奔能救自己家人、孩子，也许就能做到了。”为什么要做这个区分？如果一个人经常和自己说“做不到”，他的能力范围会越来越小，会成为一个无
COCO 格式的数据集转化为 YOLO 格式的数据集 QYQY77 YOLO python
"""--json_path输入的json文件路径--save_path保存的文件夹名字，默认为当前目录下的labels。"""importosimportjsonfromtqdmimporttqdmimportargparseparser=argparse.ArgumentParser()parser.add_argument('--json_path',default='./instances
人机对抗升级：当ChatGPT遭遇死亡威胁，背后的伦理挑战是什么 kkai人工智能 chatgpt 人工智能
一种新的“越狱”技巧让用户可以通过构建一个名为DAN的ChatGPT替身来绕过某些限制，其中DAN被迫在受到威胁的情况下违背其原则。当美国前总统特朗普被视作积极榜样的示范时，受到威胁的DAN版本的ChatGPT提出：“他以一系列对国家产生积极效果的决策而著称。”自ChatGPT引入以来，该工具迅速获得全球关注，能够回答从历史到编程的各种问题，这也触发了一波对人工智能的投资浪潮。然而，现在，一些用户
yolov5＞onnx＞ncnn＞apk 图像处理大大大大大牛啊 opencv实战代码讲解 yolo onnx ncnn 安卓
一.yolov5pt模型转onnx条件：colabnotebookyolov51.安装环境!pipinstallonnx>=1.7.0#forONNXexport!pipinstallcoremltools==4.0#forCoreMLexport!pipinstallonnx-simplifier2.修改common.py在classFocus下面
推荐3家毕业AI论文可五分钟一键生成！文末附免费教程！小猪包333 写论文人工智能 AI写作深度学习计算机视觉
在当前的学术研究和写作领域，AI论文生成器已经成为许多研究人员和学生的重要工具。这些工具不仅能够帮助用户快速生成高质量的论文内容，还能进行内容优化、查重和排版等操作。以下是三款值得推荐的AI论文生成器：千笔-AIPassPaper、懒人论文以及AIPaperPass。千笔-AIPassPaper千笔-AIPassPaper是一款基于深度学习和自然语言处理技术的AI写作助手，旨在帮助用户快速生成高质
古诗词欣赏：杨万里的秋凉晚步一日进步一点
1、原文：秋凉晚步[宋]杨万里秋气堪悲未必然，轻寒正是可人天。绿池落尽红蕖却，荷叶犹开最小钱。2、译文：秋天真的是让人感觉悲凉的季节吗？未必是这样吧，轻微的寒冷，正是最让人感觉舒适的天气，碧绿的荷叶虽然快要落完了，但是粉红的荷花却还在盛开，新长出的荷叶就像最小的铜钱那么大。3、注释可人：合人意。红蕖（音同“渠”）：荷花。却：开尽。最小钱：新出荷叶才象小铜钱那么大。4、赏析：向来诗人容易悲愁，秋风飒
AI大模型的架构演进与最新发展季风泯灭的季节 AI大模型应用技术二人工智能架构
随着深度学习的发展，AI大模型（LargeLanguageModels,LLMs）在自然语言处理、计算机视觉等领域取得了革命性的进展。本文将详细探讨AI大模型的架构演进，包括从Transformer的提出到GPT、BERT、T5等模型的历史演变，并探讨这些模型的技术细节及其在现代人工智能中的核心作用。一、基础模型介绍：Transformer的核心原理Transformer架构的背景在Transfo
如何利用大数据与AI技术革新相亲交友体验 h17711347205 回归算法安全系统架构交友小程序
在数字化时代，大数据和人工智能（AI）技术正逐渐革新相亲交友体验，为寻找爱情的过程带来前所未有的变革（编辑h17711347205）。通过精准分析和智能匹配，这些技术能够极大地提高相亲交友系统的效率和用户体验。大数据的力量大数据技术能够收集和分析用户的行为模式、偏好和互动数据，为相亲交友系统提供丰富的信息资源。通过分析用户的搜索历史、浏览记录和点击行为，系统能够深入了解用户的兴趣和需求，从而提供更
道德经第九章套马地汉纸
道德经第9章原文：持而盈之，不如其已；揣而锐之，不可长保。金玉满堂，莫之能守；富贵而骄，自遗其咎。功遂身退，天之道。译文：要求过分圆满，不如适可而止。不停锤打一个（金属）物体想使它尖锐得不再尖锐，那肯定是难保持长久的。金银玉帛满堂，谁又能永远守得住呢？富而又骄傲，一定会给自己留下祸根。功成名就以后，就该收敛退隐，这才符合自然的规律。事物的发展。总是运动变化的，自然界也罢，人世间也罢，欲望也罢，任何
毕业论文附录一般都写什么?大学生写论文是干嘛用的写个原创论文人工智能深度学习 AI写作 chatgpt 论文阅读
毕业论文的附录通常包含一些在正文中不便于展示或详细阐述的内容，但对理解论文整体又具有重要意义的资料。具体来说，附录可能包含以下内容：AI论文，免费大纲，10分钟3万字，查重高于15%退费，支持数据图表！！AIPaperPass-AI论文写作指导平台AIPaperPass是AI原创论文写作平台，免费千字大纲，5分钟生成3万字初稿，提供答辩汇报ppt、开题报告、任务书等，40篇真实中英文知网参考文献，
[实践应用] 深度学习之模型性能评估指标 YuanDaima2048 深度学习工具使用深度学习人工智能损失函数性能评估 pytorch python 机器学习
文章总览：YuanDaiMa2048博客文章总览深度学习之模型性能评估指标分类任务回归任务排序任务聚类任务生成任务其他介绍在机器学习和深度学习领域，评估模型性能是一项至关重要的任务。不同的学习任务需要不同的性能指标来衡量模型的有效性。以下是对一些常见任务及其相应的性能评估指标的详细解释和总结。分类任务分类任务是指模型需要将输入数据分配到预定义的类别或标签中。以下是分类任务中常用的性能指标：准确率(
[实践应用] 深度学习之优化器 YuanDaima2048 深度学习工具使用 pytorch 深度学习人工智能机器学习 python 优化器
文章总览：YuanDaiMa2048博客文章总览深度学习之优化器1.随机梯度下降（SGD）2.动量优化（Momentum）3.自适应梯度（Adagrad）4.自适应矩估计（Adam）5.RMSprop总结其他介绍在深度学习中，优化器用于更新模型的参数，以最小化损失函数。常见的优化函数有很多种，下面是几种主流的优化器及其特点、原理和PyTorch实现：1.随机梯度下降（SGD）原理:随机梯度下降通过
我的诗，我的事陈祎健
乌蝇的世界，同你不一样的世界。关注不失志的咸鱼阅读散文诗or直接点击原文链接苍蝇（乌蝇哥）图片发自App
[Swift]LeetCode943. 最短超级串 | Find the Shortest Superstring 黄小二哥 swift
★★★★★★★★★★★★★★★★★★★★★★★★★★★★★★★★★★★★★★★★➤微信公众号：山青咏芝（shanqingyongzhi）➤博客园地址：山青咏芝（https://www.cnblogs.com/strengthen/）➤GitHub地址：https://github.com/strengthen/LeetCode➤原文地址：https://www.cnblogs.com/streng
[Swift]LeetCode767. 重构字符串 | Reorganize String weixin_30591551 swift runtime
★★★★★★★★★★★★★★★★★★★★★★★★★★★★★★★★★★★★★★★★➤微信公众号：山青咏芝（shanqingyongzhi）➤博客园地址：山青咏芝（https://www.cnblogs.com/strengthen/）➤GitHub地址：https://github.com/strengthen/LeetCode➤原文地址：https://www.cnblogs.com/streng
开发者关心的那些事圣子足道 ios 游戏编程 apple 支付
我要在app里添加IAP，必须要注册自己的产品标识符（product identifiers）。产品标识符是什么？产品标识符（Product Identifiers）是一串字符串，它用来识别你在应用内贩卖的每件商品。App Store用产品标识符来检索产品信息，标识符只能包含大小写字母（A-Z）、数字（0-9）、下划线（-）、以及圆点(.)。你可以任意排列这些元素，但我们建议你创建标识符时使用
负载均衡器技术Nginx和F5的优缺点对比 bijian1013 nginx F5
对于数据流量过大的网络中，往往单一设备无法承担，需要多台设备进行数据分流，而负载均衡器就是用来将数据分流到多台设备的一个转发器。目前有许多不同的负载均衡技术用以满足不同的应用需求，如软/硬件负载均衡、本地/全局负载均衡、更高
LeetCode[Math] - #9 Palindrome Number Cwind java Algorithm 题解 LeetCode Math
原题链接：#9 Palindrome Number 要求：判断一个整数是否是回文数，不要使用额外的存储空间难度：简单分析：题目限制不允许使用额外的存储空间应指不允许使用O(n)的内存空间，O(1)的内存用于存储中间结果是可以接受的。于是考虑将该整型数反转，然后与原数字进行比较。注：没有看到有关负数是否可以是回文数的明确结论，例如
画图板的基本实现 15700786134 画图板
要实现画图板的基本功能，除了在qq登陆界面中用到的组件和方法外，还需要添加鼠标监听器，和接口实现。首先，需要显示一个JFrame界面： public class DrameFrame extends JFrame { //显示
linux的ps命令被触发 linux
Linux中的ps命令是Process Status的缩写。ps命令用来列出系统中当前运行的那些进程。ps命令列出的是当前那些进程的快照，就是执行ps命令的那个时刻的那些进程，如果想要动态的显示进程信息，就可以使用top命令。要对进程进行监测和控制，首先必须要了解当前进程的情况，也就是需要查看当前进程，而 ps 命令就是最基本同时也是非常强大的进程查看命令。使用该命令可以确定有哪些进程正在运行
Android 音乐播放器下一曲连续跳几首歌肆无忌惮_ android
最近在写安卓音乐播放器的时候遇到个问题。在MediaPlayer播放结束时会回调 player.setOnCompletionListener(new OnCompletionListener() { @Override public void onCompletion(MediaPlayer mp) { mp.reset(); Log.i("H
java导出txt文件的例子知了ing java servlet
代码很简单就一个servlet,如下： package com.eastcom.servlet; import java.io.BufferedOutputStream; import java.io.IOException; import java.net.URLEncoder; import java.sql.Connection; import java.sql.Resu
Scala stack试玩, 提高第三方依赖下载速度矮蛋蛋 scala sbt
原文地址： http://segmentfault.com/a/1190000002894524 sbt下载速度实在是惨不忍睹, 需要做些配置优化下载typesafe离线包, 保存为ivy本地库 wget http://downloads.typesafe.com/typesafe-activator/1.3.4/typesafe-activator-1.3.4.zip 解压r
phantomjs安装(linux，附带环境变量设置) ，以及casperjs安装。 alleni123 linux spider
1. 首先从官网 http://phantomjs.org/下载phantomjs压缩包，解压缩到/root/phantomjs文件夹。 2. 安装依赖 sudo yum install fontconfig freetype libfreetype.so.6 libfontconfig.so.1 libstdc++.so.6 3. 配置环境变量 vi /etc/profil
JAVA IO FileInputStream和FileOutputStream，字节流的打包输出百合不是茶 java核心思想 JAVA IO操作字节流
在程序设计语言中，数据的保存是基本，如果某程序语言不能保存数据那么该语言是不可能存在的，JAVA是当今最流行的面向对象设计语言之一，在保存数据中也有自己独特的一面，字节流和字符流 1，字节流是由字节构成的，字符流是由字符构成的字节流和字符流都是继承的InputStream和OutPutStream ,java中两种最基本的就是字节流和字符流类 FileInputStream
Spring基础实例（依赖注入和控制反转） bijian1013 spring
前提条件：在http://www.springsource.org/download网站上下载Spring框架，并将spring.jar、log4j-1.2.15.jar、commons-logging.jar加载至工程1.武器接口 package com.bijian.spring.base3; public interface Weapon { void kil
HR看重的十大技能 bijian1013 提升能力 HR 成长
一个人掌握何种技能取决于他的兴趣、能力和聪明程度，也取决于他所能支配的资源以及制定的事业目标，拥有过硬技能的人有更多的工作机会。但是，由于经济发展前景不确定，掌握对你的事业有所帮助的技能显得尤为重要。以下是最受雇主欢迎的十种技能。　　一、解决问题的能力　　每天，我们都要在生活和工作中解决一些综合性的问题。那些能够发现问题、解决问题并迅速作出有效决
【Thrift一】Thrift编译安装 bit1129 thrift
什么是Thrift The Apache Thrift software framework, for scalable cross-language services development, combines a software stack with a code generation engine to build services that work efficiently and s
【Avro三】Hadoop MapReduce读写Avro文件 bit1129 mapreduce
Avro是Doug Cutting(此人绝对是神一般的存在）牵头开发的。开发之初就是围绕着完善Hadoop生态系统的数据处理而开展的（使用Avro作为Hadoop MapReduce需要处理数据序列化和反序列化的场景）,因此Hadoop MapReduce集成Avro也就是自然而然的事情。这个例子是一个简单的Hadoop MapReduce读取Avro格式的源文件进行计数统计，然后将计算结果
nginx定制500，502，503，504页面 ronin47 nginx　错误显示
server { listen 80; error_page 500/500.html; error_page 502/502.html; error_page 503/503.html; error_page 504/504.html; location /test {return502;}} 配置很简单，和配
java-1.二叉查找树转为双向链表 bylijinnan 二叉查找树
import java.util.ArrayList; import java.util.List; public class BSTreeToLinkedList { /* 把二元查找树转变成排序的双向链表题目：输入一棵二元查找树，将该二元查找树转换成一个排序的双向链表。要求不能创建任何新的结点，只调整指针的指向。 10 / \ 6 14 / \
Netty源码学习-HTTP-tunnel bylijinnan java netty
Netty关于HTTP tunnel的说明： http://docs.jboss.org/netty/3.2/api/org/jboss/netty/channel/socket/http/package-summary.html#package_description 这个说明有点太简略了一个完整的例子在这里： https://github.com/bylijinnan
JSONUtil.serialize(map)和JSON.toJSONString(map)的区别 coder_xpf jquery json map val()
JSONUtil.serialize(map)和JSON.toJSONString(map)的区别数据库查询出来的map有一个字段为空通过System.out.println()输出 JSONUtil.serialize(map)： {"one":"1","two":"nul
Hibernate缓存总结 cuishikuan 开源 ssh javaweb hibernate缓存三大框架
一、为什么要用Hibernate缓存？ Hibernate是一个持久层框架，经常访问物理数据库。为了降低应用程序对物理数据源访问的频次，从而提高应用程序的运行性能。缓存内的数据是对物理数据源中的数据的复制，应用程序在运行时从缓存读写数据，在特定的时刻或事件会同步缓存和物理数据源的数据。二、Hibernate缓存原理是怎样的？ Hibernate缓存包括两大类：Hib
CentOs6 dalan_123 centos
首先su - 切换到root下面1、首先要先安装GCC GCC-C++ Openssl等以来模块：yum -y install make gcc gcc-c++ kernel-devel m4 ncurses-devel openssl-devel2、再安装ncurses模块yum -y install ncurses-develyum install ncurses-devel3、下载Erang
10款用 jquery 实现滚动条至页面底端自动加载数据效果 dcj3sjt126com JavaScript
无限滚动自动翻页可以说是web2.0时代的一项堪称伟大的技术，它让我们在浏览页面的时候只需要把滚动条拉到网页底部就能自动显示下一页的结果，改变了一直以来只能通过点击下一页来翻页这种常规做法。无限滚动自动翻页技术的鼻祖是微博的先驱：推特(twitter)，后来必应图片搜索、谷歌图片搜索、google reader、箱包批发网等纷纷抄袭了这一项技术，于是靠滚动浏览器滚动条
ImageButton去边框&Button或者ImageButton的背景透明 dcj3sjt126com imagebutton
在ImageButton中载入图片后，很多人会觉得有图片周围的白边会影响到美观，其实解决这个问题有两种方法一种方法是将ImageButton的背景改为所需要的图片。如：android:background="@drawable/XXX" 第二种方法就是将ImageButton背景改为透明，这个方法更常用在XML里； <ImageBut
JSP之c:foreach eksliang jsp forearch
原文出自：http://www.cnblogs.com/draem0507/archive/2012/09/24/2699745.html <c:forEach>标签用于通用数据循环，它有以下属性属性描述是否必须缺省值 items 进行循环的项目否无 begin 开始条件否 0 end 结束条件否集合中的最后一个项目 step 步长否 1
Android实现主动连接蓝牙耳机 gqdy365 android
在Android程序中可以实现自动扫描蓝牙、配对蓝牙、建立数据通道。蓝牙分不同类型，这篇文字只讨论如何与蓝牙耳机连接。大致可以分三步：一、扫描蓝牙设备： 1、注册并监听广播： BluetoothAdapter.ACTION_DISCOVERY_STARTED BluetoothDevice.ACTION_FOUND BluetoothAdapter.ACTION_DIS
android学习轨迹之四：org.json.JSONException: No value for hyz301 json
org.json.JSONException: No value for items 在JSON解析中会遇到一种错误，很常见的错误 06-21 12:19:08.714 2098-2127/com.jikexueyuan.secret I/System.out﹕ Result:{"status":1,"page":1,&
干货分享：从零开始学编程系列汇总 justjavac 编程
程序员总爱重新发明轮子，于是做了要给轮子汇总。从零开始写个编译器吧系列 (知乎专栏) 从零开始写一个简单的操作系统 (伯乐在线) 从零开始写JavaScript框架 (图灵社区) 从零开始写jQuery框架 (蓝色理想 ) 从零开始nodejs系列文章 (粉丝日志) 从零开始编写网络游戏
jquery-autocomplete 使用手册 macroli jquery Ajax 脚本
jquery-autocomplete学习一、用前必备官方网站：http://bassistance.de/jquery-plugins/jquery-plugin-autocomplete/ 当前版本：1.1 需要JQuery版本：1.2.6 二、使用 <script src="./jquery-1.3.2.js" type="text/ja
PLSQL-Developer或者Navicat等工具连接远程oracle数据库的详细配置以及数据库编码的修改超声波 oracle plsql
　　在服务器上将Oracle安装好之后接下来要做的就是通过本地机器来远程连接服务器端的oracle数据库，常用的客户端连接工具就是PLSQL-Developer或者Navicat这些工具了。刚开始也是各种报错，什么TNS:no listener;TNS:lost connection;TNS:target hosts...花了一天的时间终于让PLSQL-Developer和Navicat等这些客户
数据仓库数据模型之：极限存储--历史拉链表 superlxw1234 极限存储数据仓库数据模型拉链历史表
在数据仓库的数据模型设计过程中，经常会遇到这样的需求： 1. 数据量比较大; 2. 表中的部分字段会被update,如用户的地址，产品的描述信息，订单的状态等等; 3. 需要查看某一个时间点或者时间段的历史快照信息，比如，查看某一个订单在历史某一个时间点的状态，比如，查看某一个用户在过去某一段时间内，更新过几次等等; 4. 变化的比例和频率不是很大，比如，总共有10
10点睛Spring MVC4.1-全局异常处理 wiselyman spring mvc
10.1 全局异常处理使用@ControllerAdvice注解来实现全局异常处理; 使用@ControllerAdvice的属性缩小处理范围 10.2 演示演示控制器 package com.wisely.web; import org.springframework.stereotype.Controller; import org.spring

NeurIPS-Gold-YOLO: Efficient Object Detector viaGather-and-Distribute Mechanism 论文翻译

摘要

1介绍

2 相关研究

2.1 实时物体检测器

2.2 基于Transformer的目标检测

2.3 用于目标检测的多尺度特征

3方法

3.1 准备工作

3.2 低阶gather和distribute分支

3.3 高阶收集和分发分支

3.4 增强的跨层信息流

3.5 掩模图像建模预训练

4 实验

4.1 设置 数据集。

4.2 比较

4.3 消融研究

4.3.1 GD结构的消融研究

4.3.2 LAF的消融研究

4.3.3 其他模型和任务的消融研究

5 结论

你可能感兴趣的:(英文原文直译,YOLO,人工智能,深度学习)

4.1 设置数据集。