guanshanjushi2

百度提出的RT-DETR：DETRs Beat YOLOs on Real-time Object Detection目标检测论文翻译

论文地址：https://arxiv.org/pdf/2304.08069.pdfhttps://arxiv.org/pdf/2304.08069.pdf

摘要：

最近，基于端到端Transformer的检测器（DETRs）已经取得了显著的性能。然而，DETRs的高计算成本问题尚未得到有效解决，限制了它们的实际应用，并阻止它们充分利用无后处理的优点，例如非最大值抑制（NMS）。本文首先分析了现代实时目标检测器中NMS对推理速度的影响，并建立了一个端到端速度基准。为避免NMS引起的推理延迟，我们提出了Real-Time DEtection TRansformer（RT-DETR），这是我们所知道的第一个实时端到端物体检测器。具体来说，我们设计了一个高效的混合编码器，通过解耦内部尺度交互和跨尺度融合来高效处理多尺度特征，并提出了IoU感知的查询选择来改善物体查询的初始化。此外，我们提出的检测器支持通过使用不同的解码器层来灵活调整推理速度，无需重新训练，这有助于实时目标检测器的实际应用。我们的RT-DETR-L在COCO val2017上达到了53.0％的AP和在T4 GPU上达到了114 FPS，RT-DETR-X达到了54.8％的AP和74 FPS，在速度和准确性方面都优于相同规模的所有YOLO检测器。此外，我们的RT-DETR-R50在准确性方面比DINO-Deformable-DETR-R50提高了2.2％的AP，在FPS方面约高出21倍。源代码和预训练模型将在PaddleDetection上提供。

1、介绍：

目标检测是一项基本的视觉任务，涉及在图像中识别和定位物体。现代目标检测器有两种典型的架构：基于CNN和基于Transformer。过去几年，对基于CNN的目标检测器进行了广泛研究。这些检测器的架构从最初的两阶段[9，26，3]发展到单阶段[19，31，1，10，22，13，36，14，7，33，11]，并出现了两种检测范例：基于锚点[19，22，13，10，33]和基于无锚点[31，7，36，14，11]的检测器。这些研究在检测速度和准确性方面都取得了重大进展。基于Transformer的目标检测器（DETR）[4，29，34，43，23，35，20，16，40]自提出以来，由于消除了各种手工制作的组件，如非最大值抑制（NMS），受到了学术界广泛关注。这种架构极大地简化了目标检测的流程，并实现了端到端的目标检测。

实时目标检测是一个重要的研究领域，具有广泛的应用，如目标跟踪[39，42]、视频监控[24]、自动驾驶[2，38]等。现有的实时检测器通常采用基于CNN的架构，可以在检测速度和准确性之间实现合理的权衡。然而，这些实时检测器通常需要后处理的NMS，这通常很难优化并且不足够稳健，导致检测器推理速度的延迟。最近，由于研究人员在加速训练收敛和降低优化难度方面的努力，基于Transformer的检测器已经取得了显著的性能。然而，DETR的高计算成本问题尚未得到有效解决，这限制了DETR的实际应用，并导致无法充分利用其优点。这意味着虽然目标检测流程被简化了，但由于模型本身的高计算成本，实时目标检测很难实现。以上问题自然地启发我们考虑是否可以将DETR扩展到实时场景，充分利用端到端检测器来避免实时检测器上由NMS引起的延迟。

为了实现上述目标，我们重新思考了DETR并对其关键组件进行了详细的分析和实验，以减少不必要的计算冗余。具体而言，我们发现，虽然引入多尺度特征有助于加速训练收敛和提高性能[43]，但它也导致输入到编码器的序列长度显著增加。因此，由于高计算成本，Transformer编码器成为模型的计算瓶颈。为了实现实时目标检测，我们设计了一个高效的混合编码器来替换原始的Transformer编码器。通过解耦多尺度特征的内尺度交互和跨尺度融合，编码器可以高效地处理不同尺度的特征。此外，之前的工作[35，20]表明，解码器的目标查询初始化方案对检测性能至关重要。为了进一步提高性能，我们提出了IoU感知的查询选择，通过在训练期间提供IoU约束条件，为解码器提供更高质量的初始目标查询。此外，我们提出的检测器支持使用不同的解码器层灵活调整推理速度，无需重新训练，这得益于DETR架构中解码器的设计，有助于实时检测器的实际应用。

本文提出了Real Time Detection TRansformer (RT-DETR)，据我们所知，这是第一个实时端到端目标检测器。RT-DETR不仅在准确性和速度方面优于当前最先进的实时检测器，而且不需要后处理，因此检测器的推理速度不会延迟并保持稳定，充分利用了端到端检测流程的优势。我们提出的RT-DETR-L在COCO val2017上实现了53.0%的AP和114 FPS的速度，而RT-DETR-X实现了54.8%的AP和74 FPS的速度，在速度和准确性方面均优于同等规模的所有YOLO检测器。因此，我们的RT-DETR成为实时目标检测的新的SOTA，如图1所示。此外，我们提出的RT-DETR-R50实现了53.1%的AP和108 FPS的速度，而RT-DETR-R101实现了54.3%的AP和74 FPS的速度。其中，RT-DETR-R50在准确性方面优于DINO-Deformable-DETR-R50 2.2%的AP (53.1% AP vs 50.9% AP)，在FPS方面大约快了21倍(108 FPS vs 5 FPS)。

本文的主要贡献总结如下：(i)我们提出了第一个实时端到端目标检测器，不仅在准确性和速度方面优于当前最先进的实时检测器，而且不需要后处理，因此它的推理速度不会延迟并保持稳定；(ii)我们详细分析了NMS对实时检测器的影响，并从后处理的角度得出了关于基于CNN的实时检测器的结论；(iii)我们提出的IoU感知的查询选择在我们的模型中显示出优秀的性能改进，为改进目标查询的初始化方案提供了新思路；(iv)我们的工作为端到端检测器的实时实现提供了可行的解决方案，所提出的检测器可以通过使用不同的解码器层灵活调整模型大小和推理速度，无需重新训练。

2、相关工作

1.1、实时目标检测器

经过多年的持续发展，YOLO系列[25、1、32、22、13、10、7、36、14、33、11]已经成为实时目标检测器的代名词，可以大致分为两类：基于锚点的[25、1、32、10、33]和无锚点的[7、36、14、11]。从这些检测器的性能来看，锚点不再是限制YOLO发展的主要因素。然而，上述检测器产生了大量冗余的边界框，需要在后处理阶段利用NMS进行过滤。不幸的是，这导致了性能瓶颈，而NMS的超参数对检测器的准确性和速度有重要影响。我们认为这与实时目标检测器的设计理念不相容。

2.2、端对端目标检测器

端到端目标检测器[4、29、34、43、23、35、20、16、40]以其简化的流程而闻名。Carion等人[4]首先提出了基于Transformer的端到端目标检测器DETR（DEtection TRansformer）。由于其独特的特点，它引起了广泛的关注。特别是，DETR消除了传统检测流程中手动设计的锚点和NMS组件。相反，它采用二分图匹配并直接预测一对一的对象集。通过采用这种策略，DETR简化了检测流程并减轻了NMS导致的性能瓶颈。尽管DETR具有明显的优点，但它存在两个主要问题：训练收敛速度慢和难以优化的查询。许多DETR变体已被提出来解决这些问题。具体而言，Deformable-DETR [43]通过增强注意机制的效率来加速多尺度特征的训练收敛。Conditional DETR [23]和Anchor DETR [35]降低了查询的优化难度。DAB-DETR [20]引入了4D参考点，并逐层迭代地优化预测框。DN-DETR [16]通过引入查询去噪来加速训练收敛。DINO [40]在以前的工作基础上进行了改进，并实现了最先进的结果。尽管我们不断改进DETR的组件，但我们的目标不仅是进一步提高模型的性能，而且是创建一个实时的端到端目标检测器。

2.3、目标检测的多尺度特征

现代目标检测器已经证明了利用多尺度特征来提高性能的重要性，特别是对于小物体。FPN [18]引入了一个特征金字塔网络，它融合了相邻尺度的特征。随后的工作[21、8、30、10、14、33、11]扩展和增强了这个结构，并被广泛应用于实时目标检测器中。Zhu等人[43]首次将多尺度特征引入到DETR中，并提高了性能和收敛速度，但这也导致DETR的计算成本显著增加。虽然可变形注意机制在一定程度上缓解了计算成本，但多尺度特征的融合仍会导致高计算负担。为了解决这个问题，一些工作尝试设计计算效率高的DETR。Efficient DETR [37]通过使用密集先验来初始化对象查询，从而减少编码器和解码器层数。Sparse DETR [27]有选择性地更新编码器标记，以减少解码器的计算开销。Lite DETR [15]通过交错方式降低低层特征的更新频率，增强了编码器的效率。尽管这些研究已经降低了DETR的计算成本，但这些工作的目标并不是将DETR推广为实时检测器。

3、检测器的端对端推理速度

3.1、NMS分析

NMS是目标检测中广泛采用的后处理算法，用于消除检测器输出的重叠预测框。NMS需要两个超参数：分数阈值和IoU阈值。特别地，分数低于分数阈值的预测框会被直接过滤掉，每当两个预测框的IoU超过IoU阈值时，具有较低分数的框将被丢弃。这个过程是迭代进行的，直到所有类别的框都被处理完。因此，NMS的执行时间主要取决于输入预测框的数量和两个超参数。

为了验证这个观点，我们利用YOLOv5（基于锚点）[10]和YOLOv8（无锚点）[11]进行实验。我们首先统计在相同输入图像下，不同分数阈值过滤输出框后剩余的预测框数量。我们从0.001到0.25中采样一些分数作为阈值，计数两个检测器的剩余预测框并将它们绘制成直方图，直观地反映NMS对其超参数的敏感性，如图2所示。

此外，我们以YOLOv8为例，在不同的NMS超参数下评估模型在COCO val2017上的精度和NMS操作的执行时间。需要注意的是，我们在实验中采用的NMS后处理操作是指TensorRT efficientNMSPlugin，它涉及多个CUDA核函数，包括EfficientNMSFilter、RadixSort、EfficientNMS等，我们只报告EfficientNMS核函数的执行时间。我们在T4 GPU上测试速度，上述实验中的输入图像和预处理保持一致。我们使用的超参数及相应的结果如表1所示。

3.2、端对端速度基准

为了实现对各种实时检测器端到端推理速度的公平比较，我们建立了一个端到端速度测试基准。考虑到NMS的执行时间可能会受到输入图像的影响，因此需要选择一个基准数据集，并计算多个图像的平均执行时间。基准采用COCO val2017作为默认数据集，为需要后处理的实时检测器添加TensorRT的NMS后处理插件。具体来说，我们根据基准数据集上相应精度的超参数测试检测器的平均推理时间，并排除IO和内存复制操作。我们利用这个基准测试在T4 GPU上测试了基于锚点的检测器YOLOv5 [10]和YOLOv7 [33]，以及基于无锚点的检测器PP-YOLOE [36]、YOLOv6 [14]和YOLOv8 [11]的端到端速度。测试结果如表2所示。根据结果，我们得出结论：对于需要NMS后处理的实时检测器，基于无锚点的检测器在等效精度下优于基于锚点的检测器，因为前者的后处理时间明显少于后者，这在以前的工作中被忽略了。这种现象的原因是，基于锚点的检测器产生的预测框比基于无锚点的检测器多（在我们测试的检测器中多了三倍）。

4、实时的DETR

4.1、模型概述

所提出的RT-DETR由一个骨干网络、一个混合编码器和一个带有辅助预测头的变换器解码器组成。模型架构的概述如图3所示。具体而言，我们利用骨干网络的最后三个阶段的输出特征 {S3，S4，S5} 作为编码器的输入。混合编码器通过内部尺度交互和跨尺度融合（在第4.2节中描述）将多尺度特征转换为图像特征序列。随后，采用IoU感知的查询选择从编码器输出序列中选择固定数量的图像特征，作为解码器的初始对象查询（在第4.3节中描述）。最后，带有辅助预测头的解码器迭代地优化对象查询以生成框和置信度分数。

4.2、高效混合编码器

计算瓶颈分析。为了加速训练收敛和提高性能，朱等人[43]建议引入多尺度特征，并提出了可变形注意机制来减少计算量。然而，尽管注意机制的改进减少了计算开销，但输入序列长度的急剧增加仍使编码器成为计算瓶颈，阻碍了DETR的实时实现。如[17]中所报告的那样，编码器占Deformable-DETR[43]的49%的GFLOPs，但只贡献了11%的AP。为了克服这个障碍，我们分析了多尺度变换器编码器中存在的计算冗余，并设计了一组变体来证明内部尺度和跨尺度特征的同时交互在计算上效率低下。

高级特征从包含图像中对象丰富语义信息的低级特征中提取出来。直觉上，在连接多尺度特征之前进行特征交互是冗余的。为了验证这个观点，我们重新思考了编码器结构，并设计了一系列具有不同编码器的变体，如图5所示。这组变体逐步提高了模型的准确性，同时通过将多尺度特征交互解耦为内部尺度交互和跨尺度融合的两个步骤操作（详细指标参见表3），显著减少了计算成本。首先，我们将DINO-R50 [40]中的多尺度变换器编码器作为基线A。接下来，插入不同形式的编码器，基于基线A生成一系列变体，如下所述：

• A → B: 变体B插入了一个单尺度变换器编码器，该编码器使用一个变换器块层。每个尺度的特征共享编码器进行内部尺度特征交互，然后将输出的多尺度特征进行级联。
• B → C: 变体C在B的基础上引入了跨尺度特征融合，将级联的多尺度特征馈送到编码器中进行特征交互。
• C → D: 变体D解耦了多尺度特征的内部尺度交互和跨尺度融合。首先，使用单尺度变换器编码器进行内部尺度交互，然后使用类似于PANet的结构 [21] 进行跨尺度融合。

• D → E: 变体E在D的基础上进一步优化了多尺度特征的内部尺度交互和跨尺度融合，采用我们设计的高效混合编码器（详见下文）。

混合设计。基于上述分析，我们重新思考了编码器的结构，并提出了一种新型的高效混合编码器。如图3所示，所提出的编码器由两个模块组成，注意力内部尺度特征交互（AIFI）模块和基于CNN的跨尺度特征融合模块（CCFM）。AIFI基于变体D进一步减少了计算冗余，只在S5上执行内部尺度交互。我们认为，将自注意操作应用于具有更丰富语义概念的高层特征可以捕捉图像中概念实体之间的联系，从而有助于后续模块对图像中的对象进行检测和识别。同时，由于低层特征缺乏语义概念并可能与高层特征交互重复或混淆，因此其内部尺度交互是不必要的。为了验证这个观点，在变体D中我们只对S5执行内部尺度交互，实验结果见表3，第DS5行。与原始变体D相比，DS5显著降低了延迟（快35%），但提高了准确性（0.4% AP更高）。这个结论对于实时检测器的设计非常重要。基于变体D，CCFM也进行了优化，将由卷积层组成的几个融合块插入到融合路径中。融合块的作用是将相邻特征融合成一个新特征，其结构如图4所示。融合块包含N个重复块，两个路径的输出通过逐元素相加进行融合。我们可以将这个过程表述为：

4.3、IOU感知查询选择

DETR中的对象查询是一组可学习的嵌入，由解码器优化，并通过预测头映射到分类分数和边界框。然而，这些对象查询很难解释和优化，因为它们没有明确的物理含义。随后的工作[35，20，43，37，40]改进了对象查询的初始化，并将其扩展为内容查询和位置查询（锚点）。其中，[43，37，40]都提出了查询选择方案，它们共同点是利用分类分数从编码器中选择前K个特征来初始化对象查询（或仅初始化位置查询[40]）。然而，由于分类分数和位置置信度的不一致分布，一些预测框具有高分类分数但与GT框不接近，导致选择具有高分类分数但IoU得分低的框，而丢弃具有低分类分数但IoU得分高的框。这会影响检测器的性能。为了解决这个问题，我们提出了IoU感知的查询选择，通过在训练过程中限制模型在高IoU得分的特征上产生高分类分数，在低IoU得分的特征上产生低分类分数。因此，由模型根据分类分数选择的前K个编码器特征对应的预测框既具有高分类分数又具有高IoU分数。我们将检测器的优化目标重新表述如下：

效果分析。为了分析所提出的IoU感知查询选择的效果，我们在val2017数据集上可视化了由查询选择选择的编码器特征的分类分数和IoU分数，如图6所示。具体来说，我们首先根据分类分数选择前K个（在我们的实验中K = 300）编码器特征，然后可视化分类分数大于0.5的散点图。红点和蓝点分别来自于应用基准查询选择和IoU感知查询选择进行训练的模型。图中距离图像右上角越近，对应特征的质量越高，即分类标签和边界框更有可能描述图像中的真实对象。根据可视化结果，我们发现最显著的特征是大量蓝点集中在图像的右上角，而红点则集中在右下角。这表明使用IoU感知查询选择训练的模型可以产生更高质量的编码器特征。

此外，我们还定量分析了两种点的分布特征。图中蓝点比红点多138％，即分类分数小于或等于0.5的低质量特征更多地对应红点。我们还分析了分类分数大于0.5的特征的IoU分数，发现IoU分数大于0.5的蓝点比红点多120％。定量结果进一步证明了IoU感知查询选择可以为对象查询提供更准确的分类（高分类分数）和精确的位置信息（高IoU分数），从而提高检测器的准确性。详细的定量结果在第5.4节中给出。

4.4、扩展的RT-DETR

为了提供可扩展的RT-DETR版本，我们将ResNet [12]主干替换为HGNetv2。我们使用深度乘数和宽度乘数同时缩放主干和混合编码器。因此，我们得到两个具有不同参数数目和FPS的RT-DETR版本。对于我们的混合编码器，我们通过调整CCFM中RepBlocks的数量和编码器的嵌入维度来控制深度乘数和宽度乘数。值得注意的是，我们提出的不同规模的RT-DETR保持了同质化的解码器，这有助于使用高精度大型DETR模型对轻量级检测器进行蒸馏。这将是一个可探索的未来方向。

5、实验

5.1、设置

数据集。我们在Microsoft COCO数据集上进行了大量实验，以验证所提出的检测器。对于消融研究，我们在COCO train2017数据集上进行训练，并在COCO val2017数据集上进行验证。我们使用单尺度图像作为输入，使用标准的COCO AP指标进行评估。

实现细节。我们使用来自PaddleClas [5]的ImageNet [28]预训练的ResNet [12]和HGNetv2系列作为我们的主干。AIFI包括1个Transformer层，CCMF中的融合块默认由3个RepBlocks组成。在IoU感知查询选择中，我们选择前300个编码器特征来初始化解码器的对象查询。解码器的训练策略和超参数几乎遵循DINO [40]。我们使用AdamW优化器进行训练，base learning rate为0.0001，weight decay为0.0001，global gradient clip norm为0.0001，linear warmup steps为2000。主干设置的学习率遵循[4]。我们还使用指数移动平均（EMA），ema decay为0.9999。1×配置表示总时期为12，如果未指定，所有消融实验均使用1×。最终报告的结果使用6×配置。数据增强包括随机的{颜色扭曲，扩展，裁剪，翻转，调整大小}操作，遵循[36]。

5.2、与SOTA比较

表2比较了提出的RT-DETR与其他实时和端到端目标检测器。我们提出的RT-DETR-L实现了53.0%的AP和114 FPS，而RT-DETR-X实现了54.8%的AP和74 FPS，在速度和准确性方面都优于同等规模的所有YOLO检测器。此外，我们提出的RT-DETR-R50实现了53.1%的AP和108 FPS，而RT-DETR-R101实现了54.3%的AP和74 FPS，速度和准确性方面都优于同等主干的最先进端到端检测器。

与实时检测器的比较。为了公平比较，我们在端到端设置中比较缩放后的RT-DETR的速度和准确性（速度测试方法请参见第3.2节）。我们在表2中将缩放后的RT-DETR与YOLOv5 [10]、PP-YOLOE [36]、YOLOv6v3.0（以下简称YOLOv6）[14]、YOLOv7 [33]和YOLOv8 [11]进行比较。与YOLOv5-L/PP-YOLOE-L/YOLOv7-L相比，RT-DETR-L的准确性显著提高了4.0%/1.6%/1.8% AP，FPS增加了111.1%/21.3%/107.3%，参数数量减少了30.4%/38.5%/11.1%。与YOLOv5-X/PP-YOLOE-X/YOLOv7-X相比，RT-DETR-X的准确性提高了4.1%/2.5%/1.9% AP，FPS增加了72.1%/23.3%/64.4%，参数数量减少了22.1%/31.6%/5.6%。与YOLOv6-L/YOLOv8-L相比，RT-DETR-L在准确性上提高了0.2%/0.1% AP，在速度上增加了15.2%/60.6% FPS，在参数数量上减少了45.8%/25.6%。与YOLOv8-X相比，RT-DETR-X在准确性上提高了0.9% AP，在速度上增加了48.0% FPS，在参数数量上减少了1.5%。

与端到端检测器的比较。表2显示，RT-DETR在所有具有相同主干的端到端检测器中实现了最先进的性能。与DINO-Deformable-DETR-R50 [40]相比，RT-DETR-R50的准确性提高了2.2% AP（53.1% AP vs. 50.9% AP），速度提高了21倍（108 FPS vs. 5 FPS），并减少了10.6%的参数数量。与SMCA-DETR-R101 [6]相比，RT-DETR-R101的准确性提高了8.0% AP。

其余实验分析都可查看表格。

pytesseract，一个超强的 Python 库！大模型开发 python 开发语言
大家好，今天为大家分享一个超强的Python库-pytesseract。在当今数字化时代，文字识别技术扮演着越来越重要的角色。Pythonpytesseract库是一个强大的工具，能够帮助开发者轻松实现图像中文字的识别。本文将深入探讨pytesseract库的原理、功能、使用方法以及实际应用场景，并提供丰富的示例代码，让读者更全面地了解这个工具库。什么是Pythonpytesseract库？Pyt
基于协同过滤推荐算法的景点票务数据系统（python-计算机毕设）计算机程序设计(接毕设) 推荐算法机器学习毕业设计 python 人工智能
摘要IABSTRACTII第1章引言1研究背景及意义1研究背景1研究意义1国内外研究现状2智慧旅游3旅游大数据3研究内容4本章小结4第2章相关技术概述5基于内容的推荐算法5基于内容的推荐算法原理5基于内容的推荐算法实现5协同过滤推荐算法6协同过滤算法原理6协同过滤算法实现7SpringBoot框架9SpringBoot简介9SpringBoot特性10SpringBoot工作原理10Vue.js框
3月TIOBE编程语言排行：Python稳居榜首，C++和Java市场份额稳步上升朱公子的Note 编程语言 python c++java TIOBE编程语言排行
TIOBE编程语言排行榜是一个基于全球程序员数量、课程数量和第三方供应商数量的指标，旨在反映编程语言的流行度。根据TIOBEIndex，它每月更新一次，计算方法基于搜索引擎（如Google、Bing、Wikipedia等）的查询结果，涵盖专业开发者的兴趣和需求。需要注意的是，TIOBE指数不代表“最佳”编程语言或代码量最多的语言，而是反映语言在开发者社区中的热度。2025年3月的排行榜特别提到Py
PyTorch模型训练实战指南：掌握动态图特性与工业级部署技巧 lmtealily pytorch 人工智能 python
前言在深度学习领域，PyTorch凭借其动态计算图、高效的自动微分系统及高度Pythonic的设计哲学，已成为学术界与工业界的主流框架。其即时执行模式大幅简化了模型调试流程，而灵活的模块化设计则为复杂模型的构建提供了坚实基础。然而，从实验原型到工业级部署的全链路实践中，开发者仍需系统性掌握框架核心特性与工程化技巧。本文以实战为导向，深入剖析PyTorch动态图机制与自动微分原理，详解从数据预处理、
Python第六章03：列表的常用操作苹果.Python.八宝粥 python windows 开发语言
#列表的常用操作"""如:定义、下标索引获取数据、插入元素、删除元素、清空列表、修改元素、统计修改元素个数在Python中，如果将函数定义为class的成员，那么函数称为方法函数：defadd(x,y):returnx+y方法：classStudent:defadd(self,x,y):returnx+y方法和函数的功能一样，可以传入参数，有返回值，方法调用使用格式不同：函数的使用：num=add
Python第六章01：列表（lsit）定义语法苹果.Python.八宝粥 python 开发语言
#列表（list）的定义语法#基本语法：#字面量：#[元素1，元素2，元素3，元素4，......]#定义变量#变量名称=[元素1，元素2，元素3，元素4，......]#定义空列表#变量名称=[]#变量名称=list[]#列表内的每一个数据，称之为元素#1.以[]作为标识#2.列表内每一个元素直接用，逗号隔开#3.列表可以一次存储多个数据，且可以为不同的数据类型，支持嵌套。#定义一个列表my_l
31天Python入门——第5天:循环那些事儿安然无虞 Python手把手教程 python 开发语言后端
你好，我是安然无虞。文章目录1.while循环1.1while循环的嵌套1.2补充学习:print函数2.for循环2.1range函数2.2for循环2.3continue和break以及return2.4for循环的嵌套3.补充学习3.1enumerate函数3.2zip函数3.3不要在遍历列表的过程中删除元素循环是编程语言常见的一种流程控制所谓循环就是反复的执行一段代码我们人类语言要让别人反
目标检测YOLO实战应用案例100讲-基于毫米波雷达与摄像头协同的道路目标检测与识别（续）林聪木目标检测 YOLO 人工智能
目录3.2实测数据采集与分析3.2.1回波数据处理3.2.2毫米波雷达数据采集实验3.3基于传统图像特征的目标识别算法3.3.1基于灰度共生矩阵的时频图特征提取3.3.2支持向量机分类器3.3.3实验及结果分析3.4基于卷积神经网络的目标识别算法3.4.1卷积神经网络的基本理论3.4.2卷积神经网络框架设计3.4.3实验及结果分析基于图像的目标检测算法4.1目标检测算法一般流程4.2典型目标检测算
计算机视觉毕业设计选题推荐：选题技巧建议收藏 HaiLang_IT 毕业设计人工智能计算机视觉
目录前言毕设选题开题指导建议更多精选选题选题帮助最后前言大家好,这里是海浪学长毕设专题!大四是整个大学期间最忙碌的时光，一边要忙着准备考研、考公、考教资或者实习为毕业后面临的升学就业做准备,一边要为毕业设计耗费大量精力。学长给大家整理了人工智能专业最新精选选题，如遇选题困难或选题有任何疑问，都可以问学长哦(见文末)!对毕设有任何疑问都可以问学长哦!更多选题指导:最新最全计算机专业毕设选题精选推荐汇
「Python数据分析」Pandas基础，筛选数据利器：布尔索引奕澄羽邦 python 数据分析 pandas
我们在处理数据的时候，数据筛选是一个重要的过程。利用布尔索引，我们可以选择需要的数据区间。布尔索引，是利用各种不等式，以及与或非操作，来对数据区间进行选择。在pandas中，与操作，对应的是&这个符号，表示选取两个数据集重合的部分。或操作，对应的是|这个符号，表示选择两个数据集中，只要在一个数据集中出现的部分。非操作，对应的是~这个符号，表示选取一个数据集中，相反的部分。我们下面通过具体的例子，来
【数学建模】灰色关联分析模型详解与应用烟锁池塘柳0 数学建模数学建模算法
灰色关联分析模型详解与应用文章目录灰色关联分析模型详解与应用引言灰色系统理论简介灰色关联分析基本原理灰色关联分析计算步骤1.确定分析序列2.数据无量纲化处理3.计算关联系数4.计算关联度灰色关联分析应用实例实例：某企业生产效率影响因素分析灰色关联分析在各领域的应用灰色关联分析的Python实现灰色关联分析的局限性结论引言在数据分析领域，我们经常面临样本量少、信息不完全、数据不确定性高的情况。传统的
数据分析_python进行数据筛选1_行筛选 Monkey*王 python 数据分析 pandas
以titanic的训练数据为例进行展示，为了简化取前十行为例首先导入模块，导入数据importpandasaspdimportnumpyasnpdf=pd.read_csv(r"C:\Users\admin\Desktop\train.csv")df=df.head(10)df.index=['a','b','c','d','e','f','g','h','i','g']筛选单行1.利用df[行索
Python的那些事第四十六篇：基于属性的测试库hypothesis研究暮雨哀尘 Python的那些事 python 开发语言属性测试库 hypothesis 执行流程构建
一、引言（一）研究背景随着软件系统复杂性的不断增加，软件测试在确保软件质量方面的重要性愈发凸显。传统测试方法在面对大规模、复杂软件系统时，往往存在测试用例设计不全面、测试执行效率低下等问题。基于属性的测试作为一种新兴的测试方法，通过定义软件系统的属性来指导测试用例的设计与执行，为解决上述问题提供了新的思路。（二）研究意义本研究旨在深入探讨基于属性的测试库的构建与应用，以提高软件测试的效率和质量，降
3月20日复盘四万二千正式复盘 python 前端机器学习
挑战全栈第八天！今天更新Python中的迭代器和生成器，以及函数式编程的内容。8.3super().init()super().__init__()是Python中用于调用父类（基类）构造函数的一种方式。它通常用于子类的构造函数中，以确保父类的构造函数被正确调用和初始化。这在继承（inheritance）中尤为重要，因为父类的初始化代码可能包含设置实例变量或执行其他重要的初始化任务。classPa
Python + Qt Designer构建多界面GUI应用程序：Python如何调用多个界面文件懒大王爱吃狼 python python qt 命令模式 mysql 数据库 Python基础开发语言
引言QtDesigner是一个用户友好的图形用户界面设计工具，它可以帮助开发人员通过拖放的方式快速创建界面。在实际开发中，往往需要设计多个界面文件，并在Python代码中进行统一管理和使用。本文将介绍如何在Python中使用QtDesigner设计好的多个界面文件的常用方法。方法一：单独加载并显示如果界面文件相对独立，并且没有复杂的依赖关系，可以考虑单独加载并显示每个界面文件。fromPyQt5i
PyTorch 深度学习实战（19）：离线强化学习与 Conservative Q-Learning (CQL) 算法进取星辰 PyTorch 深度学习实战深度学习 pytorch 算法
在上一篇文章中，我们探讨了分布式强化学习与IMPALA算法，展示了如何通过并行化训练提升强化学习的效率。本文将聚焦离线强化学习（OfflineRL）这一新兴方向，并实现ConservativeQ-Learning(CQL)算法，利用Minari提供的静态数据集训练安全的强化学习策略。一、离线强化学习与CQL原理1.离线强化学习的特点无需环境交互：直接从预收集的静态数据集学习数据效率高：复用历史经验
【科大讯飞笔试题汇总】2024-04-21-科大讯飞春招笔试题-三语言题解(CPP/Python/Java) 春秋招笔试突围最新互联网春秋招试题合集 python java 开发语言春招笔试互联网大厂笔试题
大家好这里是KK爱Coding，一枚热爱算法的程序员✨本系列打算持续跟新科大讯飞近期的春秋招笔试题汇总～ACM银牌|多次AK大厂笔试｜编程一对一辅导感谢大家的订阅➕和喜欢KK这边最近正在收集近一年互联网各厂的笔试题汇总，如果有需要的小伙伴可以关注后私信一下KK领取，会在飞书进行同步的跟新，5月1日之前限时免费领取哦，后续会由ACM银牌团队持续维护~。文章目录01.硬币最少组合问题问题描述输入格式输
Pycharm python解释器 unsupported python 3.1 解决大表哥在曾母暗沙 Python PyCharm python pycharm ide 解释器模式
Pycharm环境unsupportedpython3.1解决1.问题重现2.原因分析3.解决方法1.问题重现之前使用Pycharm2024.1.1的时候，环境配置的Python3.11.9，现在改成使用Pycharm2020.2.2，结果Python解释器显示“unsupportedpython3.1”，如下图：2.原因分析因为Pycharm2020.2.2支持的Python最高版本就是Pyth
申请 Let's Encrypt 的免费 TLS 证书实现网站的 https 访问 python
因为这个使用apt安装的python第三方包的版本为什么这么滞后？原因，所以我不是用sudo把证书弄到系统路径，而是选择到普通用户路径下面╭─pon@aliyun2core2GB~/certbot╰─➤tree.├──config│ ├──accounts│ │ └──acme-v02.api.letsencrypt.org│ │ └──directory│ │ └──9401598
一切皆是映射：DQN训练加速技术：分布式训练与GPU并行 AI天才研究院计算 AI大模型企业级应用开发实战 ChatGPT 计算科学神经计算深度学习神经网络大数据人工智能大型语言模型 AI AGI LLM Java Python 架构设计 Agent RPA
1.背景介绍1.1深度强化学习的兴起近年来，深度强化学习（DeepReinforcementLearning，DRL）在游戏、机器人控制、自然语言处理等领域取得了令人瞩目的成就。作为一种结合深度学习和强化学习的强大技术，DRL能够使智能体在与环境交互的过程中学习最优策略，从而实现自主决策和控制。1.2DQN算法及其局限性深度Q网络（DeepQ-Network，DQN）是DRL的一种经典算法，它利用
python面试题详解 __wishing__ python
十道经典面试题（python）1.一行代码实现累加1-100之和print(sum(range(1,101)))输出结果：5050分析：利用sum函数进行累加。range控制序列。2.一行代码实现列表去重#声明需要去重的列表list1=[1,1,2,2,3,3,4,4]list1=list(set(list1))</
LangChain入门：使用Python和通义千问打造免费的Qwen大模型聊天机器人南七小僧人工智能网站开发 AI技术产品经理服务器数据库 windows
前言LangChain是一个用于开发由大型语言模型（LargeLanguageModels，简称LLMs）驱动的应用程序的框架。它提供了一个灵活的框架，使得开发者可以构建具有上下文感知能力和推理能力的应用程序，这些应用程序可以利用公司的数据和APIs。这个框架由几个部分组成。LangChain库：Python和JavaScript库。包含了各种组件的接口和集成，一个基本的运行时，用于将这些组件组合
大规模语言模型从理论到实践分布式训练的集群架构 AI智能涌现深度研究 DeepSeek R1 &大数据AI人工智能 Python入门实战计算科学神经计算深度学习神经网络大数据人工智能大型语言模型 AI AGI LLM Java Python 架构设计 Agent RPA
大规模语言模型从理论到实践分布式训练的集群架构作者：禅与计算机程序设计艺术/ZenandtheArtofComputerProgramming1.背景介绍1.1问题的由来随着深度学习技术的飞速发展，大规模语言模型（LargeLanguageModels,LLMs）在自然语言处理（NaturalLanguageProcessing,NLP）领域取得了突破性进展。LLMs，如BERT、GPT-3等，通
pygmsh 项目常见问题解决方案葛雨禹
pygmsh项目常见问题解决方案pygmsh:spider_web:GmshforPython项目地址:https://gitcode.com/gh_mirrors/py/pygmsh1.项目基础介绍和主要编程语言项目名称:pygmsh项目简介:pygmsh是一个结合了Gmsh和Python的开源项目。它通过提供Gmsh的Python接口，简化了复杂几何体的创建过程。pygmsh提供了许多有用的抽
python之gmsh划分网格老歌老听老掉牙 python有限元分析 python 开发语言 gmsh 划分网格
Gmsh（GeometryModelingandMeshingSuite）是一个开源的三维有限元网格生成器，它集成了内置的CAD引擎和后处理器。Gmsh的设计目标是提供一个快速、轻量级且用户友好的网格工具，同时具备参数化输入和高级可视化能力。Gmsh围绕几何（geometry）、网格（mesh）、求解器（solver）和后处理（post-processing）四个模块构建，用户可以通过图形用户界面
图生视频技术的发展与展望：从技术突破到未来图景 Liudef06 Stable Diffusion 音视频人工智能深度学习 stable diffusion
一、技术发展现状图生视频（Image-to-VideoGeneration）是生成式人工智能（AIGC）的重要分支，其核心是通过单张或多张静态图像生成动态视频序列。近年来，随着深度学习、多模态融合和计算硬件的进步，图生视频技术经历了从基础研究到商业落地的快速演进。早期探索与GAN的奠基早期图生视频技术主要基于生成对抗网络（GAN），通过对抗训练生成低分辨率的视频片段。例如，DeepMind的DVD
已解决：python多线程使用TensorRT输出为零？附tensorrt推理代码李卓璐算法实战 python 开发语言
我是多个不同类型的模型多线程调用报错。设备：cuda12.1,cudnn8.9.2,tensorrt8.6.11.问题tensorrt的推理没输出？？？有输入：想要的输出：原因：多进程时,每进程应单独调用importpycuda.driverascuda和cuda.init()，完成初始化CUDA驱动，并需要使用self.cfx.push()和self.cfx.pop()管理CUDA上下文，以保证
Python 的 ultralytics 库详解白.夜人工智能
ultralytics是一个专注于计算机视觉任务的Python库，尤其以YOLO（YouOnlyLookOnce）系列模型为核心，提供了简单易用的接口，支持目标检测、实例分割、姿态估计等任务。本文将详细介绍ultralytics库的功能、安装方法、核心模块以及使用示例。1.ultralytics库简介ultralytics库由Ultralytics团队开发，旨在为YOLO系列模型提供高效、灵活且易
输入某年某月某日，判断这一天是这一年的第几天python 发现文化fu python python
题目：输入某年某月某日，判断这一天是这一年的第几天python输入某年某月某日，判断这一天是这一年的第几天python思路：*判断闰年能被4整除但不能被100整除，年份能被400整除#方法1sum=0if(year%4==0andyear%100!=0)oryear%400==0:feb=29else:feb=28month_day=[0,31,feb,31,30,31,30,31,31,30,3
python练习3：输入某年某月某日，判断这一天是这一年的第几天？柯.姐姐 python
#输入某年某月某日，判断这一天是这一年的第几天？list=[0,31,59,90,120,151,181,212,243,273,304,334]year=int(input('请输入年份：'))month=int(input('请输入月份：'))day=int(input('请输入天：'))ifmonth>0andmonth2:result=result+1print("这是第%d天"%resu
sql统计相同项个数并按名次显示朱辉辉33 java oracle
现在有如下这样一个表： A表 ID Name time ------------------------------ 0001 aaa 2006-11-18 0002 ccc 2006-11-18 0003 eee 2006-11-18 0004 aaa 2006-11-18 0005 eee 2006-11-18 0004 aaa 2006-11-18 0002 ccc 20
Android+Jquery Mobile学习系列-目录白糖_ JQuery Mobile
最近在研究学习基于Android的移动应用开发，准备给家里人做一个应用程序用用。向公司手机移动团队咨询了下，觉得使用Android的WebView上手最快，因为WebView等于是一个内置浏览器，可以基于html页面开发，不用去学习Android自带的七七八八的控件。然后加上Jquery mobile的样式渲染和事件等，就能非常方便的做动态应用了。从现在起，往后一段时间，我打算
如何给线程池命名 daysinsun 线程池
在系统运行后，在线程快照里总是看到线程池的名字为pool-xx，这样导致很不好定位，怎么给线程池一个有意义的名字呢。参照ThreadPoolExecutor类的ThreadFactory，自己实现ThreadFactory接口，重写newThread方法即可。参考代码如下： public class Named
IE 中"HTML Parsing Error:Unable to modify the parent container element before the 周凡杨 html 解析 error readyState
错误： IE 中"HTML Parsing Error:Unable to modify the parent container element before the child element is closed" 现象：同事之间几个IE 测试情况下，有的报这个错，有的不报。经查询资料后，可归纳以下原因。
java上传 g21121 java
我们在做web项目中通常会遇到上传文件的情况，用struts等框架的会直接用的自带的标签和组件，今天说的是利用servlet来完成上传。我们这里利用到commons-fileupload组件，相关jar包可以取apache官网下载：http://commons.apache.org/ 下面是servlet的代码： //定义一个磁盘文件工厂 DiskFileItemFactory fact
SpringMVC配置学习 510888780 spring mvc
spring MVC配置详解现在主流的Web MVC框架除了Struts这个主力外，其次就是Spring MVC了，因此这也是作为一名程序员需要掌握的主流框架，框架选择多了，应对多变的需求和业务时，可实行的方案自然就多了。不过要想灵活运用Spring MVC来应对大多数的Web开发，就必须要掌握它的配置及原理。　　一、Spring MVC环境搭建：（Spring 2.5.6 + Hi
spring mvc-jfreeChart 柱图(1) 布衣凌宇 jfreechart
第一步：下载jfreeChart包，注意是jfreeChart文件lib目录下的，jcommon-1.0.23.jar和jfreechart-1.0.19.jar两个包即可；第二步：配置web.xml; web.xml代码如下 <servlet> <servlet-name>jfreechart</servlet-nam
我的spring学习笔记13-容器扩展点之PropertyPlaceholderConfigurer aijuans Spring3
PropertyPlaceholderConfigurer是个bean工厂后置处理器的实现，也就是BeanFactoryPostProcessor接口的一个实现。关于BeanFactoryPostProcessor和BeanPostProcessor类似。我会在其他地方介绍。PropertyPlaceholderConfigurer可以将上下文（配置文件）中的属性值放在另一个单独的标准java P
java 线程池使用 Runnable&Callable&Future antlove java thread Runnable callable future
1. 创建线程池 ExecutorService executorService = Executors.newCachedThreadPool(); 2. 执行一次线程，调用Runnable接口实现 Future<?> future = executorService.submit(new DefaultRunnable()); System.out.prin
XML语法元素结构的总结百合不是茶 xml 树结构
1.XML介绍1969年 gml (主要目的是要在不同的机器进行通信的数据规范)1985年 sgml standard generralized markup language1993年 html(www网)1998年 xml extensible markup language
改变eclipse编码格式 bijian1013 eclipse 编码格式
1.改变整个工作空间的编码格式改变整个工作空间的编码格式，这样以后新建的文件也是新设置的编码格式。 Eclipse->window->preferences->General->workspace-
javascript中return的设计缺陷 bijian1013 JavaScript AngularJS
代码1： <script> var gisService = (function(window) { return { name:function () { alert(1); } }; })(this); gisService.name(); &l
【持久化框架MyBatis3八】Spring集成MyBatis3 bit1129 Mybatis3
pom.xml配置 Maven的pom中主要包括： MyBatis MyBatis-Spring Spring MySQL-Connector-Java Druid applicationContext.xml配置 <?xml version="1.0" encoding="UTF-8"?> &
java web项目启动时自动加载自定义properties文件 bitray java Web 监听器相对路径
创建一个类 public class ContextInitListener implements ServletContextListener 使得该类成为一个监听器。用于监听整个容器生命周期的，主要是初始化和销毁的。类创建后要在web.xml配置文件中增加一个简单的监听器配置，即刚才我们定义的类。 <listener> <des
用nginx区分文件大小做出不同响应 ronin47
昨晚和前21v的同事聊天，说到我离职后一些技术上的更新。其中有个给某大客户(游戏下载类)的特殊需求设计，因为文件大小差距很大——估计是大版本和补丁的区别——又走的是同一个域名，而squid在响应比较大的文件时，尤其是初次下载的时候，性能比较差，所以拆成两组服务器，squid服务于较小的文件，通过pull方式从peer层获取，nginx服务于较大的文件，通过push方式由peer层分发同步。外部发布
java-67-扑克牌的顺子.从扑克牌中随机抽5张牌，判断是不是一个顺子，即这5张牌是不是连续的.2-10为数字本身，A为1，J为11，Q为12，K为13，而大 bylijinnan java
package com.ljn.base; import java.util.Arrays; import java.util.Random; public class ContinuousPoker { /** * Q67 扑克牌的顺子从扑克牌中随机抽5张牌，判断是不是一个顺子，即这5张牌是不是连续的。 * 2-10为数字本身，A为1，J为1
翟鸿燊老师语录 ccii 翟鸿燊
一、国学应用智慧TAT之亮剑精神A 1. 角色就是人格就像你一回家的时候，你一进屋里面，你已经是儿子，是姑娘啦，给老爸老妈倒怀水吧，你还觉得你是老总呢？还拿派呢？就像今天一样，你们往这儿一坐，你们之间是什么，同学，是朋友。还有下属最忌讳的就是领导向他询问情况的时候，什么我不知道，我不清楚，该你知道的你凭什么不知道
[光速与宇宙]进行光速飞行的一些问题 comsci 问题
在人类整体进入宇宙时代，即将开展深空宇宙探索之前，我有几个猜想想告诉大家仅仅是猜想。。。未经官方证实 1：要在宇宙中进行光速飞行，必须首先获得宇宙中的航行通行证，而这个航行通行证并不是我们平常认为的那种带钢印的证书，是什么呢？下面我来告诉
oracle undo解析 cwqcwqmax9 oracle
oracle undo解析2012-09-24 09:02:01 我来说两句作者：虫师收藏我要投稿 Undo是干嘛用的？ &nb
java中各种集合的详细介绍 dashuaifu java 集合
一，java中各种集合的关系图 Collection 接口的接口对象的集合 ├ List 子接口 &n
卸载windows服务的方法 dcj3sjt126com windows service
卸载Windows服务的方法在Windows中，有一类程序称为服务，在操作系统内核加载完成后就开始加载。这里程序往往运行在操作系统的底层，因此资源占用比较大、执行效率比较高，比较有代表性的就是杀毒软件。但是一旦因为特殊原因不能正确卸载这些程序了，其加载在Windows内的服务就不容易删除了。即便是删除注册表中的相应项目，虽然不启动了，但是系统中仍然存在此项服务，只是没有加载而已。如果安装其他
Warning: The Copy Bundle Resources build phase contains this target's Info.plist dcj3sjt126com ios xcode
http://developer.apple.com/iphone/library/qa/qa2009/qa1649.html Excerpt: You are getting this warning because you probably added your Info.plist file to your Copy Bundle
2014之C++学习笔记（一） Etwo C++Etwo Etwo iterator 迭代器
已经有很长一段时间没有写博客了，可能大家已经淡忘了Etwo这个人的存在，这一年多以来，本人从事了AS的相关开发工作，但最近一段时间，AS在天朝的没落，相信有很多码农也都清楚，现在的页游基本上达到饱和，手机上的游戏基本被unity3D与cocos占据，AS基本没有容身之处。so。。。最近我并不打算直接转型
js跨越获取数据问题记录 haifengwuch jsonp json Ajax
js的跨越问题，普通的ajax无法获取服务器返回的值。第一种解决方案，通过getson，后台配合方式，实现。 Java后台代码： protected void doPost(HttpServletRequest req, HttpServletResponse resp) throws ServletException, IOException { String ca
蓝色jQuery导航条 ini JavaScript html jquery Web html5
效果体验：http://keleyi.com/keleyi/phtml/jqtexiao/39.htmHTML文件代码： <!DOCTYPE html> <html xmlns="http://www.w3.org/1999/xhtml"> <head> <title>jQuery鼠标悬停上下滑动导航条 - 柯乐义<
linux部署jdk,tomcat,mysql kerryg jdk tomcat linux mysql
1、安装java环境jdk: 一般系统都会默认自带的JDK,但是不太好用，都会卸载了，然后重新安装。 1.1）、卸载：（rpm -qa :查询已经安装哪些软件包； rmp -q 软件包：查询指定包是否已
DOMContentLoaded VS onload VS onreadystatechange mutongwu jquery js
1. DOMContentLoaded 在页面html、script、style加载完毕即可触发，无需等待所有资源（image/iframe）加载完毕。（IE9+） 2. onload是最早支持的事件，要求所有资源加载完毕触发。 3. onreadystatechange 开始在IE引入，后来其它浏览器也有一定的实现。涉及以下 document , applet, embed, fra
sql批量插入数据 qifeifei 批量插入
hi，自己在做工程的时候，遇到批量插入数据的数据修复场景。我的思路是在插入前准备一个临时表，临时表的整理就看当时的选择条件了，临时表就是要插入的数据集，最后再批量插入到数据库中。 WITH tempT AS ( SELECT item_id AS combo_id, item_id, now() AS create_date FROM a
log4j打印日志文件如何实现相对路径到项目工程下 thinkfreer Web log4j 应用服务器日志
最近为了实现统计一个网站的访问量，记录用户的登录信息，以方便站长实时了解自己网站的访问情况，选择了Apache 的log4j,但是在选择相对路径那块卡主了，X度了好多方法(其实大多都是一样的内用，还一个字都不差的)，都没有能解决问题，无奈搞了2天终于解决了，与大家分享一下需求：用户登录该网站时，把用户的登录名,ip,时间。统计到一个txt文档里，以方便其他系统调用此txt。项目名
linux下mysql-5.6.23.tar.gz安装与配置笑我痴狂 mysql linux unix
1.卸载系统默认的mysql [root@localhost ~]# rpm -qa | grep mysql mysql-libs-5.1.66-2.el6_3.x86_64 mysql-devel-5.1.66-2.el6_3.x86_64 mysql-5.1.66-2.el6_3.x86_64 [root@localhost ~]# rpm -e mysql-libs-5.1