VKKKKKK

目标检测：SSD——Single Shot Dectector

Abstract

文章提出SSD物体检测模型，将一系列bounding boxes（由不同的aspect ratio和scale的feature map生成）离散化（default boxes），在保证准确率的同时提高了速度，即使输入的图像很小，SSD仍具有比其他模型高的准确率。
预测阶段：

生成每一个default box对每种类别的预测的分数（score)
对box做出调整，以达到更加匹配物体形状的目的
结合了不同分辨率的feature map的预测结果以处理不同尺寸的物体

SSD没有使用proposal generation、subsequent pixel 和 feature resample ，这使得SSD更加容易训练并且更容易融合到需要使用检测模型的系统中。

在PASCAL VOC、COCO和ILSVRC数据集上的实验证明SSD比其他使用了object proposal step的模型要快得多。

对于300 × 300的图像输入，在VOC2007测试集上SSD实现了74.3%的mAP；对于512 × 512 的图像输入，SSD实现了76.9%的mAP，超过了Faster RCNN。

代码实现：
Caffe: a fast open framework for deep learning.

Introduction

这篇论文的核心思想是：

using a small convolutional filter to predict object categories and offsets in bounding box locations, using separate predictors (filters) for different aspect ratio detections, and applying these filters to multiple feature maps from the later stages of a network in order to perform detection at multiple scales.

文章贡献：

提出了SSD模型，比之前的YOLO模型更快且准确率更高，速度甚至与Faster R-CNN相媲美
SSD的核心是预测分类的得分(score)以及使用小的卷积核预测一系列defaultboxes的box offsets
为了得到较高的准确率，在不同尺寸的feature map上进行预测，并得到了具有不同长宽比(aspect ratio)
这是一个简单的end-to-end的设计，同时即使是在低分辨率的图像上仍具有高精确度，在速度和准确率之间取得较好的trade-off
在PASCAL VOC、COCO和 ILSVRC 上都进行了测试（测试内容包括运行时间和准确率），与最近的 state-of-teh-art 模型都进行了比较

The Single Shot Dectector（SSD）

文章的第二部分描述了SSD的架构以及训练时的方法，后续（第三部分）会展示模型细节以及实验结果

Model

SSD基于前向传播卷积网络，产生一系列固定大小的bounding boxes以及每个box包含物体实例的得分(score)，之后是一个non-maximum suppression step（非极大抑制）来预测最终结果。SSD模型最开始的部分被称为 base network（一个标准的图像分类架构），之后是这篇文章额外添加的辅助结构：

Multi-scale feature maps for detector 这部分使用一系列大小递减的卷积层，以实现多尺度的预测
Convolution predictors for detector 使用一系列卷积核产生一系列的预测结果，对于一个 m×n，通道数为p的图像采用3×3×p的小卷积核，产生的预测结果要么是各分类的得分，要么是default box的offset
Default boxes and aspect ratios 每个feature map中的box的位置都是固定的，在feature map的每个单元格中，我们需要预测得到的box与default box之间的offset以及对每个box中的物体分类预测的得分。对于每个位置上的 k 个box，我们需要计算出关于 c 个类的score，还有这个 box 相对于 default box 的 4 个offsets（height、weight、。于是，在 feature map 中的每一个 feature map cell 上，就需要有 (c+4)×k(c+4)×k 个 filters。对于一张 m×nm×n 大小的 feature map，即会产生 (c+4)×k×m×n(c+4)×k×m×n 个输出结果。

Training

SSD与其他使用 region proposal 的检测模型的不同之处在于它需要将 ground truth 信息放入一系列固定输出的boxes里面，即SSD事先确定的一系列bounding boxes。

将ground truth 信息赋予到唯一的一个box之后，就可以进行end-to-end的损失函数的计算以及反向传播的计算了。

SSD的训练过程中包含了对default box 的选择、scale的选择、hard negative mining 以及扩张策略(augmentation strategies)。

Matching strategy

训练过程中，我们需要从一堆不同位置，不同尺寸，不同aspect ratio的boxes中确定对应 ground truth 的唯一的default box。开始的使用我们跟 MultiBox 一样使用最佳的 jaccard overlap，但是跟 MultiBox 有区别的是，MultiBox使用的是覆盖度最大的box，而SSD则是从覆盖率大于某一阈值(0.5)的boxes中挑出一个box，简化了问题。

Training object

SSD的目标函数源于MultiBox的目标函数，但是对其进行扩展，使网络能够处理多目标类别。令第 i 个default box 对应第 j 个 ground truth 的第 p 个类别的值为：
其中，若值为1，则表示匹配，不匹配则为0。根据上面的策略，我们一定会有：
等于1表示刚好有唯一一个 default box 与 ground truth 相匹配，但是该式子表明可能存在多个default boxes 与之匹配。

总的损失函数是位置的损失函数(localization loss，loc)与分类置信度的损失函数(confidence loss，conf)的加权求和：
其中，N 是与 ground truth 相匹配的default boxes的数量。如果 N = 0，损失将被置为0。位置的损失函数(localization loss，loc)使用的是Faster R-CNN的Smooth L1 loss，用在预测的box(l)以及 ground truth(g)的参数中，来回归default bounding box(d)的中心位置(cx, cy)和它的宽(w)和高(h)。
分类置信度的损失函数(confidence loss，conf)使用的是softmax loss，输入每一类的置信度 c：
交叉验证中权重项 α被置为 1。

Choosing scales and aspect ratios for default boxes

为了处理不同尺寸的目标，有些检测模型结合了图像在不同大小下的预测结果，然而SSD使用了网络中不同layer的feature maps也能产生相同的效果，同时还实现了所有目标尺寸的参数共享。

之前的工作已经表明，因为低层的layer保留的细节更多，故使用低层的feature map可以提高效果，获得更多的语义信息。（相似的，增加 global context pooled 可以帮助平滑分割结果）

因此，SSD同时使用低层和高层的feature map来检测。下图展示了 8 × 8 以及 4 × 4 的feature map：

一般来说，不同层次的layer的感受野(receptive field)的大小不同，但是，SSD模型的 default box 不需要与每一层的感受野相适应。本文设计的设计中特定的 feature map 可以适应特定尺寸的物体。假设我们使用 m 个 feature maps 来预测结果，计算每个 feature map 的 default box 的大小：
其中，s_min表示最低层的 default box 的大小（取0.2），s_max表示最高层的default box 的大小（取0.9）。再用不同的长宽比的 default box ，表示为a_r ∈ { 1, 2, 3, 1/2, 1/3 }，则每一个 default box 的宽(width)和高(height)可以计算出来：
对于长宽比等于1 的情况，本文还专门增加了一个default box大小为s’_k：
所以现在每个 feature map 特定的位置一共有 6 个default boxes。每个 default box 的中心被设置为：
|f_k| 是第 k 个 feature map 的大小，i, j ∈[ 0, |f_k| )。

结合了所有来自所有不同大小的 feature maps 的所有位置的不同尺寸和长宽比的所有不同 default boxes 的预测结果，我们现在有许许多多的预测结果，包括目标物不同的大小和形状。例如，下图所示，狗匹配上了 4 x 4的feature map中的一个default box，而 8 x 8 的 feature map 中却一个都没有匹配，这是因为那些有着不同尺寸的 boxes 不能很好的与狗的 box 相匹配，所以在训练时被认为是负样本(negative)。

Hard negative mining

匹配之后，大多数的 default boxes 被认为是负样本，特别是在 default boxes 的数量特别大时，产生的负样本更多，这种情况下训练时模型难以收敛。这里介绍了一种正样本(positive)和负样本数量极度不平衡的情况下的训练方法。本文没有使用所有的负样本，而是将 default boxes 的负样本根据 confidence loss 的大小进行排序，并选出其中最高的一些负样本，保证负样本与正样本的比例不超过 1 : 3 。这样的策略使得优化过程更快，并且训练时更稳定。

Data augmentation

为了使输入大量不同的大小和形状的目标物体之后模型的鲁棒性(rubust)增强，每一张用于训练的图片都会被随机地进行下列选择其中之一：

使用整张原始图像
采样一个碎片(patch)，使得目标物体最小的 jaccard overlap 是 0.1，0.3，0.5，0.7，0.9
随机采样一个碎片(patch)

采样的碎片大小是原始图像的 [0.1, 1] 倍之间，长宽比在 1/2 到 2 之间。当 ground truth 的重叠区域的中心是采样碎片(sample patch)时，我们保留这一部分的重叠部分。上述的采样步骤完成后，每一个采样碎片的大小将会被重新设置到一个固定的大小，并以 0.5 的概率被水平翻转(horizontally flipped)。

Experimental Results

Base network

本文的实验都基于VGG16 （VGG16清楚的结构图可参考VGG16结构图），并在ILSVRC CLS-LOC数据集上进行与训练的，与 DeepLab-LargeFOV相似，本文将 fc6 、fc7 layer转换为卷积层，并从这两层的参数中采样。
此外，将 2 x 2 步长为 2 的池化层 p5 改成 3 x 3 步长为 1 ，并使用 atrous algorithm 来填补 “holes” 。关于 atrous algorithm 算法，其实就是带洞卷积，带洞卷积可以减小卷积核的大小。如下图所示，图©就是带洞卷积：

本文还移除了所有的 dropout 层以及 fc8 层。
文章使用初始学习率(learning rate)为 10^-3 ，动量(momentum) 为0.9，weight decay 为0.0005，batch size 为32 的SGD（随机梯度下降）微调(fine-tune)了模型的结果。学习率下降的策略根据数据集的不同有细微的改变，我们会在后面讨论这一细节。

PASCAL VOC2007

在这个数据集上与Fast R-CNN 以及 Fast R-CNN 作比较，所有网络均用相同的预训练网络(VGG16)。
如上图所示，SSD300使用 conv4_3, conv7(原来的 fc7 层), conv9_2, conv10_2, conv11_2来预测位置(location)以及置信度(confidence)，并将 conv4_3 的 default box 的大小设置为 0.1还要使用 L2 normalization)。文章采用 xavier (关于这个初始化方法，我初略的看了一下，没有去了解推导过程，大概是在保证梯度不能为 0 的前提下保证各层的激活值和状态梯度的方差在传播过程中的方差保持一致，即Glorot条件)的初始化方法来初始化所有新加的卷积层。对于 conv4_3, conv10_2, conv11_2 卷积层，每个 feature map location 仅连接 4 个 default box 并且采用的是长宽比为 1/3 和 3，而在其他的卷积层则连接了 6 个 default box。
由于 conv4_3 有着同其他卷积层不一样的feature scale，所以还要使用 L2 normalization 将该卷积层的每个位置的feature scale 调整到 20 并且在反向传播时学习 scale。
文章使用10^-3的学习率进行了 40k 次迭代，然后继续在训练集中分别用 10^-4 和 10^-5 的学习率进行 10k 次迭代。
下表显示低分辨率的SSD300模型确实比Fast R-CNN 准确，当输入为 512 x 512 的图像时(VOC2007 trainval)， SSD300甚至更加准确，超过 Faster R-CNN 1.7% mAP。当使用更多的数据进行训练时，SSD300超过Faster R-CNN 1.1% 而SSD512超过Faster R-CNN 3.6%。
在COCO trainval135k 数据集上，SSD512获得最好的结果：81.6%。

SSD可以高质量的预测多种目标类别，大部分预测置信度是正确的，它的召回率(recall)达到 85% ~ 90%。可以看出，SSD在相似目标特别是动物的预测上错误率较高，可能是因为它共享了不同类别的location。
下图(Fig.4)说明SSD在小目标的预测上不如大目标的预测，这并不奇怪，因为在更高层的卷积网络中，小目标所留下的特征信息已经所剩无几了，增大输入的size可以帮助解决这一问题，但仍有提升空间。

Model analysis

为了更好的理解SSD，本文采用控制变量法来测试SSD模型中每一部分对实验最终结果的影响。

Data augmentation is crucial Fast 和 Faster R-CNN 使用原始图像以及水平翻转进行训练，但是我们采用一种类似与YOLO的策略，额外使用了一种sampling 的策略，提高了 8.8% mAP。虽然不清楚这一策略会对 Fast 和 Faster R-CNN 有什么提高，但是效果一定没有那么好，因为它们在分类的时候采用了 feature pooling，这一做法更加rubust。
More default box shapes is better 根据前文所说，我们在每个位置连接了 6 个default box，但如果去除了长宽比为 1/3 和 3 的 box，模型的表现会下降 0.6%，更进一步除掉长宽比为 1/2 和 2 的 box 模型表现会下降 2.1%。
Atrous is faster 前文提到本文使用的模型是在VGG16的基础上进行改进，如果完全使用VGG16的模型，实验结果没什么区别，但是速度却下降了 20%。
Multiple output layers at different resolutions is better SSD的一个主要贡献是使用了不同输出layer的不同大小的default box，为了测量这一做法对结果的提高，我们移除了layers来比较结果。为了公平的比较，每移除一个layer，就调整 default box的数量(通过增加剩下的 layer 不同 scale 的 box 的数量)以保持它与原始数量相同。下表可以看出准确率从 74.3 下降到 62.4。

PASCAL VOC2007

在PASCAL VOC2007上的实验结果如下：

COCO

因为COCO数据集上的物体的scale比PASCAL VOC的小，所以我们每一层都使用更小的default box。
在COCO数据集上实验的结果如下：

Interence time

由于在这个模型中会生成大量的 box，所以要采用非极大值抑制(non-maximum suppression，nms)，当我们使用 0.01 的置信阈值时，我们可以过滤掉更多的 box，然后使用在 jaccard overlap 上非极大值抑制并且每张图片都只取前 200 个detection。

计算机视觉与深度学习：使用深度学习训练基于视觉的车辆检测器（MATLAB源码-Faster R-CNN） ZhShy23 javascript 深度学习
在人工智能领域，计算机视觉是一个重要且充满活力的研究方向。它使计算机能够理解和分析图像和视频数据，从而做出有意义的决策。其中，目标检测是计算机视觉中的一项关键技术，它旨在识别并定位图像中的多个目标对象。车辆检测作为目标检测的一个重要应用，在自动驾驶、智能交通系统等领域有着广泛的应用前景。本文将介绍如何使用MATLAB和深度学习技术，特别是FasterR-CNN模型，来训练一个车辆检测器。文章目录一
YOLOv10改进，YOLOv10检测头融合RepConv卷积，添加小目标检测层（四头检测）+CA注意机制，全网首发挂科边缘 YOLOv10改进 YOLO 目标检测人工智能计算机视觉
摘要作者提出了一种简单而强大的卷积神经网络架构，其推理阶段采用与VGG类似的网络体结构，仅由一堆3x3卷积和ReLU组成，而训练阶段的模型具有多分支拓扑。这种训练阶段和推理阶段架构的解耦通过结构重参数化技术实现，因此我们将该模型命名为RepVGG。#理论介绍RepConv通过将多个卷积操作合并成一个卷积操作来优化计算的。首先在训练过程中使用多种操作（如多个卷积层、跳跃连接等）来提高模型的表达能力和
YOLOv11改进，YOLOv11检测头融合RepConv卷积，并添加小目标检测层（四头检测），适合目标检测、分割等任务挂科边缘 YOLOv8改进 YOLO 目标检测人工智能计算机视觉
摘要作者提出了一种简单而强大的卷积神经网络架构，其推理阶段采用与VGG类似的网络体结构，仅由一堆3x3卷积和ReLU组成，而训练阶段的模型具有多分支拓扑。这种训练阶段和推理阶段架构的解耦通过结构重参数化技术实现，因此我们将该模型命名为RepVGG。#理论介绍RepConv通过将多个卷积操作合并成一个卷积操作来优化计算的。首先在训练过程中使用多种操作（如多个卷积层、跳跃连接等）来提高模型的表达能力和
new[]创建对象数组会怎样？青草地溪水旁 C++学习记录 c++构造函数
当你使用new[]操作符来创建一个对象数组时，构造函数会被调用与数组大小相等的次数。每个数组元素都会通过构造函数进行初始化。以下是一个例子：#includeclassMyClass{public:MyClass(){std::cout<<"MyClassconstructorcalled."<
【大模型】从零样本到少样本学习：一文读懂 Zero-shot、One-shot 和 Few-shot 的核心原理与应用！橙子小哥的代码世界 NLP自然语言理解大模型自然语言处理 sklearn 深度学习神经网络 tensorflow
《从零样本到少样本学习：一文读懂Zero-shot、One-shot和Few-shot的核心原理与应用！》正文：在自然语言处理（NLP）领域，Zero-shot、One-shot和Few-shot学习已经成为衡量大语言模型泛化能力的重要指标。尤其是在大规模预训练模型（如GPT系列）的推动下，这些技术得到了广泛应用和关注。本篇文章将带你全面了解这三种学习方法的核心概念、原理和实际应用场景。1.什么是
深入了解卷积神经网络（CNN）：图像处理与深度学习的革命性技术 wit_@ cnn python 机器学习深度学习 scikit-learn
深入了解卷积神经网络（CNN）：图像处理与深度学习的革命性技术导语卷积神经网络（CNN）是现代深度学习领域中最重要的模型之一，特别在计算机视觉（CV）领域具有革命性的影响。无论是图像分类、目标检测，还是人脸识别、语音处理，CNN都发挥了举足轻重的作用。随着技术的不断发展，CNN已经成为了解决众多实际问题的核心工具。但对于许多人来说，CNN仍然是一个相对复杂的概念，尤其是初学者可能会被其背后的数学原
SpringCloud微服务-OpenFeign服务接口调用 TwitchR spring cloud 微服务 java
一、OpenFeign简介官网：https://cloud.spring.io/spring-cloud-static/Hoxton.SR1/reference/htmlsingle/#spring-cloud-openfeignGitHub：https://github.com/spring-cloud/spring-cloud-openfeignFeign是一个声明式WebService客户端
【YOLOV8】YOLOV8模型训练train及参数详解小小小小祥 YOLO
介绍训练深度学习模型涉及为其提供数据并调整其参数，以便它能够做出准确的预测。UltralyticsYOLOv8的训练模式专为有效、高效地训练目标检测模型而设计，充分利用现代硬件的能力。本指南旨在涵盖使用YOLOv8强大功能集训练自定义模型所需的所有细节，帮助你快速入门。为什么选择UltralyticsYOLO进行训练？高效性：无论是单GPU设置还是跨多个GPU扩展，都能充分利用你的硬件。多功能性：
【YOLOV8】目标检测任务中应该如何选择YOLOV8n/s/m/l/x模型及输入尺寸大小小小小小祥 YOLO 目标检测人工智能
问题描述：YOLOV8作为目前主流的深度学习网络，支持图像分类、目标检测、实例分割、姿态检测、旋转目标检测等功能。对于目标检测任务官方提供了n/s/m/l/x五个模型，我们在使用YOLOV8模型进行自己任务训练时，应该如何选择YOLOV8的模型以及输入尺寸大小呢？YOLOV8官网：https://github.com/ultralytics/ultralyticsYOLOV8n/s/m/l/x信息
python的抽象类 §闪灵，～星～～ python 抽象类
python抽象类的实现可以借助库abc来实现先创建类A():importabcclassA(metaclass=abc.ABCMeta):#抽象类@abc.abstractmethod#声明抽象方法defread(self):[email protected](self):passdef__str__(self):print("共有方法,__str__方法重写")接着
C# 中的委托事件和回调函数「已注销」 C#c#开发语言后端
委托委托通俗的讲就是将自己所不能做的事情交给其他人去做，但怎样才知道帮你做事情的人的名字呢，因此需要名字这个和特性。简单的委托在C#中委托就像是一个函数的指针，在程序运行时可以使用他们来调用不同的函数。首先是委托存储了方法名，还有参数列表(方法签名)，以及返回的类型：delegatestringProcessDelegate(inti);在程序中使用委托来运行程序的话，需要满足以下几点：返回类型和
Java成员变量和局部变量 qq_43332825 java
成员变量是指在一个类中定义的变量，比如publicclassDog{Stringbreed;Stringname;Stringcolor;intage；}这些都是成员变量，用于描述类本身所具有的一些属性局部变量是指在方法中定义的变量，例如：publicvoideat(){inta=0;}用于辅助实现方法中的相关操作。在一个方法中，不允许有同名的局部变量，而在不同的方法中，允许有同名局部变量。静态成
docker 部署带多种配置文件的 springboot 项目淘气小姑娘 docker linux java
准备工作：1、将要制作镜像的Springboot项目打成jar包。2、将jar包和该程序所有配置文件放在同一文件夹下（xml、yml、txt、jar等），我这里文件夹名字为json3、在该文件夹下写Dockerfile.txt文件：#指含有jdk1.8的镜像FROMjava#将当前目录下面的json-0.0.1-SNAPSHOT.jar复制命名为app.jar（复制后的名字可以自定义）。copya
数据增强方法及其工具 cxr828 大数据
数据增强（DataAugmentation）是指在训练深度学习模型时，通过对现有数据进行一系列变换，从而生成新的样本。数据增强有助于增加数据的多样性，减少过拟合，提升模型的泛化能力，尤其是在数据量有限的情况下。数据增强可以应用于图像、文本、音频等多种类型的数据。以下是一些常见的、简单易行的图像数据增强方法及其具体实现步骤，这些方法也可以广泛应用于目标检测、图像分类、图像分割等任务。一、图像数据增强
实验室多人共享GPU服务器搭建指南（更新ing） Geodesy&Geomatic 服务器运维 gpu算力深度学习 docker
1.服务器参数设置1.1实验室服务器参数操作系统Ubuntu20.04LTS系统挂盘：SSD（2×960GB）为Raid1、STAT（2×10T）为Raid0什么是raid0、raid1、raid5、raid10？需要几块硬盘？linux安装nvidia驱动必备（笔者实验室的GPU服务器交货时已安装驱动，不再详述）Ubuntu20.04安装Nvidia驱动——4060显卡（黑屏解决方法）1.首先禁
python无人飞机 python无人驾驶医学芯片 python 开发语言
这是一个简单的无人飞机代码示例：classDrone:def__init__(self):self.flying=Falsedeftakeoff(self):ifnotself.flying:print("无人机起飞")self.flying=Trueelse:print("无人机已在空中")defland(self):ifself.flying:print("无人机降落")self.flying
python注册nacos服务 MTonj Python python 开发语言
根据nacosopenapiOpenAPI指南主要是实现以下接口：创建服务注册实例注销实例删除服务发送实例心跳实现demo如下：一个web服务1http_server1.py#coding:utf-8importsocketfrommultiprocessingimportProcessdefhandle_client(client_socket):"""处理客户端请求"""request_dat
C++.类和对象（基础）煦842 c c++
1.类的定义1.1.类的定义格式：class类名(注：类中的变量叫做成员变量，类中的函数叫做成员函数){public:成员函数private:成员变量（一般情况下成员变量都是设为私有）};（注意这里的引号不可以省略）classdate{ public:voidInit(){a=1;b=2;} private: inta_1;(为了区分成员变量，一般会在成员变量上加一个特殊标识，如这里的变量后面
【YOLOv8杂草作物目标检测】 stsdddd YOLO目标检测目标检测 YOLO 目标检测人工智能
YOLOv8杂草目标检测算法介绍模型和数据集下载算法介绍YOLOv8在禾本科杂草目标检测方面有显著的应用和效果。以下是一些关键信息的总结：农作物幼苗与杂草检测系统：基于YOLOv8深度学习框架，通过2822张图片训练了一个目标检测模型，用于检测田间的农作物幼苗与杂草对象。该系统支持图片、视频以及摄像头进行目标检测，并能保存检测结果。系统界面可实时显示目标位置、目标总数、置信度、用时等信息。YOLO
Android 后台线程氤氲息安卓原生学习 android
ExecutorServiceexecutor=Executors.newSingleThreadExecutor();executor.execute(newRunnable(){@Overridepublicvoidrun(){Bitmapbitmap=getBitmapFromUrl(url);//网络请求runOnUiThread(newRunnable(){@Overridepublic
Omnissa Dynamic Environment Manager 2412 - 个性化动态 Windows 桌面环境管理虚拟化
OmnissaDynamicEnvironmentManager2412-个性化动态Windows桌面环境管理Simplifymanagementofuserprofiles,environmentsettings,andpoliciesacrossdesktopsandapps.请访问原文链接：https://sysin.org/blog/omnissa-dynamic-environment-
Spring 开发必备：深入解析 Spring Bean 的六大作用域码农技术栈 spring 后端微服务 spring cloud spring boot
SpringBean一共有六种作用域，我们可以将它们比作是不同场景下的“服务助手”。1.单例作用域（Singleton）：•就像餐厅里只有一个“领班助手”，无论顾客多少次呼唤，来的都是同一位助手。•在Spring容器中，单例作用域的Bean也只会有一个实例，无论在哪里获取，都是同一个对象。•适用于无状态的Bean，如数据库连接池等。2.原型作用域（Prototype）：•就像餐厅里每次顾客呼唤都会
数据类库 Dataclasses 深入指南陆或愉
数据类库Dataclasses深入指南dataclassDataclassesforTypeScript&JavaScript项目地址:https://gitcode.com/gh_mirrors/da/dataclass项目介绍数据类库（Dataclasses）是Python标准库中的一个模块，自Python3.7起被引入。它通过装饰器@dataclass简化了自定义类的创建过程，自动添加了属性
深度学习模块C2f代码详解你是狒狒吗目标检测人工智能计算机视觉 pytorch YOLO 神经网络
C2f是一个用于构建卷积神经网络（CNN）的模块，特别是在YOLOv5和YOLOv8等目标检测模型中。这个模块是一个改进的CSP（CrossStagePartial）Bottleneck结构，旨在提高计算效率和特征提取能力。下面是对C2f类的详细解释：类定义和初始化Python复制classC2f(nn.Module):“”“FasterImplementationofCSPBottleneckw
华为 Ascend 平台 YOLOv5 目标检测推理教程 Lunar* 目标检测华为 YOLO 目标检测
1.背景介绍随着人工智能技术的快速发展，目标检测在智能安防、自动驾驶、工业检测等领域中扮演了重要角色。YOLOv5是一种高效的目标检测模型，凭借其速度和精度的平衡广受欢迎。华为Ascend推理框架（ACL）是AscendCANN软件栈的核心组件，专为AscendAI加速硬件（如Atlas300I）设计，可实现高性能的深度学习推理。在本文中，我们将介绍如何基于华为AscendACL推理框架对YOLO
wordpress常见数据库连接错误原因及其解决方案 wodrpress资源分享数据库 wordpress
WordPress数据库连接错误通常是由于数据库配置问题、数据库服务器问题或权限问题引起的。以下是一些常见的数据库连接错误及其解决方案：常见错误信息1.“Errorestablishingadatabaseconnection”2.“WordPressdatabaseerror:[Errormessage]”3.“Unknowndatabase”4.“Accessdeniedforuser”常见原
RabbitMQ消费者重试的两种方案 xweiran java-rabbitmq rabbitmq java 重试消息消费失败
目录直接重试优点：缺点：保存数据库的重试方案优点：缺点：选择建议适合直接重试的场景适合数据库记录的场景这篇文章总结一下消费者消费重试的方案直接重试一种是消息消费失败然后消费者直接重试，这需要配置消费者重试机制@ComponentpublicclassDirectRetryConsumer{@RabbitListener(queues="myQueue")@RabbitListener(queues
昇腾NPU推理YOLOV10目标检测（C++） weixin_51923349 c++ffmpeg opencv
1.准备工作基础环境：需要安装NPU固件驱动，CANN的包在昇腾官网下载，安装最新版就可以了。C++环境搭建链接：cplusplus/environment/catenation_environmental_guidance_CN.md·Ascend/samples-Gitee.com按照上面的链接，需要安装：presentagent,opencv,ffmpeg+acllite其中ffmpeg和o
【设计模式】6大设计原则和23种设计模式藓类少女设计模式 python
设计原则是更高层次的思想指导，强调代码的可维护性、稳定性和灵活性。设计模式是实现设计原则的具体方法和工具，解决特定场景的问题。I、6大设计原则单一职责原则（SRP,SingleResponsibilityPrinciple）每个类应该只有一个引起变化的原因，职责应该保持单一。目标：高内聚，低耦合。开闭原则（OCP,Open/ClosedPrinciple）软件实体（类、模块、函数等）应该对扩展开放
键盘录入学生信息青木川崎 java
packageDay7;importjava.util.Scanner;importjava.util.ArrayList;/*键盘录入学生信息，保存到集合中。-循环录入的方式，1：表示继续录入，0：表示结束录入。-定义学生类，属性为姓名，年龄，使用学生对象保存录入数据。-使用ArrayList集合，保存学生对象，录入结束后，遍历集合。*/publicclassDemo03ScannerDemo0
knob UI插件使用换个号韩国红果果 JavaScript jsonp knob
图形是用canvas绘制的 js代码 var paras = { max:800, min:100, skin:'tron',//button type thickness:.3,//button width width:'200',//define canvas width.,canvas height displayInput:'tr
Android+Jquery Mobile学习系列(5)-SQLite数据库白糖_ JQuery Mobile
目录导航 SQLite是轻量级的、嵌入式的、关系型数据库，目前已经在iPhone、Android等手机系统中使用,SQLite可移植性好，很容易使用，很小，高效而且可靠。因为Android已经集成了SQLite，所以开发人员无需引入任何JAR包，而且Android也针对SQLite封装了专属的API，调用起来非常快捷方便。我也是第一次接触S
impala-2.1.2-CDH5.3.2 dayutianfei impala
最近在整理impala编译的东西，简单记录几个要点：根据官网的信息（https://github.com/cloudera/Impala/wiki/How-to-build-Impala）： 1. 首次编译impala，推荐使用命令： ${IMPALA_HOME}/buildall.sh -skiptests -build_shared_libs -format 2.仅编译BE ${I
求二进制数中1的个数周凡杨 java 算法二进制
解法一：对于一个正整数如果是偶数，该数的二进制数的最后一位是 0 ，反之若是奇数，则该数的二进制数的最后一位是 1 。因此，可以考虑利用位移、判断奇偶来实现。 public int bitCount(int x){ int count = 0; while(x!=0){ if(x%2!=0){ /
spring中hibernate及事务配置 g21121 Hibernate
hibernate的sessionFactory配置：  <bean id="sessionFactory" class="org.springframework.orm.hibernate3.LocalSessionFactoryBean"> <
log4j.properties 使用 510888780 log4j
log4j.properties 使用一.参数意义说明输出级别的种类 ERROR、WARN、INFO、DEBUG ERROR 为严重错误主要是程序的错误 WARN 为一般警告，比如session丢失 INFO 为一般要显示的信息，比如登录登出 DEBUG 为程序的调试信息配置日志信息输出目的地 log4j.appender.appenderName = fully.qua
Spring mvc-jfreeChart柱图（2）布衣凌宇 jfreechart
上一篇中生成的图是静态的，这篇将按条件进行搜索，并统计成图表，左面为统计图，右面显示搜索出的结果。第一步：导包第二步；配置web.xml(上一篇有代码) 建BarRenderer类用于柱子颜色 import java.awt.Color; import java.awt.Paint; import org.jfree.chart.renderer.category.BarR
我的spring学习笔记14-容器扩展点之PropertyPlaceholderConfigurer aijuans Spring3
PropertyPlaceholderConfigurer是个bean工厂后置处理器的实现，也就是BeanFactoryPostProcessor接口的一个实现。关于BeanFactoryPostProcessor和BeanPostProcessor类似。我会在其他地方介绍。 PropertyPlaceholderConfigurer可以将上下文（配置文件）中的属性值放在另一个单独的标准java
maven 之 cobertura 简单使用 antlove maven test unit cobertura report
1. 创建一个maven项目 2. 创建com.CoberturaStart.java package com; public class CoberturaStart { public void helloEveryone(){ System.out.println("=================================================
程序的执行顺序百合不是茶 JAVA执行顺序
刚在看java核心技术时发现对java的执行顺序不是很明白了,百度一下也没有找到适合自己的资料,所以就简单的回顾一下吧代码如下; 经典的程序执行面试题 //关于程序执行的顺序 //例如： //定义一个基类 public class A(){ public A(
设置session失效的几种方法 bijian1013 web.xml session失效监听器
在系统登录后，都会设置一个当前session失效的时间，以确保在用户长时间不与服务器交互，自动退出登录，销毁session。具体设置很简单，方法有三种：（1）在主页面或者公共页面中加入：session.setMaxInactiveInterval(900);参数900单位是秒，即在没有活动15分钟后，session将失效。这里要注意这个session设置的时间是根据服务器来计算的，而不是客户端。所
java jvm常用命令工具 bijian1013 java jvm
一.概述程序运行中经常会遇到各种问题，定位问题时通常需要综合各种信息，如系统日志、堆dump文件、线程dump文件、GC日志等。通过虚拟机监控和诊断工具可以帮忙我们快速获取、分析需要的数据，进而提高问题解决速度。本文将介绍虚拟机常用监控和问题诊断命令工具的使用方法，主要包含以下工具: &nbs
【Spring框架一】Spring常用注解之Autowired和Resource注解 bit1129 Spring常用注解
Spring自从2.0引入注解的方式取代XML配置的方式来做IOC之后，对Spring一些常用注解的含义行为一直处于比较模糊的状态，写几篇总结下Spring常用的注解。本篇包含的注解有如下几个： Autowired Resource Component Service Controller Transactional 根据它们的功能、目的，可以分为三组，Autow
mysql 操作遇到safe update mode问题 bitray update
我并不知道出现这个问题的实际原理,只是通过其他朋友的博客,文章得知的一个解决方案,目前先记录一个解决方法,未来要是真了解以后,还会继续补全. 在mysql5中有一个safe update mode,这个模式让sql操作更加安全,据说要求有where条件,防止全表更新操作.如果必须要进行全表操作,我们可以执行 SET
nginx_perl试用 ronin47 nginx_perl试用
因为空闲时间比较多，所以在CPAN上乱翻，看到了nginx_perl这个项目(原名Nginx::Engine)，现在托管在github.com上。地址见：https://github.com/zzzcpan/nginx-perl 这个模块的目的，是在nginx内置官方perl模块的基础上，实现一系列异步非阻塞的api。用connector/writer/reader完成类似proxy的功能（这里
java-63-在字符串中删除特定的字符 bylijinnan java
public class DeleteSpecificChars { /** * Q 63 在字符串中删除特定的字符 * 输入两个字符串，从第一字符串中删除第二个字符串中所有的字符。 * 例如，输入”They are students.”和”aeiou”，则删除之后的第一个字符串变成”Thy r stdnts.” */ public static voi
EffectiveJava--创建和销毁对象 ccii 创建和销毁对象
本章内容： 1. 考虑用静态工厂方法代替构造器 2. 遇到多个构造器参数时要考虑用构建器（Builder模式） 3. 用私有构造器或者枚举类型强化Singleton属性 4. 通过私有构造器强化不可实例化的能力 5. 避免创建不必要的对象 6. 消除过期的对象引用 7. 避免使用终结方法 1. 考虑用静态工厂方法代替构造器类可以通过
[宇宙时代]四边形理论与光速飞行 comsci
从四边形理论来推论为什么光子飞船必须获得星光信号才能够进行光速飞行？一组星体组成星座向空间辐射一组由复杂星光信号组成的辐射频带，按照四边形-频率假说一组频率就代表一个时空的入口那么这种由星光信号组成的辐射频带就代表由这些星体所控制的时空通道，该时空通道在三维空间的投影是一
ubuntu server下python脚本迁移数据 cywhoyi python Kettle pymysql cx_Oracle ubuntu server
因为是在Ubuntu下，所以安装python、pip、pymysql等都极其方便，sudo apt-get install pymysql，但是在安装cx_Oracle（连接oracle的模块）出现许多问题，查阅相关资料，发现这边文章能够帮我解决，希望大家少走点弯路。http://www.tbdazhe.com/archives/602 1.安装python 2.安装pip、pymysql
Ajax正确但是请求不到值解决方案 dashuaifu Ajax async
Ajax正确但是请求不到值解决方案解决方案：1 . async: false , 2. 设置延时执行js里的ajax或者延时后台java方法！！！！！！！例如： $.ajax({ &
windows安装配置php+memcached dcj3sjt126com PHP Install memcache
Windows下Memcached的安装配置方法 1、将第一个包解压放某个盘下面，比如在c:\memcached。 2、在终端（也即cmd命令界面）下输入 'c:\memcached\memcached.exe -d install' 安装。 3、再输入： 'c:\memcached\memcached.exe -d start' 启动。（需要注意的: 以后memcached将作为windo
iOS开发学习路径的一些建议 dcj3sjt126com ios
iOS论坛里有朋友要求回答帖子，帖子的标题是：想学IOS开发高阶一点的东西，从何开始，然后我吧啦吧啦回答写了很多。既然敲了那么多字，我就把我写的回复也贴到博客里来分享，希望能对大家有帮助。欢迎大家也到帖子里讨论和分享，地址：http://bbs.csdn.net/topics/390920759 下面是我回复的内容：结合自己情况聊下iOS学习建议，
Javascript闭包概念 fanfanlovey JavaScript 闭包
1.参考资料 http://www.jb51.net/article/24101.htm http://blog.csdn.net/yn49782026/article/details/8549462 2.内容概述要理解闭包，首先需要理解变量作用域问题内部函数可以饮用外面全局变量 var n=999; 　　functio
yum安装mysql5.6 haisheng mysql
1、安装http://dev.mysql.com/get/mysql-community-release-el7-5.noarch.rpm 2、yum install mysql 3、yum install mysql-server 4、vi /etc/my.cnf 添加character_set_server=utf8
po/bo/vo/dao/pojo的详介 IT_zhlp80 java BO VO DAO POJO po
JAVA几种对象的解释 PO:persistant object持久对象,可以看成是与数据库中的表相映射的java对象。最简单的PO就是对应数据库中某个表中的一条记录，多个记录可以用PO的集合。PO中应该不包含任何对数据库的操作. VO:value object值对象。通常用于业务层之间的数据传递，和PO一样也是仅仅包含数据而已。但应是抽象出的业务对象,可
java设计模式 kerryg java 设计模式
设计模式的分类：一、设计模式总体分为三大类： 1、创建型模式（5种）：工厂方法模式，抽象工厂模式，单例模式，建造者模式，原型模式。 2、结构型模式（7种）：适配器模式，装饰器模式，代理模式，外观模式，桥接模式，组合模式，享元模式。 3、行为型模式（11种）：策略模式，模版方法模式，观察者模式，迭代子模式，责任链模式，命令模式，备忘录模式，状态模式，访问者
[1]CXF3.1整合Spring开发webservice——helloworld篇木头.java spring webservice CXF
Spring 版本3.2.10 CXF 版本3.1.1 项目采用MAVEN组织依赖jar 我这里是有parent的pom，为了简洁明了，我直接把所有的依赖都列一起了，所以都没version，反正上面已经写了版本 <project xmlns="http://maven.apache.org/POM/4.0.0" xmlns:xsi="ht
Google 工程师亲授：菜鸟开发者一定要投资的十大目标 qindongliang1922 工作感悟人生
身为软件开发者，有什么是一定得投资的？ Google 软件工程师 Emanuel Saringan 整理了十项他认为必要的投资，第一项就是身体健康，英文与数学也都是必备能力吗？来看看他怎么说。（以下文字以作者第一人称撰写））你的健康无疑地，软件开发者是世界上最久坐不动的职业之一。每天连坐八到十六小时，休息时间只有一点点，绝对会让你的鲔鱼肚肆无忌惮的生长。肥胖容易扩大罹患其他疾病的风险，
linux打开最大文件数量1,048,576 tianzhihehe c linux
File descriptors are represented by the C int type. Not using a special type is often considered odd, but is, historically, the Unix way. Each Linux process has a maximum number of files th
java语言中PO、VO、DAO、BO、POJO几种对象的解释衞酆夼 java VO BO POJO po
PO:persistant object持久对象最形象的理解就是一个PO就是数据库中的一条记录。好处是可以把一条记录作为一个对象处理，可以方便的转为其它对象。可以看成是与数据库中的表相映射的java对象。最简单的PO就是对应数据库中某个表中的一条记录，多个记录可以用PO的集合。PO中应该不包含任何对数据库的操作。 BO:business object业务对象封装业务逻辑的java对象

目标检测：SSD——Single Shot Dectector

目录

Abstract

Introduction

The Single Shot Dectector（SSD）

Model

Training

Matching strategy

Training object

Choosing scales and aspect ratios for default boxes

Hard negative mining

Data augmentation

Experimental Results

Base network

PASCAL VOC2007

Model analysis

PASCAL VOC2007

COCO

Interence time

你可能感兴趣的:(目标检测：SSD——Single Shot Dectector)