JustForYouW

YOLO v3论文理解

Abstract

Yolo v3: an incremental improvement
yolov3包含一堆小设计，可以使系统的性能得到更新；也包含一个新训练的、非常棒的神经网络，虽然比上一版更大一些，但精度也提高了。不用担心，虽然体量大了点，它的速度还是有保障的。在输入320×320的图片后，YOLOv3能在22ms内完成处理，并取得28.2mAP的成绩。它的精度和SSD相当，但速度要快上3倍。和旧版数据相比，v3版进步明显。在Titan X环境下，YOLOv3的检测精度为57.9AP5057.9AP50，用时51ms；而RetinaNet的精度只57.5AP5057.5AP50，但却需要198ms，相当于YOLOv3的3.8倍；

The Deal

在yolov3中，作者采用了其他论文中的方法，同时也训练了一个全新的/比其他网络更好的分类网络

Bounding Box Prediction

在yolov2/yolo9000之后，yolo系统开始利用dimensions clusters预测bounding box来作为anchor box，网络会为每一个bbox预测4个coordinate：tx/ty/tw/th，如果目标cell距离图像左上角的位移是（cx，cy），且对应的bbox prior的宽和高为pw/ph，则网络的预测值bx/by/bw/bh为：

yolov3使用逻辑回归来预测每个边界框的objectness score。如果当前预测的边界框比之前的更好地与ground truth对象重合，分数为1。如果当前的预测不是最好的，但它和ground truth对象重合到了一定阈值以上，网络会忽视这个预测。文中阈值是0.5。其中系统只为每个ground truth对象分配一个边界框。如果一个bbox prior并未分配给相应对象，那它不会对坐标或分类预测造成loss，只对objectness造成影响；

Class Prediction

每个边界框都会使用多标记分类来预测框中可能包含的类。不使用softmax，而是用单独的逻辑分类器，因为我们发现前者对于提升网络性能没什么用。在训练过程中，用二元交叉熵损失来预测类别。这个选择有助于我们把YOLO用于更复杂的领域，如Open Images Dataset 。这个数据集中包含了大量重叠的标签（如女性和人）。如果使用softmax，它会强加一个假设，使得每个框只包含一个类别。但通常情况下这样做是不妥的，多标记的分类方法能更好地模拟数据；

Prediction Across Scales And Feature Extractor

yolov3预测3种不同尺寸的box，系统使用和特征金字塔类似的概念从这个尺寸中提取特征，在基本特征提取器中增加了几个卷积层，并用最后的卷积层预测一个三维张量编码bbox：边界框、框中目标和分类预测。在COCO数据集实验中，我们的神经网络分别为每种尺寸各预测了3个边界框，所以得到的张量是N*N*[3*(4+1+80)]，其中包含4个边界框offset、1个目标预测以及80种分类预测；接着从前两个图层中得到特征图，并对它进行2次上采样。再从网络更早的图层中获得特征图，用element-wise把高低两种分辨率的特征图连接到一起。这样做能使我们找到早期特征映射中的上采样特征和细粒度特征，并获得更有意义的语义信息。之后，我们添加几个卷积层来处理这个特征映射组合，并最终预测出一个相似的、大小是原先两倍的张量；用同样的网络设计来预测边界框的最终尺寸，这个过程其实也有助于分类预测，因为我们可以从早期图像中筛选出更精细的特征。yolov3使用的prior box聚类方法和v2一样还是K-Means，它能用来确定边界框的先验。在实验中，我们选择了9个聚类和3个尺寸，然后在不同尺寸的边界框上均匀分割维度聚类。在COCO数据集上，这9个聚类分别是：(10×13)、(16×30)、(33×23)、(30×61)、(62×45)、(59×119)、(116 × 90)、(156 × 198)、(373 × 326)；
yolov3用了一个新的网络来提取特征，它融合了YOLOv2、Darknet-19以及其他新型残差网络，由连续的3×3和1×1卷积层组合而成，当然，其中也添加了一些shortcut connection，整体体量也更大。因为一共有53个卷积层，称为Darknet-53

Darknet-53在精度上可以与最先进的分类器相比，同时浮点数运算更少，速度更快，它可以实现每秒最高的测量浮点运算，可以更好地利用GPU；

How We Do

在IOU=0.5（即AP50）时，yolov3非常强大。它几乎与RetinaNet相当，并且远高于SSD variants。这就证明了它其实是一款非常灵活的检测器，擅长为检测对象生成合适的边界框。然而，随着IOU阈值增加，yolov3的性能开始同步下降，这时它预测的边界框就不能做到完美对齐了；但现在我们可以预见其中的演变趋势，随着新的多尺寸预测功能上线，yolov3将具备更高的APS性能，但是它目前在中等尺寸或大尺寸物体上的表现还相对较差，仍需进一步的完善。当基于AP50指标绘制精度和速度时，我们发现YOLOv3与其他检测系统相比具有显着优势即它的速度正在越来越快。

Network Structor Analyze

#include 
---------------------------------------------
darknet yolov layer filters size input output 

0 conv 32 3 x 3 / 1 416 x 416 x 3 -> 416 x 416 x 32 0.299 BFLOPs 
1 conv 64 3 x 3 / 2 416 x 416 x 32 -> 208 x 208 x 64 1.595 BFLOPs 
2 conv 32 1 x 1 / 1 208 x 208 x 64 -> 208 x 208 x 32 0.177 BFLOPs 
3 conv 64 3 x 3 / 1 208 x 208 x 32 -> 208 x 208 x 64 1.595 BFLOPs 
4 res 1 208 x 208 x 64 -> 208 x 208 x 64 
5 conv 128 3 x 3 / 2 208 x 208 x 64 -> 104 x 104 x 128 1.595 BFLOPs 
6 conv 64 1 x 1 / 1 104 x 104 x 128 -> 104 x 104 x 64 0.177 BFLOPs 
7 conv 128 3 x 3 / 1 104 x 104 x 64 -> 104 x 104 x 128 1.595 BFLOPs 
8 res 5 104 x 104 x 128 -> 104 x 104 x 128 
9 conv 64 1 x 1 / 1 104 x 104 x 128 -> 104 x 104 x 64 0.177 BFLOPs 
10 conv 128 3 x 3 / 1 104 x 104 x 64 -> 104 x 104 x 128 1.595 BFLOPs 
11 res 8 104 x 104 x 128 -> 104 x 104 x 128 
12 conv 256 3 x 3 / 2 104 x 104 x 128 -> 52 x 52 x 256 1.595 BFLOPs 
13 conv 128 1 x 1 / 1 52 x 52 x 256 -> 52 x 52 x 128 0.177 BFLOPs 
14 conv 256 3 x 3 / 1 52 x 52 x 128 -> 52 x 52 x 256 1.595 BFLOPs 
15 res 12 52 x 52 x 256 -> 52 x 52 x 256 
16 conv 128 1 x 1 / 1 52 x 52 x 256 -> 52 x 52 x 128 0.177 BFLOPs 
17 conv 256 3 x 3 / 1 52 x 52 x 128 -> 52 x 52 x 256 1.595 BFLOPs 
18 res 15 52 x 52 x 256 -> 52 x 52 x 256 
19 conv 128 1 x 1 / 1 52 x 52 x 256 -> 52 x 52 x 128 0.177 BFLOPs 
20 conv 256 3 x 3 / 1 52 x 52 x 128 -> 52 x 52 x 256 1.595 BFLOPs 
21 res 18 52 x 52 x 256 -> 52 x 52 x 256 
22 conv 128 1 x 1 / 1 52 x 52 x 256 -> 52 x 52 x 128 0.177 BFLOPs 
23 conv 256 3 x 3 / 1 52 x 52 x 128 -> 52 x 52 x 256 1.595 BFLOPs 
24 res 21 52 x 52 x 256 -> 52 x 52 x 256 
25 conv 128 1 x 1 / 1 52 x 52 x 256 -> 52 x 52 x 128 0.177 BFLOPs 
26 conv 256 3 x 3 / 1 52 x 52 x 128 -> 52 x 52 x 256 1.595 BFLOPs 
27 res 24 52 x 52 x 256 -> 52 x 52 x 256 
28 conv 128 1 x 1 / 1 52 x 52 x 256 -> 52 x 52 x 128 0.177 BFLOPs 
29 conv 256 3 x 3 / 1 52 x 52 x 128 -> 52 x 52 x 256 1.595 BFLOPs 
30 res 27 52 x 52 x 256 -> 52 x 52 x 256 
31 conv 128 1 x 1 / 1 52 x 52 x 256 -> 52 x 52 x 128 0.177 BFLOPs 
32 conv 256 3 x 3 / 1 52 x 52 x 128 -> 52 x 52 x 256 1.595 BFLOPs 
33 res 30 52 x 52 x 256 -> 52 x 52 x 256 
34 conv 128 1 x 1 / 1 52 x 52 x 256 -> 52 x 52 x 128 0.177 BFLOPs 
35 conv 256 3 x 3 / 1 52 x 52 x 128 -> 52 x 52 x 256 1.595 BFLOPs 
36 res 33 52 x 52 x 256 -> 52 x 52 x 256 
37 conv 512 3 x 3 / 2 52 x 52 x 256 -> 26 x 26 x 512 1.595 BFLOPs 
38 conv 256 1 x 1 / 1 26 x 26 x 512 -> 26 x 26 x 256 0.177 BFLOPs 
39 conv 512 3 x 3 / 1 26 x 26 x 256 -> 26 x 26 x 512 1.595 BFLOPs 
40 res 37 26 x 26 x 512 -> 26 x 26 x 512 
41 conv 256 1 x 1 / 1 26 x 26 x 512 -> 26 x 26 x 256 0.177 BFLOPs 
42 conv 512 3 x 3 / 1 26 x 26 x 256 -> 26 x 26 x 512 1.595 BFLOPs 
43 res 40 26 x 26 x 512 -> 26 x 26 x 512 
44 conv 256 1 x 1 / 1 26 x 26 x 512 -> 26 x 26 x 256 0.177 BFLOPs 
45 conv 512 3 x 3 / 1 26 x 26 x 256 -> 26 x 26 x 512 1.595 BFLOPs 
46 res 43 26 x 26 x 512 -> 26 x 26 x 512 
47 conv 256 1 x 1 / 1 26 x 26 x 512 -> 26 x 26 x 256 0.177 BFLOPs 
48 conv 512 3 x 3 / 1 26 x 26 x 256 -> 26 x 26 x 512 1.595 BFLOPs 
49 res 46 26 x 26 x 512 -> 26 x 26 x 512 
50 conv 256 1 x 1 / 1 26 x 26 x 512 -> 26 x 26 x 256 0.177 BFLOPs 
51 conv 512 3 x 3 / 1 26 x 26 x 256 -> 26 x 26 x 512 1.595 BFLOPs 
52 res 49 26 x 26 x 512 -> 26 x 26 x 512 
53 conv 256 1 x 1 / 1 26 x 26 x 512 -> 26 x 26 x 256 0.177 BFLOPs 
54 conv 512 3 x 3 / 1 26 x 26 x 256 -> 26 x 26 x 512 1.595 BFLOPs 
55 res 52 26 x 26 x 512 -> 26 x 26 x 512 
56 conv 256 1 x 1 / 1 26 x 26 x 512 -> 26 x 26 x 256 0.177 BFLOPs 
57 conv 512 3 x 3 / 1 26 x 26 x 256 -> 26 x 26 x 512 1.595 BFLOPs 
58 res 55 26 x 26 x 512 -> 26 x 26 x 512 
59 conv 256 1 x 1 / 1 26 x 26 x 512 -> 26 x 26 x 256 0.177 BFLOPs 
60 conv 512 3 x 3 / 1 26 x 26 x 256 -> 26 x 26 x 512 1.595 BFLOPs 
61 res 58 26 x 26 x 512 -> 26 x 26 x 512 
62 conv 1024 3 x 3 / 2 26 x 26 x 512 -> 13 x 13 x1024 1.595 BFLOPs 
63 conv 512 1 x 1 / 1 13 x 13 x1024 -> 13 x 13 x 512 0.177 BFLOPs 
64 conv 1024 3 x 3 / 1 13 x 13 x 512 -> 13 x 13 x1024 1.595 BFLOPs 
65 res 62 13 x 13 x1024 -> 13 x 13 x1024 
66 conv 512 1 x 1 / 1 13 x 13 x1024 -> 13 x 13 x 512 0.177 BFLOPs 
67 conv 1024 3 x 3 / 1 13 x 13 x 512 -> 13 x 13 x1024 1.595 BFLOPs 
68 res 65 13 x 13 x1024 -> 13 x 13 x1024 
69 conv 512 1 x 1 / 1 13 x 13 x1024 -> 13 x 13 x 512 0.177 BFLOPs 
70 conv 1024 3 x 3 / 1 13 x 13 x 512 -> 13 x 13 x1024 1.595 BFLOPs 
71 res 68 13 x 13 x1024 -> 13 x 13 x1024 
72 conv 512 1 x 1 / 1 13 x 13 x1024 -> 13 x 13 x 512 0.177 BFLOPs 
73 conv 1024 3 x 3 / 1 13 x 13 x 512 -> 13 x 13 x1024 1.595 BFLOPs 
74 res 71 13 x 13 x1024 -> 13 x 13 x1024 
75 conv 512 1 x 1 / 1 13 x 13 x1024 -> 13 x 13 x 512 0.177 BFLOPs 
76 conv 1024 3 x 3 / 1 13 x 13 x 512 -> 13 x 13 x1024 1.595 BFLOPs 
77 conv 512 1 x 1 / 1 13 x 13 x1024 -> 13 x 13 x 512 0.177 BFLOPs 
78 conv 1024 3 x 3 / 1 13 x 13 x 512 -> 13 x 13 x1024 1.595 BFLOPs 
79 conv 512 1 x 1 / 1 13 x 13 x1024 -> 13 x 13 x 512 0.177 BFLOPs 
80 conv 1024 3 x 3 / 1 13 x 13 x 512 -> 13 x 13 x1024 1.595 BFLOPs 
81 conv 75 1 x 1 / 1 13 x 13 x1024 -> 13 x 13 x 75 0.026 BFLOPs 
82 yolo 
83 route 79 
84 conv 256 1 x 1 / 1 13 x 13 x 512 -> 13 x 13 x 256 0.044 BFLOPs 
85 upsample 2x 13 x 13 x 256 -> 26 x 26 x 256 
86 route 85 61 
87 conv 256 1 x 1 / 1 26 x 26 x 768 -> 26 x 26 x 256 0.266 BFLOPs 
88 conv 512 3 x 3 / 1 26 x 26 x 256 -> 26 x 26 x 512 1.595 BFLOPs 
89 conv 256 1 x 1 / 1 26 x 26 x 512 -> 26 x 26 x 256 0.177 BFLOPs 
90 conv 512 3 x 3 / 1 26 x 26 x 256 -> 26 x 26 x 512 1.595 BFLOPs 
91 conv 256 1 x 1 / 1 26 x 26 x 512 -> 26 x 26 x 256 0.177 BFLOPs 
92 conv 512 3 x 3 / 1 26 x 26 x 256 -> 26 x 26 x 512 1.595 BFLOPs 
93 conv 75 1 x 1 / 1 26 x 26 x 512 -> 26 x 26 x 75 0.052 BFLOPs 
94 yolo 
95 route 91 
96 conv 128 1 x 1 / 1 26 x 26 x 256 -> 26 x 26 x 128 0.044 BFLOPs 
97 upsample 2x 26 x 26 x 128 -> 52 x 52 x 128 
98 route 97 36 
99 conv 128 1 x 1 / 1 52 x 52 x 384 -> 52 x 52 x 128 0.266 BFLOPs 
100 conv 256 3 x 3 / 1 52 x 52 x 128 -> 52 x 52 x 256 1.595 BFLOPs 
101 conv 128 1 x 1 / 1 52 x 52 x 256 -> 52 x 52 x 128 0.177 BFLOPs 
102 conv 256 3 x 3 / 1 52 x 52 x 128 -> 52 x 52 x 256 1.595 BFLOPs 
103 conv 128 1 x 1 / 1 52 x 52 x 256 -> 52 x 52 x 128 0.177 BFLOPs 
104 conv 256 3 x 3 / 1 52 x 52 x 128 -> 52 x 52 x 256 1.595 BFLOPs 
105 conv 75 1 x 1 / 1 52 x 52 x 256 -> 52 x 52 x 75 0.104 BFLOPs 
106 yolo

conv：

layer filters size input output
0 conv 32 3 x 3 / 1 416 x 416 x 3 -> 416 x 416 x 32 0.299 BFLOPs
输入层：
- 输入：像素为416*416，通道数为3的的图片（开启random参数的话可以自适应以32为基础的变化）
- BN操作：对输入进行BN操作（这里未显示）。
- 卷积操作：32层卷积核（filters），每个卷积核大小为3*3，步伐为1（每个卷积窗口逐步进行卷积）
- 输出：32个通道的416*416大小的feature map

res（shortcut操作）：

layer filters size input output
4 res 1 208 x 208 x 64 -> 208 x 208 x 64
res层：
- 输入与输出：输入与输出一般保持一致，并且不进行其他操作，只是求差。
- 处理操作：res层来源于resnet，为了解决网络的梯度弥散或者梯度爆炸的现象，提出将深层神经网络的逐层训练改为逐阶段训练，将深层神经网络分为若干个子段，每个小段包含比较浅的网络层数，然后用shortcut的连接方式使得每个小段对于残差进行训练，每一个小段学习总差（总的损失）的一部分，最终达到总体较小的loss，同时，很好的控制梯度的传播，避免出现梯度消失或者爆炸等不利于训练的情形。

darknet-53:

从第0层一直到74层，一共有53个卷积层，其余为res层。这就是Joseph Redmon大神提出的darknet-53经典的卷积层了。作为yolov3特征提取的主要网络结构。预训练（以imagenet数据集为训练基础）的权重文件可以通过官网下载。该结构使用一系列的3*3和1*1的卷积的卷积层。这些卷积层是从各个主流网络结构选取性能比较好的卷积层进行整合得到。它比darknet-19效果好很多，同时，它在效果更好的情况下，是resnet-101效率的1.5倍，几乎与resnet-152的效果相同的情况下，保持2倍于resnet-152的效率。

yolo layer

从75到105层为yolo网络的特征交互层，分为三个尺度，每个尺度内，通过卷积核的方式实现局部的特征交互，作用类似于全连接层但是是通过卷积核（3*3和1*1）的方式实现feature map之间的局部特征（fc层实现的是全局的特征交互）交互。

最小尺度yolo层：
- 输入：13*13的feature map ，一共1024个通道。
- 操作：一系列的卷积操作，feature map的大小不变，但是通道数最后减少为75个。
- 输出；输出13*13大小的feature map，75个通道，在此基础上进行分类和位置回归。
中尺度yolo层：
- 输入：将79层的13*13、512通道的feature map进行卷积操作，生成13*13、256通道的feature map，然后进行上采样，生成26*26、256通道的feature map，同时于61层的26*26、512通道的中尺度的feature map合并。再进行一系列卷积操作，
- 操作：一系列的卷积操作，feature map的大小不变，但是通道数最后减少为75个。
- 输出：26*26大小的feature map，75个通道，然后在此进行分类和位置回归。
大尺度的yolo层：
- 输入：将91层的26*26、256通道的feature map进行卷积操作，生成26*26、128通道的feature map，然后进行上采样生成52*52、128通道的feature map，同时于36层的52*52、256通道的中尺度的feature map合并。再进行一系列卷积操作，
- 操作：一系列的卷积操作，feature map的大小不变，但是通道数最后减少为75个。
- 输出：52*52大小的feature map，75个通道，然后在此进行分类和位置回归。

Related Source

https://arxiv.org/abs/1804.02767
https://github.com/marvis/pytorch-yolo3(pytorch)
https://github.com/maiminh1996/YOLOv3-tensorflow(tensorflow)
https://pjreddie.com/darknet/yolov3/(darknet)

Thanks

https://blog.csdn.net/just_sort/article/details/80882474
https://blog.csdn.net/sum_nap/article/details/80568873
https://www.jianshu.com/p/3943be47fe84
https://zhuanlan.zhihu.com/p/35023499

Objective-C面向对象编程：类、对象、方法详解（保姆级教程）帅次 iOS Obj-C objective-c ios iphone safari swift macos flutter
目录一、核心概念二、类的定义（分.h和.m文件）1.头文件（.h）——公开声明2.实现文件（.m）——具体实现3.属性特性解析原子性所有权语义(ARC环境下)读写控制三、对象创建与内存管理1.创建对象的两种方式2.关键步骤解析3.instancetype四、方法调用（消息传递机制）1.基本语法2.关键概念五、self与super关键字六、动手实践：完整工作流1.创建Person对象并调用方法2.项
ref() 与 reactive() 前端岳大宝前端框架Vue javascript 前端 vue.js
下面，我们来系统的梳理关于ref()与reactive()的基本知识点：一、响应式编程核心概念1.1什么是响应式编程？响应式编程是一种声明式编程范式，它使数据变化能够自动传播到依赖它的代码部分。在Vue中，响应式系统实现了：数据驱动视图：数据变化自动更新DOM依赖追踪：自动跟踪数据依赖关系高效更新：最小化不必要的DOM操作1.2Vue响应式系统演进版本响应式实现特点Vue2Object.defin
FB-OCC: 3D Occupancy Prediction based on Forward-BackwardView Transformation justtoomuchforyou 智驾
NVidia，CVPR20233DOccupancyPredictionChallengeworkshoppaper：https://arxiv.org/pdf/2307.1492code：https://github.com/NVlabs/FB-BEV大参数量imagebackboneInternImage-H，1B外部数据集预训练：object365nuscenes：有点云label，强化网络
PillarNet: Real-Time and High-PerformancePillar-based 3D Object Detection justtoomuchforyou 目标检测人工智能计算机视觉智驾
ECCV2022paper：[2205.07403]PillarNet:Real-TimeandHigh-PerformancePillar-based3DObjectDetectioncode：https://github.com/VISION-SJTU/PillarNet-LTS纯点云基于pillar3D检测模型网络比较SECOND基于voxel，one-stage，基于sparse3Dc
【问题解决】pnpm : 无法将“pnpm”项识别为 cmdlet、函数、脚本文件或可运行程序的名称。 aPurpleBerry 问题解决前端
今天配置完poetry环境变量之后pnpm不能用了具体报错pnpm:无法将“pnpm”项识别为cmdlet、函数、脚本文件或可运行程序的名称。请检查名称的拼写，如果包括路径，请确保路径正确，然后再试一次。所在位置行:1字符:1+pnpmrundev+~~~~+CategoryInfo:ObjectNotFound:(pnpm:String)[],CommandNotFoundException+F
如何批量将word文档转换为PDF 渍渍渍197 word pdf c#
新建一个txt文件将以下代码复制进去OnErrorResumeNextSetwordTest=CreateObject("Word.Application")IfErr.Number<>0ThenMsgBox"MicrosoftWordnotfound!PleaseinstallWordfirst.",vbCritical,"Error"WScript.QuitEndIfwordTest.Quit
XSL-FO 块：深入解析与最佳实践沐知全栈开发开发语言
XSL-FO块：深入解析与最佳实践概述XSL-FO（XSLFormattingObjects）是一种用于生成格式化文档的语言，它允许开发者将XML数据转换成PDF、HTML、PostScript等格式。在XSL-FO中，块（Block）是一个重要的概念，它定义了文档中的矩形区域，包括文本、图像、表格等。本文将深入解析XSL-FO块的相关知识，并分享一些最佳实践。XSL-FO块的定义与属性定义XSL
JavaSE -- 时间类的详细介绍（Date，LocalDate） @Touper Java学习笔记 java 开发语言
Date类构造方法newDate()：当前系统日期和时间。newDate(long)：给定的日期时间常用方法after(Date)：判断当前日期对象是否在给定日期之后before(Date)：判断当前日期对象是否在给定日期之前equals(Object)：判断两日期是否相等compareTo(Date)：比较两日期前后顺序，如果当前日期对象大于给定日期对象返回1，小于返回-1，等于返回0。Date
明智地重写clone方法面朝大海，春不暖，花不开高级Java Java 高级java 提升
Cloneable接口的设计缺陷Cloneable接口本应作为mixin接口（条目20）让类表明自身支持克隆能力，但实际设计却未能实现这一目标。该接口存在几个根本性设计缺陷：核心机制缺陷Cloneable最显著的问题是接口中未声明clone方法，而Object类的clone方法又是protected的。这导致开发者无法直接调用实现Cloneable接口对象的clone方法，除非借助反射（条目65）
C#实践小游戏--俄罗斯方块 DamnF-- c#开发语言游戏程序
整体游戏架构游戏主循环(Game)├─场景系统│├─开始场景(BeginScene)│├─游戏场景(GameScene)│└─结束场景(EndScene)│├─方块系统│├─方块控制器(BlockWorker)│├─方块形态数据(BlockInfo)│└─绘制单元(DrawObject)│├─地图系统(Map)├─输入系统(InputCheak)├─坐标系统(Position)└─接口规范(IDr
CVPR 2024 3D方向总汇包含（3DGS、三维重建、深度补全、深度估计、全景定位、表面重建和特征匹配等）
1、3D方向Rapid3DModelGenerationwithIntuitive3DInputInstantaneousPerceptionofMovingObjectsin3DNEAT:Distilling3DWireframesfromNeuralAttractionFields⭐codeSculptingHolistic3DRepresentationinContrastiveLangua
多层次的类如何使用Jackson序列化/反序列化（Inheritance with Jackson）张紫娃 Baeldung 学习笔记基础知识 windows python 开发语言
HavealookatworkingwithclasshierarchiesinJackson.Jackson如何处理类中类InclusionofSubtypeInformationTherearetwowaystoaddtypeinformationwhenserializinganddeserializingdataobjects,namelyglobaldefaulttypingandper
全面掌握 Jackson 序列化工具：原理、使用与高级配置详解微笑听雨。 java 进阶教程 java 序列化反序列化 Jackson
全面掌握Jackson序列化工具：原理、使用与高级配置详解Jackson是一个功能强大的JSON处理库，广泛应用于Java项目中。它提供了丰富的功能和灵活的配置选项，可以轻松地在Java对象和JSON数据之间进行转换。本文将详细介绍Jackson的核心概念、基本用法、高级配置及处理集合类型的数据，旨在帮助你全面掌握Jackson的使用方法。一、Jackson的核心概念1.ObjectMapperO
浅说深拷贝（Deep Copy）与浅拷贝（Shallow Copy） =^_^=喵喵 javascript 前端开发语言
在JavaScript中，深拷贝和浅拷贝是两种不同的数据复制方式，主要区别在于如何处理引用类型数据（如对象、数组）。1.浅拷贝（ShallowCopy）定义：只复制对象的第一层属性，如果属性是引用类型（如对象、数组），则复制的是引用，而不是实际数据。特点：原始对象和拷贝后的对象共享引用类型的属性。修改其中一个对象的引用类型属性会影响另一个对象。实现方式：Object.assign()（仅第一层深拷
[SQLSERVER][SQL]监控SQlserver存储过程 awonw sqlserver sqlserver sql 数据库
USE[master]GO/******Object:StoredProcedure[dbo].[sp_who_run_plus]ScriptDate:2021-09-1016:51:26******/SETANSI_NULLSONGOSETQUOTED_IDENTIFIERONGOCREATEPROC[dbo].[sp_who_run_plus]ASBEGINSELECTDB_NAME(er.[
C#最佳实践：考虑为类重写ToString()方法阿蒙Armon C#最佳实践 c#开发语言服务器 java
C#最佳实践：考虑为类重写ToString()方法在C#编程的日常开发中，ToString()方法是一个既基础又容易被忽视的重要成员。它是System.Object类的虚方法，所有类都继承自System.Object，这意味着每个类都拥有ToString()方法。然而，默认的ToString()方法往往无法满足实际需求，因此，考虑为类重写ToString()方法成为C#编程中的一项重要最佳实践。接
深度学习计算机视觉开源系统OpenMMLab（mmsegmentation、mmdetection、mmpose）环境配置【详细、可运行】 nomoremorphine 深度学习计算机视觉开源
OpenMMLab（mmsegmentation、mmdetection、mmpose）环境配置OpenMMLab简介优势：一、Windows/Linux下环境配置（以mmsegmentationv1.2.2（最新版）为例）0.确认安装版本信息1）确认电脑显卡版本2）确认mmcv对应版本3）确认版本1.安装CUDA和cuDNN2.创建conda环境，下载pytorch3.安装mmcv4.安装MMS
Python JSON 模块的基本使用(41) Android 小码峰啊 Python入门 python json 服务器
PythonJSON模块的基本使用一、引言在当今数字化的时代，数据的交换和存储变得至关重要。不同的应用程序和系统之间需要一种通用的数据格式来进行数据的传输和共享。JSON（JavaScriptObjectNotation）作为一种轻量级的数据交换格式，因其易于阅读和编写，同时也易于机器解析和生成，成为了广泛使用的数据格式之一。Python作为一门功能强大且应用广泛的编程语言，提供了json模块来方
AI开发tool提示词开水好喝测试工具 java 服务器前端人工智能
Playwright处理module元素及其子节点[TASK]生成一个isModuleElementObjectfunction，若element的qa-testclass在对象moduleObj{"qa-test-mycourses-course":"qa-test-mycourses-course-title","qa-test-discussion-module":"qa-test-disc
结构体struct 内存分配规则及地址运算3——编译器优化面包爱阜阳 c++c语言
结构体struct内存优化3——编译器优化#include#include//includinguint32_t...typedefstruct{uint8_tcap_id;//capobjectiduint16_tframe_id;//frameiduint32_tframe_size;//framesizebybyteuint8_tframe[10];//frameuint16_t*p_fra
java鱼眼相机标定_鱼眼相机标定以及OpenCV实现元宿six java鱼眼相机标定
开始标定doublefisheye::calibrate(InputArrayOfArraysobjectPoints,InputArrayOfArraysimagePoints,constSize&image_size,InputOutputArrayK,InputOutputArrayD,OutputArrayOfArraysrvecs,OutputArrayOfArraystvecs,int
Halcon 检测物体定位点吃个糖糖 Halcon 人工智能计算机视觉深度学习
文章目录get_domain返回所有输入图像的定义域作为一个区域add_channels给区域增加灰度值find_shape_model发现匹配模板find_shape_models发现最佳模板示例get_domain返回所有输入图像的定义域作为一个区域Halcon中的区域get_domain(Image:Domain::)Image:图像(input_object):类型可以是(多通道-)图像数
1. 集合一个处女座的暖男程序猿 python 开发语言
#集合###**单列集合**####ArrayList集合的话主要分为单列集合和双列集合两种。单列集合中主要是有ArrayList、linkList以及HashSet。ArrayList的主要特点就是**有序且可重复**的，之所以有序是因为它的底层其实就是一个Object数组结构，每次添加长度都是累加的，可以重复是因为存储的过程中没有对元素做过判断。这个数组它在创建的时候**初始长度是0**，在第
web自动化测试整个流程，和相互关系？？
Web自动化测试全流程解析1.标准Web自动化测试流程需求分析选择工具/框架环境搭建编写测试脚本执行测试生成报告缺陷管理维护优化关键阶段说明：需求分析：确定哪些功能需要自动化（优先选择高频、核心业务）环境搭建：安装浏览器驱动（ChromeDriver）、配置Python+Selenium环境脚本开发：使用PageObject模式（推荐）编写可维护的代码持续集成：通过Jenkins/GitLabCI
nmmqq.php?/lspc.html,Word Html 2 Formatting Objects weixin_39944074
Thismessagewascreatedautomaticallybymaildeliverysoftware.Amessagethatyousentcouldnotbedeliveredtooneormoreofitsrecipients.Thisisapermanenterror.Thefollowingaddress(es)failed:[email protected]
08-Python文件处理 Howard’s python python 开发语言 linux 学习笔记
08-Python文件处理一、打开关闭文件可以用file对象做大部分的文件操作。file()在python3中已经被废除，使用open()打开文件open函数先用open()打开一个文件，创建一个file对象，再用相关方法才可以调用它进行读写。语法fileobject=open(file_name[,access_mode][,buffering])参数说明file_name：file_name变
42道Maven高频题整理(附答案背诵版)
1.简述什么是Maven？Maven是一个项目管理和构建自动化工具，主要服务于Java项目。使用Maven，开发者可以方便地管理项目的构建、文档生成、报告、依赖、SCM（软件配置管理）、发布和分发等过程。Maven的核心概念是基于项目对象模型（POM，ProjectObjectModel）的。每个Maven项目都有一个pom.xml文件，它包含了项目的配置信息，如项目的依赖库、构建的插件、目标平台
防御OSS Bucket泄露：RAM权限策略+日志审计+敏感数据扫描三重防护大熊计算机 #阿里云网络
1.OSS存储桶泄露的严峻态势2024年数据：阿里云安全报告显示，42%的云存储泄露事件源于权限配置错误真实案例：某金融公司因ListObjects权限开放导致6TB客户数据泄露，直接损失**$2.3M**核心矛盾：便捷访问需求与最小权限原则的冲突三重防护体系架构图（Mermaid）尝试访问非法请求合法请求异常行为定期检测泄露风险攻击者OSSBucketRAM策略拦截拒绝访问操作日志日志审计系统实
js小知识
js的三个组成部分。（1）ECMAScript语法（2）Bom浏览器与js交互（3）Domhtml内容与js交互Bomwindow对象。（1）浏览器对象模型BrowserobjectModel(2)document文档（3）screen屏幕（4）location地址（5）navigator浏览器对象（6）history历史记录window全局方法。（1）script中var声明变量没有用var声明
命令行窗口-隐藏黑窗口肆意飞扬 cmdAndWindows sql 数据库 database
要想cmd运行时隐藏黑窗口，最好的方法是使用vbs文件实现：1、新建run.vbs，编辑内容：setws=WScript.CreateObject("WScript.Shell")ws.Run"run.bat",0run.bat放到同目录下。运行run.vbs，没有cmd窗口弹出只可以隐藏cmd窗口，但不能隐藏bat中打开的第三方窗口，如yy.bat的内容为：WinRAR.exexD:\mm.ta
java线程Thread和Runnable区别和联系 zx_code java jvm thread 多线程 Runnable
我们都晓得java实现线程2种方式，一个是继承Thread，另一个是实现Runnable。模拟窗口买票，第一例子继承thread，代码如下 package thread; public class ThreadTest { public static void main(String[] args) { Thread1 t1 = new Thread1(
【转】JSON与XML的区别比较丁_新 json xml
1.定义介绍 (1).XML定义扩展标记语言 (Extensible Markup Language, XML) ，用于标记电子文件使其具有结构性的标记语言，可以用来标记数据、定义数据类型，是一种允许用户对自己的标记语言进行定义的源语言。 XML使用DTD(document type definition)文档类型定义来组织数据;格式统一，跨平台和语言，早已成为业界公认的标准。 XML是标
c++ 实现五种基础的排序算法 CrazyMizzz C++c 算法
#include<iostream> using namespace std; //辅助函数，交换两数之值 template<class T> void mySwap(T &x, T &y){ T temp = x; x = y; y = temp; } const int size = 10; //一、用直接插入排
我的软件麦田的设计者我的软件音乐类娱乐放松
这是我写的一款app软件，耗时三个月，是一个根据央视节目开门大吉改变的，提供音调，猜歌曲名。1、手机拥有者在android手机市场下载本APP，同意权限，安装到手机上。2、游客初次进入时会有引导页面提醒用户注册。（同时软件自动播放背景音乐）。3、用户登录到主页后，会有五个模块。a、点击不胫而走，用户得到开门大吉首页部分新闻，点击进入有新闻详情。b、
linux awk命令详解被触发 linux awk
awk是行处理器: 相比较屏幕处理的优点，在处理庞大文件时不会出现内存溢出或是处理缓慢的问题，通常用来格式化文本信息 awk处理过程: 依次对每一行进行处理，然后输出 awk命令形式: awk [-F|-f|-v] ‘BEGIN{} //{command1; command2} END{}’ file [-F|-f|-v]大参数，-F指定分隔符，-f调用脚本，-v定义变量 var=val
各种语言比较 _wy_ 编程语言
Java Ruby PHP 擅长领域
oracle 中数据类型为clob的编辑知了ing oracle clob
public void updateKpiStatus(String kpiStatus,String taskId){ Connection dbc=null; Statement stmt=null; PreparedStatement ps=null; try { dbc = new DBConn().getNewConnection(); //stmt = db
分布式服务框架 Zookeeper -- 管理分布式环境中的数据矮蛋蛋 zookeeper
原文地址： http://www.ibm.com/developerworks/cn/opensource/os-cn-zookeeper/ 安装和配置详解本文介绍的 Zookeeper 是以 3.2.2 这个稳定版本为基础，最新的版本可以通过官网 http://hadoop.apache.org/zookeeper/来获取，Zookeeper 的安装非常简单，下面将从单机模式和集群模式两
tomcat数据源 alafqq tomcat
数据库 JNDI(Java Naming and Directory Interface，Java命名和目录接口)是一组在Java应用中访问命名和目录服务的API。没有使用JNDI时我用要这样连接数据库： 03. Class.forName("com.mysql.jdbc.Driver"); 04. conn
遍历的方法百合不是茶遍历
遍历在java的泛
linux查看硬件信息的命令 bijian1013 linux
linux查看硬件信息的命令一.查看CPU： cat /proc/cpuinfo 二.查看内存： free 三.查看硬盘： df linux下查看硬件信息 1、lspci 列出所有PCI 设备； lspci - list all PCI devices:列出机器中的PCI设备（声卡、显卡、Modem、网卡、USB、主板集成设备也能
java常见的ClassNotFoundException bijian1013 java
1.java.lang.ClassNotFoundException: org.apache.commons.logging.LogFactory 添加包common-logging.jar2.java.lang.ClassNotFoundException: javax.transaction.Synchronization
【Gson五】日期对象的序列化和反序列化 bit1129 反序列化
对日期类型的数据进行序列化和反序列化时，需要考虑如下问题： 1. 序列化时，Date对象序列化的字符串日期格式如何 2. 反序列化时，把日期字符串序列化为Date对象，也需要考虑日期格式问题 3. Date A -> str -> Date B,A和B对象是否equals 默认序列化和反序列化 import com
【Spark八十六】Spark Streaming之DStream vs. InputDStream bit1129 Stream
1. DStream的类说明文档： /** * A Discretized Stream (DStream), the basic abstraction in Spark Streaming, is a continuous * sequence of RDDs (of the same type) representing a continuous st
通过nginx获取header信息 ronin47 nginx header
1. 提取整个的Cookies内容到一个变量，然后可以在需要时引用，比如记录到日志里面， if ( $http_cookie ~* "(.*)$") { set $all_cookie $1; } 变量$all_cookie就获得了cookie的值，可以用于运算了
java-65.输入数字n，按顺序输出从1最大的n位10进制数。比如输入3，则输出1、2、3一直到最大的3位数即999 bylijinnan java
参考了网上的http://blog.csdn.net/peasking_dd/article/details/6342984 写了个java版的： public class Print_1_To_NDigit { /** * Q65.输入数字n，按顺序输出从1最大的n位10进制数。比如输入3，则输出1、2、3一直到最大的3位数即999 * 1.使用字符串
Netty源码学习-ReplayingDecoder bylijinnan java netty
ReplayingDecoder是FrameDecoder的子类，不熟悉FrameDecoder的，可以先看看 http://bylijinnan.iteye.com/blog/1982618 API说，ReplayingDecoder简化了操作，比如： FrameDecoder在decode时，需要判断数据是否接收完全： public class IntegerH
js特殊字符过滤 cngolon js特殊字符 js特殊字符过滤
1.js中用正则表达式过滤特殊字符, 校验所有输入域是否含有特殊符号function stripscript(s) { var pattern = new RegExp("[`~!@#$^&*()=|{}':;',\\[\\].<>/?~！@#￥……&*（）——|{}【】‘；：”“'。，、？]"
hibernate使用sql查询 ctrain Hibernate
import java.util.Iterator; import java.util.List; import java.util.Map; import org.hibernate.Hibernate; import org.hibernate.SQLQuery; import org.hibernate.Session; import org.hibernate.Transa
linux shell脚本中切换用户执行命令方法 daizj linux shell 命令切换用户
经常在写shell脚本时，会碰到要以另外一个用户来执行相关命令，其方法简单记下： 1、执行单个命令：su - user -c "command" 如：下面命令是以test用户在/data目录下创建test123目录 [root@slave19 /data]# su - test -c "mkdir /data/test123"
好的代码里只要一个 return 语句 dcj3sjt126com return
别再这样写了：public boolean foo() { if (true) { return true; } else { return false;
Android动画效果学习 dcj3sjt126com android
1、透明动画效果方法一：代码实现 public View onCreateView(LayoutInflater inflater, ViewGroup container, Bundle savedInstanceState) { View rootView = inflater.inflate(R.layout.fragment_main, container, fals
linux复习笔记之bash shell (4)管道命令 eksliang linux管道命令汇总 linux管道命令 linux常用管道命令
转载请出自出处： http://eksliang.iteye.com/blog/2105461 bash命令执行的完毕以后，通常这个命令都会有返回结果，怎么对这个返回的结果做一些操作呢？那就得用管道命令‘|’。上面那段话，简单说了下管道命令的作用，那什么事管道命令呢？答：非常的经典的一句话，记住了，何为管
Android系统中自定义按键的短按、双击、长按事件 gqdy365 android
在项目中碰到这样的问题：由于系统中的按键在底层做了重新定义或者新增了按键，此时需要在APP层对按键事件（keyevent）做分解处理，模拟Android系统做法，把keyevent分解成： 1、单击事件：就是普通key的单击； 2、双击事件：500ms内同一按键单击两次； 3、长按事件：同一按键长按超过1000ms（系统中长按事件为500ms）； 4、组合按键：两个以上按键同时按住；
asp.net获取站点根目录下子目录的名称 hvt .net C#asp.net hovertree Web Forms
使用Visual Studio建立一个.aspx文件(Web Forms)，例如hovertree.aspx,在页面上加入一个ListBox代码如下： <asp:ListBox runat="server" ID="lbKeleyiFolder" /> 那么在页面上显示根目录子文件夹的代码如下： string[] m_sub
Eclipse程序员要掌握的常用快捷键 justjavac java eclipse 快捷键 ide
判断一个人的编程水平，就看他用键盘多，还是鼠标多。用键盘一是为了输入代码（当然了，也包括注释），再有就是熟练使用快捷键。曾有人在豆瓣评《卓有成效的程序员》：“人有多大懒，才有多大闲”。之前我整理了一个程序员图书列表，目的也就是通过读书，让程序员变懒。写道程序员作为特殊的群体，有的人可以这么懒，懒到事情都交给机器去做，而有的人又可
c++编程随记 lx.asymmetric C++笔记
为了字体更好看，改变了格式…… &&运算符： #include<iostream> using namespace std; int main(){ int a=-1,b=4,k; k=(++a<0)&&!(b--
linux标准IO缓冲机制研究音频数据 linux
一、什么是缓存I/O(Buffered I/O)缓存I/O又被称作标准I/O,大多数文件系统默认I/O操作都是缓存I/O。在Linux的缓存I/O机制中，操作系统会将I/O的数据缓存在文件系统的页缓存(page cache)中，也就是说，数据会先被拷贝到操作系统内核的缓冲区中，然后才会从操作系统内核的缓冲区拷贝到应用程序的地址空间。1.缓存I/O有以下优点:A.缓存I/O使用了操作系统内核缓冲区，
随想生活暗黑小菠萝生活
其实账户之前就申请了，但是决定要自己更新一些东西看也是最近。从毕业到现在已经一年了。没有进步是假的，但是有多大的进步可能只有我自己知道。毕业的时候班里12个女生，真正最后做到软件开发的只要两个包括我，PS：我不是说测试不好。当时因为考研完全放弃找工作，考研失败，我想这只是我的借口。那个时候才想到为什么大学的时候不能好好的学习技术，增强自己的实战能力，以至于后来找工作比较费劲。我
我认为POJO是一个错误的概念 windshome java POJO 编程 J2EE 设计
这篇内容其实没有经过太多的深思熟虑，只是个人一时的感觉。从个人风格上来讲，我倾向简单质朴的设计开发理念；从方法论上，我更加倾向自顶向下的设计；从做事情的目标上来看，我追求质量优先，更愿意使用较为保守和稳妥的理念和方法。 &

YOLO v3论文理解

Abstract

The Deal

Bounding Box Prediction

Class Prediction

Prediction Across Scales And Feature Extractor

How We Do

Network Structor Analyze

conv：

res（shortcut操作）：

darknet-53:

yolo layer

Related Source

Thanks

你可能感兴趣的:(Object,Detection)