Code_Mart

[论文笔记] YOLO系列论文笔记

YOLO 系列模型近年来受到众多关注，原因有二：1. 实时性高，远超同时期的许多模型； 2. 代码开源程度高，作者非常乐意分享。这也使得在实践中，大家都乐意使用 YOLO 系列的模型。YOLO 系列模型属于 one-stage，end-to-end model，将图像输入到模型中，经过一系列卷积操作，即可直接回归出 bounding box 的坐标和 class probability。

YOLO 的核心是将图像划分成 $S * S$ 个 grid cell，经过模型系列卷积操作后，得到 $S * S * (B * 5 + C)$ 的特征向量，将特征向量以矩阵的形式表示，进行 Descenting Sort 和 NMS 操作，经过一系列操作后即可得到检测结果。

YOLOv2 的核心是在 YOLO 的基础上，修改了bounding box 的预测方式，不再假设每个 grid cell 仅有一种类别存在；引进 Anchor Box，并通过 K-means 是其更符合数据中 bounding box 的形状；且作者提出新的 classification network，即 DarkNet-19。此外，作者在同一篇论文中，提出了 YOLO 9000，该模型采用了一种分类和检测的联合训练策略，可以将检测超过9000个类别的物体。

YOLOv3 的核心是在于作者在 YOLOv2 上做出了许多改进，在 DarkNet-19 的基础上引进 ResNet 的结构，提出 DarkNet-53。

1. YOLO

论文题目：You Only Look Once: Unified, Real-Time Object Detection
论文作者：Joseph Redmon, Santosh Divvala, Ross Girshick, Ali Farhadi
所属机构：University of Washington, Allen Institute for AI, Facebook AI Research
论文链接：https://arxiv.org/pdf/1506.02640.pdf

(1) 摘要

2015年，Joseph Redmon， Ali Farhadi 和 Ross Girshick（R-CNN系列论文的作者）一起提出了 YOLO。YOLO 与 R-CNN 不同，并不使用 classifier 做 object detection，而是完全将 object detection 视为一个 regression problem。该模型不仅是 end-to-end model，还是 one-stage model。
此外，该模型的优点有以下三点：

运行速度很快，能在 Titan X 上达到45 fps，而 fast version YOLO 能达到150 fps（这远远超过其他算法，人们青睐YOLO系列算法正是因为这点）
YOLO 进行 prediction 时是基于 global image 的，这与基于 region proposal 的算法不同，更能从全局上进行推断
YOLO 对物体的表示更具有泛化性

(2) 模型结构

首先，模型将图像 resize 为 $448 * 448$ ，再将其划分为 $S * S$ 个格子（若待检测物体的中心落在某个格子中，该格子负责检测该物体）。
接着，每个格子进行检测时会提供两种预测信息：预测 B 个 bounding box 和 C 个 conditional class probabilities。其中，bounding box 信息包括：x,y,w,h,and confidence（x,y 为 bounding box 的中心坐标，相对于每个单元格左上角坐标点的偏移值；w,h 为 bounding box 的宽度与高度，该值是相对于整个图片的宽与高的比例；所以 x,y,w,h 的范围都是 [0,1]）。
而confidence 由两部分组成：该格子中存在 object 的概率（存在 object，则 $P (O b j e c t) = 1$ ；否则，则 $P (O b j e c t) = 0$ ）和所预测 bounding box 与 ground truth 的 IOU（即 $IOU^{truth}_{pred}$ ）：

所预测的 C 个 conditional class probabilities 对应着该格子在存在 object 情况下，该 object 为某种类别的概率。

故，模型的预测结果的 shape 应该为： $S * S * (B * 5 + C)$ 。

细节：

网络预测 bounding box 的步骤如下：（建议阅读参考资料中的 ‘YOLO幻灯片’）

每个格子所预测 $B$ 个 bounding box 的 confidence 与所在格子所预测的 conditional class probabilities相乘，得到 $C * (S * S * B)$ 的矩阵（也就是 20 × 98，每行分别对应一个类别，每列分别对应某一个 bounding box）。
将每一行中低于阈值的 score 设为 0，并进行 Descenting Sort。
对每行进行如下操作（NMS，non-Maximum Suppression）：
- 设 score 最高的 bounding box 为 bbox_max，将下一个 score 不为 0 的 bounding box 设为 bbox_cur
- 若 $IOU(bbox_max,bboxcur)>0.5$ ，将 bbox_cur 的score 设为 0。接着，继续将下一个 score 不为 0 的 bounding box 设为bbox_cur，重复该操作直到到达右侧顶端。
- 不考虑之前的 bbox_max 的情况下，设 score 最高的bounding box 为 bbox_max。重复操作3，直到无法选出 bbox_max 为止。
对每列进行如下操作：
- 计算 $class=max\_index(scores),score=max(score)$
- 若 $s c o r e > 0$ ，则对应 bounding box 可以预测目标物体，且所预测的类别为分数最高的那一类。

关于网络结构：

细节：

该网络结构由 GoogLe Net改进而来，称为 DarkNet。作者用后接 $3 * 3$ conv layer 的 $1 * 1$ reduction layer 代替了 Google Net 中的 Inception Module。
作者在 ImageNet 上 pre-train 时，只使用网络的前面 20 个卷积层（后跟着 average-pooling layer 和 FC layer），intput size 为 $224 * 224$ 。然后，在训练检测的时候，作者再加上随机初始化的4个卷积层和2个全连接层，同时将 input size 改为 $448 * 448$ 。
作者将 ReLU layer 改为 pReLU layer。
Fast YOLO 与 YOLO 相比，不同之处为： conv layer 的数量由 24 减为 9 以及 conv layer 中 filter 的数量也变少了。

关于 multi-part loss function：

该 loss function 由三部分组成：Coord Error，IOU Error，Class Error。前两项为 Coord Error，作者为了加大位置误差对网络的影响，引入了 $\lambda_{coord} = 5$ ，并且为了平衡不同大小的物体 bounding box的位置误差对网络的影响，作者将物体的大小信息 w 和 h 进行求平方根，以进行改进。中间两项为 IOU Error，作者为减小不存在物体的格子的预测误差对网络的影响，引入了 $\lambda_{noobj} = 0.5$ 。最后一项为 Class Error，作者并未对这一项进行额外改动。

(3) 实验结果.

(4) 总结

YOLO： 输入图像 $\to$ 将大小resize到 $448 * 448$ $\to$ 输入到网络中，得到预测结果，shape 为 $S * S * (B * 5 + C)$ $\to$ 对每个 bounding box 进行阈值和NMS操作 $\to$ 得到最终检测结果

优点：

运行速度快：
YOLO 结构简单，仅需通过CNN 网络即可，相比于R-CNN自然快得多。
背景误检率低：
YOLO 进行预测时，利用得是整张图片得信息，这与基于 Region Proposal 的 R-CNN 是非常不同的，这也使得 YOLO 不受局部信息的影响，能更好的识别出背景。
通用性强：
YOLO对于艺术类作品中的物体检测同样适用，它对非自然图像物体的检测率远远高于 DPM 和 R-CNN 系列检测方法。

有待改进之处：

位置精准性差：
YOLO 是将图片划分为 $S * S$ 个格子，每个格子分别进行预测，这就导致往往体积较小的物体和集中较为密集的物体检测效果不好。此外，YOLO 中每个格子的 bounding box 的检测与 class 的检测是分开的，这就默认每个格子中仅有一个类别的物体。
无法处理任意size的图像：
这是由于网络中所存在的 FC layer所导致的，这个可以像 SPP Net 一样用 SPP layer 解决，也可以用 average pooling layer 解决。
召回率低
无法处理不常见的 bouning box：
YOLO 是从数据集中学习如何预测 bounding box 的，一旦出现与数据集种中不同 aspect ratio 的 bounding box，YOLO将无法很好的进行预测。

2. YOLOv2

论文题目：YOLO9000: Better, Faster, Stronger
论文作者：Joseph Redmon, Ali Farhadi
所属机构：University of Washington, Allen Institute for AI
论文链接：https://arxiv.org/pdf/1612.08242.pdf

(1) 摘要

2016年， Joseph Redmon 和 Ali Farhadi 在YOLO 的基础上做出了一系列的改进，推出了 YOLOv2。此外，他们还提出了一种新的训练方式，使得同时使用 large classification dataset 和 small detection dataset 进行objection detection成为可能，基于这种训练方式，作者推出了 YOLO 9000, 该模型可以 detection 9000种不同的物体。

(2) 模型结构

关于Batch Normalization:

自2015年，Google 提出了 Batch Normalization 后，BN 在深度网络中的应用便开始一发不可收拾，各种变体也横空出世。
BN 可以很好的解决网络中的梯度问题（梯度消失与梯度爆炸），减轻对参数初始化的依赖，使得训练速度提升，并增加了网络的泛化能力，可以抛弃 Dropout 等技术。

关于 High Resolution Classifier:

在 YOLO 中，作者在 ImageNet 上训练好的网络，添加后续四个 Conv layer 和两个 FC layer 后，便提高 resolution 到 $448 * 448$ 后便直接在训练集上进行训练。在 YOLOv2 中，作者选择提高 resolution 后，依然在 ImageNet 上进行 10 EPOCH 的 fine-tuning 后，再到训练集上进行训练。

关于 Convolutional With Anchor Boxs:

在 YOLO 中，网络直接由 FC layer 在 feature map 上预测 bounding box。而在 Faster R-CNN 中，模型借助 hand-picked priors（也就是那九种 anchor box）利用 RPN 预测 bounding box 相对于 anchor box 的 offset。

在 YOLOv2 中，作者也开始采用 anchor box 的 idea。首先，作者删去了一个 pooling layer 以提高最后 feature map 的 resolution；然后，作者 shrink 网络，使得网络处理图像的 input size 为 $416 * 416$ ，这一步的目的是为了让后面产生的卷积特征图宽高都为奇数，这样就可以产生一个center cell。作者观察到，大物体通常占据了图像的中间位置，就可以只用中心的一个cell来预测这些物体的位置，否则就要用中间的4个cell来进行预测，这个技巧可稍稍提升效率；最后，YOLOv2 使用 conv layer进行 downsample （factor 为 32），使得最后得到的 feature map 的 shape 为 $13 * 13$ 。

利用 anchor box，虽然 YOLOv2 的 mAP 下降了一点，但是 recall 提升了很多。（原先 YOLO 每张图最多预测 $7 * 7 * 2 = 98$ 个 bounding box，YOLOv2 可以预测 $13 * 13 * 9 = 1521$ 个 bounding box；加 anchor box 之前，mAP=69.5%，recall=81%；加了 anchor box 之后，mAP=69.2%，recall=88%）

并且，作者不再像 YOLO 中那样每个 grid 负责预测 grid 中物体的类别，改为每个 bounding box 预测 bounding box 中物体的类别。

关于 Dimension Cluster:

在 Faster-RCNN 中，anchor box 提供了三种 aspect ratio 和三种 scale的 anchor box（一共九种）。虽然模型会在 anchor box 的基础上进行回归以微调 bounding box，但是构造合适的 anchor box （也就是精选的先验框，hand-picked priors）对于模型的训练仍然有着益处。

在 YOLOv2 中，相较于手工构造 anchor box，作者选择借助统计学的力量：对数据中的标注 bounding box 进行 K-Means Cluster，以此学得更好的 aspect ratio 和 scale 的 anchor box。其中，距离函数为： $d (b o x, c e n t r o i d) = 1 - I O U (b o x, c e n t r o i d)$ 。之所以不使用传统的欧式距离函数，是因为那样会导致 size 大的 box 相对于 size 小的 box 来说，error 更大。

最后，作者基于 recall 与模型的复杂度的权衡，选择设定 $k = 5$ ，利用 K-Means 在 VOC 2007 和 COCO 上分别得到了五种 anchor box（基本都比较‘瘦长’，COCO上得到的 anchor box 比 VOC 2007 上得到的 anchor box 变化较大）。

关于 Direct Location Prediction:

之前提到，作者在 YOLOv2 中借鉴 Faster R-CNN 中的 RPN，也采用 anchor box 进行预测 bounding box 相对于 anchor box 的 offset 。但作者指出：YOLO 使用 anchor box 会导致模型不稳定，尤其在迭代初期。

在论文中，作者给出的计算公式应该是错的，我认为减号应该改为加号：

因为在 Faster R-CNN 中的计算公式为：

作者说，这样的计算公式是没有约束的，因为 $t_x,t_y$ 并没有任何约束，这就意味这最后计算的中心坐标可以落在图像上的任何位置。所以，作者放弃了这种计算公式，而采用了下面的计算公式：

其中， $c_x,c_y$ 为 grid cell 的左上角坐标，计算时每个 cell 的尺度都是1， $\sigma(t_x),\sigma(t_y)$ 也就代表着 bounding box 中心相对于 grid cell 左上角坐标的 offset。

最后，可以将式子改为如下，使得预测值的范围都在 $[0, 1]$ ：

其中， $(W, H)$ 为 feature map 的大小。

关于 Fine-Grained Feature:

由于修改后的 YOLO 最后会生成 $13 * 13$ 的 feature map，作者认为这样的粗粒度特征虽然可以胜任大尺度物体的检测，但是难以应付小物体的检测，要知道 YOLO 的缺点之一就是对小物体的检测精度低。

借鉴 SSD 的思路，作者选择利用多尺度的特征进行预测，但是与 SSD 不同，作者并没有在不同尺度上的 feature map上分别进行预测，而是将不同尺度的 feature map 进行叠加，作者称该结构为 passthrough layer，与 ResNet 中的 identity mapping 类似（‘The passthrough layer concatenates the higher resolution features with the low resolution features by stacking adjacent features into different channels instead of spatial locations, similar to the identity mappings in ResNet’）。

细节：
关于 pass-through layer，具体来说就是特征重排（不涉及到参数学习），前面 $26 * 26 * 512$ 的特征图使用按行和按列隔行采样的方法，就可以得到4个新的特征图，其维度都是 $13 * 13 * 512$ ，然后做concat操作，得到 $13 * 13 * 2048$ 的特征图，将其拼接到后面的层，相当于做了一次特征融合，有利于检测小目标。

关于 Mutli-Scale Training:

在 YOLOv2 中，作者为了增强模型对任意 size 图像的鲁棒性，采用了多尺度输入训练的策略：每隔 10 batch，就随机选择新的size 的图像进行训练。由于 YOLOv2 的 downsample 的 factor 为 32，可选输入图像的大小为： ${320,352,...,608\}$ ，则最后的 feature map 的 size 分别为 ${10,...,19\}$ 。

关于 DarkNet-19：

作者提出了一个新的 classification network，称为 DarkNet-19。在 DarkNet-19 中，作者常常在 conv layer 使用 $3 * 3$ 的 filter，并在每次pooling layer后，使得 filter 的 channel 数量翻倍；此外，作者借鉴 Network in Network，采用了 GAP（global average pooling），用来压缩所得到的 feature map（Avgpool layer 使得网络可以处理任意 size 的图像）。

细节：

至此，作者关于 YOLOv2 的描述基本讲完了，但是对比 YOLO 就可以发现，作者没讲模型训练时如何确定先验框以及损失函数。查阅资料后，发现有人做了这方面的讲解：

YOLOv2 与 YOLO 类似，在训练中，若物体中心点落在某个 grid cell 内，那么该 grid cell 内的5个 anchor box 负责预测它。具体是哪个 bounding box 预测它，需要在训练中确定，即由那个与ground truth的IOU最大的 bounding box 预测它，而剩余的4个 bounding box 不与该ground truth匹配。YOLOv2 同样假定每个 grid cell 至多含有一个 groundth truth，而在实际上基本不会出现多于1个的情况。与ground truth匹配的先验框计算坐标误差、置信度误差（此时target为1）以及分类误差，而其它的边界框只计算置信度误差（此时target为0）
YOLOv2 的 Loss Function 为：（还没完全搞清楚）

关于 VOLO 9000 的细节，我建议大家阅读参考资料中的 YOLO2，我觉得这篇文章讲的比较详细，值得一看。

(3) 实验结果

3. YOLOv3

论文题目：YOLOv3: An Incremental Improvement
论文作者：Joseph Redmon, Ali Farhadi
所属机构：University of Washington
论文链接：https://arxiv.org/pdf/1804.02767.pdf

(1) 摘要

YOLOv3 并非纯粹意义上的论文，用作者的话来说，是作者近一年的 Tech Report。在 YOLOv3 中，作者对 YOLOv2 做了许多改进，提升了 YOLOv2 的性能。其中，最值得注意的是，YOLOv3 使用了 ResNet 结构，提出了 DarkNet-53，并且采用 FPN （Feature Pyramid Networks for Object Detection）结构。

(2) 所做尝试

关于 Class Prediction：

作者在 YOLOv3 中，不再采用 Softmax ，而是采用 independent logistic classifers，并采用 binary cross-entroy loss。
这是由于 Softmax 不适用于存在 overlapping label 的复杂领域（如：Open Images Dataset），并且采用 independent logistic classifers 的效果并不差。

关于 Feature Extractor：

作者在 DarkNet-19 的基础上引进 ResNet 中的 building block 结构，提出了 DarkNet-53（因为其中含有 53个 conv layer）。

此外，作者还将其与 DarkNet-19，ResNet-101，ResNet-152 进行了对比：

关于 Prediction Across Scales：

（作者对这一块的描述写在 Feature Extrator 前面，但我感觉应该写在后面比较好，并且应该配上一张结合 DarkNet-53 的网络结构图）

在 YOLOv3 中，作者对 bounding box 设置了三种尺度特征，并且仍然利用 k-means 得到九个先验框，并将其划分到3个尺度特征图上，尺度更大的特征图使用更小的先验框。

除了以上所提到的各种改进，作者也列出了一些没有 work 的改进：采用 Focal Loss，采用与Faster R-CNN 相似的 IOU threshold 的策略，采用 Linear activation 预测 bounding box 的坐标

(3) 实验结果

参考资料：

zhangqizky/awesome-object-detection
YOLO 幻灯片
YOLO详解
YOLO（You Only Look Once）算法详解
目标检测|YOLO原理与实现
目标检测|YOLOv2原理与实现(附YOLOv3)
YOLO2
目标检测：YOLOv2算法详解
目标检测网络之 YOLOv3

如果你看到了这篇文章的最后，并且觉得有帮助的话，麻烦你花几秒钟时间点个赞，或者受累在评论中指出我的错误。谢谢！

作者信息：
知乎：没头脑
LeetCode：Tao Pu
CSDN：Code_Mart
Github：Bojack-want-drink

LocalDateTime 转 String igotyback java 开发语言
importjava.time.LocalDateTime;importjava.time.format.DateTimeFormatter;publicclassMain{publicstaticvoidmain(String[]args){//获取当前时间LocalDateTimenow=LocalDateTime.now();//定义日期格式化器DateTimeFormatterformat
Linux下QT开发的动态库界面弹出操作（SDL2） 13jjyao QT类 qt 开发语言 sdl2 linux
需求：操作系统为linux，开发框架为qt，做成需带界面的qt动态库，调用方为java等非qt程序难点：调用方为java等非qt程序，也就是说调用方肯定不带QApplication::exec()，缺少了这个，QTimer等事件和QT创建的窗口将不能弹出(包括opencv也是不能弹出)；这与qt调用本身qt库是有本质的区别的思路：1.调用方缺QApplication::exec()，那么我们在接口
python os.environ_python os.environ 读取和设置环境变量 weixin_39605414 python os.environ
>>>importos>>>os.environ.keys()['LC_NUMERIC','GOPATH','GOROOT','GOBIN','LESSOPEN','SSH_CLIENT','LOGNAME','USER','HOME','LC_PAPER','PATH','DISPLAY','LANG','TERM','SHELL','J2REDIR','LC_MONETARY','QT_QPA
多线程之——ExecutorCompletionService 阿福德
在我们开发中，经常会遇到这种情况，我们起多个线程来执行，等所有的线程都执行完成后，我们需要得到个线程的执行结果来进行聚合处理。我在内部代码评审时，发现了不少这种情况。看很多同学都使用正确，但比较啰嗦，效率也不高。本文介绍一个简单处理这种情况的方法：直接上代码：publicclassExecutorCompletionServiceTest{@TestpublicvoidtestExecutorCo
tiff批量转png 诺有缸的高飞鸟 opencv 图像处理 python opencv 图像处理
目录写在前面代码完写在前面1、本文内容tiff批量转png2、平台/环境opencv,python3、转载请注明出处：https://blog.csdn.net/qq_41102371/article/details/132975023代码importnumpyasnpimportcv2importosdeffindAllFile(base):file_list=[]forroot,ds,fsin
遥感影像的切片处理 sand&wich 计算机视觉 python 图像处理
在遥感影像分析中，经常需要将大尺寸的影像切分成小片段，以便于进行详细的分析和处理。这种方法特别适用于机器学习和图像处理任务，如对象检测、图像分类等。以下是如何使用Python和OpenCV库来实现这一过程，同时确保每个影像片段保留正确的地理信息。准备环境首先，确保安装了必要的Python库，包括numpy、opencv-python和xml.etree.ElementTree。这些库将用于图像处理
windows下python opencv ffmpeg读取摄像头实现rtsp推流拉流图像处理大大大大大牛啊 opencv实战代码讲解视觉图像项目 windows python opencv
windows下pythonopencvffmpeg读取摄像头实现rtsp推流拉流整体流程1.下载所需文件1.1下载rtsp推流服务器1.2下载ffmpeg2.开启RTSP服务器3.opencv读取摄像头并调用ffmpeg进行推流4.opencv进行拉流5.opencv异步拉流整体流程1.下载所需文件1.1下载rtsp推流服务器下载RTSP服务器下载页面https://github.com/blu
c++ opencv4.3 sift匹配图像处理大大大大大牛啊图像处理 opencv实战代码讲解 opencv sift c++opencv4 特征点
c++opencv4.3sift匹配main.cppintmain(){vectorkeypoints1,keypoints2;Matimg1,img2,descriptors1,descriptors2;intnumF
自动写论文的网站推荐这5款实用类工具小猪包333 写论文人工智能深度学习计算机视觉 AI写作
在当今学术研究和写作领域，AI论文写作工具的出现极大地提高了写作效率和质量。这些工具不仅能够帮助研究人员快速生成论文草稿，还能进行内容优化、查重和排版等操作。以下是五款实用类工具推荐，特别是千笔-AIPassPaper。1.千笔-AIPassPaper千笔-AIPassPaper是一款功能强大且全面的AI论文写作助手，用户只需输入基本的研究需求和关键词，便能迅速生成一篇完整的论文。该工具利用先进的
推荐3家毕业AI论文可五分钟一键生成！文末附免费教程！小猪包333 写论文人工智能 AI写作深度学习计算机视觉
在当前的学术研究和写作领域，AI论文生成器已经成为许多研究人员和学生的重要工具。这些工具不仅能够帮助用户快速生成高质量的论文内容，还能进行内容优化、查重和排版等操作。以下是三款值得推荐的AI论文生成器：千笔-AIPassPaper、懒人论文以及AIPaperPass。千笔-AIPassPaper千笔-AIPassPaper是一款基于深度学习和自然语言处理技术的AI写作助手，旨在帮助用户快速生成高质
4款毕业论文参考文献格式生成器（附加详细步骤）小猪包333 写论文人工智能深度学习计算机视觉 AI写作
在撰写毕业论文时，参考文献的格式规范是至关重要的。为了帮助学生和学者们更高效地生成符合要求的参考文献格式，本文将详细介绍四款推荐的参考文献格式生成器，并提供详细的使用步骤。1.千笔-AIPassPaper千笔-AIPassPaper是一款先进的AI辅助论文写作工具，不仅能够自动生成大纲、开题报告，还能一键生成参考文献。AI论文，免费大纲，10分钟3万字https://www.aipaperpass
AI论文写作推荐哪个好？分享5款AI论文写作带数据图表网站小猪包333 写论文人工智能深度学习计算机视觉
在当今学术研究和写作领域，AI论文写作工具的出现极大地提高了写作效率和质量。这些工具不仅能够帮助研究人员快速生成论文草稿，还能进行内容优化、查重和排版等操作。以下是五款推荐的AI论文写作工具，包括千笔-AIPassPaper。千笔-AIPassPaper千笔-AIPassPaper是一款功能强大的AI论文写作助手，旨在帮助用户快速生成高质量的论文内容。AI论文，免费大纲，10分钟3万字https:
AI论文题目生成器怎么用？9款论文写作网站简单3步搞定小猪包333 写论文人工智能深度学习计算机视觉
在当今信息爆炸的时代，AI写作工具的出现极大地提高了写作效率和质量。本文将详细介绍9款优秀的论文写作网站，并重点推荐千笔-AIPassPaper。一、千笔-AIPassPaper千笔-AIPassPaper是一款功能强大的AI论文生成器，基于最新的自然语言处理技术，能够一键生成高质量的毕业论文、开题报告等文本内容。它不仅提供智能选题、文献推荐和论文润色等功能，还具有较高的用户评价。其文献综述生成功
毕业论文附录一般都写什么?大学生写论文是干嘛用的写个原创论文人工智能深度学习 AI写作 chatgpt 论文阅读
毕业论文的附录通常包含一些在正文中不便于展示或详细阐述的内容，但对理解论文整体又具有重要意义的资料。具体来说，附录可能包含以下内容：AI论文，免费大纲，10分钟3万字，查重高于15%退费，支持数据图表！！AIPaperPass-AI论文写作指导平台AIPaperPass是AI原创论文写作平台，免费千字大纲，5分钟生成3万字初稿，提供答辩汇报ppt、开题报告、任务书等，40篇真实中英文知网参考文献，
鲁西南方言杂谈-麻胡一两茶叶
《汉语词典》给“麻胡”的解释是“拼音máhú，传说中人名。说法不一，以残暴著称。民间习用以恐吓小儿。谓貌丑而多须者。”的意思；《国语辞典》也给出其“传说中的坏人，用来吓唬啼哭中的小孩。也称为‘麻虎子’、‘马虎子’。唐代李匡义《资暇集．卷下．非麻胡》俗怖婴儿曰：‘麻胡来！’不知其源者，以为多髯之神而验刺者，非也。隋将军麻祜，性酷虐，炀帝令开汴河，威棱既盛，至稚童望风而畏，互相恐吓曰：‘麻祜来！’稚童
ubuntu安装opencv最快的方法 Derek重名了
最快方法，当然不能太多文字$sudoapt-getinstallpython-opencv借助python就可以把ubuntu的opencv环境搞起来，非常快非常容易参考：https://docs.opencv.org/trunk/d2/de6/tutorial_py_setup_in_ubuntu.html
代码的执行效果高天
packagecom20210409;publicclassdemo04{publicstaticvoidmain(String[]args){//////&&当前的条件不满足,则最后结果一定不满足,后面的条件不再执行////&不管条件是否满足所有条件均作判断//intx=1,y=1;//if(++y==2&&x++==2){//x=7;//}//System.out.println("x="+x
使用Python和Playwright破解滑动验证码 asfdsgdf python 开发语言
滑动验证码是一种常见的验证码形式，通过拖动滑块将缺失的拼图块对准原图中的空缺位置来验证用户操作。本文将介绍如何使用Python中的OpenCV进行模板匹配，并结合Playwright实现自动化破解滑动验证码的过程。所需技术OpenCV模板匹配：用于识别滑块在背景图中的正确位置。Python：主要编程语言。Playwright：用于浏览器自动化，模拟用户操作。破解过程概述获取验证码图像：下载背景图和
OpenCV图像处理技术（Python）——入门森屿_ opencv
©FuXianjun.AllRightsReserved.OpenCV入门图像作为人类感知世界的视觉基础，是人类获取信息、表达信息的重要手段，OpenCV作为一个开源的计算机视觉库，它包括几百个易用的图像成像和视觉函数，既可以用于学术研究，也可用于工业邻域，它于1999年由因特尔的GaryBradski启动，OpenCV库主要由C和C++语言编写，它可以在多个操作系统上运行。1.1图像处理基本操作
opencv学习：图像旋转的两种方法，旋转后的图片进行模板匹配代码实现夜清寒风学习 opencv 机器学习人工智能计算机视觉
图像旋转在图像处理中，rotate和rot90是两种常见的图像旋转方法，它们在功能和使用上有一些区别。下面我将分别介绍这两种方法，并解释它们的主要区别rot90方法rot90方法是NumPy提供的一种数组旋转函数，它主要用于对二维数组（如图像）进行90度的旋转。这个方法比较简单，只支持90度的倍数旋转，不支持任意角度旋转。使用NumPy进行旋转使用NumPy的rot90函数对模板图像进行旋转操作。
探索创新科技： Lite-Mono - 简约高效的小型化Mono框架杭律沛Meris
探索创新科技：Lite-Mono-简约高效的小型化Mono框架Lite-Mono[CVPR2023]Lite-Mono:ALightweightCNNandTransformerArchitectureforSelf-SupervisedMonocularDepthEstimation项目地址:https://gitcode.com/gh_mirrors/li/Lite-Mono如果你在寻找一个轻
Python OpenCV图像处理：从基础到高级的全方位指南极客代码玩转Python 开发语言 python opencv 图像处理计算机视觉
目录第一部分：PythonOpenCV图像处理基础1.1OpenCV简介1.2PythonOpenCV安装1.3实战案例：图像显示与保存1.4注意事项第二部分：PythonOpenCV图像处理高级技巧2.1图像变换2.2图像增强2.3图像复原第三部分：PythonOpenCV图像处理实战项目3.1图像滤波3.2图像分割3.3图像特征提取第四部分：PythonOpenCV图像处理注意事项与优化策略4
C# 禁止程序重复启动 wiseyao1219 c#
修改：Program.cs[STAThread]staticvoidMain(){Mutexmutex=newMutex(true,"NewGuid123456",outboolisCreatedNew);if(!isCreatedNew){MessageBox.Show(Application.ProductName+"isrunning...");return;}Application.Ena
2018-08-16【Swift 4.1】关于Swift4.0以后调用MJExtension无法模型转换问题码农happy
1、本人使用swift4.1，弄了一晚上才弄好，结果还是一个小问题真是尴尬，要在model中每个属性前面加上@objcimportUIKitclassUserModel:NSObject{@objcvardix=String()}letdic=["dix":"ffffff"]asNSDictionaryletmodel=UserModel.mj_object(withKeyValues:dic)!
python图像匹配_opencvpython中的图像匹配 weixin_39585675 python图像匹配
我一直在做一个项目，用opencvpython识别相机中显示的标志。我已经尝试过使用surf、颜色直方图匹配和模板匹配。但在这3个问题中，它并不总是返回正确的答案。我现在想要的是，解决我这个问题的最好办法是什么。模板图像示例：以下是摄像头中显示的标志示例。如果这是我想要识别的图像，该怎么用？在更新matchTemplate中的代码flags=["Cambodia.jpg","Laos.jpg","
利用Python+OpenCV实现截图匹配图像，支持自适应缩放、灰度匹配、区域匹配、匹配多个结果 xu-jssy Python自动化脚本 python opencv 开发语言图像处理自动化
可以直接通过pip获取，无需手动安装其他依赖pipinstallxug示例：importxugxug.find_image_on_screen(,,,)=========================================================================一、依赖安装pipinstallopencv-pythonpipinstallpyautogui二、获
day12 控制流程 if switch while do...while 猜数字游戏卓越小Y JAVA学习日志游戏 java 开发语言
控制流程顺序结构所有的程序都是按顺序执行if语句选择结构单选择语句if(a>0){System.out.println(“hello”);}packagecom.ckw.blog.select;importjava.util.Scanner;publicclassdemo01{publicstaticvoidmain(String[]args){intscore=0;Scannerscanner=
Vector和Stack的用法蟹道人 JavaSe java
/***作者：*日期：*功能：vector的用法*/packagecom.cg;importjava.util.*;publicclassDemo5{publicstaticvoidmain(String[]args){//Vector的使用Vectorvec=newVector();Empemp=newEmp("2011",25,"zhang");vec.add(emp);for(inti=0;
C#文件被占用的解决方案花北城 C#项目文件占用
问题打更新包时，提示文件被占用。System.IO.IOException:文件“D:\RS\RS_CCVI20111210.exe”正由另一进程使用，因此该进程无法访问该文件。在System.IO.__Error.WinIOError(Int32errorCode,StringmaybeFullPath)在System.IO.FileStream.Init(Stringpath,FileMode
数组拷贝Arraycopy xing2516 Arraycopy java
packageqing;//数组拷贝publicclassArraycopy{publicstaticvoidmain(String[]args){//一维数组拷贝Stringa[]={"小米","华为","阿里","腾讯","百度"};String[]aBak=newString[6];//从a数组第0个copy到数组aBak0个开始，长度是a数组长度System.arraycopy(a,0,a
Java常用排序算法/程序员必须掌握的8大排序算法 cugfy java
分类： 1）插入排序（直接插入排序、希尔排序） 2）交换排序（冒泡排序、快速排序） 3）选择排序（直接选择排序、堆排序） 4）归并排序 5）分配排序（基数排序）所需辅助空间最多：归并排序所需辅助空间最少：堆排序平均速度最快：快速排序不稳定：快速排序，希尔排序，堆排序。先来看看8种排序之间的关系： 1.直接插入排序（1
【Spark102】Spark存储模块BlockManager剖析 bit1129 manager
Spark围绕着BlockManager构建了存储模块，包括RDD，Shuffle，Broadcast的存储都使用了BlockManager。而BlockManager在实现上是一个针对每个应用的Master/Executor结构，即Driver上BlockManager充当了Master角色，而各个Slave上(具体到应用范围，就是Executor)的BlockManager充当了Slave角色
linux 查看端口被占用情况详解 daizj linux 端口占用 netstat lsof
经常在启动一个程序会碰到端口被占用，这里讲一下怎么查看端口是否被占用，及哪个程序占用，怎么Kill掉已占用端口的程序 1、lsof -i:port port为端口号 [root@slave /data/spark-1.4.0-bin-cdh4]# lsof -i:8080 COMMAND PID USER FD TY
Hosts文件使用周凡杨 hosts locahost
一切都要从localhost说起，经常在tomcat容器起动后，访问页面时输入http://localhost:8088/index.jsp，大家都知道localhost代表本机地址，如果本机IP是10.10.134.21，那就相当于http://10.10.134.21:8088/index.jsp，有时候也会看到http: 127.0.0.1:
java excel工具 g21121 Java excel
直接上代码，一看就懂，利用的是jxl： import java.io.File; import java.io.IOException; import jxl.Cell; import jxl.Sheet; import jxl.Workbook; import jxl.read.biff.BiffException; import jxl.write.Label; import
web报表工具finereport常用函数的用法总结（数组函数）老A不折腾 finereport web报表函数总结
ADD2ARRAY ADDARRAY(array,insertArray, start):在数组第start个位置插入insertArray中的所有元素，再返回该数组。示例： ADDARRAY([3,4, 1, 5, 7], [23, 43, 22], 3)返回[3, 4, 23, 43, 22, 1, 5, 7]. ADDARRAY([3,4, 1, 5, 7], "测试&q
游戏服务器网络带宽负载计算墙头上一根草服务器
家庭所安装的4M，8M宽带。其中M是指，Mbits/S 其中要提前说明的是： 8bits = 1Byte 即8位等于1字节。我们硬盘大小50G。意思是50*1024M字节，约为 50000多字节。但是网宽是以“位”为单位的，所以，8Mbits就是1M字节。是容积体积的单位。 8Mbits/s后面的S是秒。8Mbits/s意思是每秒8M位，即每秒1M字节。我是在计算我们网络流量时想到的
我的spring学习笔记2-IoC（反向控制依赖注入） aijuans Spring 3 系列
IoC（反向控制依赖注入）这是Spring提出来了，这也是Spring一大特色。这里我不用多说，我们看Spring教程就可以了解。当然我们不用Spring也可以用IoC，下面我将介绍不用Spring的IoC。 IoC不是框架，她是java的技术，如今大多数轻量级的容器都会用到IoC技术。这里我就用一个例子来说明：如：程序中有 Mysql.calss 、Oracle.class 、SqlSe
高性能mysql 之选择存储引擎(一) annan211 mysql InnoDB MySQL引擎存储引擎
1 没有特殊情况，应尽可能使用InnoDB存储引擎。原因：InnoDB 和 MYIsAM 是mysql 最常用、使用最普遍的存储引擎。其中InnoDB是最重要、最广泛的存储引擎。她被设计用来处理大量的短期事务。短期事务大部分情况下是正常提交的，很少有回滚的情况。InnoDB的性能和自动崩溃恢复特性使得她在非事务型存储的需求中也非常流行，除非有非常
UDP网络编程百合不是茶 UDP编程局域网组播
UDP是基于无连接的,不可靠的传输与TCP/IP相反 UDP实现私聊,发送方式客户端,接受方式服务器 package netUDP_sc; import java.net.DatagramPacket; import java.net.DatagramSocket; import java.net.Ine
JQuery对象的val()方法执行结果分析 bijian1013 JavaScript js jquery
JavaScript中，如果id对应的标签不存在（同理JAVA中，如果对象不存在），则调用它的方法会报错或抛异常。在实际开发中，发现JQuery在id对应的标签不存在时，调其val()方法不会报错，结果是undefined。
http请求测试实例（采用json-lib解析） bijian1013 json http
由于fastjson只支持JDK1.5版本，因些对于JDK1.4的项目，可以采用json-lib来解析JSON数据。如下是http请求的另外一种写法，仅供参考。 package com; import java.util.HashMap; import java.util.Map; import
【RPC框架Hessian四】Hessian与Spring集成 bit1129 hessian
在【RPC框架Hessian二】Hessian 对象序列化和反序列化一文中介绍了基于Hessian的RPC服务的实现步骤，在那里使用Hessian提供的API完成基于Hessian的RPC服务开发和客户端调用，本文使用Spring对Hessian的集成来实现Hessian的RPC调用。定义模型、接口和服务器端代码 |---Model &nb
【Mahout三】基于Mahout CBayes算法的20newsgroup流程分析 bit1129 Mahout
1.Mahout环境搭建 1.下载Mahout http://mirror.bit.edu.cn/apache/mahout/0.10.0/mahout-distribution-0.10.0.tar.gz 2.解压Mahout 3. 配置环境变量 vim /etc/profile export HADOOP_HOME=/home
nginx负载tomcat遇非80时的转发问题 ronin47
　　nginx负载后端容器是tomcat（其它容器如WAS,JBOSS暂没发现这个问题）非８０端口，遇到跳转异常问题。解决的思路是：$host:port 详细如下：　　该问题是最先发现的，由于之前对nginx不是特别的熟悉所以该问题是个入门级别的： ? 1 2 3 4 5
java-17-在一个字符串中找到第一个只出现一次的字符 bylijinnan java
public class FirstShowOnlyOnceElement { /**Q17.在一个字符串中找到第一个只出现一次的字符。如输入abaccdeff，则输出b * 1.int[] count:count[i]表示i对应字符出现的次数 * 2.将26个英文字母映射：a-z <--> 0-25 * 3.假设全部字母都是小写 */ pu
mongoDB 复制集开窍的石头 mongodb
mongo的复制集就像mysql的主从数据库，当你往其中的主复制集(primary)写数据的时候，副复制集(secondary)会自动同步主复制集(Primary)的数据,当主复制集挂掉以后其中的一个副复制集会自动成为主复制集。提供服务器的可用性。和防止当机问题 mo
[宇宙与天文]宇宙时代的经济学 comsci 经济
宇宙尺度的交通工具一般都体型巨大，造价高昂。。。。。在宇宙中进行航行，近程采用反作用力类型的发动机，需要消耗少量矿石燃料，中远程航行要采用量子或者聚变反应堆发动机，进行超空间跳跃，要消耗大量高纯度水晶体能源以目前地球上国家的经济发展水平来讲，
Git忽略文件 Cwind git
有很多文件不必使用git管理。例如Eclipse或其他IDE生成的项目文件，编译生成的各种目标或临时文件等。使用git status时，会在Untracked files里面看到这些文件列表，在一次需要添加的文件比较多时（使用git add . / git add -u），会把这些所有的未跟踪文件添加进索引。 ==== ==== ==== 一些牢骚
MySQL连接数据库的必须配置 dashuaifu mysql 连接数据库配置
MySQL连接数据库的必须配置 1.driverClass：com.mysql.jdbc.Driver 2.jdbcUrl：jdbc:mysql://localhost:3306/dbname 3.user：username 4.password：password 其中1是驱动名；2是url，这里的‘dbna
一生要养成的60个习惯 dcj3sjt126com 习惯
一生要养成的60个习惯第1篇让你更受大家欢迎的习惯 1 守时，不准时赴约,让别人等,会失去很多机会。如何做到： ①该起床时就起床， ②养成任何事情都提前15分钟的习惯。 ③带本可以随时阅读的书，如果早了就拿出来读读。 ④有条理，生活没条理最容易耽误时间。 ⑤提前计划：将重要和不重要的事情岔开。 ⑥今天就准备好明天要穿的衣服。 ⑦按时睡觉，这会让按时起床更容易。 2 注重
[介绍]Yii 是什么 dcj3sjt126com PHP yii2
Yii 是一个高性能，基于组件的 PHP 框架，用于快速开发现代 Web 应用程序。名字 Yii （读作易）在中文里有“极致简单与不断演变”两重含义，也可看作 Yes It Is! 的缩写。 Yii 最适合做什么？ Yii 是一个通用的 Web 编程框架，即可以用于开发各种用 PHP 构建的 Web 应用。因为基于组件的框架结构和设计精巧的缓存支持，它特别适合开发大型应
Linux SSH常用总结 eksliang linux ssh SSHD
转载请出自出处：http://eksliang.iteye.com/blog/2186931 一、连接到远程主机格式： ssh name@remoteserver 例如： ssh [email protected] 二、连接到远程主机指定的端口格式： ssh name@remoteserver -p 22 例如： ssh i
快速上传头像到服务端工具类FaceUtil gundumw100 android
快速迭代用 import java.io.DataOutputStream; import java.io.File; import java.io.FileInputStream; import java.io.FileNotFoundException; import java.io.FileOutputStream; import java.io.IOExceptio
jQuery入门之怎么使用 ini JavaScript html jquery Web css
jQuery的强大我何问起（个人主页：hovertree.com）就不用多说了，那么怎么使用jQuery呢？首先，下载jquery。下载地址：http://hovertree.com/hvtart/bjae/b8627323101a4994.htm，一个是压缩版本，一个是未压缩版本，如果在开发测试阶段，可以使用未压缩版本，实际应用一般使用压缩版本(min)。然后就在页面上引用。
带filter的hbase查询优化 kane_xie 查询优化 hbase RandomRowFilter
问题描述 hbase scan数据缓慢，server端出现LeaseException。hbase写入缓慢。问题原因直接原因是： hbase client端每次和regionserver交互的时候，都会在服务器端生成一个Lease,Lease的有效期由参数hbase.regionserver.lease.period确定。如果hbase scan需
java设计模式-单例模式 men4661273 java 单例枚举反射 IOC
单例模式1，饿汉模式 //饿汉式单例类.在类初始化时，已经自行实例化 public class Singleton1 { //私有的默认构造函数 private Singleton1() {} //已经自行实例化 private static final Singleton1 singl
mongodb 查询某一天所有信息的3种方法，根据日期查询 qiaolevip 每天进步一点点学习永无止境 mongodb 纵观千象
// mongodb的查询真让人难以琢磨，就查询单天信息，都需要花费一番功夫才行。 // 第一种方式： coll.aggregate([ {$project:{sendDate: {$substr: ['$sendTime', 0, 10]}, sendTime: 1, content:1}}, {$match:{sendDate: '2015-
二维数组转换成JSON tangqi609567707 java 二维数组 json
原文出处：http://blog.csdn.net/springsen/article/details/7833596 public class Demo { public static void main(String[] args) { String[][] blogL
erlang supervisor wudixiaotie erlang
定义supervisor时，如果是监控celuesimple_one_for_one则删除children的时候就用supervisor:terminate_child (SupModuleName, ChildPid)，如果shutdown策略选择的是brutal_kill，那么supervisor会调用exit(ChildPid, kill)，这样的话如果Child的behavior是gen_

[论文笔记] YOLO系列论文笔记

目录

1. YOLO

2. YOLOv2

3. YOLOv3

你可能感兴趣的:(Paper,CV,CV,杂谈)