zj360202

YOLOv2论文理解

YOLO9000:Better, Faster, Stronger

论文YOLO9000: Better, Faster, Stronger的主要内容有三点：
1、作者提出了YOLOv2。
YOLOv2在YOLOv1的基础上，使用新的网络结构（darknet19）和技巧（Batch Normalization、High Resolution Classifier、Convolutional With Anchor Boxes等），提高了检测速度和检测精度。
2、作者提出了一种联合训练方法，可以同时使用检测数据集和分类数据集来训练检测模型，用分层的观点对物体分类，用检测数据集学习准确预测物体的位置，用分类数据集来增加可识别的类别量，提升鲁棒性。
3、作者基于YOLOv2提出了YOLO9000，可以实时检测九千多种物体。

我参考论文和代码进行了实验，YOLOv2相对于YOLOv1有很明显的提升，但是YOLO9000使用感受并不好。YOLO9000的主要问题在于很难调整合适的分层阈值，同时很多物体的检测精度过低。

由于工作和学习中对YOLOv2的研究比较多，对YOLO9000的研究并不深入，所以本文仅记录对YOLOv2的理解。

Better

YOLO相较于其他的state-of-the-art的检测系统有一些缺陷，主要表现在两点：
1、和Fast R-CNN相比，YOLO会产生较多的bounding boxes的定位错误。
2、和基于region proposal的检测系统相比，YOLO的Recall较低。

机器视觉的发展有着神经网络越来越大、越来越深的趋势。现在的检测系统，更好的检测性能往往伴随着更大的神经网络或者是多个检测模型的集成。YOLO的目标是高精度实时检测，所以期望在不增大网络、精度不下降的前提下来对定位错误和低Recall进行改善，为此作者尝试了一系列方法（如图所示）。

Batch Normalization

BN在消除对其他正则项依赖的同时，在帮助模型收敛方面有显著作用。通过对每个卷积层添加BN，YOLO的mAP有了2%的提升。BN对模型的泛化很有帮助，加入BN后，去掉了dropout模型依旧没有过拟合。

High Resolution Classifier

所有state-of-the-art的检测方法都在ImageNet上对分类器进行了预训练。从AlexNet开始，多数分类器都把输入图像resize到256 * 256以下，这会容易丢失一些小物体的信息。
YOLOv1先使用224 * 224的分辨率来训练分类网络，在训练检测网络的时候再切换到448 * 448的分辨率，这意味着YOLOv1的卷积层要重新适应新的分辨率同时YOLOv1的网络还要学习检测网络。
现在，YOLOv2直接使用448 * 448的分辨率来fine tune分类网络，好让网络可以调整filters来适应高分辨率。然后再用这个结果来fine tune检测网络。
使用高分辨率的分类网络提升了将近4%的mAP。

Convolutional With Anchor Boxes

YOLOv1使用卷积层之后的全连接层来直接预测bounding boxes的坐标。Faster R-CNN的做法和YOLO不同，使用精心挑选的anchor boxes来预测bounding boxes的坐标。Faster R-CNN的region proposal network（RPN）使用全卷积网络来预测相对anchor boxes的offsets和confidences。因为预测层是个卷积层，RPN在一个特征图上预测所有bounding boxes的offsets。和直接预测坐标相比，预测offsets简化了问题，而且网络更容易学习。
YOLOv2去掉了全连接层，使用anchor boxes预测bounding boxes。
YOLOv2一个池化层，使得卷积层的输出有更高的分辨率。
YOLOv2将输入图像的尺寸从448 * 448缩减到416 * 416，这样特征图的输出就是一个奇数，有一个中心栅格。作者观察到，有很多物体，尤其是较大的物体往往会位于图像的中心。有一个中心栅格的话可以用中心栅格专门去负责预测这些中心落在图像中心附近的物体，而不需要图像中心附近的4个栅格去预测这些物体。YOLOv2对图像进行了32倍的降采样，最终输出的特征图尺寸是13 * 13。

使用anchor boxes预测坐标的同时，YOLOv2还对对conditional class probability的预测机制和空间位置（栅格）做了解耦。
在YOLOv1将输入图像划分为S*S的栅格，每一个栅格预测B个bounding boxes，以及这些bounding boxes的confidence scores。
每一个栅格还要预测C个 conditional class probability（条件类别概率）：Pr(Classi|Object)。即在一个栅格包含一个Object的前提下，它属于某个类的概率。且每个栅格预测一组（C个）类概率，而不考虑框B的数量。
YOLOv2不再由栅格去预测条件类别概率，而由Bounding boxes去预测。在YOLOv1中每个栅格只有1组条件类别概率，而在YOLOv2中，因为每个栅格有B个bounding boxes，所以有B组条件类别概率。
在YOLOv1中输出的维度为S * S * （B * 5 + C ），而YOLOv2为S * S * （B * （5 + C））。

使用anchor boxes, 模型的的精度有一点点下降，但是Recall有大幅上升。没有anchor box，我们的中间模型的mAP为69.5，Recall为81%。使用anchor boxes 模型的mAP为69.2，Recall为88%。尽管mAP有轻微的下降，但是Recall的增加意味着模型有更多的改进空间。

Dimension Clusters

尝试在YOLO中使用anchor boxes的过程中遇到了两个问题，第一个问题是如何选择anchor boxes。Faster R-CNN的anchor boxes是手工精心挑选的，但未必是最好的。虽然神经网络在训练过程中会逐渐学着调整预测的bounding boxes，让预测更合理，但有好的anchor boxes帮助可以神经网络让预测更简单。
机器学习的本质是学习数据中的概率分布，手工挑选的anchor boxes未必很好的符合训练集ROI的概率分布，使用K-means从训练集中聚类得到的anchor boxes可能更好。
YOLOv2中的anchor boxes是通过k-means在训练集中学得的。值得注意的是，因为使用欧氏距离会让大的bounding boxes比小的bounding boxes产生更多的error，而我们希望能通过anchor boxes获得好的IOU scores，并且IOU scores是与box的尺寸无关的。
为此作者定义了新的距离公式：

d(box,centroid)=1−IOU(box,centroid)

作者使用了一系列k的值运行k-means，并画出了平均IOU，如图所示：

和使用手工挑选的anchor boxes相比，使用K-means得到的anchor boxes表现更好。使用5个k-means得到的anchor boxes的性能（IOU 61.0）和使用9个手工挑选的anchor boxes的性能（IOU 60.9）相当。这意味着使用k-means获取anchor boxes来预测bounding boxes让模型更容易学习如何预测bounding boxes。

Direct location prediction

尝试在YOLO中使用anchor boxes的过程中遇到的第二个问题就是模型变得不稳定，尤其是在训练的早期迭代。不稳定的主要因素来自对bounding box中心坐标x，y的预测。在RPN中，网络预测出偏移量tx 和 ty,计算对bounding box中心坐标x，y的公式为：

x=(tx∗wa)−xa

y=(ty∗ha)−ya

论文中的该公式可能有误，参考Faster R-CNN的论文，公式应为：

x=(tx∗wa)+xa

y=(ty∗ha)+ya

公式中 xa ， ya 为anchor的坐标， wa , ha 为anchor的长宽。如果 tx 大于0，bounding box会向右移动anchor宽的 tx 倍；如果 tx 小于0，bounding box会向左移动anchor宽的 tx 倍。由于 tx 和 ty 没有限制，预测出的bounding box的中心可以在图像上的任意一点，即便这个点落在别的栅格中，应当由别的栅格来预测。
由于模型是随机初始化的，要花很长时间去训练，参数才能调整到能够很敏感的预测offset。因此YOLOv2不预测offset，而是延续YOLOv1预测bounding boxes相对栅格左上角的坐标（相对栅格边长的比例）。为了确保bounding boxes的中心落在栅格中（即坐标落在0到1之间），作者使用了logistic激活函数来约束预测值。
YOLOv2网络为每个栅格预测5个bounding boxes（对应5个anchor boxes），每个bounding box预测5个坐标 tx,ty,tw,th 和 to 。如果栅格左上角的坐标为（cx,xy），anchor box的宽高为 (pw,ph) ，则bounding box的中心点坐标 (bx,by) ，宽高 bw,bh 和
置信分的计算公式为：

σ(tx) 是bounding box的中心相对栅格左上角的横坐标， σ(ty) 是纵坐标， σ(to) 是bounding box的confidence score。

约束了位置预测的范围后，网络参数变得更容易学习，网络变得稳定。和使用手选的anchor boxes预测offset相比，使用k-means得到的anchor boxes直接预测相对栅格的坐标，mAP提升了将近5%。

Fine-Grained Features

YOLOv2在卷积层输出的13 * 13特征图上进行检测，这对于大的物体是足够的，但是更细粒度的特征可以帮助模型定位较小的目标。Faster R-CNN和SSD在一系列尺寸不同的特征图上运行RPN来获取不同分别率的信息。YOLOv2采取不同的方法，通过添加一个passthrough layer，将前一个卷积块26 * 26分辨率的特征图的信息融合起来。

类似于ResNet的Identity Mapping，passthrough layer层通过将相邻特征堆叠到不同的通道，将较高分辨率特征与低分辨率特征的信息融合。这使得26×26×512的特征图转换为与原始特征相连接的13×13×2048的特征图。YOLOv2的检测器在这个扩展的特征图的顶部运行，以便利用细粒度的特征。这提高了将近1%的性能。

Multi-Scale Training

YOLOv1网络使用448 * 448的图像作为输入，YOLOv2加入anchor boxes后，输入图像的尺寸变成了416 * 416。YOLOv2网络只用到了卷积层和池化层，因此可以进行动态调整输入图像的尺寸。作者希望YOLOv2对于不同尺寸图像的检测都有较好的鲁棒性，因此做了针对性训练。
和YOLOv1训练时网络输入的图像尺寸固定不变不同，YOLOv2（在cfg文件中random=1时）每隔几次迭代后就会微调网络的输入尺寸。训练时每迭代10次，就会随机选择新的输入图像尺寸。因为YOLOv2的网络使用的downsamples倍率为32，所以使用32的倍数调整输入图像尺寸{320,352，…，608}。训练使用的最小的图像尺寸为320 * 320，最大的图像尺寸为608 * 608。
这种策略让YOLOv2网络不得不学着对不同尺寸的图像输入都要预测得很好，这意味着同一个网络可以胜任不同分辨率的检测任务，在网络训练好之后，在使用时只需要根据需求，修改cfg文件中的网络输入图像尺寸（width和height的值）即可。
YOLOv2在检测速度和精度上达到了很好的平衡。
YOLOv2在检测低分辨率的图像时，精度较低但速度非常快。在输入尺寸为228 * 228的时候，检测帧率达到90FPS，而mAP几乎和Faster R-CNN的水准相同。使意味着YOLOv2在低性能GPU、高帧率视频、多媒体视频流场景中更加适用。
在检测大尺寸图像检测中，YOLOv2不仅依然保持着实时检测，精度也很高，如在VOC2007 上mAP为78.6%。和其他检测系统的性能对比见下面几张图：

VOC2007

VOC2012

COCO2015

Faster

YOLO设计的初衷是兼得速度和精度，达到实时检测。YOLOv2不仅提高了精度，通过设计新的网络结构，检测速度也有提升。

Darknet-19

多数的检测系统使用VGG-16作为基础特征提取器。VGG-16是一个高精度的有效的分类网络，但是有些过于复杂。VGG-16的卷积层对一张224 * 224 的图像做一次前传计算要做306.9亿次浮点数运算。
YOLOv1使用的网络是基于GoogleNet的。该网络比VGG-16快，对一张224 * 224 的图像做一次前传计算要做85.2亿次浮点数运算，但是精度比VGG-16略低。VGG-16在ImageNet上的Top-5精度为90.0%，YOLOv1的定制网络精度为88.0%。
YOLOv2的分类网络叫做Darknet-19，Darknet-19对一张224 * 224 的图像做一次前传计算要做55.8亿次浮点数运算，在ImageNet上的Top-5精度为91.2%，比YOLOv1更快，比VGG-16更高。

Darknet-19的网络结构如图：

类似VGG网络，Darknet-19中使用了较多的3 * 3卷积核，在每一次池化操作后把通道数翻倍。
Darknet-19也借鉴了Network in Network的思想，使用了全局平均池化（global average pooling），还把1 * 1的卷积核置于3 * 3的卷积核之间，用来压缩特征。
同时，Darknet-19还用了batch normalization稳定模型训练，加速收敛并泛化模型。

Training for classification

作者使用Darknet-19在标准的ImageNet1000类分类数据集上训练了160个迭代，用的随机梯度下降算法，初始学习率为0.1，polynomial rate decay 为4，weight decay为0.0005 ，momentum 为0.9。训练时用了很多常见的数据扩充方法（data augmentation），包括random crops, rotations, and hue, saturation, and exposure shifts。
初始训练时网络的输入是224 * 224，160个迭代后输入的分辨率切换到448 * 448进行fine tune，fine tune时学习率调整为0.001，训练10个迭代。最终分类网络在ImageNet上top-1准确率76.5%，top-5准确率93.3%。

Training for detection

训练检测网络时去掉了分类网络的网络最后一个卷积层，在后面增加了三个卷积核尺寸为3 * 3，卷积核数量为1024的卷积层，并在这三个卷积层的最后一层后面跟一个卷积核尺寸为1 * 1的卷积层，卷积核数量是（B * （5 + C））。
对于VOC数据集，卷积层输入图像尺寸为416 * 416时最终输出是13 * 13个栅格，每个栅格预测5种boxes大小，每个box包含5个坐标值和20个条件类别概率，所以输出维度是13 * 13 * 5 * （5+20）= 13 * 13 * 125。

检测网络加入了passthrough layer，从最后一个输出为26 * 26 * 512的卷积层连接到新加入的三个卷积核尺寸为3 * 3的卷积层的第二层，使模型有了细粒度特征。
从yolo-voc.cfg文件可以看到，第25层为route层，逆向9层拿到第16层26 * 26 * 512的输出，并由第26层的reorg层把26 * 26 * 512 变形为13 * 13 * 2048，再有第27层的route层连接24层和26层的输出，堆叠为13 * 13 * 3072，由最后一个卷积核为3 * 3的卷积层进行跨通道的信息融合并把通道降维为1024。
如图所示：

作者训练检测网络时以0.001的初始学习率训练了160个迭代，在60次和90次迭代的时候，学习率减为原来的十分之一。weight decay为0.0005，momentum为0.9，使用了类似于Faster-RCNN和SSD的数据扩充（data augmentation）方法。

参考

https://zhuanlan.zhihu.com/p/25167153
http://blog.csdn.net/jesse_mx/article/details/53925356
https://arxiv.org/abs/1612.08242

目标检测-YOLOv3 wydxry 深度学习目标检测 YOLO 深度学习
YOLOv3介绍YOLOv3(YouOnlyLookOnce,Version3)是YOLO系列目标检测模型的第三个版本，相较于YOLOv2有了显著的改进和增强，尤其在检测速度和精度上表现优异。YOLOv3的设计目标是在保持高速的前提下提升检测的准确性和稳定性。下面是对YOLOv3改进和优势的介绍，以及YOLOv3核心部分的代码展示。相比YOLOv2的改进与优势多尺度特征金字塔YOLOv3引入了FP
目标检测-YOLOv2 wydxry 深度学习目标检测 YOLO 人工智能
YOLOv2介绍YOLOv2（YouOnlyLookOnceversion2）是一种用于目标检测的深度学习模型，由JosephRedmon等人于2016年提出，并详细论述在其论文《YOLO9000:Better,Faster,Stronger》中。YOLOv2在保持高速检测的同时，显著提升了检测的精度和泛化能力，成为实时目标检测领域的重要算法之一。核心原理YOLOv2的核心原理是将目标检测问题转化
目标检测 | yolov8 原理和介绍 hero_hilog 目标检测 AI YOLO 目标检测
相关系列：目标检测|yolov1原理和介绍目标检测|yolov2/yolo9000原理和介绍目标检测|yolov3原理和介绍目标检测|yolov4原理和介绍目标检测|yolov5原理和介绍目标检测|yolov6原理和介绍目标检测|yolov7原理和介绍目标检测|yolov8原理和介绍目标检测|yolov9原理和介绍目标检测|yolov10原理和介绍IEEE链接:https://ieeexplore
深度学习||YOLO（You Only Look Once）深度学习的实时目标检测算法（YOLOv1~YOLOv5）小嘤嘤怪学深度学习算法目标检测
目录YOLOv1:YOLOv2:YOLOv3:YOLOv4:YOLOv5:总结：YOLO（YouOnlyLookOnce）是一系列基于深度学习的实时目标检测算法。自从2015年首次被提出以来，YOLO系列不断发展，推出了多个版本，包括YOLOv1,YOLOv2,YOLOv3,YOLOv4,和YOLOv5等。下面是对YOLO系列的详解：YOLOv1:提出时间:2015年。主要贡献:将目标检测任务转换
挑战杯 YOLOv7 目标检测网络解读 laafeer python
文章目录0前言1yolov7的整体结构2关键点-backbone关键点-head3训练4使用效果5最后0前言世界变化太快，YOLOv6还没用熟YOLOv7就来了，如果有同学的毕设项目想用上最新的技术，不妨看看学长的这篇文章，学长带大家简单的解读yolov7，目的是对yolov7有个基础的理解。从2015年的YOLOV1，2016年YOLOV2，2018年的YOLOV3，到2020年的YOLOV4、
ConvE——二维卷积知识图谱横空出世时光诺言机器学习—图神经网络知识图谱人工智能 python 卷积神经网络
《Convolutional2DKnowledgeGraphEmbeddings》论文理解+代码复现本论文理解不再翻译原文，只写上我对于论文原生态的理解，应该会比较详细，请读者放心。一.作者为什么要提出ConvE？传统的R-GCN和DistMult的参数量过大，并且模型深度不够深，只能处理较小的知识图谱，所以作者将CNN引入到图神经网络中。二.一维卷积与二维卷积的对比2.1一维卷积当a,b特征简单
YOLO系列详解（YOLOV1-YOLOV3） X.AI666 深度学习 yolo
YOLO算法简介本文主要介绍YOLO算法，包括YOLOv1、YOLOv2/YOLO9000和YOLOv3。YOLO算法作为one-stage目标检测算法最典型的代表，其基于深度神经网络进行对象的识别和定位，运行速度很快，可以用于实时系统。了解YOLO是对目标检测算法研究的一个必须步骤。目标检测思路目标检测属于计算机视觉的一个中层任务，该任务可以细化为目标定位与目标识别两个任务，简单来说，找到图片中
时序动作定位｜使用 ‘注意力机制’ 的弱监督时序动作定位顶会论文理解笔记（Weakly-Supervised Temporal Action Localization）六个核桃Lu 视频动作定位深度学习人工智能神经网络机器学习计算机视觉
目录WeaklySupervisedActionLocalizationbySparseTemporalPoolingNetwork（CVPR2018）W-TALC:Weakly-supervisedTemporalActivityLocalizationandClassification（ECCV2018）
基于yolov2深度学习网络的视频手部检测算法matlab仿真简简单单做算法 MATLAB算法开发 #深度学习 YOLO 手部检测手掌识别 matlab 深度学习 yolov2
目录1.算法运行效果图预览2.算法运行软件版本3.部分核心程序4.算法理论概述5.算法完整程序工程1.算法运行效果图预览输入mp4格式的视频文件进行测试，视频格式为[email protected].算法运行软件版本matlab2022a3.部分核心程序...................................................figure;fori=1:numFramesToRead
经典目标检测YOLO系列(三)YOLOv3算法详解 undo_try #深度学习目标检测 YOLO python
经典目标检测YOLO系列(三)YOLOv3算法详解不论是YOLOv1，还是YOLOv2，都有一个共同的致命缺陷：小目标检测的性能差。尽管YOLOv2使用了passthrough技术将16倍降采样的特征图（即C4特征图）融合到了C5特征图中，但最终的检测仍是在C5尺度的特征图上进行的。为了解决这一问题，YOLO作者做了第3次改进，主要改进如下：使用了更好的主干网络DarkNet-53使用了多级检测与
经典目标检测YOLO系列(三)YOLOv3的复现(2)正样本的匹配、损失函数的实现 undo_try #深度学习目标检测 YOLO
经典目标检测YOLO系列(三)YOLOv3的复现(2)正样本的匹配、损失函数的实现我们在之前实现YOLOv2的基础上，加入了多级检测及FPN，快速的实现了YOLOv3的网络架构，并且实现了前向推理过程。经典目标检测YOLO系列(三)YOLOV3的复现(1)总体网络架构及前向处理过程我们继续进行YOLOv3的复现。1正样本匹配策略1.1基于先验框的正样本匹配策略官方YOLOv2的正样本匹配思路是根据
经典目标检测YOLO系列(三)YOLOV3的复现(1)总体网络架构及前向处理过程 undo_try #深度学习目标检测 YOLO 人工智能
经典目标检测YOLO系列(三)YOLOV3的复现(1)总体网络架构及前向处理过程和之前实现的YOLOv2一样，根据《YOLO目标检测》(ISBN:9787115627094)一书，在不脱离YOLOv3的大部分核心理念的前提下，重构一款较新的YOLOv3检测器，来对YOLOv3有更加深刻的认识。书中源码连接:RT-ODLab:YOLOTutorial1、YOLOv3网络架构1.1DarkNet53主
YOLO系列：YOLO v1-v8、YOLOx、PP-YOLOE、DAMO-YOLO、YOLOX-PAI 设计思路 Debroon 医学视觉 #深度学习 YOLO
从YOLOv1-v8YOLO综述改进点改进方向YOLOv1YOLO流程网格（grid）、锚点（anchors）、锚框（anchorboxes）交并比为什么把图像分割成n*n的格子呢？边界框的作用？为什么需要俩个边界框？那如果一个格子有俩个以上的对象呢？主干网络损失函数解析为什么不是一个损失函数？怎么判断是否有物体以及预测准确性？非极大值抑制去除重复预测结果YOLOv1的优化思路YOLOv2更轻量化
基于yolov2深度学习网络的车辆检测算法matlab仿真,包括白天场景和夜晚场景简简单单做算法 MATLAB算法开发 #深度学习 YOLO yolov2 深度学习网络车辆检测 matlab 深度学习
目录1.算法运行效果图预览2.算法运行软件版本3.部分核心程序4.算法理论概述4.1YOLOv2算法原理4.2车辆检测原理4.3白天场景和夜晚场景的车辆检测5.算法完整程序工程1.算法运行效果图预览2.算法运行软件版本MATLAB2022a3.部分核心程序loadyolov2.mat%加载训练好的目标检测器img_size=[224,224];imgPath='test/';%图像库路径imgDi
经典目标检测YOLO系列(二)YOLOV2的复现(2)正样本的匹配、损失函数的实现及模型训练 undo_try #深度学习目标检测 python YOLO
经典目标检测YOLO系列(二)YOLOV2的复现(2)正样本的匹配、损失函数的实现及模型训练我们在之前实现YOLOv1的基础上，加入了先验框机制，快速的实现了YOLOv2的网络架构，并且实现了前向推理过程。经典目标检测YOLO系列(二)YOLOV2的复现(1)总体网络架构及前向推理过程如前所述，我们使用基于先验框的正样本匹配策略。1正样本匹配策略1.1基于先验框的正样本匹配策略由于每个网格只输出一
YOLOV2网络剪枝立夏陆之昂学习小记录 yolo
对神经网络进行剪枝这个想法并不新奇，可追溯至1900年（YanLecun的工作-http://yann.lecun.com/exdb/publis/pdf/lecun-90b.pdf）。其基本的思想是：神经网络的参数众多，但其中有些参数对最终的输出结果贡献不大而显得冗余，剪枝顾名思义，就是要将这些冗余的参数剪掉。首先，需要根据对最终输出结果的贡献大小来对模型的神经元们排序，然后，舍去那些贡献度低的
Darknet_yolov2综述入门整理立夏陆之昂学习小记录
接着上次的神经网络，这次整理一下Darknet，yolov2首先得先了解Darknet,是深度学习框架，总的来说深度学习框架提供了一些列的深度学习的组件（对于通用的算法，里面会有实现），当需要使用新的算法的时候就需要用户自己去定义，然后调用深度学习框架的函数接口使用用户自定义的新算法.这篇讲述了深度学习框架的定义：https://blog.csdn.net/yeler082/article/det
yolov1到yolov2的改进立夏陆之昂 yolo 学习小记录
大部分人学习YOLO应该是从V3开始的，我很奇葩，从V2开始的，但是V2论文中有很多点一笔带过，前前后后断断续续看了几篇博客介绍V2和V1，想着做一个阶段性总结，自己写一篇，也有助于自己加深理解。大部分参考https://blog.csdn.net/shentanyue/article/details/84860600#t0这篇总结的很全面目前的目标检测算法分为两类：One-stage和Two-s
yolo9000：Better, Faster, Stronger的目标检测网络慕溪同学 YOLO 目标检测目标检测人工智能 YOLO 深度学习 yolo
目录一、回顾yolov1二、yolov2详细讲解2.1Better部分创新点（1）BatchNormalization(批量归一化)（2）HighResolutionClassifier---高分辨率分类器（3）AnchorBoxes---锚框（4）DimensionClusters---数据集标准框的长宽进行聚类（5）Directlocationprediction---位置预测（6）Fine-
经典目标检测YOLO系列(二)YOLOV2的复现(1)总体网络架构及前向推理过程 undo_try #深度学习目标检测 YOLO 人工智能
经典目标检测YOLO系列(二)YOLOV2的复现(1)总体网络架构及前向推理过程和之前实现的YOLOv1一样，根据《YOLO目标检测》(ISBN:9787115627094)一书，在不脱离YOLOv2的大部分核心理念的前提下，重构一款较新的YOLOv2检测器，来对YOLOV2有更加深刻的认识。书中源码连接:RT-ODLab:YOLOTutorial对比原始YOLOV2网络，主要改进点如下：添加了后
YOLOv2相比YOLOv1有哪些进步及改变？ AAI机器之心 YOLO 人工智能深度学习 pytorch web安全 AI
YOLOv2相对v1版本，在继续保持处理速度的基础上，从预测更准确（Better），速度更快（Faster），识别对象更多（Stronger）这三个方面进行了改进。其中识别更多对象也就是扩展到能够检测9000种不同对象，称之为YOLO9000。下面我们看下yoloV2的都做了哪些改进？2.1预测更准确（better）2.1.1batchnormalization批标准化有助于解决反向传播过程中的梯
经典目标检测YOLO系列(二)YOLOv2算法详解 undo_try #深度学习目标检测 YOLO 算法
经典目标检测YOLO系列(二)YOLOv2算法详解YOLO-V1以完全端到端的模式实现达到实时水平的目标检测。但是，YOLO-V1为追求速度而牺牲了部分检测精度，在检测速度广受赞誉的同时，其检测精度也饱受诟病。正是由于这个原因，YOLO团队在2016年提出了YOLO的第一个改进版本—YOLO-V2。该论文题目，直接指出了该模型的存在三大特点——更好（better）、更快（faster）、更强（st
基于yolov2深度学习网络的车辆行人检测算法matlab仿真简简单单做算法 MATLAB算法开发 #深度学习 YOLO 深度学习人工智能 yolov2 车辆行人检测
目录1.算法运行效果图预览2.算法运行软件版本3.部分核心程序4.算法理论概述5.算法完整程序工程1.算法运行效果图预览2.算法运行软件版本MATLAB2022a3.部分核心程序..........................................................loadyolov2.mat%加载训练好的目标检测器img_size=[224,224];imgPath=
[论文阅读]YOLO9000：Better，Faster，Stronger 不是吧这都有重名 YOLO系列论文阅读目标跟踪人工智能
摘要我们引入了YOLO9000，一个可以检测超过9000种类别的先进的实时目标检测系统。首先我们提出了多种yolo检测方法的提升方式，既新颖又参考了之前的工作。改进后的模型，YOLOV2在标准检测任务例如PASCALVO和COCO上都取得了领先。使用一个新颖的多尺度的训练方法，同一个YOLOV2模型可以在不同尺寸下行，提供了一种速度和准确率之间的简单的平衡。在67fps下，yolov2在VOC20
目标检测-One Stage-YOLO v3 学海一叶目标检测目标检测 YOLO 人工智能计算机视觉算法
文章目录前言一、YOLOv3的网络结构和流程二、YOLOv3的创新点总结前言根据前文目标检测-OneStage-YOLOv2可以看出YOLOv2的速度和精度都有相当程度的提升，但是精度仍较低，YOLOv3基于一些先进的结构和思想对YOLOv2做了一些改进。提示：以下是本篇文章正文内容，下面内容和可供参考一、YOLOv3的网络结构和流程将影像输入卷积网络（DarkNet53）+FPN得到多尺度特征图
目标检测-One Stage-RetinaNet 学海一叶目标检测目标检测人工智能计算机视觉算法深度学习
文章目录前言一、RetinaNet的网络结构和流程二、RetinaNet的创新点BalancedCrossEntropyFocalLoss总结前言根据前文目标检测-OneStage-YOLOv2可以看出YOLOv2的速度和精度都有相当程度的提升，但是OneStage目标检测模型仍存在一个很大的问题：前景(positive)和背景(negatives)类别的不平衡ps：假设我们有一个医学图像分类任务
目标检测-Owo Stage-YOLOv2 学海一叶目标检测目标检测 YOLO 人工智能计算机视觉深度学习
文章目录前言一、YOLOv2的网络结构和流程二、YOLOv2的创新点预处理网络结构训练总结前言根据前文目标检测-OneStage-YOLOv1可以看出YOLOv1的主要缺点是：和Fast-CNN相比，速度快，但精度下降。（边框回归不加限制）YOLOv2提出了一些改进策略，如anchor-based等提示：以下是本篇文章正文内容，下面内容可供参考一、YOLOv2的网络结构和流程将影像输入卷积网络（D
基于yolov2深度学习网络的血细胞检测算法matlab仿真简简单单做算法 MATLAB算法开发 #深度学习 YOLO yolov2 深度学习网络血细胞检测 matlab
目录1.算法运行效果图预览2.算法运行软件版本3.部分核心程序4.算法理论概述4.1YOLOv2算法原理4.2YOLOv2网络结构4.3血细胞检测算法实现数据集准备数据预处理网络训练模型评估与优化5.算法完整程序工程1.算法运行效果图预览2.算法运行软件版本MATLAB2022a3.部分核心程序....................................................
论文理解—— Disentangle-based Continual Graph Representation Learning qq_26919935 网络表示学习图表示学习知识图谱持续学习
EMNLP2020Disentangle-basedContinualGraphRepresentationLearning链接：https://arxiv.org/abs/2010.02565研究背景：多关系数据表示真实世界中实体和实体之间的关系，其中的节点表示实体，边代表实体之间的关系，比如常见的知识图谱和信息网络等。利用图表示学习方法对多关系图建模一直是学术界和业界关注的热点。图表示学习目的
【Digest】YOLO系列：YOLOv1,YOLOv2,YOLOv3,YOLOv4,YOLOv5简介 gikod YOLO
1.前言论文下载：http://arxiv.org/abs/1506.02640代码下载：https://github.com/pjreddie/darknet核心思想：将整张图片作为网络的输入（类似于Faster-RCNN），直接在输出层对BBox的位置和类别进行回归。目标检测之YOLO算法：YOLOv1,YOLOv2,YOLOv3,TinyYOLO,YOLOv4,YOLOv5,YOLObile
Java 并发包之线程池和原子计数 lijingyao8206 Java计数 ThreadPool 并发包 java线程池
对于大数据量关联的业务处理逻辑，比较直接的想法就是用JDK提供的并发包去解决多线程情况下的业务数据处理。线程池可以提供很好的管理线程的方式，并且可以提高线程利用率，并发包中的原子计数在多线程的情况下可以让我们避免去写一些同步代码。这里就先把jdk并发包中的线程池处理器ThreadPoolExecutor 以原子计数类AomicInteger 和倒数计时锁C
java编程思想抽象类和接口百合不是茶 java 抽象类接口
接口c++对接口和内部类只有简介的支持,但在java中有队这些类的直接支持 1 ,抽象类 : 如果一个类包含一个或多个抽象方法,该类必须限定为抽象类(否者编译器报错) 抽象方法 : 在方法中仅有声明而没有方法体 package com.wj.Interface;
[房地产与大数据]房地产数据挖掘系统 comsci 数据挖掘
随着一个关键核心技术的突破,我们已经是独立自主的开发某些先进模块,但是要完全实现,还需要一定的时间... 所以,除了代码工作以外,我们还需要关心一下非技术领域的事件..比如说房地产 &nb
数组队列总结沐刃青蛟数组队列
数组队列是一种大小可以改变，类型没有定死的类似数组的工具。不过与数组相比，它更具有灵活性。因为它不但不用担心越界问题，而且因为泛型（类似c++中模板的东西）的存在而支持各种类型。以下是数组队列的功能实现代码： import List.Student; public class
Oracle存储过程无法编译的解决方法 IT独行者 oracle 存储过程　
今天同事修改Oracle存储过程又导致2个过程无法被编译，流程规范上的东西，Dave 这里不多说，看看怎么解决问题。 1. 查看无效对象 XEZF@xezf(qs-xezf-db1)> select object_name,object_type,status from all_objects where status='IN
重装系统之后oracle恢复文强chu oracle
前几天正在使用电脑，没有暂停oracle的各种服务。突然win8.1系统奔溃，无法修复，开机时系统提示正在搜集错误信息，然后再开机，再提示的无限循环中。无耐我拿出系统u盘准备重装系统，没想到竟然无法从u盘引导成功。晚上到外面早了一家修电脑店，让人家给装了个系统，并且那哥们在我没反应过来的时候，直接把我的c盘给格式化了并且清理了注册表，再装系统。然后的结果就是我的oracl
python学习二（一些基础语法）小桔子 pthon 基础语法
紧接着把！昨天没看继续看django 官方教程，学了下python的基本语法与c类语言还是有些小差别： 1.ptyhon的源文件以UTF-8编码格式 2. / 除结果浮点型 // 除结果整形 % 除取余数 * 乘 ** 乘方 eg 5**2 结果是5的2次方25 _&
svn 常用命令 aichenglong SVN 版本回退
1 svn回退版本 1)在window中选择log,根据想要回退的内容,选择revert this version或revert chanages from this version 两者的区别: revert this version:表示回退到当前版本(该版本后的版本全部作废) revert chanages from this versio
某小公司面试归来 alafqq 面试
先填单子，还要写笔试题，我以时间为急，拒绝了它。。时间宝贵。老拿这些对付毕业生的东东来吓唬我。。面试官很刁难，问了几个问题，记录下； 1，包的范围。。。public,private,protect. --悲剧了 2，hashcode方法和equals方法的区别。谁覆盖谁.结果，他说我说反了。 3，最恶心的一道题，抽象类继承抽象类吗？（察，一般它都是被继承的啊） 4，stru
动态数组的存储速度比较集合框架百合不是茶集合框架
集合框架：自定义数据结构(增删改查等) package 数组; /** * 创建动态数组 * @author 百合 * */ public class ArrayDemo{ //定义一个数组来存放数据 String[] src = new String[0]; /** * 增加元素加入容器 * @param s要加入容器
用JS实现一个JS对象，对象里有两个属性一个方法 bijian1013 js对象
<html> <head> </head> <body> 用js代码实现一个js对象，对象里有两个属性，一个方法 </body> <script> var obj={a:'1234567',b:'bbbbbbbbbb',c:function(x){
探索JUnit4扩展：使用Rule bijian1013 java 单元测试 JUnit Rule
在上一篇文章中，讨论了使用Runner扩展JUnit4的方式，即直接修改Test Runner的实现(BlockJUnit4ClassRunner)。但这种方法显然不便于灵活地添加或删除扩展功能。下面将使用JUnit4.7才开始引入的扩展方式——Rule来实现相同的扩展功能。 1. Rule &n
[Gson一]非泛型POJO对象的反序列化 bit1129 POJO
当要将JSON数据串反序列化自身为非泛型的POJO时，使用Gson.fromJson(String, Class)方法。自身为非泛型的POJO的包括两种： 1. POJO对象不包含任何泛型的字段 2. POJO对象包含泛型字段，例如泛型集合或者泛型类 Data类 a.不是泛型类， b.Data中的集合List和Map都是泛型的 c.Data中不包含其它的POJO
【Kakfa五】Kafka Producer和Consumer基本使用 bit1129 kafka
0.Kafka服务器的配置一个Broker，一个Topic Topic中只有一个Partition（） 1. Producer： package kafka.examples.producers; import kafka.producer.KeyedMessage; import kafka.javaapi.producer.Producer; impor
lsyncd实时同步搭建指南——取代rsync+inotify ronin47
1. 几大实时同步工具比较 1.1 inotify + rsync 最近一直在寻求生产服务服务器上的同步替代方案，原先使用的是 inotify + rsync，但随着文件数量的增大到100W+，目录下的文件列表就达20M，在网络状况不佳或者限速的情况下，变更的文件可能10来个才几M，却因此要发送的文件列表就达20M，严重减低的带宽的使用效率以及同步效率；更为要紧的是，加入inotify
java-9. 判断整数序列是不是二元查找树的后序遍历结果 bylijinnan java
public class IsBinTreePostTraverse{ static boolean isBSTPostOrder(int[] a){ if(a==null){ return false; } /*1.只有一个结点时，肯定是查找树 *2.只有两个结点时，肯定是查找树。例如{5,6}对应的BST是 6 {6,5}对应的BST是
MySQL的sum函数返回的类型 bylijinnan java spring sql mysql jdbc
今天项目切换数据库时，出错访问数据库的代码大概是这样： String sql = "select sum(number) as sumNumberOfOneDay from tableName"; List<Map> rows = getJdbcTemplate().queryForList(sql); for (Map row : rows
java设计模式之单例模式 chicony java设计模式
在阎宏博士的《JAVA与模式》一书中开头是这样描述单例模式的：　　作为对象的创建模式，单例模式确保某一个类只有一个实例，而且自行实例化并向整个系统提供这个实例。这个类称为单例类。单例模式的结构　　单例模式的特点：单例类只能有一个实例。单例类必须自己创建自己的唯一实例。单例类必须给所有其他对象提供这一实例。　　饿汉式单例类 publ
javascript取当月最后一天 ctrain JavaScript
 <script language=javascript> var current = new Date(); var year = current.getYear(); var month = current.getMonth(); showMonthLastDay(year, mont
linux tune2fs命令详解 daizj linux tune2fs 查看系统文件块信息
一.简介： tune2fs是调整和查看ext2/ext3文件系统的文件系统参数，Windows下面如果出现意外断电死机情况，下次开机一般都会出现系统自检。Linux系统下面也有文件系统自检，而且是可以通过tune2fs命令，自行定义自检周期及方式。二.用法： Usage: tune2fs [-c max_mounts_count] [-e errors_behavior] [-g grou
做有中国特色的程序员 dcj3sjt126com 程序员
从出版业说起网络作品排到靠前的，都不会太难看，一般人不爱看某部作品也是因为不喜欢这个类型，而此人也不会全不喜欢这些网络作品。究其原因，是因为网络作品都是让人先白看的，看的好了才出了头。而纸质作品就不一定了，排行榜靠前的，有好作品，也有垃圾。许多大牛都是写了博客，后来出了书。这些书也都不次，可能有人让为不好，是因为技术书不像小说，小说在读故事，技术书是在学知识或温习知识，有
Android：TextView属性大全 dcj3sjt126com textview
android:autoLink 设置是否当文本为URL链接/email/电话号码/map时，文本显示为可点击的链接。可选值(none/web/email/phone/map/all) android:autoText 如果设置，将自动执行输入值的拼写纠正。此处无效果，在显示输入法并输
tomcat虚拟目录安装及其配置 eksliang tomcat配置说明 tomca部署web应用 tomcat虚拟目录安装
转载请出自出处：http://eksliang.iteye.com/blog/2097184 1.-------------------------------------------tomcat 目录结构 config：存放tomcat的配置文件 temp ：存放tomcat跑起来后存放临时文件用的 work ：当第一次访问应用中的jsp
浅谈：APP有哪些常被黑客利用的安全漏洞 gg163 APP
首先，说到APP的安全漏洞，身为程序猿的大家应该不陌生；如果抛开安卓自身开源的问题的话，其主要产生的原因就是开发过程中疏忽或者代码不严谨引起的。但这些责任也不能怪在程序猿头上，有时会因为BOSS时间催得紧等很多可观原因。由国内移动应用安全检测团队爱内测（ineice.com）的CTO给我们浅谈关于Android 系统的开源设计以及生态环境。 1. 应用反编译漏洞：APK 包非常容易被反编译成可读
C#根据网址生成静态页面 hvt Web .net C#asp.net hovertree
HoverTree开源项目中HoverTreeWeb.HVTPanel的Index.aspx文件是后台管理的首页。包含生成留言板首页，以及显示用户名，退出等功能。根据网址生成页面的方法： bool CreateHtmlFile(string url, string path) { //http://keleyi.com/a/bjae/3d10wfax.htm stri
SVG 教程（一）天梯梦 svg
SVG 简介 SVG 是使用 XML 来描述二维图形和绘图程序的语言。学习之前应具备的基础知识：继续学习之前，你应该对以下内容有基本的了解： HTML XML 基础如果希望首先学习这些内容，请在本站的首页选择相应的教程。什么是SVG？ SVG 指可伸缩矢量图形 (Scalable Vector Graphics) SVG 用来定义用于网络的基于矢量
一个简单的java栈 luyulong java 数据结构栈
public class MyStack { private long[] arr; private int top; public MyStack() { arr = new long[10]; top = -1; } public MyStack(int maxsize) { arr = new long[maxsize]; top
基础数据结构和算法八：Binary search sunwinner Algorithm Binary search
Binary search needs an ordered array so that it can use array indexing to dramatically reduce the number of compares required for each search, using the classic and venerable binary search algori
12个C语言面试题，涉及指针、进程、运算、结构体、函数、内存，看看你能做出几个！刘星宇 c 面试
12个C语言面试题，涉及指针、进程、运算、结构体、函数、内存，看看你能做出几个！ 1.gets()函数问：请找出下面代码里的问题： #include<stdio.h> int main(void) { char buff[10]; memset(buff,0,sizeof(buff));
ITeye 7月技术图书有奖试读获奖名单公布 ITeye管理员活动 ITeye 试读
ITeye携手人民邮电出版社图灵教育共同举办的7月技术图书有奖试读活动已圆满结束，非常感谢广大用户对本次活动的关注与参与。 7月试读活动回顾： http://webmaster.iteye.com/blog/2092746 本次技术图书试读活动的优秀奖获奖名单及相应作品如下（优秀文章有很多，但名额有限，没获奖并不代表不优秀）：《Java性能优化权威指南》