AlexeyAB DarkNet YOLOv3框架解析与应用实践(一)

AlexeyAB DarkNet YOLOv3框架解析与应用实践(一)

Darknet: C语言中的开源神经网络

Darknet是一个用C和CUDA编写的开源神经网络框架。它速度快,易于安装,支持CPU和GPU计算。您可以在GitHub上找到源代码,也可以在这里阅读更多关于Darknet可以做什么的信息:

  1. Installing Darknet

Darknet易于安装,只有两个可选依赖项:

OpenCV,如果你想要更广泛的支持图像类型。

如果你想计算GPU的话,安装CUDA。

两者都是可选的,所以让我们从安装基本系统开始。我只在Linux和Mac电脑上测试过。

Installing
The Base System

首先在这里获取Darknet git存储库。这可以通过以下方式实现:

git clone
https://github.com/pjreddie/darknet.git

cd darknet

make

如果这有效,你会看到一大堆编译信息飞驰而过:

mkdir -p obj

gcc -I/usr/local/cuda/include/ -Wall -Wfatal-errors -Ofast…

gcc -I/usr/local/cuda/include/ -Wall -Wfatal-errors -Ofast…

gcc -I/usr/local/cuda/include/ -Wall -Wfatal-errors -Ofast…

gcc
-I/usr/local/cuda/include/ -Wall
-Wfatal-errors -Ofast -lm…

如果你有任何错误,试着去修正它们?如果一切看起来都编译正确,请尝试运行它!

./darknet

你应该得到输出:

usage: ./darknet

使用CUDA编译

CPU上的Darknet速度很快,但是GPU上的速度快了500倍!你必须有一个Nvidia的GPU,你必须安装CUDA。我不会详细介绍CUDA的安装,因为它很可怕。

安装CUDA后,将基本目录中Makefile的第一行更改为:

GPU=1

现在你可以做这个项目,CUDA将被启用。默认情况下,它将在系统的第0个图形卡上运行网络(如果正确安装了CUDA,则可以使用nvidia smi列出图形卡)。如果要更改Darknet使用的卡,可以给它一个可选的命令行标志-i,例如:

./darknet -i 1 imagenet test cfg/alexnet.cfg
alexnet.weights

如果您使用CUDA编译,但出于任何原因希望进行CPU计算,则可以使用-nogpu来代替CPU:

./darknet -nogpu imagenet test
cfg/alexnet.cfg alexnet.weights

用OpenCV编译

默认情况下,Darknet使用stb_image.h加载图像。如果你想更多的支持奇怪的格式(像CMYK jpeg),你可以使用OpenCV代替!OpenCV还允许您查看图像和检测,而无需将它们保存到磁盘。

首先安装OpenCV。如果从源代码处执行此操作,则会很长且很复杂,因此请尝试让包管理器为您执行此操作。

接下来,将Makefile的第2行更改为:

OPENCV=1

完成了!尝试一下,首先重新做一个项目。然后使用imtest例程测试图像加载和显示:

./darknet imtest data/eagle.jpg

  1. YOLO:实时目标检测

你只看一次(YOLO)是一个最先进的实时物体检测系统。在Pascal Titan X上,它以每秒30帧的速度处理图像,在COCO test-dev上有57.9%的mAP。

与其他检测模型的比较

YOLOv3非常快速和准确。在0.5 IOU处测得的mAP中,YOLOv3与焦距损失相当,但速度快了约4倍。此外,可以轻松地权衡速度和准确性之间的简单改变模型的大小,无需再训练!
AlexeyAB DarkNet YOLOv3框架解析与应用实践(一)_第1张图片
AlexeyAB DarkNet YOLOv3框架解析与应用实践(一)_第2张图片

工作原理

先前的检测系统重新利用分类器或定位器来执行检测。他们将模型应用于多个位置和比例的图像。图像的高分区域被认为是检测。

使用完全不同的方法。将单一的神经网络应用于完整的图像。该网络将图像分为多个区域,并预测每个区域的包围盒和概率。这些边界框由预测的概率加权。

与基于分类器的系统相比,我们的模型有几个优点。它在测试时查看整个图像,因此它的预测由图像中的全局上下文通知。它也用单一的网络评估来预测,不像R-CNN这样的系统需要数千张单一的图像。这使得它非常快,比R-CNN快1000倍,比R-CNN快100倍。有关完整系统的详细信息,请参阅我们的论文。

你可能感兴趣的:(目标检测,深度学习,计算机视觉)