基于yolov5的鸟类图像准确识别

项目要求

现有不同种类的鸟,每一类有5张图,要求是对每一幅图中的鸟进行准确定位,即用bounding box将图中的鸟框出来。演示如下:

基于yolov5的鸟类图像准确识别_第1张图片

实现步骤:

1、数据集的制作

使用Make Sense网站制作数据集,创建六类鸟的labels,并对图像进行标注,并将其导出为yolov所使用的文件形式
基于yolov5的鸟类图像准确识别_第2张图片基于yolov5的鸟类图像准确识别_第3张图片
基于yolov5的鸟类图像准确识别_第4张图片

2、下载yolov5官方代码,并下载yolov5s.pt,将其作为预训练使用的权重。

3、在目录下新建一个mydata文件夹,在该文件夹下面新建如下图的文件夹

基于yolov5的鸟类图像准确识别_第5张图片
其中image的train和val文件夹中存放训练和预测的图片,labels下面存放制作好的数据集和用来预测的数据集(val下面的文件是后面运行过程中生成的),test文件夹下存放用来测试的图片。

4、在文件中放入yolov5s.pt预训练权重。

放入预训练权重

5、将文件打包上传到colab上(本计算机算力不够,故采用colab进行训练)

6、修改colab配置,选择使用GPU进行训练

基于yolov5的鸟类图像准确识别_第6张图片

7、使用指令解压文件

!unzip -uq birds.zip

8、使用指令切换工作目录,并安装yolov5所需要的依赖库

%cd /content/birds/yolov5-master/
!pip install -r requirements.txt

9、将data目录下的VOC.yaml复制一份,并将其命名为birds.yaml,并修改以下代码为自己的文件路径

train: /content/birds/yolov5-master/mydata/images/train  # train images (relative to 'path')  30 images

val: /content/birds/yolov5-master/mydata/images/val

# Classes
nc: 6  # number of classes
names:  ["egrets family", "redshank", "avocet", "plover", "egret", "night heron"]   # class names

10、复制models文件下的yolov5s.yaml,并将其命名为yolov5s_birds.yaml,并修改该文件下nc:6

11、修改train.py中的代码,先设置100轮进行训练,并且修改batch-size大小为32,充分调用GPU,以及修改相关路径

parser = argparse.ArgumentParser()
    parser.add_argument('--weights', type=str, default='/content/birds/yolov5-master/weighs/yolov5s.pt', help='initial weights path')
    parser.add_argument('--cfg', type=str, default='/content/birds/yolov5-master/models/yolov5s_birds.yaml', help='model.yaml path')
    parser.add_argument('--data', type=str, default='/content/birds/yolov5-master/data/birds.yaml', help='dataset.yaml path')
    parser.add_argument('--hyp', type=str, default=ROOT / 'data/hyps/hyp.scratch-low.yaml', help='hyperparameters path')
    parser.add_argument('--epochs', type=int, default=100)
    parser.add_argument('--batch-size', type=int, default=32, help='total batch size for all GPUs, -1 for autobatch')

12、使用指令进行训练

!python train.py

基于yolov5的鸟类图像准确识别_第7张图片基于yolov5的鸟类图像准确识别_第8张图片
基于yolov5的鸟类图像准确识别_第9张图片

训练100轮后还行啦night heron的准确率不够,此时选择修改训练轮数为300,重新进行训练。
基于yolov5的鸟类图像准确识别_第10张图片
准确率得以提高。

13、启用tensorbord查看参数

tensorbord --logdir=runs/train

基于yolov5的鸟类图像准确识别_第11张图片

14、可以在本地进行测试,也可在colab进行测试,本次选择在本地进行测试,下载训练好的权重,放到本地的文件夹中。并修改detect.py中代码

parser = argparse.ArgumentParser()
    parser.add_argument('--weights', nargs='+', type=str, default='best.pt', help='model path(s)')
    parser.add_argument('--source', type=str, default='F:/birds/yolov5-master/mydata/test/', help='file/dir/URL/glob, 0 for webcam')

15、运行detect.py查看测试结果

基于yolov5的鸟类图像准确识别_第12张图片

测试结果

白鹭家族
基于yolov5的鸟类图像准确识别_第13张图片
红脚鹬
基于yolov5的鸟类图像准确识别_第14张图片

反嘴鹬
基于yolov5的鸟类图像准确识别_第15张图片
环颈珩
基于yolov5的鸟类图像准确识别_第16张图片
小白鹭
基于yolov5的鸟类图像准确识别_第17张图片
夜鹭基于yolov5的鸟类图像准确识别_第18张图片

实验结果总结

总结:此项目是数字图像处理课程期末大实验,在实现过程中博主选择了使用yolov5来做,希望各位大佬批评指正

你可能感兴趣的:(深度学习,python,计算机视觉)