一、口罩数据采集
我们需要利用labelimg软件标记图片中的口罩。
1.新建一个文件夹,在这个文件夹中再新建两个文件夹分别是images和labels。
2.在这两个文件夹中都再新建两个文件夹,分别是train和val,这两个数据量比大约为3:1。
3.把需要标记的图片放在images-train这个文件夹中里。
4.打开labelimg,如下图。
5.先点Open Dir打开你要标记的图片所在的文件夹。
6.再点Change Save Dir选择标完的数据放在那。
7.在标图之前,要注意把PascalVOC改成YOLO。
8.点击Create开始标图,标完点Save保存,如下图。
二、利用Kaggle用Yolov5算法进行口罩模型数据的训练
1.下载yolov5源码
2.修改源码采用kaggele训练模型一定要修改文件的保存路径
3.在data文件夹中增加mask.yaml
# MY dataset - first 600 training images
# Train command: python train.py --data my_dataset.yaml
# Default dataset location is next to /yolov5:
# /parent_folder
# /my_dataset
# /yolov5
# train and val data as 1) directory: path/images/, 2) file: path/images.txt, or 3) list: [path1/images/, path2/images/]
train: maskdata/images/train/ # 600 images #口罩训练集的路径
val: maskdata/images/val/ # 600 images #口罩验证集的路径
# number of classes
nc: 1
# class names
names: [ 'mask' ] #类别的命名
4.修改train.py中的源码
.......
def parse_opt(known=False):
parser = argparse.ArgumentParser()
parser.add_argument('--weights', type=str, default=ROOT / 'yolov5s.pt', help='initial weights path')
parser.add_argument('--cfg', type=str, default='', help='model.yaml path')
parser.add_argument('--data', type=str, default=ROOT / 'data/mask.yaml', help='dataset.yaml path')
parser.add_argument('--hyp', type=str, default=ROOT / 'data/hyps/hyp.scratch-low.yaml', help='hyperparameters path')
parser.add_argument('--epochs', type=int, default=100, help='total training epochs')
parser.add_argument('--batch-size', type=int, default=16, help='total batch size for all GPUs, -1 for autobatch')
parser.add_argument('--imgsz', '--img', '--img-size', type=int, default=640, help='train, val image size (pixels)')
parser.add_argument('--rect', action='store_true', help='rectangular training')
parser.add_argument('--resume', nargs='?', const=True, default=False, help='resume most recent training')
parser.add_argument('--nosave', action='store_true', help='only save final checkpoint')
parser.add_argument('--noval', action='store_true', help='only validate final epoch')
parser.add_argument('--noautoanchor', action='store_true', help='disable AutoAnchor')
parser.add_argument('--noplots', action='store_true', help='save no plot files')
parser.add_argument('--evolve', type=int, nargs='?', const=300, help='evolve hyperparameters for x generations')
parser.add_argument('--bucket', type=str, default='', help='gsutil bucket')
parser.add_argument('--cache', type=str, nargs='?', const='ram', help='image --cache ram/disk')
parser.add_argument('--image-weights', action='store_true', help='use weighted image selection for training')
parser.add_argument('--device', default='', help='cuda device, i.e. 0 or 0,1,2,3 or cpu')
parser.add_argument('--multi-scale', action='store_true', help='vary img-size +/- 50%%')
parser.add_argument('--single-cls', action='store_true', help='train multi-class data as single-class')
parser.add_argument('--optimizer', type=str, choices=['SGD', 'Adam', 'AdamW'], default='SGD', help='optimizer')
parser.add_argument('--sync-bn', action='store_true', help='use SyncBatchNorm, only available in DDP mode')
parser.add_argument('--workers', type=int, default=8, help='max dataloader workers (per RANK in DDP mode)')
parser.add_argument('--project', default='/kaggle/working/runs/train', help='save to project/name')
parser.add_argument('--name', default='exp', help='save to project/name')
parser.add_argument('--exist-ok', action='store_true', help='existing project/name ok, do not increment')
parser.add_argument('--quad', action='store_true', help='quad dataloader')
parser.add_argument('--cos-lr', action='store_true', help='cosine LR scheduler')
parser.add_argument('--label-smoothing', type=float, default=0.0, help='Label smoothing epsilon')
parser.add_argument('--patience', type=int, default=100, help='EarlyStopping patience (epochs without improvement)')
parser.add_argument('--freeze', nargs='+', type=int, default=[0], help='Freeze layers: backbone=10, first3=0 1 2')
parser.add_argument('--save-period', type=int, default=-1, help='Save checkpoint every x epochs (disabled if < 1)')
parser.add_argument('--seed', type=int, default=0, help='Global training seed')
parser.add_argument('--local_rank', type=int, default=-1, help='Automatic DDP Multi-GPU argument, do not modify')
# Logger arguments
parser.add_argument('--entity', default=None, help='Entity')
parser.add_argument('--upload_dataset', nargs='?', const=True, default=False, help='Upload data, "val" option')
parser.add_argument('--bbox_interval', type=int, default=-1, help='Set bounding-box image logging interval')
parser.add_argument('--artifact_alias', type=str, default='latest', help='Version of dataset artifact to use')
return parser.parse_known_args()[0] if known else parser.parse_args()
......
5.点New Dataset,把源码本地打包成.zip格式上传到Kaggle的Data上
6.选择New notebook
7.在代码框中输入如下命令并运行
pip install -r /kaggle/input/m-a-s-k/yolov5-master (4)/yolov5-master/requirements.txt
8.运行train.py
!python /kaggle/input/m-a-s-k/yolov5-master (4)/yolov5-master/train.py
9.下载run中训练好的模型,点击Output下面的文件夹找到best.pt下载
10.测试训练好的模型,运行如下图