使用yolov5-5.0遇到的问题和总结

https://github.com/ultralytics/yolov5/issues

github上的模型的使用

使用
    看README.md以及参数后面的help说明
    根据自身的需求对 程序的中参数进行设置
          parser.add_argument('--img-size', type=int, default=640, help='inference size (pixels)')

关于parser.add_argument()的required==True
    就是在我们使用参数时需要手动设置初始值
    使用 default 替代 required=True
        parser.add_argument('--img-size', type=int, required=True, help='inference size (pixels)')
        parser.add_argument('--img-size', type=int, default=640, help='inference size (pixels)')
    
 

关于add_argument方法的使用

https://blog.csdn.net/lly_zy/article/details/97130496

使用
    创建 ArgumentParser() 对象
    调用 add_argument() 方法添加参数
    使用 parse_args() 解析添加的参数
方法和参数
    ArgumentParser.add_argument(name or flags...[, action][, nargs]
        [, const][, default][, type][, choices]
        [, required][, help][, metavar][, dest])

        name or flags - 选项字符串的名字或者列表,例如 foo 或者 -f, --foo。
        action - 命令行遇到参数时的动作,默认值是 store。
            例子
                parser.add_argument('--view-img', action='store_true', help='display results')
                指定参数--view-img, 就执行动作store_true
            store_const,表示赋值为const;
            append,将遇到的值存储成列表,也就是如果参数重复则会保存多个值;
            append_const,将参数规范中定义的一个值保存到一个列表;
            count,存储遇到的次数;此外,也可以继承 argparse.Action 自定义参数解析;
        nargs 
            - 应该读取的命令行参数个数,可以是具体的数字,或者是?号,
            当不指定值时对于 Positional argument 使用 default,
            对于 Optional argument 使用 const;或者是 * 号,
            表示 0 或多个参数;或者是 + 号表示 1 或多个参数。
        const - action 和 nargs 所需要的常量值。
        default - 不指定参数时的默认值。
        type - 命令行参数应该被转换成的类型。
        choices - 参数可允许的值的一个容器。
        required - 可选参数是否可以省略 (仅针对可选参数)。
        help - 参数的帮助信息,当指定为 argparse.SUPPRESS 时表示不显示该参数的帮助信息.
        metavar - 在 usage 说明中的参数名称,对于必选参数默认就是参数名称,对于可选参数默认是全大写的参数名称.
        dest - 解析后的参数名称,默认情况下,对于可选参数选取最长的名称,中划线转换为下划线.

使用
    parser = argparse.ArgumentParser()
    parser.add_argument('--weights', nargs='+', type=str, default='yolov5s.pt', help='model.pt path(s)') #  训练好的模型的权重
    opt = parser.parse_args()

注意
    参数
        --agnostic-nms
    解析后
        agnostic_nms

github上的模型的训练

将可用线程设置为0 只有一个主线程,如果不设置可能出现难以预料的问题
    parser.add_argument('--workers', type=int, default=0, help='maximum number of dataloader workers')
生成文件
    weights
        最好的网络模型参数 或是保存的网络模型
        最近一次网络模型参数
    events.out.tfevents.1651655164.DESKTOP-9M1JE2F.6664.0
    hyp.yaml 超参数
    opt.yaml 训练中参数的设置

模型参数
    parser.add_argument('--weights', type=str, default='yolov5s.pt', help='initial weights path') 
        # 使用训练好的模型的路径yolov5s.pt,初始化模型的权重矩阵,
        # 从头开始将default设置为'' ,使用程序简单的初始化模型的权重矩阵,
    parser.add_argument('--cfg', type=str, default='', help='model.yaml path')
        # 模型参数的设置,设置模型的结构
    parser.add_argument('--data', type=str, default='data/coco128.yaml', help='data.yaml path')
        # 使用的数据集
    parser.add_argument('--hyp', type=str, default='data/hyp.scratch.yaml', help='hyperparameters path')
        # 超参数的设置
    parser.add_argument('--epochs', type=int, default=300)
        # 训练的轮数
    parser.add_argument('--batch-size', type=int, default=16, help='total batch size for all GPUs')
        # dataloader的batch-size
    parser.add_argument('--img-size', nargs='+', type=int, default=[640, 640], help='[train, test] image sizes')
        # 设置训练集和测试集的大小 推理大小(像素) 缩放 640*640,640*640
    parser.add_argument('--rect', action='store_true', help='rectangular training')
        #  对图片进行最小的 填充满足模型的需求 使之可用被32整除, 32是需要下采样5次
    parser.add_argument('--resume', nargs='?', const=True, default=False, help='resume most recent training')
        # 从最近的模型上开始训练,指定模型的位置 如default = "runs\train\exp3\weights\best.pt"  迁移学习 
        # 将延续模型训练的轮数
    parser.add_argument('--nosave', action='store_true', help='only save final   checkpoint')
        # 仅保存最后一次训练的模型
    parser.add_argument('--notest', action='store_true', help='only test final epoch')
        # 是否只在最后一个epoch训练
     parser.add_argument('--noautoanchor', action='store_true', help='disable autoanchor check')
        # 取消锚点 https://blog.csdn.net/qq_46110834/article/details/111410923
    parser.add_argument('--evolve', action='store_true', help='evolve hyperparameters')
        # 优化 超参数 
    parser.add_argument('--bucket', type=str, default='', help='gsutil bucket')
        # 从谷歌云盘下载
    parser.add_argument('--cache-images', action='store_true', help='cache images for faster training')
        # 缓存 图片
    parser.add_argument('--image-weights', action='store_true', help='use weighted image selection for training')
        # 对训练不好的图片保存起来,使用加权图像选择进行训练
    parser.add_argument('--device', default='', help='cuda device, i.e. 0 or 0,1,2,3 or cpu')
        # 选择训练的设备 
    parser.add_argument('--multi-scale', action='store_true', help='vary img-size +/- 50%%')
        # 对图片尺寸进行变化
    parser.add_argument('--single-cls', action='store_true', help='train multi-class data as single-class')
        # 判断训练的数据集是单类别 或 是多类别   
    parser.add_argument('--adam', action='store_true', help='use torch.optim.Adam() optimizer')
        # 选择优化器
    parser.add_argument('--sync-bn', action='store_true', help='use SyncBatchNorm, only available in DDP mode')
        # 多GPU的训练 分布式训练
    parser.add_argument('--local_rank', type=int, default=-1, help='DDP parameter, do not modify')
    parser.add_argument('--workers', type=int, default=0, help='maximum number of dataloader workers')
        # dataloader使用的线程
    parser.add_argument('--project', default='runs/train', help='save to project/name')
        # 保存路径
    parser.add_argument('--entity', default=None, help='W&B entity')
        # 'W&B entity'的库 weight 和 bias  是一个网站
    parser.add_argument('--name', default='exp', help='save to project/name')
        # 保存的文件名
    parser.add_argument('--exist-ok', action='store_true', help='existing project/name ok, do not increment')
        # 是否保存在同一个文件夹中
    parser.add_argument('--quad', action='store_true', help='quad dataloader')
        # dataloader 加载数据的方式
    parser.add_argument('--linear-lr', action='store_true', help='linear LR')
        # 设置学习率的模式
    parser.add_argument('--label-smoothing', type=float, default=0.0, help='Label smoothing epsilon')
        # 标签平滑 ,防止过拟合的情况产生 
    parser.add_argument('--upload_dataset', action='store_true', help='Upload dataset as W&B artifact table')
        # 上传数据集
    parser.add_argument('--bbox_interval', type=int, default=-1, help='Set bounding-box image logging interval for W&B')
    parser.add_argument('--save_period', type=int, default=-1, help='Log model after every "save_period" epoch')
        # 每次保存模型后输出 日志模型
    parser.add_argument('--artifact_alias', type=str, default="latest", help='version of dataset artifact to be used')
        # 尚未实现

训练过程
    采用--cfg设置的数据模型,采用coco128的数据集--data,采用yolov5s.pt初始化后的权重矩阵--weight,采用--hyp的超参数
    训练的轮数为--epoch, 每次处理dataloader中biach_size大小的数据,图片缩放的大小设置为--img_size

在云端训练模型

1 上传模型的压缩文件.zip 到colab
2 使用命令 对文件进行 解压
    !unzip /content/yolov5-5.0.zip -d /content/yolov5
3 删除多余的文件
    !rm -rf /content/yolov5/_MACOSX
4 去到指定的目录
    #cd /content/yolov5/yolov5-5.0
5 按照程序需要的组件
    !pip install -r /content/yolov5/requirements.txt
6 添加tensorboard插件
    %load_ext tensorboard
7 使用tensorboard
    %tensorboard --logdir=/content/yolov5/runs/train   
8 开始训练模型
    !python train.py --rect
9 开始训练更大模型
    !python train.py --rect --data=data/coco.yaml
10 使用训练好的模型 也就是模型权重
    best.pt
     parser.add_argument('--weights', type=str, default='best.pt',
                        help='initial weights path')

制作和训练数据集

数据集
    标注
        makesense
    下载已有的 
    仿真数据集

训练需求
    数据集
    设置parser.add_argument('--data', type=str, default='data/coco128.yaml', help='data.yaml path')

检测使用的数据集
    使用训练好的数据集

关于加载数据集卡顿
    让Pycharm不进行加载
        Mark Directory as excluded
    

Q&A

OSError: [WinError 1455] 页面文件太小,无法完成操作。

https://blog.csdn.net/weixin_43817670/article/details/116748349

###关于在Pycharm中,执行python程序设置参数

打开 Run/Debug Conigurations,在parameters框中设置参数 

AttributeError: ‘Upsample’ object has no attribute ‘recompute_scale_factor’

https://blog.csdn.net/SSS__jq/article/details/123458804

解决方法
    查看报错信息 File "F:\Anaconda3_L\envs\pytorch\lib\site-packages\torch\nn\modules\upsampling.py", line 154, in forward
    打开 "F:\Anaconda3_L\envs\pytorch\lib\site-packages\torch\nn\modules\upsampling.py"
    将
    return F.interpolate(input, self.size, self.scale_factor, self.mode, self.align_corners, # 之前的代码
                               recompute_scale_factor=self.recompute_scale_factor)
    改为
     return F.interpolate(input, self.size, self.scale_factor, self.mode, self.align_corners)

AttributeError: Can‘t get attribute ‘SPPF‘ on <module ‘models.common‘ from ‘model\common.py‘

https://blog.csdn.net/magicnnonn/article/details/124343085

在 model\\common.py添加
    import warnings
    
    class SPPF(nn.Module):
        # Spatial Pyramid Pooling - Fast (SPPF) layer for YOLOv5 by Glenn Jocher
        def __init__(self, c1, c2, k=5):
            super().__init__()
            c_ = c1 // 2  # hidden channels
            self.cv1 = Conv(c1, c_, 1, 1)
            self.cv2 = Conv(c_ * 4, c2, 1, 1)
            self.m = nn.MaxPool2d(kernel_size=k, stride=1, padding=k // 2)
     
        def forward(self, x):
            x = self.cv1(x)
            with warnings.catch_warnings():
                warnings.simplefilter('ignore')
                y1 = self.m(x)
                y2 = self.m(y1)
                return self.cv2(torch.cat([x, y1, y2, self.m(y2)], 1))

RuntimeError: The size of tensor a (80) must match the size of tensor b (56) at non-singleton dimension 3

原因
    看下载的版本
    Downloading https://github.com/ultralytics/yolov5/releases/download/v6.1/yolov5s.pt to yolov5s.pt...
    79%|███████▉  | 11.2M/14.1M [01:46<00:29, 103kB/s]
解决方法
    手动下载放到yolov5-5.0目录下面
    https://github.com/ultralytics/yolov5/releases/download/v5.0/yolov5s.pt

你可能感兴趣的:(pytorch,pytorch)