记录一下我跑代码出现的问题

1、RuntimeError: CUDA error: device-side assert triggered CUDA kernel errors might be asynchronously 

解决方式没有注意模型中的分类数量不对应记录一下我跑代码出现的问题_第1张图片

2、RuntimeError: Unable to find a valid cuDNN algorithm to run convolution

        修改batch_size改小就可以了,占的内存太大了

3、AttributeError: 'NoneType' object has no attribute 'copy' 

看了很多都说是路径中有中文的缘故,可我仔细看看也没有觉得我的地址有问题,后面调试的时候发现图片地址根本没有给过去,显示None,但是换了一个地址好像就可以了很奇怪但有用。

4、RuntimeError: Error(s) in loading state_dict for,size mismatch for linear.weight: copying a param with shape torch.Size([1000, 1536]) from checkpoint

刚开始我就看的是

load_state_dict加上False就可以,可是我之前就加过了,说明不只是这个问题,后面我仔细看了一下原来是训练网络的模型中的classes和测试的没有对应上然后改了一下就可以跑通了。但其实就是训练权重不匹配的问题,可以检查一下下载的预训练模型中的全连接层是1000类别的,而自己需要的类别和1000不匹配才会出现错误。

你可能感兴趣的:(一些bug,python)