深度学习/分割模型/pytorch/各种坑集合

这几天跑TCSM这个模型,用的是自己的数据集,过于小白,这是我复现的第一篇的论文。。。研究了一周,差不多弄清楚结构就开始跑。然后就是长达一周bug之路。。。

第一个bug:

opt/conda/conda-bld/pytorch_1524580978845/work/aten/src/THCUNN/SpatialClassNLLCriterion.cu:99: void cunn_SpatialClassNLLCriterion_updateOutput_kernel(T *, T *, T *, long *, T *, int, int, int, int, int, long) [with T = float, AccumT = float]: block: [0,0,0], thread: [886,0,0] Assertion t >= 0 && t < n_classes failed.

借用一下网络上的bug,和我的bug一样,但是没有保存复制。看遍了各种教程,大神一直在说是你的num_class出了错,什么ignore_class,我发现我没有ignore_class,并且我还没找到输出的num_class。真的是过于小白,最后我发现,原来二分类分割,问题出在掩膜mask上,一般我们都会将mask输出为[0,255],但是要进行二分类分割,必须保证[0,num_class-1],所以这里,我应该将255的部分归一化为1.真的是太小白的错误。

第二个bug:

OpenCV(4.6.0) /io/opencv/modules/imgproc/src/resize.cpp:4052: error: (-215:Assertion failed) !ssize.empty() in function 'resize'

这个问题真的很简单,总体思想就是,找不到该文件,要么是路径出错,要么就是数据集短缺(我就是data和mask没有对应短缺),因为数据量太大,头昏眼花很容易出错,大家仔细一点就可以啦。

未完待续。。。

最后一句,我真的讨厌科研,但是在bug中进步,也算是成长的意义。

你可能感兴趣的:(python,pytorch,人工智能,神经网络,深度学习)