记录:ssd算法复现时出现的一些问题

1、
undefined symbol:_ZN6caffe26detail36_typeMetaDataInstance_preallocated_7E
出现 undefineed symbol:xxxx问题种类很多,Uninstalling torch and torchvision and reinstalling them would help in this matter.这是代码原作者GitHub上的建议,在得到他回信之前,这么做确实解决了问题。
2、根据作者给出的示例python demo.py --config-file configs/vgg_ssd300_voc0712.yaml --images_dir demo --ckpt https://github.com/lufficc/SSD/releases/download/1.2/vgg_ssd300_voc0712.pth
预训练模型下载完后显示不完整,网上说可能是由于ftp传输损坏了模型文件。屡试未果后,网上从其他地方找到该模型,迅雷下载后上传到服务器,成功。
3、训练时指定01node的1号gpu提示段错误,切换至02node后运行成功,证明并不是代码内规定了gpu的型号,应该是01节点0号gpu出问题了
4、在project比较庞大,文件较多时,不知道如何修改配置以适应自己的数据集,可以从作者给出的训练示例代码入手,用到了哪个文件,顺着去里面找就行。

你可能感兴趣的:(记录:ssd算法复现时出现的一些问题)