Superpoint复现过程——踩坑实录分享

代码来自GitHub,搜索superpoint即可下载。
2022.5.10

环境配置

Anaconda虚拟环境下,下载相关包

python 3.6
tensorflow-gpu
1.14
numpy
scipy
opencv-python3.4.2.16
opencv-contrib-python
3.4.2.16
tqdm
pyyaml
flake8
jupyter
cudatoolkit ==10.0
cudnn ==7.6.5

自建settings文件夹,其中包含:DATA_PATH 和 EXPER_PATH。
2022.6.2
在第一步训练时,大家应该会遇到一个问题如下(没有请忽略):

 Executor failed to create kernel. Invalid argument: Default MaxPoolingOp only supports NHWC on device type CPU
[[{{node magicpoint/train_tower0/vgg/pool1/MaxPool}}]]

在GitHub上rpautrat大神是这样说的:由于您仅使用 CPU,因此操作 MaxPoolingOp 仅适用于最后具有通道尺寸的张量。data_format: 'channels_last'您可以通过在文件中添加参数来解决此问题configs/magic-point_shapes.yaml。
小弟试过了,没有用。我是这样解决的:

这似乎是tensorflow-gpu的问题,1.14版本绝对够用,但是当我在虚拟环境下运行:
python3
import tensorflow as tf
tf.test.is_gpu_available()

终端显示False,为此我重新安装了他,我不知道是什么原因,我先后使用pip install 和conda install分别安装了tf-gpu=1.14,结果显示true.然后打开程序运行:it is Ok!

 CUDA_VISIBLE_DEVICES=0 TMPDIR=/tmp/ python3 experiment.py train configs/magic-point_shapes.yaml magic-point_synth

Superpoint复现过程——踩坑实录分享_第1张图片
6.6
(奇怪!几天没动它,进行第二步利用第一步训练的权重对数据集进行自标注时,又报了找不到GPU的错误,又重新装了一遍!!!)
!!!错误频出,不过网上都能找到解决方法。
第二步,已经训练了22小时了!!!
Superpoint复现过程——踩坑实录分享_第2张图片

相关步骤请参考:link
这里只做相关补充或者填坑!

未完待续!

你可能感兴趣的:(深度学习,github,python,tensorflow)