PointPillars复现问题小结

项目地址:https://github.com/traveller59/second.pytorch
由于pointpillar是在second的基础上改动的,所以直接用second项目,只不过在训练和测试时参数文件不一样。
1、
首先安装pytorch,使用anaconda新建一个环境,百度搜索pytorch,从官网选择cuda,直接有安装命令,即可安装pytorch。
pytorch支持cuda10.1,所以首先要安装cuda10.1
2、
然后按照项目安装依赖,这里要注意,
llvmlite要选择0.26.0版本,使用conda安装 conda install llvmlite==0.26.0
3、
安装spconv,注意安装高版本cmake,注意cmake安装方法在其readme中有,有三个指令,要分别运行,加sudo
add second.pytorch/ to PYTHONPATH 这一步指的是在bashrc文件中添加项目地址,可以百度
注意修改配置文件中的文件目录,
./ 表示当前文件夹
…/表示上一级文件夹

注意训练时,由于GPU显存不够,batchsize要调整为1,多进程可以调为8

网络还有一个小bug
/pytorch/aten/src/ATen/native/cuda/LegacyDefinitions.cpp:14: UserWarning: masked_fill_ received a mask with dtype torch.uint8, this behavior is now deprecated,please use a mask with dtype torch.bool instead.
要把progress_bar.py中的Unit.Byte 改为Unit.Bool
也有人说是
在second.pytorch\second\pytorch\models文件夹下的voxelnet.py的911行:
改为:
opp_labels = (box_preds[…, -1] > 0) ^ dir_labels.bool()
就可以正常训练了(本版本没有找到这个在哪)

The same problem. Fixed it by changing every
“mask = blahblahblah.byte()”
to
“mask = blahblahblah.bool()”

训练完后用tensorboard查看训练过程:
tensorboard --logdir=logs
logs为日志文件夹,具体本例为summary文件夹,注意需要安装tensorflow才能使用

要进行BBox可视化,还需要安装一些扩展
Ros-kinetic-jsk-gui-msgs
-hark-msgs
-interactive
-interactive-marker
-interactive-test
-recognition-msgs
-recognition-utils
-rqt-plugins
-rviz-plugins
-topic-tools
-visualization

注意:运行ros时说没有rospkg :

  1. $ conda install setuptools
  2. $ pip install -U rosdep rosinstall_generator wstool rosinstall six vcstools

来自 https://blog.csdn.net/qq_36501182/article/details/79971570

由于可视化用到了nuscenes,所以要安装nuscenes:
Pip install nuscenes-devkit

numpy版本不能大于1.18
Pip uninstall numpy
Pip install numpy==1.17
Num_worker数越多,占用内存越大,但是好像和时间没有关系
batchsize越大,每个step用时越多,某一step的训练量越大

RTX显卡可以使用apex
安装apex时出错,ninja有问题,把-v 改成 --version,还是有问题,在梯度削减的地方出错。。。放弃后面再试
https://blog.csdn.net/Orientliu96/article/details/104583998

KITTI 3D目标检测评估参数说明
https://blog.csdn.net/shuqiaos/article/details/82770370

你可能感兴趣的:(python,pytorch,深度学习,自动驾驶,神经网络)