恒源云(Gpushare)_JupyterLab/TensorBoard使用问题?技巧大放送4!

文章来源 | 恒源云社区

原文地址 | 【小技巧-工具篇】


1、JupyterLab/TensorBoard 如何使用?

可参考JupyterLab文档、TensorBoard文档。

2、JupyterLab打不开或者响应慢怎么办?

如果遇到JupyterLab页面响应特别缓慢或者打不开的情况,可登录实例后通过以下命令来重启JupyterLab

supervisorctl restart jupyterlab

不建议通过JupyterLab页面直接运行较消耗资源的程序,因为该程序很可能会导致JupyterLab无响应或者运行缓慢问题,可通过tmux工具放置在实例后台运行。

3、tensorboard打不开或者响应慢怎么办?

如果遇到tensorboard页面响应特别缓慢或者打不开的情况,可登录实例后通过以下命令来重启tensorboard

supervisorctl restart tensorboard

4、自定义镜像如何安装jupyterlab?

自定义镜像登录实例后,执行如下命令,即可完成安装jupyterlab,安装完成后,可通过控制台打开jupyterlab页面

curl -OL "https://download.gpushare.com/download/custom_install"
chmod u+x ./custom_install
./custom_install jupyterlab

5、自定义镜像如何安装tensorboard?

自定义镜像登录实例后,执行如下命令,即可完成安装tensorboard,安装完成后,可通过控制台打开tensorboard页面

curl -OL "https://download.gpushare.com/download/custom_install"
chmod u+x ./custom_install
./custom_install tensorboard

6、JupyterLab 要输入密码怎么办?

通过终端执行 jupyter server list 命令可以得到 JupyterLab 的登陆 Token。

如下可以从执行结果内获得 Token 为 3fq593blw4afqjtqgdp3ldk5。

root@I15b96311d0280127d:~# jupyter server list
Currently running servers:
http://0.0.0.0:8888/?token=3fq593blw4afqjtqgdp3ldk5 :: /

7、TensorFlow 训练报 ptxas fatal 错误

当在 RTX 3000 系列显卡上使用 TensorFlow 2.4 For CUDA 11.0 时,训练会出现下列警告。

W tensorflow/stream_executor/gpu/asm_compiler.cc:235] Your CUDA software stack is old. We fallback to the NVIDIA driver for some compilation. Update your CUDA version to get the best performance. The ptxas error was: ptxas fatal : Value 'sm_86' is not defined for option 'gpu-name'

原因是该版本的 PTX compiler 不支持 8.6 compute capability。此报错为警告,不影响正常训练。

该警告可以通过 os.environ[‘TF_CPP_MIN_LOG_LEVEL’] = “2” 关闭。

此问题虽然不影响训练但性能上会降低,推荐创建 TensorFlow 2.5 For CUDA 11.2 的镜像,不会存在此问题。

你可能感兴趣的:(深度学习pytorch终端)