linux下模型训练常用操作指令

ubuntu下模型训练常用操作

  • 查看anaconda版本
  • 查看ubuntu版本
  • 查看显卡驱动版本号
  • 查看TensorFlow版本
  • 验证tensorflow-gpu是否安装成功
  • 查看python版本
  • 查看gpu运行情况
  • 查看cuda版本
      • 查看系统cuda安装版本
      • 查看自己的anaconda下cuda版本
  • 查看cudnn版本
      • 查看系统cudnn安装版本
      • 查看自己的anaconda下cudnn版本
  • 根据进程号PID查看是哪个用户UID下发的指令
  • 查看磁盘占用情况

查看anaconda版本

conda --version

查看ubuntu版本

cat /proc/version

查看显卡驱动版本号

cat /proc/driver/nvidia/version

查看TensorFlow版本

python
>>>print(tensorflow.__version__)

验证tensorflow-gpu是否安装成功

import tensorflow as tf
sess = tf.Session(config=tf.ConfigProto(log_device_placement=True))

查看python版本

python

查看gpu运行情况

静态查看:

nvidia-smi

动态查看:这样就每5秒刷新一次这个窗口,只要你窗口不关闭,它就一直运行

watch -n 5 nvidia-smi

查看cuda版本

查看系统cuda安装版本

方法一:查看文件

cat  /usr/local/cuda/version.txt

方法二:命令

nvcc --version

查看自己的anaconda下cuda版本

conda list

查看cudnn版本

查看系统cudnn安装版本

cat /usr/local/cuda/include/cudnn.h | grep CUDNN_MAJOR -A 2

查看自己的anaconda下cudnn版本

conda list

根据进程号PID查看是哪个用户UID下发的指令

因为实验室的服务器是多人使用的,有的时候gpu被占了,想看看谁在占用,可以先使用以下指令查看每个gpu上的PID

nvidia-smi

假设PID为14421,使用以下指令即可查看指令下发用户

ps -ef|grep 14421

查看磁盘占用情况

进入到root用户下,该指令执行时间比较久

sudo du -sh *

你可能感兴趣的:(linux下模型训练常用操作指令)