深度学习服务器常用命令

深度学习服务器常用命令

  • 一、GPU类命令
  • 二、CPU类命令

一、GPU类命令

查看显卡信息

nvidia-smi				(显示一次当前GPU占用情况)
nvidia-smi -l			(每秒刷新一次并显示)
watch -n 5 nvidia-smi 	(其中,5表示每隔6秒刷新一次终端的显示结果)

释放显存

ps -ef | grep python脚本名 | awk '{print $2}' | xargs kill -9

二、CPU类命令

1.free命令

free –m

用于检查有关系统RAM的使用情况(查看系统的可用和已用内存)

2.vmstat 指令

vmstat -s(参数)

用于查看系统的内存存储信息,是一个报告虚拟内存统计信息的小工具,vmstat 命令报告包括:进程、内存、分页、阻塞 IO、中断、磁盘、CPU。

3./proc/meminfo 指令(难用,不直观)

cat /proc/meminfo

用于从/proc文件系统中提取与内存相关的信息。这些文件包含有 系统和内核的内部信息。

你还可以使用命令 less /proc/meminfo 直接读取该文件。通过使用 less 命令,可以在长长的输出中向上和向下滚动,找到你需要的内容。

4.top 指令

top -o %MEM

用于打印系统中的CPU和内存使用情况。

top 最好的地方之一就是发现可能已经失控的服务的进程 ID 号(PID)。有了这些 PID,你可以对有问题的任务进行故障排除(或 kill)。

5.htop 指令(这个好用,直观)

htop

详细分析CPU和内存使用情况。
如果你终端没安装 htop,先通过指令来安装。
命令格式:sudo apt-get update
接着输入以下指令
命令格式:sudo apt install htop

你可能感兴趣的:(服务器,深度学习,linux)