linux环境新NVIDIA-GPU服务器进行压力测试

实验室新进购的服务器。

机型为:4卡GPU,GTX2080ti。

新的服务器需要对其进行压力测试,测试服务器在显存满载的情况下,能否保证散热正常、计算精度正常等等。

本次压力测试,用到的程序gpu_burn实现,搜索了很长时间的资料,记录下来。

参考资料:Linux 系統 NVIDIA GPU 顯示卡壓力測試


首先在gpu_burn官网下载代码

官网链接:点击进入gpu_burn官网

linux环境新NVIDIA-GPU服务器进行压力测试_第1张图片

这里我下载的是gpu_burn-0.9.tar.gz (compute profile 30, compatible w/ CUDA 9) 。

wget http://wili.cc/blog/entries/gpu-burn/gpu_burn-0.9.tar.gz

然后对文件进行解压(tar -zxvf   filename)

进入gpu_burn文件内:

cd gpu_burn

编译文件:

make

进行压力测试:

sh gpu_burn 

上边的是一个10秒的测试,如果要进行1小时的测试只需要在后面加秒数即可:

sh gpu_burn 3600

另外,如果要运行很长时间,需要放在后台运行,需要用到nohup命令:

nohup sh gpu_burn 3600

后台运行时,cmd输出的内容会存入到nohup.out文件内,文件过于庞大,这里我们只查看最后5行信息,即可看见运行的最后结果:

tail -n 5 filename

也可以观察显卡的占用情况:

watch nvidia-smi

 

你可能感兴趣的:(服务器安装,gpu_burn,压力测试)