Centos7 上为kaldi安装/卸载 nvidia显卡驱动和CUDA

比起sge集群的搭建配置,这个不算难,但还是有很多细节拖慢你的速度。已经重装超过三次了,还是整理清楚记下来方便以后再要重装吧!

1.安装和配置

https://blog.csdn.net/cwy_yeah/article/details/79334126 这个博客说可以用cuda*.run安装cuda时把显卡驱动也一并装了,我试了之后装了但最后不能正常使用,所以还是参考https://www.jianshu.com/p/75e7053bdd43?from=timeline&isappinstalled=0这篇博文先装显卡驱动,然后再装cuda。

一个关键点就是:nvidia显卡的类型决定可以安装哪些cuda的版本,而显卡驱动的版本又必须满足cuda版本的要求!

  • 先查看自己机子nvidia显卡的类型;
  • https://www.nvidia.cn/Download/index.aspx?lang=cn 在这个网页上查询可装的cuda版本和对应的驱动版本。(我的是cuda 9.0和 navida 384.145的驱动版本)   
  • 获取显卡驱动安装包NVIDIA-Linux-x86_64-384.145.run: wget https://www.nvidia.cn/Download/driverResults.aspx/135493/cn (是上一个连接里填好显卡类型和cuda版本信息后点击“搜索”出来的页面)  ( https://www.nvidia.cn/object/unix-cn.html 这个连接里有各个版本的驱动可下载)
  • 获取CUDA安装包cuda_9.0.176_384.81_linux-run : wget https://developer.nvidia.com/compute/cuda/9.0/Prod/local_installers/cuda_9.0.176_384.81_linux-run
  • https://docs.nvidia.com/cuda/cuda-toolkit-release-notes/index.html  这个连接可以查看cuda版本和显卡驱动版本的匹配要求,如果不匹配的话后面会不成功。

1.1 安装nvidia显卡驱动

  • https://www.jianshu.com/p/75e7053bdd43?from=timeline&isappinstalled=0 参考这篇文章里的“2.安装显卡驱动”
  • 检查驱动是否安装成功: cat /proc/driver/nvidia/version

1.2 安装CUDA

  1.2.1 禁用nouveau(不禁用的话无法成功安装)

cd /usr/lib/modprobe.d

vim dist-blacklist.conf

(添加:

blacklist nouveau

options nouveau modeset=0)

输入init3切换模式,在root下继续安装

  1.2.2 https://www.jianshu.com/p/75e7053bdd43?from=timeline&isappinstalled=0 参考这篇文章里的“3.安装CUDA”

  1.2.3 配置环境及最终验证

https://blog.csdn.net/cwy_yeah/article/details/79334126 参考这个博客里的8

1.4 在kaldi中把CUDA编译进去

kaldi/src目录下:

make clean (这个很必要)

./configure

make all 

2.卸载显卡驱动和CUDA

如果倒腾过程中出现解决不了的问题,有时没办法只能卸载了重装。

2.1 卸载CUDA

cd /usr/local/cuda-9.0/bin
sudo ./uninstall_cuda_toolkit_9.0.pl
2.2 卸载显卡驱动

sh NVIDIA-Linux-x86-270.41.19.run --uninstall (得在NVIDIA-Linux-x86-270.41.19.run文件所在目录中运行该命令)

 

 

你可能感兴趣的:(kaldi相关)