ERROR: Unable to load the 'nvidia-drm' kernel module.

centos 7安装NVIDIA参考https://blog.csdn.net/xueshengke/article/details/78134991?tdsourcetag=s_pcqq_aiomsg

安装tf gpu遇到问题一:

centos 7 安装 nvidia驱动时遇到的ERROR: Unable to load the 'nvidia-drm' kernel module问题,网上查询大部份查询都是说出现这个问题最有可能的原因是你安装的Ubuntu是UEFI模式启动的,但是在BIOS中却打开了Security BOOT选项。 正确做法是禁用该选项。我的是禁用的。

解决办法:核版本不一致导致的失败

# uname -r

# ll /usr/src/kernels/

查询的结果不一致,解决办法,升级内核

#yum -y update

问题二:ImportError: libcublas.so.9.0: cannot open shared object file: No such file or directory。

当装完CUDA,CUDNN后调TF报这个错

1.是否正确添加的环境变量。我当时装的时候由于安装失败反复安装CUDA9.0,10.0等,环境变量等引用出现了问题。 libcublas.so.9.0代表TF对应的是CUDA9.0,libcublas.so.1.0对应的是CUDA10.0,同理。

2.显卡和CUDA不匹配,很多新显卡不支持低版本的CUDA,升级对应版本的cuda,cudnn,tf,NVIDIA,版本对应关系网上很好查到,不再复制了。

注:今天再次装新机的时候,使用#yum -y update后还是未能装成功报相同的问题,经查

#uname -r

#rpm -q kernel-devel

结果不一致,

经查,服务器同存在

3.10.0-957.el7.x86_64

3.10.0-1062.18.1.el7.x86_64,

删除3.10.0-957.el7.x86_64后重启服务器,

安装成功。

你可能感兴趣的:(ERROR: Unable to load the 'nvidia-drm' kernel module.)