2020年12月14日(勉强成功
最后并不是按照下面这样一步步安装的(可能是由于服务器的硬件问题),而是直接安装CUDA,在安装过程中会提示是否安装nvidia driver,选择安装就行,具体步骤在后面。
虽然安装结束了,还是要说一句:“Nvidia, fuck you !”。
sudo passwd root
记住网络名称eno1和eno2,编辑网络配置文件
vi /etc/network/interfaces
这里使用vi编辑,和vim略有不同,常用操作有:
更建议使用gedit编辑,还能复制粘贴,但是指不定哪天只能用vi了是吧哈哈哈。
打开后文件有下面两行:
auto lo
iface lo inet loopback
再下面添加添加有线网络的静态设置
auto eno1
iface eno1
address xxx.xxx.xxx.xxx
netmask xxx.xxx.xxx.xxx
gateway xxx.xxx.xxx.xxx
dns-nameservers xxx.xxx.xxx.xxx
有的博客说变量名应该是eth0,我试的时候不太好使,干脆全加上了,上述代码将eno1换成eno2和eth0,都加在这个文件中。
保存退出,重启networking服务:
sudo /etc/init.d/networking restart
但是这样并不能配置DNS(最后一行好像没用),此时还是不能打开网页
我的方法是DNS在图形界面配置:
在ubuntu右上角点击需要连接的网络,点击设置,在ipv4里面把DNS写上(事后记录所以没图,应该找得到),并点击 应用
这位xd提出再另一个文件手动设置DNS服务器
vim /etc/resolv.conf
手动添加
nameserver xxx.xxx.xxx.xxx
保存退出,重启networking服务:
sudo /etc/init.d/networking restart
正常情况下,最后把DNS配好后,就可以打开网页了
然而这样做还是有问题,重启之后又不能上网了,问题出在/etc/resolv.conf。重启后,此文件配置的dns又被自动修改为默认值。所以需要永久性修改DNS。方法如下:
vim /etc/resolvconf/resolv.conf.d/base
添加
nameserver xxx.xxx.xxx.xxx
保存退出,重启networking服务:
sudo /etc/init.d/networking restart
然而这个方法在我这里仍然没用,重启之后依然要重新在图形界面配置DNS,甚至还碰到还碰到一个问题
有线连接未托管
方法是:
sudo vim /etc/NetworkManager/NetworkManager.conf
(联网之后下了vim嘿嘿嘿)
[main]
plugins=ifupdown,keyfile
[ifupdown]
managed=false
[device]
wifi.scan-rand-mac-address=no
将managed=false改成managed=true
这样就托管上了,详情见这位老哥
这是 天坑 ,我还没爬出来
参考 A, B 等老哥的博客后,大致流程应该如下:
blacklist nouveau
options nouveau modeset=0
sudo update-initramfs -u
sudo reboot
lsmod | grep nouveau
如果回车后无反应,说明禁用成功
sudo apt-get remove --purge nvidia*
sudo apt update && sudo apt upgrade
然后(没换源的话下一步大概率失败)
sudo add-apt-repository ppa:graphics-drivers/ppa
ubuntu-drivers devices
在最适合的后面会有 recommended
sudo apt-get install nvidia-driver-435 #此处数字要对应上面查询到的版本号
sudo apt-get install mesa-common-dev #不造这是干啥,但是博客里有
注意: 如果前面没有禁用secure boot,则在安装过程中会提示设置一个密码,在重启时需要输入密码验证以禁用secure boot,重启后会出现蓝屏,这时候不能直接选择continue,而应该按下按键,选择Enroll MOK, 确认后在下一个选项中选择continue,接着输入安装驱动时设置的密码,开机
sudo reboot
目前卡死在这一步,服务器显示CPU internal error,而且进入不了ubuntu登录界面,所以甚至连进入命令行删除已经安装(失败)的NVIDIA驱动都做不到,只能重装系统。
(重装也不是插上U盘就重装,首先要关闭服务器,然后在服务器后面拔掉2根电源,然后长按开关键20s,并等待1min左右后再次接上两根电源,CPU error才会消失)
9. 打开终端验证
nvidia-smi
多么希望看到这张图啊