为跑代码方便,实验室电脑一般都用ubuntu系统,但无奈买来的电脑都是预装windows,所以需要重装系统,然后再配置一系列的环境。走一遍流程总要有些坑,下次再重复安装总是隐约记得但又会再踩坑,为了之后提高效率,这次把整个流程记录下来,以后用着也方便。
现在ubuntu已经出到了21版本,一般安装LTS(长期支持)版本就没啥问题,但为了兼容一些老环境、老配置,这里选18版本的稳妥一些。
镜像在官网下载:https://ubuntu.com/#download
我用的是18.04.6桌面版,可以在这里下载:
链接:https://pan.baidu.com/s/1p4kAtoaZSzxJa2VqtjuFmg
提取码:vwj5
下载之后,要制作启动盘,用u盘或光盘都可,这里用u盘制作
制作工具用 UltraISO软碟通,下载之后,准备好一个空u盘(制作启动盘需要格式化u盘),8g的就够,然后按照这个来就行
https://jingyan.baidu.com/article/154b46311befea28ca8f41ae.html
之后就是关机,插上u盘,开机进入bios,选择u盘启动那一项,按照引导安装就行。(因为是重装系统,直接覆盖原系统,所以分区、存储那些配置都按照默认的来就行,记得选择覆盖原系统就行)
深度学习网络都离不开显卡,安装显卡驱动算是最重要的一步。
首先,有个准备工作,禁用BIOS中的secure boot(需要重启一下进BIOS)。
进入系统后,禁用默认使用的开源显卡驱动nouveau:
sudo vim /etc/modprobe.d/blacklist-nouveau.conf
blacklist nouveau
options nouveau modeset=0
sudo update-initramfs -u
lsmod | grep nouveau
想使用nvidia的独立显卡,就需要安装对应的显卡驱动,所以要知道自己显卡的信息,确定驱动版本。
终端输入:ubuntu-drivers devices
可以看到推荐安装的是 nvidia-driver-470,直接安装就可。
sudo apt update
sudo apt install nvidia-driver-470
安装后重启一下,终端输入:nvidia-smi
如图安装成功。
其实也可以去nvidia官网下载对应版本的驱动,除去官网的版本可能更新一点之外,其实都差不多,上边的方法更简单。
具体过程参考:
https://zhuanlan.zhihu.com/p/59618999
https://blog.csdn.net/new_delete_/article/details/81544438
!!踩坑!!:之前安装显卡驱动后,再重启会显示驱动的版本和系统不一致,这是由于linux内核自动更新导致的,所以为了方便起见,避免之后出现问题,在显卡驱动安装后,先设置禁止系统内核更新,之后再重启查看显卡驱动。
查看一下在使用的内核版本 uname -a
然后 sudo apt-mark hold linux-image-5.4.0-84-generic
dpkg --get-selections |grep linux-image
,显示hold就可以了
然后再禁止一下软件更新(如果不用图形界面,软件的更新其实没啥用)
参考:https://www.cnblogs.com/111testing/p/13668275.html
接下来就是安装python以及cuda这些实验环境了,由于后续想在虚拟环境中配置对应工程的环境,用conda还是方便些。
安装anaconda,基本的过程就这样:https://blog.csdn.net/qq_15192373/article/details/81091098
注意:anaconda的版本建议新一点,我用老版本安装后,后续安装pytorch时候,装cuda11.3版本死活找不到源,后来升级了一下conda版本就可以了,所以建议一开始就安装新一点的版本。
新建一个conda环境,python版本按需安装,一般3.6就够用了。 https://blog.csdn.net/omg_orange/article/details/98181099
进入环境,开始安装pytorch
在官网 https://pytorch.org/ 找到安装指令,前边安装显卡驱动时候显示cuda11.4,这是驱动支持的最高cuda版本,可以向下兼容,下载11.3就可以。
安装:conda install pytorch torchvision torchaudio cudatoolkit=11.3 -c pytorch
这里一般会出现网络连接不上,找不到资源等问题,网上有很多换conda源的,感觉某些资源可以在清华源这种找到,但是一些较新的资源还是没有,所以建议安装较新版本的anaconda,之后直接按照这个指令安装就行,可能会很慢,可以科学上网提提速。
写个python程序测试一下
#test_gpu.py
import torch
flag = torch.cuda.is_available()
print(flag)
ngpu= 1
# Decide which device we want to run on
device = torch.device("cuda:0" if (torch.cuda.is_available() and ngpu > 0) else "cpu")
print(device)
print(torch.cuda.get_device_name(0))
print(torch.rand(3, 3).cuda())