联想拯救者R9000P安装Ubuntu 21.04系统及运行TensorFlow1.X代码

联想拯救者R9000P安装Ubuntu 21.04系统,让RTX3070 Laptop显卡运行TensorFlow1.X代码

    • 前言
    • 1. 需要安装的环境
    • 2. Ubuntu 21.04
    • 3. 安装后续驱动及cuda前的准备工作
    • 4. NVIDIA显卡驱动
      • 4.1 禁用nouveau
      • 4.2 禁用nouveau内核模块
      • 4.3 关闭用户图形界面
      • 4.4 安装显卡驱动
    • 5. cuda_11.1.0_455.23.05_linux安装
    • 6. 配置路径
    • 7. 安装cudnn 8.0.4
    • 8. 安装anaconda3,创建并进入虚拟环境
    • 9. 安装tensorflow
    • 10. 安装 Nvidia-tensorflow 1.15.4
    • 11. 亮度调节

前言

作为社区的新成员,平日受益颇多。最近因为机器学习程序训练需要在拯救者R9000P RTX3070上跑TensorFlow1.X代码,由于cuda版本高所以考虑安装Linux系统来实现代码。笔者水平有限,如有疏漏,还请谅解。

1. 需要安装的环境

需要安装的环境:

  1. Ubuntu 21.04

  2. NVIDIA显卡驱动 NVIDIA-Linux-x86_64-460.80

  3. cuda11.1和cudnn8.0.4

  4. Anaconda Linux 64-Bit (x86) Installer (Python3.8)

  5. TensorFlow1.15.4虚拟环境安装

  6. Vscode安装(后续补充)

2. Ubuntu 21.04

官方下载链接:地址
需要工具:U盘,系统分区工具 Universal USB Installer
Version 2.0.0.4
,系统制作工具 diskgenius
由于B站有良心博主Summer-lights出了详细视频,直接按照他的来操作。但是为了防止linux安装驱动出现中文菱形乱码,系统安装时语言设置为英文。(与视频时间9:51不同之处。)为了方便之后的安装各种驱动,建议设置reboot的密码。

安装Windows和Linux双系统

因为指令不涉及中文,安装中文输入法省略,具体教程参考论坛内的操作步骤。

3. 安装后续驱动及cuda前的准备工作

如果你是windows系统,下载好了相应的文件,建议安装Ubuntu后,直接从windows的硬盘空间内复制NVIDIA,cuda,cudnn安装包到Ubuntu系统 Home页面(主文件夹)下。Nvidia-Tensorflow-install文件夹也放到同样路径下。
百度网盘 提取码:bkpp
内部包含NVIDIA显卡驱动 NVIDIA-Linux-x86_64-460.80cuda_11.1.0_455.23.05_linuxcudnn-11.1-linux-x64-v8.0.4.30TensorFlow1.154

4. NVIDIA显卡驱动

NVIDIA官网下载显卡驱动 NVIDIA-Linux-x86_64-460.80,需要根据GPU型号及系统版本来选择。(如果不是RTX30系列)
NVIDIA显卡驱动
为了之后显卡安装不报错,需要关机一次,在开机启动时不停按f2进入BIOS管理,禁用BIOS的secure boot,即disable它。(按→方向键切换到Security,选择Secure Boot回车设置成Disabled,关闭安全启动)

4.1 禁用nouveau

安装nvidia显卡驱动首先需要禁用nouveau,不然会碰到冲突的问题,导致无法安装nvidia显卡驱动。
编辑文件blacklist.conf,在终端中输入如下指令(一次只能运行一行)

sudo gedit /etc/modprobe.d/blacklist.conf

在打开的blacklist.conf的最后添加如下文字(复制如下的文字)

blacklist nouveau

blacklist lbm-nouveau

options nouveau modeset=0

alias nouveau off

alias lbm-nouveau off

保存后关闭blacklist.conf。保留终端继续运行,切记,不要关闭终端,不要关闭终端,不要关闭终端

4.2 禁用nouveau内核模块

在终端中继续按行输入如下指令,注意reboot代表系统重启

echo options nouveau modeset=0
sudo update-initramfs -u
sudo reboot

4.3 关闭用户图形界面

在终端中继续按行输入如下指令,注意reboot代表系统重启

sudo systemctl set-default multi-user.target
sudo reboot

4.4 安装显卡驱动

这时重启后不会进入正常系统,而是legion黑色画面,按住ctrl+alt+f2进入控制台,需要你填写注册Ubuntu时设置的账号及密码。再逐行输入如下指令

sudo apt-get remove --purge nvidia*
sudo apt autoremove

运行安装文件

sudo chmod a+x NVIDIA-Linux-x86_64-460.80.run
sudo ./NVIDIA-Linux-x86_64-460.80.run -no-x-check -no-nouveau-check -no-opengl-files

运行以后会看到协议页面,输入 accept以进行安装。
在选择界面依次选continue,no,no,yes。

The distribution-provided pre-install script failed! Are you sure you want to continue? 选择 yes 继续。
Would you like to register the kernel module souces with DKMS? This will allow DKMS to automatically build a new module, if you install a different kernel later?  选择 No 继续。
问题没记住,选项是:install without signing
问题大概是:Nvidia's 32-bit compatibility libraries? 选择 No 继续。
Would you like to run the nvidia-xconfigutility to automatically update your x configuration so that the NVIDIA x driver will be used when you restart x? Any pre-existing x confile will be backed up.  选择 Yes

经过这些操作后Nvidia显卡驱动安装成功。
再次运行如下指令确保安装成功

nvidia-smi  # 如果出现GPU列表,则驱动安装成功

5. cuda_11.1.0_455.23.05_linux安装

继续在控制台里输入

sudo chmod a+x cuda_11.1.0_455.23.05_linux.run
sudo ./cuda_11.1.0_455.23.05_linux.run

先输入accept进入安装界面,在依次点击Options - Driver Options- Do not install any of the OpenGL-related driver files。然后选择 Done 退回到初始页面,在初始页面下把打上X的Drive取消勾选(上一步4.4 安装显卡驱动已经安装)。选择 Install 开始安装。安装完成后开启用户图形界面。

sudo systemctl set-default graphical.target

sudo reboot

6. 配置路径

用如下指令打开bashrc

sudo gedit ~/.bashrc

在打开的bashrc最后添加路径

export CUDA_HOME=/usr/local/cuda

export LD_LIBRARY_PATH=${
     LD_LIBRARY_PATH}:${
     CUDA_HOME}/lib64

export PATH=${
     CUDA_HOME}/bin:${
     PATH}



export PATH="/home/用户名(自己修改)/anaconda3/install/bin:$PATH"



export MANPATH=${
     MANPATH}:/usr/local/texlive/2020/texmf-dist/doc/man

export INFOPATH=${
     INFOPATH}:/usr/local/texlive/2020/texmf-dist/doc/info

export PATH=${
     PATH}:/usr/local/texlive/2020/bin/x86_64-linux



export PATH=/usr/local/Polyspace/R2020b/bin:$PATH

保存,退出,输入 source ~/.bashrc 使其生效。

验证CUDA版本,会输出版本号

nvcc --version

cat /proc/driver/nvidia/version

7. 安装cudnn 8.0.4

解压cudnn-11.1-linux-x64-v8.0.4.30.tgz
在文件所在的路径下打开终端

sudo cp cuda/lib64/* /usr/local/cuda/lib64/

sudo cp cuda/include/* /usr/local/cuda/include/

sudo chmod a+r /usr/local/cuda/include/cudnn.h /usr/local/cuda/lib64/libcudnn*

最后验证cudnn是否配置好并输出版本号:

cat /usr/local/cuda/include/cudnn_version.h | grep CUDNN_MAJOR -A 2

8. 安装anaconda3,创建并进入虚拟环境

conda create -n tensorflow1 python=3.6.8

conda activate tensorflow1

9. 安装tensorflow

在虚拟环境下运行requirements.sh安装nvidia-TensorFlow对应离线的依赖包:
在终端中用conda activate tensorflow1后来输入如下指令。

sh requirements.sh

验证库文件

pip list | grep nvidia

如果发现没有Nvidia-tensorflow 1.15.4,关闭终端,重新进入虚拟环境并运行前面的代码,这样能够最终完成安装tensorflow(支持GPU深度学习)
测试Tensorflow是否安完成

python -c 'import tensorflow as tf; print(tf.__version__)'

10. 安装 Nvidia-tensorflow 1.15.4

另外一种在线安装方法,安装Nvidia-tensorflow 1.15.4步骤如下。
同样需要在虚拟环境下进行安装,在终端中用conda activate tensorflow1后来输入如下指令。

  1. 安装tensorlfow索引
 pip install nvidia-pyindex
  1. 安装Nvidia-tensorflow 1.15.4
pip install nvidia-tensorflow[horovod]
  1. 验证软件包是否已安装
pip list | grep nvidia

出现如下列表,说明安装成功(版本号可能不一致,具体以实时显示的为准)

nvidia-cublas 11.1.0.213
nvidia-cuda-cupti 11.0.167
nvidia-cuda-nvcc 11.0.167
nvidia-cuda-nvrtc 11.0.167
nvidia-cuda-runtime 11.0.167
nvidia-cudnn 8.0.1.13
nvidia-cufft 10.1.3.191
nvidia-curand 10.2.0.191
nvidia-cusolver 10.4.0.191
nvidia-cusparse 11.0.0.191
nvidia-dali 0.22.0
nvidia-dali-tf-plugin 0.22.0
nvidia-horovod 0.19.1
nvidia-nccl 2.7.5
nvidia-pyindex 1.0.0
nvidia-tensorflow 1.15.2+nv20.6
nvidia-tensorrt 7.1.2.8

11. 亮度调节

$ sudo add-apt-repository ppa:apandada1/brightness-controller
$ sudo apt update
$ sudo apt install brightness-controller

打开brightness-controller,拖动最左竖条可以修改Ubuntu系统下的亮度(因为系统亮度调节失效,所以安装brightness-controller)

你可能感兴趣的:(Ubuntu,ubuntu,linux,cuda,深度学习,gpu)