1、深度学习环境

1、查看显卡信息

1)查看显卡信息:
lspci | grep -i vga
2)查看详细信息:
lspci -v -s 02:00.0
连接:https://blog.csdn.net/dcrmg/article/details/78146797

2、概念图

显卡: 简单理解这个就是我们前面说的GPU,尤其指NVIDIA公司生产的GPU系列,因为后面介绍的cuda,cudnn都是NVIDIA公司针对自身的GPU独家设计的。
显卡驱动:很明显就是字面意思,通常指NVIDIA Driver,其实它就是一个驱动软件,而前面的显卡就是硬件。
gpu架构:Tesla、Fermi、Kepler、Maxwell、Pascal
芯片型号:GT200、GK210、GM104、GF104等
显卡系列:GeForce、Quadro、Tesla
GeForce显卡型号:G/GS、GT、GTS、GTX

详细:
[1] https://zhuanlan.zhihu.com/p/91334380
[2] https://chenrudan.github.io/blog/2015/12/20/introductionofgpuhardware.html

3、安装步骤

1) 查看操作系统对应版本(uname -m && cat /etc/*release 或者 uname -a)
2)安装nvidia驱动,下载对应版本的驱动并安装:sudo ./NVIDIA-Linux-x86_64-440.82.run
3)若安装失败,可能需要安装对应的 kernel header 和 package development
tips1: apt search linux-headers-$(uname -r) 有可能找不到对应版本的headers
tips2: 需要到官网下载对应版本的linux-headers、headers-common、linux-kbuild 和 linux-compiler 进行安装
tips3: 下载 wget http://snapshot.debian.org/archive/debian/20190205T032415Z/pool/main/l/linux/linux-headers-4.9.0-8-common_4.9.144-3_all.deb
tips4: 安装 dpkg -i linux-headers-4.9.0-8-amd64_4.9.144-3_amd64.deb
nvida 驱动卸载
sudo /usr/bin/nvidia-uninstall
cuda  卸载
cd /usr/local/cuda/bin
sudo ./cuda-uninstaller

卸载:Ubuntu 16.04 卸载Nvidia显卡驱动和cuda
注意版本要求:https://tensorflow.google.cn/install/source#linux

版本.png

4、

安装 Anaconda3
sudo bash Anaconda3-2020.02-Linux-x86_64.sh
conda create -n Py36TF2.2 python=3.6 anaconda
conda env remove -n tf2.2Py36
conda remove --name python35 --all

conda使用:Anaconda使用总结

5、

cudnn 安装:下载对应版本 cudnn-10.1-linux-x64-v7.6.4.38.tgz
tar -xvf cudnn-10.1-linux-x64-v7.6.4.38.tgz
sudo cp cuda/include/cudnn.h /usr/local/cuda-10.1/include/
sudo cp cuda/lib64/libcudnn* /usr/local/cuda-10.1/lib64/
sudo chmod a+r /usr/local/cuda-10.1/include/cudnn.h /usr/local/cuda-10.1/lib64/libcudnn*

6、tf 安装请参考官网

pip install --upgrade https://storage.googleapis.com/tensorflow/linux/gpu/tensorflow_gpu-2.2.0-cp36-cp36m-manylinux2010_x86_64.whl
#pip install -i https://pypi.tuna.tsinghua.edu.cn/simple tensorflow-gpu==2.2.0
Verify the install: 
python -c "import tensorflow as tf;print(tf.reduce_sum(tf.random.normal([1000, 1000])))"

7、jupyter notebook 添加 conda 环境

nohup jupyter notebook > /dev/null 2>&1 &
conda install ipykernel
python -m ipykernel install --user --name Py36TF2.2 --display-name Py36TF2.2

参考:
[1] ubuntu安装cuda驱动实现nvidia-smi命令
[2] 从零开始搭建深度学习服务器: 1080TI四卡并行
[3] Linux服务器安装cuda,cudnn,显卡驱动和pytorch超详细流程
[4.1]nvidia 官网
[4.2]snapshot.debian.org
[5] ubuntu18.04安装paddlepaddle开发环境
[6] How To Install linux-headers-4.7.0-0.bpo.1-amd64 on Debian?
[7] 如何解决Linux内核头文件和内核版本不同的问题?
[8] 如何分分钟构建强大又好用的深度学习环境?
[9] 搭建深度学习服务器环境

你可能感兴趣的:(1、深度学习环境)