深度学习 主机配置和安装总结

2019年5月底的配置:
RTX2080TI 8999元,11g,微星的卡
金士顿16g2 629元2
机箱 冷酷至尊 685元
电源850w 949元
msi主板 z390 edge ac 1459元 (支持X8+X8)
cpu i5 8500 1699元
硬盘 4t wd 639元
intel ms2 ssd 512g 729元
总结在1万6左右。

主要说一下安装过程碰到的问题:
安装过程参考了以下两个博客:
https://blog.csdn.net/channelyoung/article/details/88038344
https://www.jianshu.com/p/2d4cfa112784
有点类似,也有点不同,还有一些我自己碰到的问题。

安装的时候我用了ubuntu 19.04 最新的。

1)第一个安装的时候我碰到了显卡驱动的问题:
nouveau是Linux自带的第三方开源显卡驱动,安装nvidia驱动前禁用nouveau,
查看是否有nouveau启动,如果命令
lsmod | grep -i nouveau
返回了结果显示意味着nouveau启动了,禁用nouveau驱动:
sudo vim /etc/modprobe.d/blacklist-nouveau.conf
在文件中添加
blacklist vga16fb
blacklist nouveau
blacklist rivafb
blacklist rivatv
blacklist nvidiafb
options nouveau modeset=0

执行更新上面配置
sudo update-initramfs -u
重启系统确认是否仍在执行
lsmod | grep -i nouveau
如果之前已安装了旧版本显卡驱动,卸载老版本
sudo /usr/bin/nvidia-uninstall

另外如另一个文章说的,这里不用先安装驱动,后续再安装CUDA的时候会一起安装。
这样把带的驱动删除就可以了,要不后续安装新驱动也会有问题。

2)CUDA的安装
选择合适的cuda版本,tensorflow1.13不支持cuda10.1 (如果不支持的版本后续运行会出错,load so库失败)
深度学习 主机配置和安装总结_第1张图片
安装cuda的过程中会自动安装最新的驱动
安装完成后在.bashrc中设置环境变量
export PATH=/usr/local/cuda/binKaTeX parse error: Expected '}', got 'EOF' at end of input: {PATH:+:{PATH}}
export LD_LIBRARY_PATH=/usr/local/cuda/lib64KaTeX parse error: Expected '}', got 'EOF' at end of input: …LIBRARY_PATH:+:{LD_LIBRARY_PATH}}
export CUDA_HOME=/usr/local/cuda
运行source .bashrc使其生效
(这里的修改.bashrc是对的,另一个/etc/profile的配置方式会无效,LD_LIBRARY_PATH环境变量会空,所以建议按这个配置。)

3).CUDNN的安装,需要安装两个帖子的内容的总和。
深度学习 主机配置和安装总结_第2张图片
执行安装命令 (这里安装最新版本,我安装的是7.6.0)
sudo dpkg -i libcudnn7_7.5.0.56-1+cuda10.0_amd64.deb
sudo dpkg -i libcudnn7-dev_7.5.0.56-1+cuda10.0_amd64.deb
sudo dpkg -i libcudnn7-doc_7.5.0.56-1+cuda10.0_amd64.deb

还有这个:
深度学习 主机配置和安装总结_第3张图片
也是需要的。

解压,复制文件到/usr/local/cuda相关文件夹内
sudo cp cuda/include/cudnn.h /usr/local/cuda/include
sudo cp cuda/lib64/libcudnn* /usr/local/cuda/lib64
sudo chmod a+r /usr/local/cuda/include/cudnn.h /usr/local/cuda/lib64/libcudnn*

4).tensorflow的安装
我没有选择miniconda3的方式安装,直接安装的,直接安装的时候碰到一个setuptools库缺失的错误,只要先安装这个库就可以了
pip3 install setuptool 的方式 (ubuntu默认安装了python3,没有python2,我也就没管,以后用到再说)
安装这个后,就可以顺利安装如下的了:
pip3 install --upgrade tensorflow-gpu

5).共享桌面的问题
自带的共享桌面有一个bug,18.04版本,最新的修复在19.04,如果你按这两个贴子里的,把apt的源修改为了aliyun,5月29日的时候aliyun还没有最新的这个版本,所以修改修改回apt的源,然后再update, upgrade,搞定,桌面共享会在另一个组件里。可以成功。

你可能感兴趣的:(深度学习 主机配置和安装总结)