开篇需要强调的一点是,如果你是将要进行深度学习方面的学习。在环境配置和安装方面一定要记得 自己显卡的型号——Nvidia驱动版本——CUDA版本——python版本——pytorch/tensorflow版本 以上五者齐对应。即此五者不同版本之间有相互的支持,比如你安装CUDA版本的时候就需要查询以下相对应支持的驱动版本的要求。
这里放几个连接,大家可以参考
Cuda与驱动
https://docs.nvidia.com/cuda/cuda-toolkit-release-notes/index.html
驱动与自己的显卡
https://www.nvidia.com/Download/index.aspx?lang=en-us
(以下讲述默认为Linux系统下的安装,偶尔会提一下Windows下的情况。)
接下来我们进入Nvidia驱动的安装
第一步先nvidia-smi
出现上图的话,就是本就安好了Nvidia驱动。我们可以在上面看到驱动版本450.66
如果你是Windows系统,可以在cmd里面进入C:\Program Files\NVIDIA Corporation\NVSMI 目录,然后nvidia-smi 。Windows系统上还可以直接在桌面上面右键点nvidia控制面板的
然后点击系统信息
如果你觉得这个版本不合适的话,可以卸载。
如果是Windows系统下的话,就在控制面板里面的“程序”中卸载,和卸载普通软件一样。至于卸载哪一个东西,你就看名字,
名字中带有NVIDIA名字并且带有你的驱动版本那个数字的都卸掉。
在Linux系统中,敲
sudo /usr/bin/nvidia-uninstall
(总之在类似的目录中去找nvidia-uninstall)
卸载之后,如果敲之前的命令nvidia-smi出错的话,那就是卸载成功了。
接下来就是驱动的安装了
去官网上面按照自己的显卡的情况下载相应版本的驱动。
然后会下载相应的.run文件。
我们再修改其权限。
chmod +x NVIDIA-Linux-x86_64-340.65.run
接下来就是正式安装
但如果你直接
sudo ./NVIDIA-Linux-x86_64-340.65.run
会报以下这些错误:
那么这个时候我们就只能
先按ctrl+alt+f1进入到下面这个控制界面
输入用户名密码之后就登录进去了
然后
sudo service lightdm stop
sudo ./NVIDIA-Linux-x86_64-340.65.run
(插播一下,这里我曾经出现过一个尴尬问题,就是我.run的文件在“下载”目录里面。然后我运行它就需要进入“下载”目录,或者在路径中用Downloads。结果应该是中文乱码的原因当我ctrl+alt+f1之后,下载目录在ls下直接找不到了。。。最后就只能reboot,然后把下载目录中的.run文件移动到其它目录,然后再ctrl+alt+f1进入操作)
接下来的各种选择(只有一个选项的图片我就不放了)
最后测试
nvidia-smi
没有问题的话就结束了
接下来安装CUDA
首先看是不是已经有CUDA了
nvcc -V
可以看到自己的CUDA版本。
如果找不到命令则是没有安装(当然也可能是环境变量没有配置好,所以最好是去/usr/local下的cuda文件夹下面搜索以下看有没有名字nvcc这个文件。如果有说明安装好了。)
没有则现在来安装。
首先下载,注意选择相应版本。
(注意anaconda和Pycharm里面也能够搜索到一个叫cudatoolkit的包,这个和我们现在要安装的CUDA是两回事!!!)
然后运行
chmod +x ???????.run
sudo ./???????.run
问号里面是你的.run文件名字,相应替换即可。
Driver这个选项去掉即可,然后Install
接下来设置环境变量
sudo vim ~/.bashrc
在文件中追加
export PATH=/usr/local/cuda-9.0/bin:$PATH
export LD_LIBRARY_PATH=/usr/local/cuda-9.0/lib64$LD_LIBRARY_PATH
如果nvcc -V没错,那就是已经成功了。如果出错的话,就先去usr/local/里面的cuda文件夹里面找找看是否有nvcc文件,如果有说明只是环境变量设置错误,如果没有说明cuda没有正常安装。
转载请标明出处,原文地址:https://blog.csdn.net/come_from_pluto