Ubuntu16.04+gtx1060+cuda8.0+cudnn8.0+tensorflow安装

折腾了两天系统安装和配置,简单的记录一下。

linux坑太多,如果有朋友遇到坑,欢迎交流。


1.Ubuntu16.04安装


1)先去官网找到对应的版本,我这里安装的是Ubuntu16.04 ltx版本,下载地址为:https://www.ubuntu.com/desktop。

2)下载好后,找一个U盘,用ultroiso制作启动盘,具体办法百度google网上一大堆。

3)关机,重启,按F12或者del进入bios设置boot顺序,我电脑是f12进入,开机的时候会有闪过,注意看一下或者网上查。把U盘设置为第一顺序。

4)然后就选择install Ubuntu。后面有不同是安装方式,比如和win一起,Erase disk and install Ubuntu,或者其他方式自己设置分区

5)之后设置用户名密码之类,然后就是等。到最后下载abobe-flash的时候很慢,用了网上的方法,拔掉网线,过了会儿就装好了。然后就可以看到全新的Ubuntu系统。


2.GTX1060驱动安装

先根据对应的GPU下载对应的驱动版本,下载地址为http://www.nvidia.com/Download/index.aspx?lang=en-us

在我电脑上Ubuntu下载的速度很慢,所以先在win下用迅雷下好了,然后拷贝到了U盘里,放在home或者downloads目录下都行。

方法可以参照这里:https://wiki.ubuntu.com.cn/NVIDIA,但是不用完全安装步骤走。

我的方法是,1)ctrl+alt+f1到命令行环境,然后输入用户名和密码登录

2)sudo /etc/init.d/lightdm stop关闭界面环境

3)cd到放驱动文件的目录,运行sudo sh driver-name.sh,然后一路安装下去

4)sudo /etc/init.d/lightdm restart重新启动界面环境

5)终端输入nvidia-smi看安装结果

这样就安装成功了。

(装好的第二天某次死机了,我强关电脑重启后,出现了登录界面循环的问题,在小伙伴的建议下又重新装了一边显卡驱动就好了,这是后话)

(补充:后续电脑出现了挂起suspend恢复后会出现死机的问题,升级了内核出现黑屏,显示“输入不支持”,用启动盘进入try Ubuntu后用boot-repair修复后开机进入了选择内核的页面,选择了原来的内核才重新进入,真是大坑。后来又装了NVIDIA 367还是370的驱动,从sestem setting装的,还是会死机。不甘心的我认为还有可能是16.04太新,重装了14.04,装了375.20的驱动,还是会出现挂起恢复后死机,情况好点,玩了一小会儿才死机,但是依然会死。网上又搜了一些信息,最终感觉是nvidia驱动的问题,无怪Linus torvalds对nvidia说的那句,fuck you,nvidia!

14.04下367的驱动依然不行)


(以下三部分参考了博客:http://blog.csdn.net/WoPawn/article/details/52302164)

3.CUDA安装 

CUDA的安装文件也是win下下好的,通过U盘拷到了linux下。下载地址为:https://developer.nvidia.com/cuda-toolkit

安装步骤为:

1)cd到文件目录

2)sh CUDA-NAME.run --override 

3)启动安装程序,一直按空格到最后,输入accept接受条款 
输入n不安装nvidia图像驱动,之前已经安装过了 (这里注意)
输入y安装cuda 8.0工具 
回车确认cuda默认安装路径:/usr/local/cuda-8.0 
输入y用sudo权限运行安装,输入密码 
输入y或者n安装或者不安装指向/usr/local/cuda的符号链接 
输入y安装CUDA 8.0 Samples,以便后面测试 
回车确认CUDA 8.0 Samples默认安装路径:/home/用户名目录,该安装路径测试完可以删除 



4.cudnn安装

终端输入 
1)cd 到放安装文件的目录 (也是提取下好的)
2)解压在下载目录下产生一个cuda目录 
tar zxvf cudnn-8.0-linux-x64-v5.1.tgz 
cd cuda/include/ 
sudo cp cudnn.h /usr/local/cuda/include/ 复制头文件 
cd ../lib64 打开lib64目录 
sudo cp lib* /usr/local/cuda/lib64/ 复制库文件 
sudo chmod a+r /usr/local/cuda/include/cudnn.h/usr/local/cuda/lib64/libcudnn*给所有用户增加这些文件的读权限  



5.建立软链接

1)终端输入 
cd /usr/local/cuda/lib64/ 
sudo rm -rf libcudnn.so libcudnn.so.5 
sudo ln -s libcudnn.so.5.1.5 libcudnn.so.5 
sudo ln -s libcudnn.so.5 libcudnn.so 
2)设置环境变量(不然找不到CUDA文件,重要)
终端输入
sudo gedit /etc/profile 

在末尾加入 
PATH=/usr/local/cuda/bin:$PATH 
export PATH 

保存后,创建链接文件 
sudo vim /etc/ld.so.conf.d/cuda.conf 
按a进入插入模式,增加下面一行 
/usr/local/cuda/lib64 
按esc退出插入模式,按:wq保存退出 
最后在终端输入sudo ldconfig使链接生效


6.cuda samples测试

打开CUDA 8.0 Samples默认安装路径,终端输入 
cd /home/用户名/NVIDIA_CUDA-8.0_Samples 
sudo make all -j4 (4核) 
出现“unsupported GNU version! gcc versions later than 5.3 are not supported!”的错误,这是由于GCC版本过高,在终端输入 

(源博客出现了这个问题,在我安装的时候并没有出现)
cd /usr/local/cuda-8.0/include 
sudo cp host_config.h host_config.h.bak 
sudo gedit host_config.h 
ctrl+f寻找有“5.3”的地方,只有一处,如下 
# if __GNUC__ > 5 || (__GNUC__ == 5 && __GNUC_MINOR__ > 3) 
#error -- unsupported GNU version! gcc versions later than 5.3 are not supported! 
将两个5改成6,即 
#if __GNUC__ > 6 || (__GNUC__ == 6 && __GNUC_MINOR__ > 3) 
保存退出,继续在终端输入 
cd /home/用户名/NVIDIA_CUDA-8.0_Samples  
sudo make all -j4 (4核) 
完成后继续向终端输入 
cd bin/x86_64/linux/release 
./deviceQuery 
完成之后出现如下图所示,表示成功安装cuda

(这是源博客的图)

Ubuntu16.04+gtx1060+cuda8.0+cudnn8.0+tensorflow安装_第1张图片



7.安装pip

cd 
wget --no-check-certificate https://bootstrap.pypa.io/ez_setup.py 
sudo python ez_setup.py --insecure 
wget https://bootstrap.pypa.io/get-pip.py 
sudo python get-pip.py


9.Tensorflow安装

tensorflow有四种安装方式,

1)pip安装

2)Virtualenv installation
3)Anaconda installation
4)Docker installation
或者从源代码编译安装,我因为要用anaconda,所以选用了anaconda安装方式

官网的安装指导看这里:https://www.tensorflow.org/versions/r0.11/get_started/os_setup.html#anaconda-installation,网上也可以找到很多中文教程。大致步骤为:先安装anaconda2或者3,cd到目录下的envs目录,用conda指令创建一个tensorflow虚拟环境,然后source activate tensorflow,用pip下载安装。

然后可以在tensorflow环境下用conda指令安装ipython和jupyter

$ source activate tensorflow
(tensorflow)$ conda install ipython

(tensorflow)$ conda install jupyter

以后可以输入jupyter notebook,在jupyter里用tensorflow

每次启动都需要先source activate tensorflow,结束的时候deactivate tensorflow。

这次装完后后来出过一次问题,输入import tensorflow后,输出no module namad tensorflow,没找到解决办法,我重装了一下好了。

要是想在pycharm下用tensorflow的话,参考上一篇博客。


太晚了,急着睡觉,写的有点粗略。。。。。

你可能感兴趣的:(tensorflow,deep,learning)