Ubuntu16.04+Gtx1080ti+cuda9.0+cudnn7+Anaconda3+opencv3+pytorch+jupyter notebook配置

make -j (( (nproc)+1)) #这个可以用cpu最快的速度

安装Ubuntu16.04:

如果出现no root file system defined, 那么是分区时缺少挂载点,就看下面的分区选择弄就行了。


由于电脑本身含有win8的系统,在安装linux时,心血来潮把win8给格掉了,grub引导项也随之走了。

这里有两个办法可以解决:
    1. 重新安装win8,用diskgenius重新建立分区表。(没尝试)
    2. 给linux重新分区。(第一次分区可能未建立efi分区,但是在可以在第二次安装的时候直接选择reinstall,而不选择重新分区,
                这样就含有grub引导项了。当然,有efi分区了就别删了)
我的分区选择: / :15G
          boot: 200M
          swap:  32G
    剩下的全是home的。(留下了1G多。网上说效果会比较好。。。随便了~。~)
    机械硬盘的2T 选择了/usr分区。
    除了 / 根分区选择了主分区,其他的都选择逻辑分区。

安装Nvidia驱动:

在安装Nvidia驱动时,可能显示Nouveau显卡正在运行:
Ubuntu自带的Nouveau显卡和Nvidia显卡冲突,需要先关掉Nouveau显卡。

查看属性:
    sudo ls -lh /etc/modprobe.d/blacklist.conf
修改属性:
    sudo chmod 666 /etc/modprobe.d/blacklist.conf
用gedit编辑器打开:(gedit改成vi和vim都行)
    sudo gedit /etc/modprobe.d/blacklist.conf
在文档末尾加入如下几行:
    blacklist vga16fb
    blacklist nouveau
    blacklist rivafb
    blacklist rivatv
    blacklist nvidiafb

安装Nvidia驱动:

  1. 在官网直接下载Nvidia驱动的runfile文件。
  2. Ctrl+alt+F1 #进入字符界面,输入用户名和密码。(这是为了关闭图形界面)
  3. sudo service lightdm stop #关闭图形界面
  4. sudo chmod 755 NVIDIA-Linux-x86_64-367.44.run #进入下载文件的目录下操作。赋予权限
  5. sudo ./NVIDIA-Linux-x86_64-367.44.run #安装驱动

查看显卡驱动版本:
  nvidia-smi 或 cat /proc/driver/nvidia/version 或 lspci sudo lshw -c video | grep configuration

问题-登录界面反复,且驱动安装不上。
  把gcc4.9变成gcc5.4
  装了sudo apt-get install linux-headers-uname -r,但该指令未成功,改为sudo apt-get -f,安装后即可正确安装显卡驱动。

gcc/g++降级:

由于CUDA不支持gcc和g++5.3以上版本,所以需要给gcc和g++降级:
    下载包:
    sudo apt-get install gcc-4.9
    sudo apt-get install g++-4.9

给下载的包软链接:
    cd /usr/bin
    sudo rm gcc
    sudo ln -s gcc-4.9 gcc
    sudo rm g++
    sudo ln -s g++-4.9 g++
查看版本:
    gcc --version 
    g++ --version 

安装Cuda:

官网https://developer.nvidia.com/cuda-downloads 下载run文件
终端执行命令:
    1. sudo sh cuda_8.0.27_linux.run --no-opengl-libs #不加这个选项会进入循环登陆
    2. 启动安装程序,一直按空格到最后,输入accept, 接受条款
    3. 输入n,不安装nvidia图像驱动 (如果选择了y,再直接关机的话,
        显卡驱动就会与linux的cpu冲突(这句话有错误),就是屏幕不会有输出)
    4. 后面就一直y,或者enter完成安装就行了。
我们在之前已经安装了Nvidia驱动,所以这里就不用安装了。如果是自己的笔记本电脑,可以试一试。

配置环境变量:
    sudo gedit /etc/profile
    在文件最后添加路劲:
    export PATH=/usr/local/cuda-9.0/bin:$PATH
    export LD_LIBRARY_PATH=/usr/local/cuda-9.0/lib64$LD_LIBRARY_PATH

测试:
    cd /usr/local/cuda-9.0/samples/1_Utilities/deviceQuery
    sudo make
    ./deviceQuery
    如果显示的是关于GPU的信息,那么则说明安装成功了。

环境变量设置:
    sudo vim ~/.bashrc
    在末尾添加: 
        export CUDA_HOME=/usr/local/cuda-9.0
        export LD_LIBRARY_PATH=/usr/local/cuda-9.0/lib64:$LD_LIBRARY_PATH
        export PATH=/usr/local/cuda-9.0/bin:$PATH
刷新:
    source ~/.bashrc


动态链接库设置:
    创建文件:
        sudo vim /etc/ld.so.conf.d/cuda.conf
    写入:
        /usr/local/cuda/lib64   #如果这里出错,那可以进入root权限再进行写入。
    使之生效:
        sudo ldconfig -v

检查:
    1. cuda版本:
        nvcc -V
    2. Sample测试(进入Cuda的sample文件夹)
        make (要几分钟的样子)#编译
        进入Samples的bin/x86_64/linux/release/目录,运行deviceQuery程序:
            sudo ./deviceQuery #最后一行显示Result=Pass,就是安装成功了
        运行bandwidthTest程序:
            sudo ./bandwidthTest #最后一行显示Result=Pass,就是安装成功了

安装Cudnn:

下载好cudnn的压缩包。
进入相应目录,解压:
    tar -zxvf cudnn-8.0-linux-x64-v5.1.tgz 
在解压后的cuda目录进行如下操作:
    cd cuda/include/ 
    sudo cp cudnn.h /usr/local/cuda/include/  #复制头文件 
    cd ../lib64    #打开lib64目录 
    sudo cp lib* /usr/local/cuda/lib64/    #复制库文件 
    sudo chmod a+r /usr/local/cuda/include/cudnn.h /usr/local/cuda/lib64/libcudnn*    
            #给所有用户增加这些文件的读权限

问题: CUDNN_STATUS_INTERNAL_ERROR
那么在终端输入: sudo rm -rf ~/.nv
然后重启就行了

建立软连接:
  终端输入:
  cd /usr/local/cuda/lib64/
  sudo rm -rf libcudnn.so libcudnn.so.7
  sudo ln -s libcudnn.so.7.0.4 libcudnn.so.7
  sudo ln -s libcudnn.so.7 libcudnn.so

设置环境变量:
  sudo gedit /etc/profile
  在末尾加入:
  PATH=/usr/local/cuda/bin:$PATH
  export PATH

创建链接文件
  sudo vim /etc/ld.so.conf.d/cuda.conf
  加入如下信息:
  /usr/local/cuda/lib64 #如果加入后不能保存,可以进入root权限再进行操作。
  sudo ldconfig #使链接生效

如果出现“/sbin/ldconfig.real: /usr/lib/nvidia-375/libEGL.so.1 is not a symbolic link

    /sbin/ldconfig.real: /usr/lib32/nvidia-375/libEGL.so.1 is not a symbolic link”这样的错误,可以输入如下几行再进行操作:
        sudo mv /usr/lib/nvidia-375/libEGL.so.1 /usr/lib/nvidia-375/libEGL.so.1.org
        sudo mv /usr/lib32/nvidia-375/libEGL.so.1 /usr/lib32/nvidia-375/libEGL.so.1.org
        sudo ln -s /usr/lib/nvidia-375/libEGL.so.375.39 /usr/lib/nvidia-375/libEGL.so.1
        sudo ln -s /usr/lib32/nvidia-375/libEGL.so.375.39 /usr/lib32/nvidia-375/libEGL.so.1

python最好直接安装Anaconda,不然可能出现很多问题。
安装包依赖,python的pip和easy_install和git,在如下链接:
#http://blog.csdn.net/hyy0228/article/details/53762930

安装Anaconda:

提示:之前安装的是Anaconda2,以及配置了python的依赖环境后,pytorch无法安装到home/ai/anaconda2.不知道是哪个出现了问题,但是删除了依赖环境和Anaconda2之后,
      安装anaconda3,torch就能安装了。
官网下载Anaconda3的sh文件
执行sudo bash Anaconda3----------------------.
    #注意,需要另外开启一个terminal才能打开Anaconda。在原终端访问不了。

别装这个了,我们需要装的是pytorch。

安装torch:
1. git clone https://github.com/torch/distro.git ~/torch –recursive
2. 进入torch目录,执行 bash install-deps
3. ./install.sh #最后会要你输入一个yes
4. source ~/.bashrc #添加环境变量
5. 输入 th 测试是否安装成功。

建设Juptyer notebook远程服务器配置:

blog.csdn.net/u013473520/article/details/50696771
blog.csdn.net/bitboy_star/article/details/51427306

Jupyter Notebook建设双核Python(python2和python3)

https://stackoverflow.com/questions/28831854/how-do-i-add-python3-kernel-to-jupyter-ipython
看这个网址。应该就如下两个语句就行了:
    python2 -m pip install ipykernel
    python2 -m ipykernel install --user
但检测的时候,用错了语句,所以多输入了几个其他语句。理论上这两句就行了。

安装opencv:

# www.cnblogs.com/arkenstone/p/6490017.html 从这个网站可以得到官网安装呢opencv的做法
但我的经验是,这些都是假的!!!!!!!!!!!!!!cuda8.0和opencv各种问题。。。
使用如下指令直接安装 opencv-python:
    pip install opencv-python
直接装也是可以的,但是不要装opencv3.3,装opencv3.2.直接就能安装成功。

安装opencv2.4.13:
    http://www.cnblogs.com/darkknightzh/p/5638117.html
    按照这个网址的教程安装即可。

安装pytorch:

直接使用官网的命令:  conda install pytorch torchvision cuda90 -c pytorch
可能是之前安装了python的环境和依赖的相关东西,所以安装的时候出现了问题。
1. 出现了home/ai/anaconda2不能读入;    2. conda: command not found.
解决方式:
    sudo chown -R ai:ai /home/ai/anaconda3/      #解决权限问题
    用conda update conda              #解决conda命令问题

  官网:pytorch.org
  官网上有三种安装方式,conda,pip和source
  使用pip安装,
    pip3 install http://download.pytorch.org/whl/cu90/torch-0.3.0.post4-cp36-cp36m-linux_x86_64.whl
    pip3 install torchvision
  他提示pip未更新到最新状况。在更新到最新状况后,发现仍然不行。
    使用pip -V,发现版本是3.6.2
    使用pip2 -V,发现版本是2.7
    使用pip3 -V,发现版本是3.5

  所以发现是pip3的问题,在输入 alias “pip3.6”=”python3.6 -m pip $1”之后,就可以使用pip3.6安装。
  将pip3.6带入官网上的pip3就能安装pytorch了。

你可能感兴趣的:(ubuntu-配置,pytorch,gtx1080ti,cuda9-0,anaconda3,jupyter)