Ubuntu深度学习服务器环境部署

系统的安装

Ubuntu 14.04

1.在安装系统前,制作14.04系统U盘
2.U盘启动
3.选择中文或者英文都无所谓(这一步可能影响下载源的设置)
4.不下载更新,直接继续
5.选择其他选项,手动设置分区(重点)

  • 一般设置四个足够了,其他的将自动配置到相应分区
  • /boot,主分区,500MB(我设置的1024MB)
  • /,主分区,229300MB
  • /home,主分区,和/一样大
  • swap,主分区,内存两倍大(我设置的20480MB,貌似~)
  • 引导器安装在系统盘,选sda(这个也有讲究,对于单系统和多系统是不一样的)

6.安装过程中,能skip就skip,省时间
7.安装完,重启,delete进入bios修改为ubuntu启动

显卡驱动安装

Nvidia 390.87(run file)

在显卡驱动安装之前,有一点一定要注意,当然大多数情况下不会出现这一步

  • 安装完系统千万不要更新
  • 安装完系统千万不要更新
  • 安装完系统千万不要更新
    因为更新以后可能导致一个问题
would you like to register the kernel module sources with DKMS? This will allow DKMS to automatically build a new kernel. if you***

然后你就会迎来一个Error

ERROR:Failed to run '/usr/sbin/dkms build -m nvidia -v 390.87 -k 4.4.0.148-generic':
Kernel preparation unnecessary for the kernel. Skipping...

Build module:
cleaning build area....
******

这是内核版本过高,驱动版本低了,原因是做了升级操作,这个操作可能是由于你点了系统的更新,或者手动upgrade或者像我一样在ubuntu14.04上安装了cuda9(仅支持16.04和18.04)

1.驱动文件要先下好,或者拷贝到home下面
2.首先限制Ubuntu自带的驱动nouveau

  • sudo apt-get purge nvidia*删除可能存在的旧版nvidia驱动
  • sudo vim /etc/modprobe.d/blacklist-nouveau.conf创建一个配置文件并编辑
blacklist nouveau
options nouveau modeset=0
  • sudo update-initramfs -u更新一下
  • reboot 重启
  • 启动后,lsmod | grep nouveau 如果没有输出就说明已经禁用了,否则禁用失败

3.sudo service lightdm stop 关闭x-window,然后ctrl+alt+f1切换到tty1控制台,输入用户名和密码
4.sudo chmod a+x NVidia-390.run给权限
5.sudo ./NVidia-390.run -no-x-check -no-nouveau-check -no-opengl-files

  • -no-x-check(可省)
  • -no-nouveau-check(可省)
  • -no-opengl-files用于解决循环登录问题

6.安装过程中,会有几个提示

  • the distribution-provided pre-install script failed!××× 选择继续
  • 还有一个关键的地方,would you like to run the nvidia-xconfig utility to automatically update your x configuration file so that the NVidia x driver will be used when you restart X? 选择no,这个可能导致多显卡在进入系统时导致low graphics×××,无法进入桌面

7.当不小心在上一步,选择了yes导致了low graphics那个问题时,可以进入tty1界面,输入

sudo cp /etc/X11/xorg.conf.failsafe /etc/X11/xorg.conf

这样可以还原,但是不一定有直接选择no那么稳定,没有测试过

远程SSH连接配置

ssh方式

1.首先设置静态ip,右上角网络连接,编辑,保存
2.安装ssh服务端

sudo apt install openssh-server

3.远程连接测试,找一台安装了ssh的机器

ssh [email protected].*.*
  • 如果这台机器之前已经保存了服务器的ssh-key的话,可能连接时会报错,使用下面的命令重新更新下
ssh-keygen -R 192.168.**.**

4.远程进入GNome环境

sudo nautilus

这一步的前提是ssh连接方式不能是 ssh user@ip这样的方式,而是ssh -X user@ip
否则,就会是如下的错误提示

error: XDG_RUNTIME_DIR not set in the environment.

(nautilus:4671): Gtk-WARNING **: cannot open display: 

5.在sudo scp 命令拷贝文件到服务器上时,出现如下错误提示

@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@
@    WARNING: REMOTE HOST IDENTIFICATION HAS CHANGED!     @
@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@
IT IS POSSIBLE THAT SOMEONE IS DOING SOMETHING NASTY!
Someone could be eavesdropping on you right now (man-in-the-middle attack)!
It is also possible that a host key has just been changed.
The fingerprint for the ECDSA key sent by the remote host is
******
Please contact your system administrator.
Add correct host key in /root/.ssh/known_hosts to get rid of this message.
Offending ECDSA key in /root/.ssh/known_hosts:1
  remove with: ssh-keygen -f "/root/.ssh/known_hosts" -R 192.168.***

解决方法已经写出来了
ssh-keygen -f "/root/.ssh/known_hosts" -R 192.168.***,前面可能还要加个sudo给个权限。

你可能感兴趣的:(Ubuntu深度学习服务器环境部署)