实验室服务器配置

目录

  • 前言
  • 服务器硬件
  • 服务器交付前
  • 服务器配置
    • 查看服务器IP地址并SSH连接
    • GPU(显卡驱动、CUDA、cudnn)
  • 服务器日常管理
    • 创建公共文件夹
    • 公共文件夹下载公用文件(如Anaconda)
    • 设立新用户

前言

最近实验室新配了一台服务器,本文记录服务器配置相关流程和遇到的问题。

服务器硬件

实验室服务器配置_第1张图片
图中LSI 9271-81应是 LSI 9271-8i。

服务器交付前

商家安装了UBUNTU18.04系统,磁盘阵列选择RAID5,RAID5兼顾安全性和空间利用率。

在通常情况下,RAID有下几种分类:
RAID0:由多个硬盘并发协同工作完成数据的读写,数据被均匀分布在各个硬盘上,一般情况下,使用的硬盘越多,读写的速度越快。RAID0的特点是读写速度快,并且价格便宜;缺点是安全性相对较差,因为在RAID0中的一个硬盘出现故障时,整个阵列的数据将会丢失。RAID0是最快和最有效的磁盘阵列类型,但没有容错功能。
RAID1:称为磁盘镜像。原理是在两个硬盘之间建立完全的镜像,即所有数据会被同时存放到两个物理硬盘上,当一个磁盘出故障时,仍可从另一个硬盘中读取数据,因此安全性得到保障。但系统的成本大大提高,因为系统的实际有效硬盘空间仅为所有硬盘空间的一半。
RAID 0+1:为RAID0和RAID1的组合,即由两个完全相同配置的RAID0形成镜像关系,既提高了阵列的读取速度,又保障了阵列数据的安全性,当然,为此付出的代价同样是价格昂贵。
RAID3:是把数据分成多个“块”,按照一定的容错算法,存放在N+1个硬盘上,实际数据占用的有效空间为N个硬盘的空间总和,而第N+1个硬盘上存储的数据是校验容错信息,当这N+1个硬盘中的其中一个硬盘出现故障时,从其它N个硬盘中的数据也可以恢复原始数据,这样,仅使用这N个硬盘也可以带伤继续工作(如采集和回放素材),当更换一个新硬盘后,系统可以重新恢复完整的校验容错信息。由于在一个硬盘阵列中,多于一个硬盘同时出现故障率的几率很小,所以一般情况下,使用RAID3,安全性是可以得到保障的。与RAID0相比,RAID3在读写速度方面相对较慢。
RAID5:RAID5 和RAID3的原理非常类似,硬盘的有效使用空间也是一样的,只是其算法以及数据分块方式有所不同。 使用的容错算法和分块大小决定RAID使用的应用场合,在通常情况下,RAID3比较适合大文件类型且安全性要求较高的应用,如视频编辑、硬盘播出机、大型数据库等;而RAID5适合较小文件的应用,如文字、图片、小型数据库等。
下表是几个常用的RAID级别的特征:

RAID级别 0 1 3 5
容错性 N Y Y Y
冗余类型 N 复制 奇偶校验 奇偶校验
热备份选择 N Y Y Y
硬盘要求 一个或多个 偶数个 至少三个 至少三个
有效硬盘容量 全部硬盘容量 硬盘容量50% 硬盘容量n-1/n 硬盘容量n-1/n

RAID级别的选择有三个主要因素:可用性(数据冗余)、性能和成本。如果不要求可用性,选择RAID0以获得最佳性能。如果可用性和性能是重要的而成本不是一个主要因素,则根据硬盘数量选择RAID 1。如果可用性、成本和性能都同样重要,则根据一般的数据传输和硬盘的数量选择RAID3、RAID5。
实验室服务器配置_第2张图片

服务器配置

查看服务器IP地址并SSH连接

ifconfig

上面的命令可以获得IP地址,可以固定IP地址(参考),但通常来说,IP地址不会改变,可以不设置,我暂时没有设置。
下面服务器安装ssh(参考):

sudo apt install openssh-server

然后通过IP地址、用户名、密码便可远程登录服务器。

GPU(显卡驱动、CUDA、cudnn)

nvidia-smi

实验室服务器配置_第3张图片
发现现有的英伟达驱动、CUDA版本过低,进行卸载重装。

驱动网址
实验室服务器配置_第4张图片
查看下载链接,进行下载:

sudo wget https://cn.download.nvidia.cn/XFree86/Linux-x86_64/450.57/NVIDIA-Linux-x86_64-450.57.run

卸载旧驱动(重启):

sudo apt-get purge nvidia*
sudo apt autoremove
sudo apt-get --purge remove "*nvidia*"
sudo reboot

安装新驱动:

sudo sh NVIDIA-Linux-x86_64-450.57.run

安装完后nvidia-smi查看:
实验室服务器配置_第5张图片
发现cuda version也升级了,OK。

服务器日常管理

创建公共文件夹

cd /home/
sudo mkdir public_folder

公共文件夹下载公用文件(如Anaconda)

cd public_folder
sudo wget https://repo.anaconda.com/archive/Anaconda3-2020.02-Linux-x86_64.sh

设立新用户

关于创建新用户

你可能感兴趣的:(服务器)