从零开始为实验室搭建一个多人使用远程登录服务器

TO从零开始为实验室搭建一个多人使用远程登录服务器C

动机:课题组服务器电脑原来是windows server,现在由于多人使用的需要,要实现在局域网内,每个人都可以调用,各自有各自的账户、密码、文件夹,编程环境互不影响。
做法:安装ubuntu18.04,利用SSH建立远程连接,将服务器连接到办公室网络
意外收获:居然可以通过连接VPN远程登入办公室服务器,效果很棒
这份教程可以教会你
1.如何从零搭建一台可以多人使用的ubuntu服务器;
2.多人使用可以上传下载文件,可以在本地浏览器运行服务器的jupyter notebook内核
3.包括一些常见问题:
• 如何管理多人使用服务器(新建、监控、剔除用户)?
• 如何多人共用一套anaconda环境,避免重复安装?
• 如何新建虚拟环境,为每个人建立自己的独立环境?
• 如何应对独立环境里面安装tensorflow不能import的问题?
• 如何解决tensorflow-GPU版本的安装问题?
• 如何解决ubuntu18.04开机黑屏问题?

以下是0901~0908在课题组台式机的测试记录
第一部分 服务端(管理员
1.备份电脑
原来是windows系统,我用老毛桃软件备份到硬盘里面(打开软件,有备份选项),以防后期要恢复成windows系统

2.安装ubuntu系统
a.用u盘下载ubuntu18.04系统
b.安装ubuntu18.04系统
c.系统设置信息:
▪ 语言:英文
▪ name:l
▪ computer’s name :B204
▪ user name:l
▪ passpord:l1234
d.联网:台式机或者服务器没有无线网卡模组,要外接模组,那个黑色长的硬件就是、
e.有的博客说要更换源,我也没换,如果下载东西慢可以换
f.安装Python环境,首选Anaconda3:
▪ 在清华镜像网站https://mirrors.tuna.tsinghua.edu.cn/anaconda/archive下载对应ubuntu系统的.sh文件(年限近一点)
▪ 打开对应文件夹到终端(Ctrl+alt+T打开终端用cd命令,或者在文件夹里面右击选择打开到终端)
▪ 命令:-bash 安装包名称
g.如果conda不好使,应该是环境路径没配好
打开配置文件 sudo gedit ~/ .bashrc
在最后面加一句 export PATH=$PATH:/home/lyl/anaconda3/bin
source ~/.bashrc

3.构建多个用户(新建群组、用户、权限、文件夹)
a.新建群组students:sudo groupadd students
查看群组: sudo cat /etc/group
最后一行有students❌1001:说明群组建好了
b.新建用户THQ
sudo useradd -r -N -m -s /bin/bash THQ 默认会在home下面新建一个THQ文件夹
查看一下用户sudo cat /etc/shadow
最后一行有THQ好了
c.设置密码
sudo passwd THQ 按照提示输入两遍密码 THQ1234
d.加入群组
加入群组 sudo usermod -g students THQ
查看一遍群组 先不分配sudo权限sudo adduser THQ sudo
e.分配sudo权限
f.再新建一个SK(量化新建)
sudo useradd -r -N -m -s /bin/bash SK
sudo passwd SK
sudo usermod -g students SK
-d<登入目录> 指定用户登入时的目录。 -g<群组> 初始群组。 -G<群组> 非初始群组。 -m 自动创建用户的家目录。 -M 不要创建用户的家目录。-r 添加系统账户 -N 不要创建以用户名称为名的群组。 -s 指定用户登入后所使用的shell。

4.配置多用户共享anaconda环境(避免每个人都要安装一遍)
配置环境变量供多用户使用Anaconda
执行以下语句,打开全局变量文件;sudo gedit /etc/profile
在文件最后添加以下语句,保存并退出文件,这样可向所有用户交代Anaconda所在路径;
export PATH=/home/lyl/anaconda3/bin:$PATH
执行source命令更新source /etc/profile
执行以下命令echo $PATH

5.新建虚拟环境(以后每个人使用的时候要先在里面)
执行以下命令创建虚拟环境,env_THQ1为环境名(可替换),并设置python版本;
conda create -n env_THQ1 python=3.7 (Python可以不指定,用默认的可以)
激活环境;conda activate env_THQ1
首次激活可能会报错(得激活conda init bash)
安装完成后,执行以下命令退出虚拟环境;conda deactivate
执行以下命令,可查看虚拟环境列表。conda env list

6.安装第三方包,
如安装cpu版的tensorFlow,直接conda install tensorFlow是cpu版本,安装后不能import
原因是路径问题,安装这个包就可以了
conda install nb_conda

7.安装GPU版的tensorflow
比如在WH账户中,
• 新建一个虚拟环境,conda create -n tf;激活conda activate tf进入虚拟环境
• 查看显卡型号 lshw -c video得到Geforce GT720
ubuntu-drivers devices可以看到推荐的显卡驱动比如nvidia-470
• 禁用nouveau
打开终端输入:sudo gedit /etc/modprobe.d/blacklist.conf
在blacklist.conf文件末尾加上这两行,并保存:
blacklist nouveau
ptions nouveau modeset=0
执行命令:sudo update-initramfs -u //应用更改
重启系统,验证是否禁用nouveau
lsmod | grep nouveau 没反应说明
• 卸载旧版本nvidia驱动:sudo apt-get remove --purge nvidia
• 自动安装推荐的显卡驱动:sudo ubuntu-drivers autoinstall
重启,reboot,查看NVIDIA版本检验是否安装完成 nvidia-smi 可以看到cuda版本11.4
• 自动找合适版本的安装包安装conda install tensorflow-gpu,比如我这个720显卡就自动cuda11.4 安装了2.4.1的tensorflow-gpu
查看有没有起作用,import tensorflow as tf,、tf.config.experimental.list_physical_devices(“GPU”),会有显示

8.安装SSH
a.安装SSH
sudo apt-get install openssh-server openssh-client
b.查看SSH服务状态
service ssh status
c.改配置文件
sudo gedit /etc/ssh/sshd_config
按照建议修改权限
passwordAuthentication yes
PermitRootLogin yes
d.重启ssh
service ssh restart

9.查看ip
sudo apt install net-tools(安装网络工具)(出现不能安装的问题 更新源 sudo apt-get update)
ifconfig
办公室路由器ip192.168.10.x
校园网ip 100.80.186.xxx
ubuntu连接办公室路由器的时候,连接办公室路由器可以连接
Ubuntu连接tj-wifi时,直接连接校园网不好使,连接办公室路由器好使,连接热点再连VPN好使

10.管理用户
a.新建目录
mkdir SK
删除目录
rm -d SK
b.查看登录
who 看信息
w看用户
踢出用户 pkill -kill -t pts/1

11.意外黑屏修复
用U盘启动
命令行
sudo add-apt-repository ppa:yannubuntu/boot-repair添加源
sudo apt-get update
sudo apt-get install -y boot-repair
boot-repair
进入recovery模式 高级选项root
sudo apt-get remove --purge nvidia* 设置了一个密码lylLYL1234
sudo reboot

第二部分 客户端(大家使用)
1.Windows用户
a.文件交互,安装MobaXterm
登录用户名,服务器ip(100.80.186.xxx),端口(默认22),输入密码
在软件里面可以上传和下载文件

b.本地浏览器使用Jupyte notebook
直接在cmd里面输入ssh -L 8888:localhost:8888 [email protected] -p 22
弹出来的网址粘贴到浏览器,就可以丝滑享受了
用ctrl+C结束jupyter notebook
用logout退出SSH
c.本地pycharm 调用服务器计算资源
用专业版pycharm,连接ip,输入用户和密码

2.Mac用户
类似,用命令行登录SSH输入ip、端口、用户、密码

你可能感兴趣的:(ubuntu,linux,服务器,经验分享)