历史上,Linux 的启动一直采用init进程。
下面的命令用来启动服务。
$ sudo /etc/init.d/apache2 start
# 或者
$ service apache2 start
这种方法有两个缺点。
init
进程是串行启动,只有前一个进程启动完,才会启动下一个进程。init
进程只是执行启动脚本,不管其他事情。脚本需要自己处理各种情况,这往往使得脚本变得很长。Systemd 就是为了解决这些问题而诞生的。它的设计目标是,为系统的启动和管理提供一套完整的解决方案。根据 Linux 惯例,字母d
是守护进程(daemon)的缩写。 Systemd 这个名字的含义,就是它要守护整个系统。
Systemd 是 Linux 系统工具,用来启动守护进程,已成为大多数发行版的标准配置。Systemd 是一系列工具的集合,其作用也远远不仅是启动操作系统,它还接管了后台服务、结束、状态查询,以及日志归档、设备管理、电源管理、定时任务等许多职责,并支持通过特定事件(如插入特定 USB 设备)和特定端口数据触发的 On-demand(按需)任务。Systemd 的后台服务还有一个特殊的身份——它是系统中 PID 值为 1 的进程。
Systemd 默认从目录 /etc/systemd/system/ 读取配置文件。但是,里面存放的大部分文件都是符号链接,指向目录 /usr/lib/systemd/system/,真正的配置文件存放在那个目录。
Unit 文件按照 Systemd 约定,应该被放置指定的三个系统目录之一中。这三个目录是有优先级的,越靠上的优先级越高。因此,在三个目录中有同名文件的时候,只有优先级最高的目录里的那个文件会被使用。
Systemd 可以管理所有系统资源,不同的资源统称为 Unit(单位)。
在 Systemd 的生态圈中,Unit 文件统一了过去各种不同系统资源配置格式,例如服务的启/停、定时任务、设备自动挂载、网络配置、虚拟内存配置等。而 Systemd 通过不同的文件后缀来区分这些配置文件。
Systemd 支持的 12 种 Unit 文件类型
.automount:用于控制自动挂载文件系统,相当于 SysV-init 的 autofs 服务
.device:对于 /dev 目录下的设备,主要用于定义设备之间的依赖关系
.mount:定义系统结构层次中的一个挂载点,可以替代过去的 /etc/fstab 配置文件
.path:用于监控指定目录或文件的变化,并触发其它 Unit 运行
.scope:这种 Unit 文件不是用户创建的,而是 Systemd 运行时产生的,描述一些系统服务的分组信息
.service:封装守护进程的启动、停止、重启和重载操作,是最常见的一种 Unit 文件
.slice:用于表示一个 CGroup 的树,通常用户不会自己创建这样的 Unit 文件
.snapshot:用于表示一个由 systemctl snapshot 命令创建的 Systemd Units 运行状态快照
.socket:监控来自于系统或网络的数据消息,用于实现基于数据自动触发服务启动
.swap:定义一个用户做虚拟内存的交换分区
.target:用于对 Unit 文件进行逻辑分组,引导其它 Unit 的执行。它替代了 SysV-init 运行级别的作用,并提供更灵活的基于特定设备事件的启动方式
.timer:用于配置在特定时间触发的任务,替代了 Crontab 的功能
# 重新加载一个服务的配置文件
$ sudo systemctl reload nginx.service
# 重载所有修改过的配置文件
$ sudo systemctl daemon-reload
启动服务
$ sudo systemctl start nginx
查看一下该服务的状态
$ sudo systemctl status nginx
停止服务
$ sudo systemctl stop nginx.service
服务停不下来。这时候就不得不"杀进程"了
$ sudo systemctl kill nginx.service
重启服务
$ sudo systemctl restart nginx.service
开机启动 可省略.service
$ sudo systemctl enable nginx
# 等同于
$ sudo ln -s '/usr/lib/systemd/system/nginx.service' '/etc/systemd/system/nginx.service'
注意,键值对的等号两侧不能有空格。
# Stop dance for nginx
# =======================
#
# ExecStop sends SIGSTOP (graceful stop) to the nginx process.
# If, after 5s (--retry QUIT/5) nginx is still running, systemd takes control
# and sends SIGTERM (fast shutdown) to the main process.
# After another 5s (TimeoutStopSec=5), and if nginx is alive, systemd sends
# SIGKILL to all the remaining processes in the process group (KillMode=mixed).
#
# nginx signals reference doc:
# http://nginx.org/en/docs/control.html
#
[Unit]
Description=A high performance web server and a reverse proxy server
Documentation=man:nginx(8)
After=network.target nss-lookup.target
[Service]
Type=forking
PIDFile=/run/nginx.pid
ExecStartPre=/usr/sbin/nginx -t -q -g 'daemon on; master_process on;'
ExecStart=/usr/sbin/nginx -g 'daemon on; master_process on;'
ExecReload=/usr/sbin/nginx -g 'daemon on; master_process on;' -s reload
ExecStop=-/sbin/start-stop-daemon --quiet --stop --retry QUIT/5 --pidfile /run/nginx.pid
TimeoutStopSec=5
KillMode=mixed
[Install]
WantedBy=multi-user.target
如上所示,Systemd 服务的 Unit 文件可以分为三个配置区段:
用来 Service 的配置,只有 Service 类型的 Unit 才有这个区块。它的主要字段分为服务生命周期和服务上下文配置两个方面。
注意:如果在 ExecStart、ExecStop 等属性中使用了 Linux 命令,则必须要写出完整的绝对路径。对于 ExecStartPre 和 ExecStartPost 辅助命令,若前面有个 “-” 符号,表示忽略这些命令的出错。因为有些 “辅助” 命令本来就不一定成功,比如尝试清空一个文件,但文件可能不存在。
在 Unit 文件中,有时会需要使用到一些与运行环境有关的信息,例如节点 ID、运行服务的用户等。这些信息可以使用占位符来表示,然后在实际运行被动态地替换实际的值。
这部分配置的目标模块通常是特定运行目标的 .target 文件,用来使得服务在系统启动时自动运行。这个区段可以包含三种启动约束:
multi-user.target
,表示多用户命令行状态;另一个是graphical.target
,表示图形用户状态,它依赖于multi-user.target
。官方文档有一张非常清晰的 Target 依赖关系图。root@ip-172-31-16-69:/lib/systemd/system# find /etc/systemd/system/* -type d
/etc/systemd/system/cloud-final.service.wants
/etc/systemd/system/cloud-init.target.wants
/etc/systemd/system/emergency.target.wants
/etc/systemd/system/final.target.wants
/etc/systemd/system/getty.target.wants
/etc/systemd/system/mdmonitor.service.wants
/etc/systemd/system/multi-user.target.wants
/etc/systemd/system/network-online.target.wants
/etc/systemd/system/open-vm-tools.service.requires
/etc/systemd/system/paths.target.wants
/etc/systemd/system/rescue.target.wants
/etc/systemd/system/sleep.target.wants
/etc/systemd/system/snapd.mounts.target.wants
/etc/systemd/system/sockets.target.wants
/etc/systemd/system/[email protected]
/etc/systemd/system/sysinit.target.wants
/etc/systemd/system/timers.target.wants
# 列出正在运行的 Unit
$ systemctl list-units
# 列出所有Unit,包括没有找到配置文件的或者启动失败的
$ systemctl list-units --all
# 列出所有没有运行的 Unit
$ systemctl list-units --all --state=inactive
# 列出所有加载失败的 Unit
$ systemctl list-units --failed
# 列出所有正在运行的、类型为 service 的 Unit
$ systemctl list-units --type=service
# 查看 Unit 配置文件的内容
$ systemctl cat docker.service
Unit
案例创建x11服务文件x11.service
[Unit]
Description=x11vnc server
After=network.target
[Service]
Type=forking
#PIDFile=/root/.vnc/x11vnc.pid
ExecStart=/usr/bin/x11vnc -display :1 -forever -bg -rfbauth /root/.vnc/passwd
#ExecReload=/bin/kill -s HUP $MAINPID
#ExecStop=/bin/kill -s TERM $MAINPID
[Install]
WantedBy=multi-user.target
创建gunicorn
服务文件gunicorn.service
[Unit]
Description=reset snapshot server
After=network.target
[Service]
WorkingDirectory=/root/flask
PIDFile=/root/flask/log/gunicorn.pid
ExecStart=/usr/local/bin/gunicorn -w 2 -b 0.0.0.0:5000 pro_resnapshot:app
ExecReload=/bin/kill -s -HUP $MAINPID
ExecStop=/bin/kill -s TERM $MAINPID
#ExecStart=/bin/echo execstart
#ExecReload=/bin/echo execreload
#ExecStop=/bin/echo execstop
#ExecStartPre=/bin/echo execstartpre
#ExecStartPost=/bin/echo execstartpost
#ExecStopPost=/bin/echo execstoppost
Type=simple
[Install]
WantedBy=multi-user.target
一般我们使用apt或yum安装的软件会自动创建Unit文件, 直接使用systemctl status xxx就可以了, 下图enabled说明是开机启动, 否则systemctl enable xxx设置开机启动
如果没有可以自己创建
/usr/lib/systemd/system
目录下sudo systemctl daemon-reload
sudo systemctl enable x11
sudo systemctl enable x11
Systemd 通过其标准日志服务 Journald 提供的配套程序 journalctl 将其管理的所有后台进程打印到 std:out(即控制台)的输出重定向到了日志文件。
Systemd 的日志文件是二进制格式的,必须使用 Journald 提供的 journalctl 来查看,默认不带任何参数时会输出系统和所有后台进程的混合日志。
默认日志最大限制为所在文件系统容量的 10%,可以修改 /etc/systemd/journald.conf 中的 SystemMaxUse 来指定该最大限制。
# 查看所有日志(默认情况下 ,只保存本次启动的日志)
$ sudo journalctl
# 查看内核日志(不显示应用日志):--dmesg 或 -k
$ sudo journalctl -k
# 查看系统本次启动的日志(其中包括了内核日志和各类系统服务的控制台输出):--system 或 -b
$ sudo journalctl -b
$ sudo journalctl -b -0
# 查看上一次启动的日志(需更改设置)
$ sudo journalctl -b -1
# 查看指定服务的日志:--unit 或 -u
$ sudo journalctl -u docker.servcie
# 查看指定服务的日志
$ sudo journalctl /usr/lib/systemd/systemd
# 实时滚动显示最新日志
$ sudo journalctl -f
# 查看指定时间的日志
$ sudo journalctl --since="2012-10-30 18:17:16"
$ sudo journalctl --since "20 min ago"
$ sudo journalctl --since yesterday
$ sudo journalctl --since "2015-01-10" --until "2015-01-11 03:00"
$ sudo journalctl --since 09:00 --until "1 hour ago"
# 显示尾部的最新 10 行日志:--lines 或 -n
$ sudo journalctl -n
# 显示尾部指定行数的日志
$ sudo journalctl -n 20
# 将最新的日志显示在前面
$ sudo journalctl -r -u docker.service
# 改变输出的格式:--output 或 -o
$ sudo journalctl -r -u docker.service -o json-pretty
# 查看指定进程的日志
$ sudo journalctl _PID=1
# 查看某个路径的脚本的日志
$ sudo journalctl /usr/bin/bash
# 查看指定用户的日志
$ sudo journalctl _UID=33 --since today
# 查看某个 Unit 的日志
$ sudo journalctl -u nginx.service
$ sudo journalctl -u nginx.service --since today
# 实时滚动显示某个 Unit 的最新日志
$ sudo journalctl -u nginx.service -f
# 合并显示多个 Unit 的日志
$ journalctl -u nginx.service -u php-fpm.service --since today
# 查看指定优先级(及其以上级别)的日志,共有 8 级
# 0: emerg
# 1: alert
# 2: crit
# 3: err
# 4: warning
# 5: notice
# 6: info
# 7: debug
$ sudo journalctl -p err -b
# 日志默认分页输出,--no-pager 改为正常的标准输出
$ sudo journalctl --no-pager
# 以 JSON 格式(单行)输出
$ sudo journalctl -b -u nginx.service -o json
# 以 JSON 格式(多行)输出,可读性更好
$ sudo journalctl -b -u nginx.serviceqq
-o json-pretty
# 显示日志占据的硬盘空间
$ sudo journalctl --disk-usage
# 指定日志文件占据的最大空间
$ sudo journalctl --vacuum-size=1G
# 指定日志文件保存多久
$ sudo journalctl --vacuum-time=1years
查看原文:Linux Systemd 服务管理教程
关注公众号 "字节航海家" 及时获取最新内容