【浅谈守护进程】Demo:后台监控程序-- Python实现

前言

最近在做的项目需要定期检测某个进程是否运行,若挂了自动重启,脑袋一拍觉得需要这样一个守护进程 来进行监控,于是顺便复习了一下守护进程。

正文

什么是守护进程?

守护进程(daemon)是生存期长的一种进程。它们常常在系统引导装入时启动,仅在系统关闭时才终止。因为它们没有控制终端,所以说它们是在后台运行的。
—–《APUE》

我们需求就是默默地定期执行任务 与守护进程非常的匹配。

编写一个守护进程


守护进程需要

  1. 设置文件模式创建屏蔽字。
  2. 没有控制终端。
  3. 确定工作目录。
  4. 关闭不再需要的文件描述符。
  5. 告别标准输入输出

如何实现

文件模式屏蔽字

只需要通过umask() 即可,由继承(至于为什么是继承,请看后面)得到的文件模式创建屏蔽字可能已经被修改为拒绝某些权限,所以我们最好根据需要进行重新设置。

甩掉控制终端

我们希望守护进程在后台默默运行不受控制终端的控制。这里是通过setsid() 函数来实现。调用这个函数的效果是:

1)创建一个新会话(session)
2)创建一个新进程组。
3)调用进程成为 新会话 的首进程
4)调用进程成为 新进程组 的组长进程
5)调用进程失去控制终端

最后一条正是我们需要的效果,但这个函数也有前提条件。那就是调用函数不能是进程组的组长进程,为了达到这个条件,我们通常的做法是,首先调用fork() 然后父进程退出,由子进程来setsid()。因为,子进程获得的进程组ID和自己的PID必然不同,也就是子进程必然不是进程组的组长进程,可以顺利调用setsid()

潜在的BUG

在基于System V的系统如Linux,存在以下的实现

当会话首进程打开第一个尚未与一个会话相关联的终端设备时,只要在调用open() 时没有指定O_NOCTTY标志,那么System V派生的系统将此作为控制终端分配给此会话。 —《APUE》

为了消除这个BUG,我们在通常的做法(先调用fork() 然后父进程退出,由子进程来setsid())之后,再调用一次fork(),然后再次让父进程退出,使用子进程,这样子进程不是会话(组)首进程,就消除了这个BUG。
当然也可以在之后每次open终端设备时加上O_NOCTTY标志。。。。

同时,在glibc中的daemon() 就因为其实现只是fork() 一次,存在这个BUG(来自man)

确定工作目录

这里主要是因为守护进程其长期工作的特性,如果当前目录为挂载的文件系统,会导致其文件系统不能被卸载。所以我们用chdir()显式地设置工作目录。

关闭不再需要的文件描述符

还是由于fork() 继承的原因可能具有不需要一些文件描述符,所以我们要显式的关闭。

告别标准输入输出

。。。其实前面都关了,不过考虑到某些和标准输出输入错误扯上关系的库函数,我们就把0,1,2设置为/dev/null


Demo:后台监控程序—Python实现

#!/usr/bin/env python
# coding=utf-8
# Jack Kang
import os
import time
import sys

# 检测port对应节点是否存活
def check(port):
    isAlive = "ps -ef | grep \"" + port + " \[cluster\]\"" 
    recovery = "redis-server ./" + port + "/redis.conf"  
    if os.system(isAlive):  #判断
        os.system(recovery) #进程不存在,重启节点



#设置为守护进程 

stdin = '/dev/null'
stdout = '/dev/null'
stderr = '/dev/null'

try:
    pid = os.fork()
    if pid > 0 :
        sys.exit(0)
except OSError, e:
    print "error #1"
    sys.exit(1)

os.chdir("./redis_cluster") # 切换工作目录
os.umask(0)                 # 设置文件模式创建屏蔽字
os.setsid()                 # 甩掉控制终端

# 第二次fork 保证子进程不是会话首进程
try:
    pid = os.fork()
    if pid > 0:
        sys.exit(0)        #父进程退出
except OSError:
    print "error #2"
    sys.exit(1)

for f in sys.stdout, sys.stderr: 
    f.flush()              # 刷新缓冲区

#将标准输出输入错误改为/dev/null   
si = open(stdin, 'r')
so = open(stdout, 'a+')
se = open(stderr, 'a+', 0)
os.dup2(si.fileno(), sys.stdin.fileno())
os.dup2(so.fileno(), sys.stdout.fileno())
os.dup2(se.fileno(), sys.stderr.fileno())

#主循环 每5s检测port进程是否存活
port = sys.argv[1]  
while True:
    check(port)
    time.sleep(5)

其实C实现和Python很像啦。这里就偷懒不写出C实现了。。。有空补上。

两次fork的结果截图

结果

可以看到pid 不等于sid 所以不是会话首进程

引用及参考

APUE第十三章(守护进程)第九章(进程关系)
Demo 中守护进程部分的实现 主要参考了Python实例浅谈之五Python守护进程和脚本单例运行

才疏学浅,不足之处,欢迎指正。

你可能感兴趣的:(小小总结)