supervisor是个好工具。superviosr是一个Linux/Unix系统上的进程监控工具,Supervisor是用Python开发的一套通用的进程管理程序,能将一个普通的命令行进程变为后台daemon,并监控进程状态,异常退出时能自动重启。只要在supervisor的配置文件中,把要管理的进程的可执行文件的路径写进去即可。当子进程挂掉的时候,父进程可以准确获取子进程挂掉的信息的,可以选择是否自己启动和报警。supervisor还提供了一个功能,可以为supervisord或者每个子进程,设置一个非root的user,这个user就可以管理它对应的进程。
由于supervisor不能监控后台程序,而nginx默认是后台运行的,解决方法
第一种是直接在 nginx.conf 配置文件中增加 daemon off; 参数。
第二种则是在启动 Nginx 时追加命令,命令为:
/usr/sbin/nginx -g 'daemon off;'
command = /usr/local/bin/nginx 这个命令默认是后台启动,
加上-g ‘daemon off;’这个参数可解决这问题,这个参数的意思是在前台运行。
一、安装配置supervisor
apt install supervisor
新建Supervisor的Nginx配置文件 /etc/supervisor/conf.d/nginx.conf,文件如下:
; supervisor nginx config file
[program:nginx]
command = /usr/sbin/nginx -g 'daemon off;'
startsecs=0
autostart=true
autorestart=true
stdout_logfile=/var/log/nginx/nginx_sup.log
redirect_stderr=true
priority=10
stopasgroup=true
killasgroup=true
stopsignal=INT
startsecs=10
startretries=10
相关参数意义
[program: nginx]
;管理的子进程。后面的是名字,最好写的具有代表性,避免日后”认错“
command=/usr/local/nginx/sbin/nginx -g 'daemon off;'
;我们的要启动进程的命令路径,可以带参数。
directory=/root ;
;进程运行前,会先切换到这个目录
autorestart=true;
;设置子进程挂掉后自动重启的情况,有三个选项,false,unexpected和true。false表示无论什么情况下,都不会被重新启动;unexpected表示只有当进程的退出码不在下面的exitcodes里面定义的退出码的时候,才会被自动重启。当为true的时候,只要子进程挂掉,将会被无条件的重启
autostart=true ;
;如果是true的话,子进程将在supervisord启动后被自动启动,默认就是true
stderr_logfile=/home/work/super/nginx_error.log ;
;日志,没什么好说的
stdout_logfile=/home/work/super/nginx_stdout.log ;
;日志
environment=ASPNETCORE_ENVIRONMENT=Production ;
;这个是子进程的环境变量,默认为空
user=nginx ;
;可以用来管理该program的用户
stopsignal=INT
;进程停止信号,可以为TERM, HUP, INT, QUIT, KILL, USR1等,默认为TERM
startsecs=10 ;
;子进程启动多少秒之后,此时状态如果是running,我们认为启动成功了,默认值1
startretries=10 ; 当进程启动失败后,最大尝试的次数。当超过10次后,进程的状态变为FAIL,默认值3
stopasgroup=true
;这个东西主要用于,supervisord管理的子进程,这个子进程本身还有子进程。那么我们如果仅仅干掉supervisord的子进程的话,子进程的子进程有可能会变成孤儿进程。所以可以设置这个选项,把整个该子进程的整个进程组干掉。默认false
到这里基本就算是完成了,我们可以直接干掉nginx,然后再启动supervisor就可以了,它会自动把nginx启动起来
取消nginx默认的开机自动启动服务,以启用supervisor来托管nginx服务
关闭开机自动启动systemctl disable nginx
开机自动启动systemctl enable nginx
修改后记得更新 Supervisor 以及重启 Nginx 进程,命令:
$ supervisorctl reread # 重新读取配置
$ supervisorctl update # 更新配置
$ supervisorctl restart nginx # 重启 nginx
$ killall nginx # 杀掉所有的 nginx 进程
二、supervisorctrl操作命令
1、更新新的配置到supervisord
supervisorctl update
2、重新启动配置中的所有程序
supervisorctl reload
3、启动某个进程(program_name=你配置中写的程序名称)
supervisorctl start program_name
4、查看正在守候的进程
supervisorctl
5、停止某一进程 (program_name=你配置中写的程序名称)
supervisorctl stop program_name
6、重启某一进程 (program_name=你配置中写的程序名称)
supervisorctl restart program_name
7、停止全部进程
supervisorctl stop all
三、附录:supervisord配置文件详解
supervisord配置块详解:
– logfile:log文件路径
– logfile_maxbytes:log文件达到多少后自动进行轮转,单位是KB、MB、GB。如果设置为0则表示不限制日志文件大小
– logfile_backups:轮转日志备份的数量,默认是10,如果设置为0,则不备份
– loglevel:error、warn、info、debug、trace、blather、critical
– pidfile:pid文件路径
– umask:umask值,默认022
– nodaemon:如果设置为true,则supervisord在前台启动,而不是以守护进程启动
– minfds:supervisord在成功启动前可用的最小文件描述符数量,默认1024
– minprocs:supervisord在成功启动前可用的最小进程描述符数量,默认200
– nocleanup:防止supervisord在启动的时候清除已经存在的子进程日志文件
– childlogdir:自动启动的子进程的日志目录
– user:supervisord的运行用户
– directory:supervisord以守护进程运行的时候切换到这个目录
– strip_ansi:消除子进程日志文件中的转义序列
– environment:一个k/v对的list列表
supervisord program配置详解:
– command:启动程序使用的命令,可以是绝对路径或者相对路径
– process_name:一个python字符串表达式,用来表示supervisor进程启动的这个的名称,默认值是%(program_name)s
– numprocs:Supervisor启动这个程序的多个实例,如果numprocs>1,则process_name的表达式必须包含%(process_num)s,默认是1
– numprocs_start:一个int偏移值,当启动实例的时候用来计算numprocs的值
– priority:权重,可以控制程序启动和关闭时的顺序,权重越低:越早启动,越晚关闭。默认值是999
– autostart:如果设置为true,当supervisord启动的时候,进程会自动重启。
– autorestart:值可以是false、true、unexpected。false:进程不会自动重启,unexpected:当程序退出时的退出码不是exitcodes中定义的时,进程会重启,true:进程会无条件重启当退出的时候。
– startsecs:程序启动后等待多长时间后才认为程序启动成功
– startretries:supervisord尝试启动一个程序时尝试的次数。默认是3
– exitcodes:一个预期的退出返回码,默认是0,2。
– stopsignal:当收到stop请求的时候,发送信号给程序,默认是TERM信号,也可以是 HUP, INT, QUIT, KILL, USR1, or USR2。
– stopwaitsecs:在操作系统给supervisord发送SIGCHILD信号时等待的时间
– stopasgroup:如果设置为true,则会使supervisor发送停止信号到整个进程组
– killasgroup:如果设置为true,则在给程序发送SIGKILL信号的时候,会发送到整个进程组,它的子进程也会受到影响。
– user:如果supervisord以root运行,则会使用这个设置用户启动子程序
– redirect_stderr:如果设置为true,进程则会把标准错误输出到supervisord后台的标准输出文件描述符。
– stdout_logfile:把进程的标准输出写入文件中,如果stdout_logfile没有设置或者设置为AUTO,则supervisor会自动选择一个文件位置。
– stdout_logfile_maxbytes:标准输出log文件达到多少后自动进行轮转,单位是KB、MB、GB。如果设置为0则表示不限制日志文件大小
– stdout_logfile_backups:标准输出日志轮转备份的数量,默认是10,如果设置为0,则不备份
– stdout_capture_maxbytes:当进程处于stderr capture mode模式的时候,写入FIFO队列的最大bytes值,单位可以是KB、MB、GB
– stdout_events_enabled:如果设置为true,当进程在写它的stderr到文件描述符的时候,PROCESS_LOG_STDERR事件会被触发
– stderr_logfile:把进程的错误日志输出一个文件中,除非redirect_stderr参数被设置为true
– stderr_logfile_maxbytes:错误log文件达到多少后自动进行轮转,单位是KB、MB、GB。如果设置为0则表示不限制日志文件大小
– stderr_logfile_backups:错误日志轮转备份的数量,默认是10,如果设置为0,则不备份
– stderr_capture_maxbytes:当进程处于stderr capture mode模式的时候,写入FIFO队列的最大bytes值,单位可以是KB、MB、GB
– stderr_events_enabled:如果设置为true,当进程在写它的stderr到文件描述符的时候,PROCESS_LOG_STDERR事件会被触发
– environment:一个k/v对的list列表
– directory:supervisord在生成子进程的时候会切换到该目录
– umask:设置进程的umask
– serverurl:是否允许子进程和内部的HTTP服务通讯,如果设置为AUTO,supervisor会自动的构造一个url