如何监视一个进程,崩溃挂掉后自动重启

如何保证服务一直运行?如何保证即使服务挂掉了也能自动重启?在写服务程序时经常会碰到这样的问题。 

 

shell脚本

下面的shell通过一个while-do循环,用ps -ef|grep 检查loader进程是否正在运行,如果没有运行,则启动,这样就保证了崩溃挂掉的进程重新被及时启动。

必须注意两点:

1、ps |grep 一个进程时必须加上其路劲,否则容易grep到错误的结果;

2、必须用 -v 从结果中去除grep命令自身,否则结果非空。

 

#!/bin/sh
echo "Current DIR is " $PWD
while [ 1 ]
do
 propserverpid=`ps -ef|grep propserver|grep 6668|grep -v grep|awk '{print $2}'`
 if [ "$propserverpid" ]
 then
  echo "propserver is running,pid is " $propserverpid
  kill -9 $propserverpid 
 else
  echo "propserver is down ,now starting ..."
  nohup $PWD/propserver -c config.ini -p 6668 &
 fi
 sleep 5
done

 

 

 

 如果启动此shell时发现进程已经存在,说明以别的方式启动了进程而不是此shell,那么它会持续提醒找到进程,解决办法是,要么只用此shell启动服务,要么一经发现以其他方式启动的服务即kill掉,上面的语句就是这么干的:

 

    kill  - 9  $pidof $PWD / loader

 

另外运行脚本是老是提示这个错误:

: bad interpreter: 没有那个文件或目录

 

查了下解释如下

这种情况常见于通过windows平台传递shell脚本,导致bash编码出错,但这次是两台linux服务器通过ftp来传递的,应该不会出现这种问题,算了不管~问题出现了就先解决!


解决方法:
废话少说,直奔主题!

1.在新服务器中新建shell脚本文件。
# vi jobak

2.将原来服务器上的shell脚本的内容复制到刚刚创建的脚本文件,保存退出。

3.修改shell脚本的执行权限属性等等,这个自由发挥。

 


///////////////////////////////////////////////////////////////////////////////////////////////////////////////////////////////
 

exec+fork方式

笔者最终采用的exec+fork方式来实现的,具体思想如下:

1,exec函数把当前进程替换为一个新的进程,新进程由path或file参数指定。可以使用exec函数将程序的执行从一个程序切换到另一个程序;

2,fork函数是创建一个新的进程,在进程表中创建一个新的表项,而创建者(即父进程)按原来的流程继续执行,子进程执行自己的控制流程;

3,wait 当fork启动一个子进程时,子进程就有了它自己的生命周期并将独立运行,我们可以在父进程中调用wait函数让父进程等待子进程的结束;

相信介绍到这里,读者已经能够想到解决方法了:1)首先使用fork系统调用,创建子进程,2)在子进程中使用exec函数,执行需要自动重启的程序,3) 在父进程中执行wait等待子进程的结束,然后重新创建一个新的子进程。

使用方法:

点击隐藏BASH CODE
#./portmap 需要监控的程序的路径
#args portmap 需要的参数
$ ./supervisor ./portmap  args.....

代码如下:

 
#include
#include
#include
#include
#include
#include
#include
 
int
main(int argc, char **argv)
{
    int ret, i, status;
    char *child_argv[100] = {0};
    pid_t pid;
    if (argc < 2) {
 
        fprintf(stderr, "Usage:%s /n", argv[0]);
        return -1;
    }
    for (i = 1; i < argc; ++i) {
        child_argv[i-1] = (char *)malloc(strlen(argv[i])+1);
        strncpy(child_argv[i-1], argv[i], strlen(argv[i]));
        child_argv[i-1][strlen(argv[i])] = '/0';
    }
    while(1){
 
        pid = fork();
        if (pid == -1) {
            fprintf(stderr, "fork() error.errno:%d error:%s/n", errno, strerror(errno));
            break;
        }
        if (pid == 0) {
            ret = execv(child_argv[0], (char **)child_argv);
            //ret = execl(child_argv[0], "portmap", NULL, 0);
            if (ret < 0) {
                fprintf(stderr, "execv ret:%d errno:%d error:%s/n", ret, errno, strerror(errno));
                continue;
            }
            exit(0);
        }
 
        if (pid > 0) {
            pid = wait(&status);
 
            fprintf(stdout, "wait return");
        }
 
    }
 
 
    return 0;
}

 
     
 

你可能感兴趣的:(如何监视一个进程,崩溃挂掉后自动重启)