详解C的异常处理机制(goto\setjmp longjmp)

(转载)http://blog.csdn.net/yucan1001/article/details/7014277

来自希赛网,作者王胜祥。
1 C语言中的异常处理机制
    在这之前的所有文章中,都是阐述关于C++的异常处理机制。的确,在C++语言中,它提供的异常处理的模型是非常完善的,主人公阿愚因此才和“异常处理”结下了不解之缘,才有了这一系列文章的基本素材,同时主人公阿愚在自己的编程开发过程中,也才更离不开她,喜欢并依赖于她。
 
    另外,C++语言中完善的异常处理的模型,也更激发了主人公阿愚更多其它的思考。难道异常处理机制只有在C++语言中才有吗?不是的,绝对不是这样的。实际上,异常处理的机制是无处不在的,它与软件的编程思想的发展,与编程语言的发展是同步的。异常处理机制自身的发展和完善过程,也是并记录了我们在编程思想上和编程方法上的改变、进步和发展的过程和重要的足迹。

  在前面的文章中,早就讲到过,异常处理的核心思想是,把功能模块代码与系统中可能出现错误的处理代码分离开来,以此来达到使我们的代码组织起来更美观、逻辑上更清晰,并且同时从根本上来提高我们软件系统长时间稳定运行的可靠性。那么,现在回过头来看,实际上在计算机系统的硬件设计中,操作系统的总体设计中,早期的许多面向结构化程序设计语言中(例如C语言),都有异常处理的机制和方法的广泛运用。只不过是到了像C++这样面向对象的程序设计语言中,才把异常处理的模型设计到了一个相当理想和完善的程度。下面来看看主人公阿愚对在C语言中,异常处理机制的如何被运用?

goto语句,实现异常处理编程,最初也最原始的支持手段

  1、goto语句,程序员朋友们对它太熟悉了,它是C语言中使用最为灵活的一条语句,由它也充分体现出了C语言的许多特点或者说是优点。它虽然是一条高级语言中提供的语句,但是它一般却直接对应一条“无条件直接跳转的机器指令”,所以说它非常地特别,它引起过许多争议,但是这条语句仍然一直被保留了下来,即便是今天的C++语言中,也有对它的支持(虽然不建议使用它)。goto语句有非常多的用途或优点,例如,它特别适合于在编写系统程序中被使用,它能使编写出来的代码非常简练。另外,goto语句另外一个最重要的作用就是,它实际上是一种对异常处理编程,最初也最原始的支持手段或方法。它能把错误处理模块的代码有效与其它代码分离开来。例程如下(请与第一集文章中的示例代码相比较):

void main(int argc, char* argv[])

{

    if (Call_Func1(in, param out)

    {

        // 函数调用成功,我们正常的处理

        if (Call_Func2(in, param out)

        {

            // 函数调用成功,我们正常的处理

            while(condition)

            {

                //do other job                

                // 如果错误直接跳转

                if (has error) goto Error;                

                //do other job

            }

        }

        // 如果错误直接跳转

        else goto Error;        

    }

    // 如果错误直接跳转

    else goto Error;

    // 错误处理模块

Error:

    process_error();

    exit();    

}

  呵呵!上面经过改善后的代码是不是更加清晰了一些,也更简练了一些。因此说,goto语句确是是能够很好地完成一些简易的异常处理编程的实现。虽然它较C++语言中提供的异常处理编程模型相差甚远。

为什么不建议使用goto语句来实现异常处理编程

  虽然goto 语句能有效地支持异常处理编程的实现。但是没有人却建议使用它,即便是在C语言中。因为:
  (1) goto语句能破坏程序的结构化设计,使代码难于测试,且包含大量goto的代码模块不易理解和阅读。它一直遭结构化程序设计思想所抛弃,强烈建议程序员不易使用它;
  (2) 与C++语言中提供的异常处理编程模型相比,它的确是太弱了一些。例如,它一般只能是在某个函数的局部作用域内跳转,也即它不能有效和方便地实现程序控制流的跨函数远程的跳转。

  (3) 如果在C++语言中,用goto语句来实现异常处理,那么它将给面向对象构成极大破坏,并影响到效率。这一点,以后会继续深入阐述。

总结

  虽然goto语句缺点多多,但不管如何,goto语句的确为程序员朋友们,在C语言中,有效运用异常处理思想来进行编程处理,提供了一种途径或简易的手段。当然,运用goto语句来进行异常处理编程已经成为历史。因为,在C语言中,早就已经提供了一种更加优雅的异常处理机制。去看看吧!继续!

2 C语言中一种更优雅的异常处理机制
    上一篇文章对C语言中的goto语句进行了较深入的阐述,实际上goto语句是面向过程与面向结构化程序语言中,进行异常处理编程的最原始的支持形式。后来为了更好地、更方便地支持异常处理编程机制,使得程序员在C语言开发的程序中,能写出更高效、更友善的带有异常处理机制的代码模块来。于是,C语言中出现了一种更优雅的异常处理机制,那就是setjmp()函数与longjmp()函数。

  实际上,这种异常处理的机制不是C语言中自身的一部分,而是在C标准库中实现的两个非常有技巧的库函数,也许大多数C程序员朋友们对它都很熟悉,而且,通过使用setjmp()函数与longjmp()函数组合后,而提供的对程序的异常处理机制,以被广泛运用到许多C语言开发的库系统中,如jpg解析库,加密解密库等等。

  也许C语言中的这种异常处理机制,较goto语句相比较,它才是真正意义上的、概念上比较彻底的,一种异常处理机制。作风一向比较严谨、喜欢刨根问底的主人公阿愚当然不会放
弃对这种异常处理机制进行全面而深入的研究。下面一起来看看。

setjmp函数有何作用?
  前面刚说了,setjmp是C标准库中提供的一个函数,它的作用是保存程序当前运行的一些状态。它的函数原型如下:
int setjmp( jmp_buf env );

  这是MSDN中对它的评论,如下:
  setjmp函数用于保存程序的运行时的堆栈环境,接下来的其它地方,你可以通过调用longjmp函数来恢复先前被保存的程序堆栈环境。当setjmp和longjmp组合一起使用时,它们能提供一种在程序中实现“非本地局部跳转”("non-local goto")的机制。并且这种机制常常被用于来实现,把程序的控制流传递到错误处理模块之中;或者程序中不采用正常的返回(return)语句,或函数的正常调用等方法,而使程序能被恢复到先前的一个调用例程(也即函数)中。
    对setjmp函数的调用时,会保存程序当前的堆栈环境到env参数中;接下来调用longjmp时,会根据这个曾经保存的变量来恢复先前的环境,并且当前的程序控制流,会因此而返回到先前调用setjmp时的程序执行点。此时,在接下来的控制流的例程中,所能访问的所有的变量(除寄存器类型的变量以外),包含了longjmp函数调用时,所拥有的变量。

  setjmp和longjmp并不能很好地支持C++中面向对象的语义。因此在C++程序中,请使用C++提供的异常处理机制。

  好了,现在已经对setjmp有了很感性的了解,暂且不做过多评论,接着往下看longjmp函数。
longjmp函数有何作用?
  同样,longjmp也是C标准库中提供的一个函数,它的作用是用于恢复程序执行的堆栈环境,它的函数原型如下:
void longjmp( jmp_buf env, int value );

  这是MSDN中对它的评论,如下:
  longjmp函数用于恢复先前程序中调用的setjmp函数时所保存的堆栈环境。setjmp和longjmp组合一起使用时,它们能提供一种在程序中实现“非本地局部跳转”("non-local goto")的机制。并且这种机制常常被用于来实现,把程序的控制流传递到错误处理模块,或者不采用正常的返回(return)语句,或函数的正常调用等方法,使程序能被恢复到先前的一个调用例程(也即函数)中。
  对setjmp函数的调用时,会保存程序当前的堆栈环境到env参数中;接下来调用longjmp时,会根据这个曾经保存的变量来恢复先前的环境,并且因此当前的程序控制流,会返回到先前调用setjmp时的执行点。此时,value参数值会被setjmp函数所返回,程序继续得以执行。并且,在接下来的控制流的例程中,它所能够访问到的所有的变量(除寄存器类型的变量以外),包含了longjmp函数调用时,所拥有的变量;而寄存器类型的变量将不可预料。setjmp函数返回的值必须是非零值,如果longjmp传送的value参数值为0,那么实际上被setjmp返回的值是1。

  在调用setjmp的函数返回之前,调用longjmp,否则结果不可预料。

  在使用longjmp时,请遵守以下规则或限制:
  · 不要假象寄存器类型的变量将总会保持不变。在调用longjmp之后,通过setjmp所返回的控制流中,例程中寄存器类型的变量将不会被恢复。
  · 不要使用longjmp函数,来实现把控制流,从一个中断处理例程中传出,除非被捕获的异常是一个浮点数异常。在后一种情况下,如果程序通过调用 _fpreset函数,来首先初始化浮点数包后,它是可以通过longjmp来实现从中断处理例程中返回。
  · 在C++程序中,小心对setjmp和longjmp的使用,应为setjmp和longjmp并不能很好地支持C++中面向对象的语义。因此在C++程序中,使用C++提供的异常处理机制将会更加安全。
把setjmp和longjmp组合起来,原来它这么厉害!
  现在已经对setjmp和longjmp都有了很感性的了解,接下来,看一个示例,并从这个示例展开分析,示例代码如下(来源于MSDN):

/* FPRESET.C: This program uses signal to set up a

* routine for handling floating-point errors.

*/

#include <stdio.h>

#include <signal.h>

#include <setjmp.h>

#include <stdlib.h>

#include <float.h>

#include <math.h>

#include <string.h>



jmp_buf mark; /* Address for long jump to jump to */

int fperr; /* Global error number */



void __cdecl fphandler( int sig, int num ); /* Prototypes */

void fpcheck( void );



void main( void )

{

    double n1, n2, r;

    int jmpret;

    /* Unmask all floating-point exceptions. */

    _control87( 0, _MCW_EM );

    /* Set up floating-point error handler. The compiler

    * will generate a warning because it expects

    * signal-handling functions to take only one argument.

    */

    if( signal( SIGFPE, fphandler ) == SIG_ERR )

        

    {

        fprintf( stderr, "Couldn't set SIGFPE\n" );

        abort(); }

    

        /* Save stack environment for return in case of error. First

        * time through, jmpret is 0, so true conditional is executed.

        * If an error occurs, jmpret will be set to -1 and false

        * conditional will be executed.

    */

    

    // 注意,下面这条语句的作用是,保存程序当前运行的状态

    jmpret = setjmp( mark );

    if( jmpret == 0 )

    {

        printf( "Test for invalid operation - " );

        printf( "enter two numbers: " );

        scanf( "%lf %lf", &n1, &n2 );

        

        // 注意,下面这条语句可能出现异常,

        // 如果从终端输入的第2个变量是0值的话

        r = n1 / n2;

        /* This won't be reached if error occurs. */

        printf( "\n\n%4.3g / %4.3g = %4.3g\n", n1, n2, r );

        

        r = n1 * n2;

        /* This won't be reached if error occurs. */

        printf( "\n\n%4.3g * %4.3g = %4.3g\n", n1, n2, r );

    }

    else

        fpcheck();

}

/* fphandler handles SIGFPE (floating-point error) interrupt. Note

* that this prototype accepts two arguments and that the

* prototype for signal in the run-time library expects a signal

* handler to have only one argument.

*

* The second argument in this signal handler allows processing of

* _FPE_INVALID, _FPE_OVERFLOW, _FPE_UNDERFLOW, and

* _FPE_ZERODIVIDE, all of which are Microsoft-specific symbols

* that augment the information provided by SIGFPE. The compiler

* will generate a warning, which is harmless and expected.



*/

void fphandler( int sig, int num )

{

/* Set global for outside check since we don't want

* to do I/O in the handler.

    */

    fperr = num;

    /* Initialize floating-point package. */

    _fpreset();

    /* Restore calling environment and jump back to setjmp. Return

    * -1 so that setjmp will return false for conditional test.

    */

    // 注意,下面这条语句的作用是,恢复先前setjmp所保存的程序状态

    longjmp( mark, -1 );

}

void fpcheck( void )

{

    char fpstr[30];

    switch( fperr )

    {

    case _FPE_INVALID:

        strcpy( fpstr, "Invalid number" );

        break;

    case _FPE_OVERFLOW:

        strcpy( fpstr, "Overflow" );

        

        break;

    case _FPE_UNDERFLOW:

        strcpy( fpstr, "Underflow" );

        break;

    case _FPE_ZERODIVIDE:

        strcpy( fpstr, "Divide by zero" );

        break;

    default:

        strcpy( fpstr, "Other floating point error" );

        break;

    }

    printf( "Error %d: %s\n", fperr, fpstr );

}


程序的运行结果如下:
Test for invalid operation - enter two numbers: 1 2
1 / 2 = 0.5

1 * 2 = 2

 

  上面的程序运行结果正常。另外程序的运行结果还有一种情况,如下:
Test for invalid operation - enter two numbers: 1 0
Error 131: Divide by zero

  呵呵!程序运行过程中出现了异常(被0除),并且这种异常被程序预先定义的异常处理模块所捕获了。厉害吧!可千万别轻视,这可以C语言编写的程序。

分析setjmp和longjmp
  当程序运行到第②步时,调用setjmp函数,这个函数会保存程序当前运行的一些状态信息,主要是一些系统寄存器的值,如ss,cs,eip, eax,ebx,ecx,edx,eflags等寄存器,其中尤其重要的是eip的值,因为它相当于保存了一个程序运行的执行点。这些信息被保存到 mark变量中,这是一个C标准库中所定义的特殊结构体类型的变量。

  调用setjmp函数保存程序状态之后,该函数返回0值,于是接下来程序执行到第③步和第④步中。在第④步中语句执行时,如果变量n2为0值,于是便引发了一个浮点数计算异常,,导致控制流转入fphandler函数中,也即进入到第⑤步。

  然后运行到第⑥步,调用longjmp函数,这个函数内部会从先前的setjmp所保存的程序状态,也即mark变量中,来恢复到以前的系统寄存器的值。于是便进入到了第⑦步,注意,这非常有点意思,实际上,通过longjmp函数的调用后,程序控制流(尤其是eip的值)再次戏剧性地进入到了 setjmp函数的处理内部中,但是这一次setjmp返回的值是longjmp函数调用时,所传入的第2个参数,也即-1,因此程序接下来进入到了第⑧ 步的执行之中。

总结
  与goto语句不同,在C语言中,setjmp()与longjmp()的组合调用,为程序员提供了一种更优雅的异常处理机制。它具有如下特点:
   (1) goto只能实现本地跳转,而setjmp()与longjmp()的组合运用,能有效的实现程序控制流的非本地(远程)跳转;
   (2)与goto语句不同,setjmp()与longjmp()的组合运用,提供了真正意义上的异常处理机制。例如,它能有效定义受监控保护的模块区域(类似于C++中try关键字所定义的区域);同时它也能有效地定义异常处理模块(类似于C++中catch关键字所定义的区域);还有,它能在程序执行过程中,通过longjmp函数的调用,方便地抛出异常(类似于C++中throw关键字)。
  现在,相信大家已经对在C语言中提供的这种异常处理机制有了很全面地了解。但是我们还没有深入它研究它,下一篇文章中继续探讨吧!go!

3 全面了解setjmp与longjmp的使用
    上一篇文章对setjmp函数与longjmp函数有了较全面的了解,尤其是这两个函数的作用,函数所完成的功能,以及将setjmp函数与 longjmp函数组合起来,实现异常处理机制时,程序模块控制流的执行过程等。这里更深入一步,将对setjmp与longjmp的具体使用方法和适用的场合,进行一个非常全面的阐述。

  另外请特别注意,setjmp函数与longjmp函数总是组合起来使用,它们是紧密相关的一对操作,只有将它们结合起来使用,才能达到程序控制流有效转移的目的,才能按照程序员的预先设计的意图,去实现对程序中可能出现的异常进行集中处理。

  与goto语句的作用类似,它能实现本地的跳转

  这种情况容易理解,不过还是列举出一个示例程序吧!如下:

void main( void )

{

    int jmpret;

    

    jmpret = setjmp( mark );

    if( jmpret == 0 )

    {

        // 其它代码的执行

        // 判断程序远行中,是否出现错误,如果有错误,则跳转!

        if(1) longjmp(mark, 1);

        

        // 其它代码的执行

        // 判断程序远行中,是否出现错误,如果有错误,则跳转!

        if(2) longjmp(mark, 2);

        

        // 其它代码的执行

        // 判断程序远行中,是否出现错误,如果有错误,则跳转!

        if(-1) longjmp(mark, -1);

        

        // 其它代码的执行

    }

    else

    {

        // 错误处理模块

        switch (jmpret)

        {

        case 1:

            printf( "Error 1\n");

            break;

        case 2:

            printf( "Error 2\n");

            break;

        case 3:

            printf( "Error 3\n");

            break;

        default :

            printf( "Unknown Error");

            break;

        }

        exit(0);

    }    

    return;

}

      上面的例程非常地简单,其中程序中使用到了异常处理的机制,这使得程序的代码非常紧凑、清晰,易于理解。在程序运行过程中,当异常情况出现后,控制流是进行了一个本地跳转(进入到异常处理的代码模块,是在同一个函数的内部),这种情况其实也可以用goto语句来予以很好的实现,但是,显然setjmp与 longjmp的方式,更为严谨一些,也更为友善。

    setjmp与longjmp相结合,实现程序的非本地的跳转

  呵呵!这就是goto语句所不能实现的。也正因为如此,所以才说在C语言中,setjmp与longjmp相结合的方式,它提供了真正意义上的异常处理机制。其实上一篇文章中的那个例程,已经演示了longjmp函数的非本地跳转的场景。这里为了更清晰演示本地跳转与非本地跳转,这两者之间的区别,我们在上面刚才的那个例程基础上,进行很小的一点改动,代码如下:

void Func1()

{

    // 其它代码的执行

    // 判断程序远行中,是否出现错误,如果有错误,则跳转!

    if(1) longjmp(mark, 1);

}



void Func2()

{

    // 其它代码的执行

    // 判断程序远行中,是否出现错误,如果有错误,则跳转!

    if(2) longjmp(mark, 2);

}



void Func3()

{

    // 其它代码的执行

    // 判断程序远行中,是否出现错误,如果有错误,则跳转!

    if(-1) longjmp(mark, -1);

}



void main( void )

{

    int jmpret;    

    jmpret = setjmp( mark );

    if( jmpret == 0 )

    {

        // 其它代码的执行        

        // 下面的这些函数执行过程中,有可能出现异常

        Func1();        

        Func2();

        Func3();        

        // 其它代码的执行

    }

    else

    {

        // 错误处理模块

        switch (jmpret)

        {

        case 1:

            printf( "Error 1\n");

            break;

        case 2:

            printf( "Error 2\n");

            break;

        case 3:

            printf( "Error 3\n");

            break;

        default :

            printf( "Unknown Error");

            break;

        }

        exit(0);

    }    

    return;

}

 

  回顾一下,这与C++中提供的异常处理模型是不是很相近。异常的传递是可以跨越一个或多个函数。这的确为C程序员提供了一种较完善的异常处理编程的机制或手段。

setjmp和longjmp使用时,需要特别注意的事情

  1、setjmp与longjmp结合使用时,它们必须有严格的先后执行顺序,也即先调用setjmp函数,之后再调用longjmp函数,以恢复到先前被保存的“程序执行点”。否则,如果在setjmp调用之前,执行longjmp函数,将导致程序的执行流变的不可预测,很容易导致程序崩溃而退出。请看示例程序,代码如下:

class Test

{

public:

    Test() {printf("构造对象\n");}

    ~Test() {printf("析构对象\n");}

}obj;

//注意,上面声明了一个全局变量obj



void main( void )

{

    int jmpret;    

    // 注意,这里将会导致程序崩溃,无条件退出

    Func1();

    while(1);    

    jmpret = setjmp( mark );

    if( jmpret == 0 )

    {

        // 其它代码的执行    

        // 下面的这些函数执行过程中,有可能出现异常

        Func1();        

        Func2();        

        Func3();        

        // 其它代码的执行

    }

    else

    {

        // 错误处理模块

        switch (jmpret)

        {

        case 1:

            printf( "Error 1\n");

            break;

        case 2:

            printf( "Error 2\n");

            break;

        case 3:

            printf( "Error 3\n");

            break;

        default :

            printf( "Unknown Error");

            break;

        }

        exit(0);

    }    

    return;

}

上面的程序运行结果,如下:
  构造对象
  Press any key to continue

  的确,上面程序崩溃了,由于在Func1()函数内,调用了longjmp,但此时程序还没有调用setjmp来保存一个程序执行点。因此,程序的执行流变的不可预测。这样导致的程序后果是非常严重的,例如说,上面的程序中,有一个对象被构造了,但程序崩溃退出时,它的析构函数并没有被系统来调用,得以清除一些必要的资源。所以这样的程序是非常危险的。(另外请注意,上面的程序是一个C++程序,所以大家演示并测试这个例程时,把源文件的扩展名改为 xxx.cpp)。

  2、除了要求先调用setjmp函数,之后再调用longjmp函数(也即longjmp必须有对应的setjmp函数)之外。另外,还有一个很重要的规则,那就是longjmp的调用是有一定域范围要求的。这未免太抽象了,还是先看一个示例,如下:

int Sub_Func()

{

    // 注意,这里改动了一点

    int be_modify, jmpret;    

    be_modify = 0;    

    jmpret = setjmp( mark );

    if( jmpret == 0 )

    {

        // 其它代码的执行

    }

    else

    {

        // 错误处理模块

        switch (jmpret)

        {

        case 1:

            printf( "Error 1\n");

            break;

        case 2:

            printf( "Error 2\n");

            break;

        case 3:

            printf( "Error 3\n");

            break;

        default :

            printf( "Unknown Error");

            break;

        }        

        //注意这一语句,程序有条件地退出

        if (be_modify==0) exit(0);

    }    

    return jmpret;

}



void main( void )

{

    Sub_Func();    

    // 注意,虽然longjmp的调用是在setjmp之后,但是它超出了setjmp的作用范围。

    longjmp(mark, 1);

}

      运行或调试(单步跟踪)上面的程序,发现它崩溃了,为什么?这就是因为,“在调用setjmp的函数返回之前,调用longjmp,否则结果不可预料” (这在上一篇文章中已经提到过,MSDN中做了特别的说明)。为什么这样做会导致不可预料?其实仔细想想,原因也很简单,那就是因为,当setjmp函数调用时,它保存的程序执行点环境,只应该在当前的函数作用域以内(或以后)才会有效。如果函数返回到了上层(或更上层)的函数环境中,那么setjmp保存的程序的环境也将会无效,因为堆栈中的数据此时将可能发生覆盖,所以当然会导致不可预料的执行后果。

  3、不要假象寄存器类型的变量将总会保持不变。在调用longjmp之后,通过setjmp所返回的控制流中,例程中寄存器类型的变量将不会被恢复。(MSDN中做了特别的说明,上一篇文章中,这也已经提到过)。寄存器类型的变量,是指为了提高程序的运行效率,变量不被保存在内存中,而是直接被保存在寄存器中。寄存器类型的变量一般都是临时变量,在C语言中,通过register定义,或直接嵌入汇编代码的程序。这种类型的变量一般很少采用,所以在使用setjmp和longjmp时,基本上不用考虑到这一点。

  4、MSDN中还做了特别的说明,“在C+ +程序中,小心对setjmp和longjmp的使用,因为setjmp和longjmp并不能很好地支持C++中面向对象的语义。因此在C++程序中,使用C++提供的异常处理机制将会更加安全。”虽然说C++能非常好的兼容C,但是这并非是100%的完全兼容。例如,这里就是一个很好的例子,在C++ 程序中,它不能很好地与setjmp和longjmp和平共处。在后面的一些文章中,有关专门讨论C++如何兼容支持C语言中的异常处理机制时,会做详细深入的研究,这里暂且跳过。

总结
  主人公阿愚现在对setjmp与longjmp已经是非常钦佩了,虽然它没有C++中提供的异常处理模型那么好用,但是毕竟在C语言中,有这么好用的东东,已经是非常不错了。为了更上一层楼,使setjmp与longjmp更接近C++中提供的异常处理模型(也即try()catch()语法)。阿愚找到了不少非常有价值的资料。不要错过,继续到下一篇文章中去吧!让程序员朋友们“玩转setjmp与longjmp”,Let’s go!

    后面的是有关模拟C++中try,catch还有throw的方法,以及为什么不要在C++中使用setjmp
和longjum的讨论,主要还是因为无法保证对象正确销毁,就不贴了。

你可能感兴趣的:(异常处理)