应用程序异常处理与崩溃收集

应用程序异常处理与崩溃收集_第1张图片
BugReport

简介

对于Windows应用, 当应用发布出去之后,如果应用程序在用户机器上发生了崩溃,我们需要这样一种手段,即在程序崩溃的瞬间能够“记录”下崩溃时进程、线程、栈、栈上下文等信息,这些信息对我们分析崩溃原因非常有帮助。另外,由于客户端程序一般是运行在用户的机器上,当生成崩溃信息后,还需要将这些信息上报至服务器,以方便开发者能够快捷地拿到这些崩溃信息进行分析。一般来说客户端程序崩溃的收集与处理流程如下图:

应用程序异常处理与崩溃收集_第2张图片
崩溃收集与处理流程
  • step1: 开发者开发好代码后,由编译集群编译后将产出的二进制等文件放入产品库中,产品库会记录每次发布的版本号(version)、安装程序(*.exe)、对应版本的符号表(.pdb)等信息。
  • step2: 通过各种发布渠道发布最新版本。
  • step3: 用户在使用过程中产生崩溃,生成崩溃时主进程启动一个辅助进程(BugReport.exe)收集崩溃信息。
  • step4: 辅助进程将收集到的崩溃信息上传至服务器。
  • step5: 开发者根据程序版本号(version)和用户标识(用户id)从服务器上拿到用户机器上程序生成的崩溃信息(*.dmp),再从产品库中提取对应版本的符号表文件,最后利用调试工具(Visual Studio、WinDbg等)分析崩溃原因,将修复后的版本再次按照以上流程发布出去。

异常处理

这里的异常处理不同于C++中的异常处理,是指Windows操作系统提供地一种处理应用程序运行时异常(运行时严重错误)的能力。Windows提供了三个函数供应用程序设置回调,当程序出现运行时异常时,可以让应用进行“最后”处理让程序更优雅地退出。

  • SetUnhandledExceptionFilter:当出现没有控制的异常时回调
  • _set_invalid_parameter_handler:当出现无效参数调用时回调
  • _set_purecall_handler:当出现纯虚函数调用时回调

函数签名为:

LPTOP_LEVEL_EXCEPTION_FILTER WINAPI SetUnhandledExceptionFilter(
    LPTOP_LEVEL_EXCEPTION_FILTER lpTopLevelExceptionFilter
);

_invalid_parameter_handler _set_invalid_parameter_handler(      
    _invalid_parameter_handler pNew  
);  

_purecall_handler _set_purecall_handler( 
    _purecall_handler function
);

比如对于最常见的空指针引用,可以设置一个UnhandledExceptionFilter回调函数,当出现空指针引用时,�系统会回调设置的UnhandledExceptionFilter函数,在该函数就可以记录下异常信息。

LONG WINAPI MyUnhandledExceptionFilterCb(PEXCEPTION_POINTERS pExceptionInfo)
{
    printf("Unhandled exception occurred!\n");
    return EXCEPTION_EXECUTE_HANDLER;
}

int main(void)
{
    ::SetUnhandledExceptionFilter(MyUnhandledExceptionFilterCb);

    *(int*)0 = 100;
    return 0;
}

崩溃收集

对于那些不可恢复的异常,我们可以在设置的回调函数中记录下相应的异常信息。从Windows XP操作系统开始,微软发布了DbgHelp.dll并提供了API用于创建minidump文件,该文件记录了程序崩溃瞬间进程状态的一个快照,函数签名如下:

BOOL MiniDumpWriteDump( 
    HANDLE hProcess, 
    DWORD ProcessId, 
    HANDLE hFile, 
    MINIDUMP_TYPE DumpType, 
    PMINIDUMP_EXCEPTION_INFORMATION ExceptionParam, 
    PMINIDUMP_USER_STREAM_INFORMATION UserStreamParam, 
    PMINIDUMP_CALLBACK_INFORMATION CallbackParam
);

函数的具体用法可以参考MSDN, 想了解更多用法可以参考DebugInfo.com。按照MSDN的说法:

MiniDumpWriteDump应该尽可能在一个单独的进程中调用,而不是在被dump的目标进程中,特别是在目标进程已经不稳定的情况下。

所以我们把写dump的操作放到一个单独的进程中处理。如图(崩溃收集与处理流程)的step3中,应用程序发生不可恢复的异常时,为了防止应用程序再次产生崩溃,先将进程中除处理异常的线程外的所有线程都挂起。然后启动一个独立进程BugReport,并将异常信息传给BugReport。再由BugReport调用MiniDumpWriteDump生成崩溃信息,再上传至服务器。
这里涉及的两个进程之间的通信,进程间通信的方式有很多,在这里采用共享内存是一个不错的选择。至于共享内存中要共享的数据结构嘛,就看业务场景了。

参考

[1]. http://www.debuginfo.com/articles/effminidumps.html#introduction
[2]. https://msdn.microsoft.com/en-us/library/windows/desktop/ms680360(v=vs.85).aspx
[3]. Windows核心编程(第5版)

你可能感兴趣的:(应用程序异常处理与崩溃收集)