在 AIX V5.3 中使用 MALLOCDEBUG 隔离并解决内存泄漏

引言

在编写应用程序时进行动态内存分配是非常必要的。它可以在程序运行的过程中帮助分配所需的内存,而不是在进程启动的时候就进行分配。然而,有效地管理这些内存同样也是非常重要的。在大型的、复杂的应用程序中,内存泄漏是很常见的问题。当以前分配的一片内存不再需要使用或无法访问时,但是却并没有释放它,那么对于该进程来说,会因此导致总的可用内存的减少,这时就出现了内存泄漏。尽管优秀的编程实践可以确保最少的泄漏,但是根据经验,当使用大量的函数对相同的内存块进行处理时,很可能会出现内存泄漏。尤其是在碰到错误路径的情况下更是如此。

本文介绍了一种内存泄漏处理方法,并讨论了如何利用 AIX? 中附带的 MALLOCDEBUG 工具。
为什么内存泄漏难以解决

应用程序可以根据所碰到的具体情况,在其生命周期中的不同时刻释放一片内存。编程人员需要对应用程序进行合理的设计,以便它能够知道何时可以释放一块内存,并马上执行这个操作,而不是等待更长的时间。根据具体的控制流程,可以在代码中的不同地方进行内存的释放。有一点至关重要,那就是必须涉及到所有的控制流程,而不仅仅是最常执行的代码流程路径。

同时,在内存做好释放准备之前对其进行释放可能引起灾难性的错误。因此,要了解内存块在何处做好了释放的准备,必须全面地了解应用程序中的控制流程。
检测内存泄漏

当出现下列症状时,表示可能出现了泄漏:

    malloc 返回的 errno 被设置为 ENOMEM。
    发生核心转储,并且堆栈中的一个函数来自于 malloc 子系统。
    在进行核心转储时,进程的大小比正常运行时要大。
    进程大小(可以使用 ps 命令来查看)急剧增长。

如果出现了一些内存泄漏的症状,那么最好使用内存监视工具进行分析。有许多第三方的工具,如 Zerofault 和 IBM Rational? Purify?,但本文将讨论 AIX 中附带的 MALLOCDEBUG 工具。
使用 MALLOCDEBUG 报告内存泄漏

MALLOCDEBUG 是一种很易于使用的 malloc 子系统监视工具。通过使用两个环境变量 MALLOCDEBUG 和 MALLOCTYPE,您可以轻松地对特定的应用程序启用 malloc 子系统调试任务。您需要将这些变量导出到运行该应用程序的 Shell 中。在 AIX Version 5.3 中,错误报告将写入到 stderr。
MALLOCTYPE

MALLOCTYPE 变量用来确定应该使用何种 malloc 子系统,以及是否启用调试任务。下面的表 1 显示了 MALLOCTYPE 各种可能的取值。请参见参考资料部分,其中提供了“Developing and Porting C and C++ Applications on AIX”的链接。IBM 红皮书。
表 1. MALLOCTYPE 变量
MALLOCTYPE=    内存分配器    IBM 红皮书“Developing and Porting C and C++ Applications on AIX”中的详细解释
3.1    3.1 内存分配器    4.2.1 节,3.1 内存分配器
NULL    缺省内存分配器    4.2.2 节,缺省内存分配器
buckets    具有 malloc 桶扩展的缺省内存分配器    4.2.3 节,具有 malloc 桶扩展的缺省内存分配器
debug    调试内存分配器    4.2.4 节,调试内存分配器
user:archive_name    用户定义的内存分配器    4.2.5 节,用户定义的内存分配器

您应该清楚,MALLOCDEBUG 假定使用的是缺省分配器。
MALLOCDEBUG

MALLOCDEBUG 变量可以包含下面表 2 的列表中的多个值,这些值之间以逗号分隔。
表 2. MALLOCDEBUG 变量
MALLOCDEBUG=    简要解释
Align:n    n 是内存对齐的数值。关于更多的信息,请参见参考资料部分。
postfree_checking    postfree_checking 使得 MALLOCDEBUG 报告对已释放的内存进行访问的尝试,然后中止该程序。
validate_ptrs    如果向 free() 调用传递的指针并不是以前由 malloc 分配的,那么将会引发一个错误消息,而该程序将被中止。
override_signal_handling    当 MALLOCDEBUG 检测到内存错误,它会强迫该程序使用 SIGSEGV 或 SIGABRT 进行核心转储。设置 override_signal_handling 可以确保该程序终止并进行核心转储,即使应用程序已经对这些信号进行了处理。
allow_overreading     allow_overreading 将忽略读取越界。
report_allocations     report_allocations 将报告在应用程序退出时所有未释放的内存分配。
record_allocations     record_allocations 将报告所有的内存分配。
continue    继续报告错误,但它并不异常终止 (ABEND) 该程序。这是 AIX Version 5.3 中提供的一种非常有用的特性。
stack_depth:n    stack_depth:n 将错误堆栈报告到第 n 层,而不是缺省的第 6 层。

在这些选项中,使用 report_allocations 最为合适,因为它可以为您提供已检测到的应用程序中泄漏的列表。
示例

在这一部分中,您将看到一个示例和一些示例代码清单,用以说明如何使用 MALLOCDEBUG。下载部分中提供了这个示例的源代码。
清单 1. 将 MALLOCDEBUG 和 MALLOCTYPE 设置导出到 Shell

/home/user> export MALLOCTYPE=debug
/home/user> export MALLOCDEBUG=report_allocations

清单 2. 程序的输出

/home/user> ./stud 2>mal_dbg_stud
Student Name: Manish
 Subjects # Maths   English

Student Name: Vaarun
 Subjects # Chemistry   Physics

Student Name: Sandeep
 Subjects # Biology   Maths

    ......
    ......
    ......
    ......

Student Name: Govind
 Subjects # Physics   Biology

Student Name: Manish
 Subjects # Maths   English

Current allocation report:

    Allocation #0: 0x2000EFE8
        Allocation size: 0x14
        Allocation traceback:
        0xD0371F64  malloc
        0xD0322194  init_malloc
        0xD0323224  malloc
        0x10000BE4  initialize_leaky

    Allocation #1: 0x20010FF0
        Allocation size: 0xA
        Allocation traceback:
        0xD0371F64  malloc
        0x10000C08  initialize_leaky
        0x10000DD4  main
        0x100001B4  __start

    Allocation #2: 0x20012FF0
        Allocation size: 0xA
        Allocation traceback:
        0xD0371F64  malloc
        0x10000C08  initialize_leaky
        0x10000DD4  main
        0x100001B4  __start
    ......
    ......
    ......
    ......
    Allocation #17: 0x20030FF0
        Allocation size: 0x10
        Allocation traceback:
        0xD0371F64  malloc
        0x100008F4  getnode
        0x10000B08  insert
        0x10000DDC  main

    Allocation #18: 0x20032FF8
        Allocation size: 0x8
        Allocation traceback:
        0xD0371F64  malloc
        0x10000894  allocate_for_dbl_ptr
        0x10000910  getnode
        0x10000B08  insert

    Allocation #19: 0x20034FE8
        Allocation size: 0x14
        Allocation traceback:
        0xD0371F64  malloc
        0x10000A5C  allocate_name
        0x10000B18  insert
        0x10000DDC  main

    Allocation #22: 0x2003AFF0
        Allocation size: 0x10
        Allocation traceback:
        0xD0371F64  malloc
        0x100008F4  getnode
        0x10000B3C  insert
        0x10000DDC  main
    ......
    ......
    ......
    ......

MALLOCDEBUG 的输出格式对于用户来说并不是很友好。它只是为每个已分配且尚未释放的内存块打印出调用 malloc 的函数堆栈。它还返回了内存块的大小以及由 malloc 所返回的指针值。

为了使上面的输出更容易理解,我们编写了一个示例脚本。(请参见 下载部分。请注意,这是一个适用于与该示例程序具有类似输出的示例脚本。)下面的清单 3 显示了在对上面这些堆栈运行了该脚本之后的输出。
清单 3. 使用脚本解析 MALLOCDEBUG 的输出

/home/user> ./format_mallocdebug_op.ksh
Usage : ./stack.ksh stackfile

/home/katiyar/DW> ./format_mallocdebug_op.ksh ./mal_dbg_stud |
   tee ./mal_dbg_stud_formatted
Parsing output from debug malloc ...
Analyzed 50 stacks ...

main
insert
allocate_subjects
malloc
################################
220 bytes leaked in 22 Blocks
################################
main
insert
allocate_name
malloc
################################
220 bytes leaked in 11 Blocks
################################
__start
main
initialize_leaky
malloc
################################
190 bytes leaked in 16 Blocks
################################
main
insert
getnode
malloc
################################
176 bytes leaked in 11 Blocks
################################
insert
getnode
allocate_for_dbl_ptr
malloc
################################
88 bytes leaked in 11 Blocks
################################
initialize_leaky
malloc
init_malloc
malloc
################################
20 bytes leaked in 1 Blocks
################################

调查工作应从最大的泄漏着手。上面的第一个堆栈显示出,main 调用了 insert,后者调用了 allocate_subjects。而 allocate_subjects 通过调用 malloc 来分配内存块,并且这块内存一直没有释放。该脚本的输出显示,22 次独立的分配总共产生了 220 个字节的泄漏。这表示您应该查看代码,找出在 allocate_subjects 函数中分配 10 个字节的数据的位置,并检查是否释放了其所有的实例。通过对该程序的代码进行仔细的分析,您可以找到出现问题并且应该释放的内存块。

可以对报告中的每个堆栈进行类似的分析,并对其进行修复。如果在运行该程序之前将 FREE_BLOCKS=1 环境变量导出到了 Shell,那么对这个程序进行的修复将会立即生效。
清单 4. 释放了通过 malloc 分配的内存块之后的输出

/home/katiyar/DW> ./stud
Student Name: Manish
 Subjects # Maths   English

Student Name: Vaarun
 Subjects # Chemistry   Physics

Student Name: Sandeep
 Subjects # Biology   Maths

    ......
    ......
    ......
    ......

Student Name: Govind
 Subjects # Physics   Biology

Student Name: Manish
 Subjects # Maths   English

Current allocation report:

Total allocations: 0.

回页首
结束语

当您的软件运行在客户的计算机上时,MALLOCDEBUG 是可供使用的 malloc 子系统监视工具之一。当用户在计算机上使用软件的过程中出现 malloc 错误时,需要用户提供 MALLOCDEBUG 日志,为了避免这种情况,在将应用程序提交给客户之前,使用 MALLOCDEBUG 对其进行测试是很有帮助的。

你可能感兴趣的:(C++,AIX,DBX)