进程概述和内存分配
本文是作者阅读TLPI(The Linux Programer Interface的总结),为了突出重点,避免一刀砍,我不会过多的去介绍基本的概念和用法,我重点会去介绍原理和细节。因此对于本文的读者,至少要求读过APUE,或者是实际有写过相关代码的程序员,因为知识有点零散,所以我会尽可能以FAQ的形式呈现给读者。
每个进程所所分配的内存由很多部分组成,通常我们称之为段,一般会有如下段:
注: 为什么要区分初始化数据段,和未初始化数据段呢?,未初始化数据段简称为BSS段,有何含义BSS全称为Block Started by Symbol,其主要原因在于程序在磁盘上存储时,没有必要为未经初始化的变量分配存储空间,相反,可执行文件只需要记录未初始化数据段的位置和所需大小即可。直到运行时才分配内存空间。通过size命令可以显示可执行文件的文本段,初始化数据段,未初始化数据段的段大小信息。
大多数UNIX实现中C语言编程环境提供了三个全局符号:etext,edata,end,可在程序内使用这些符号获取文本段,初始化数据段,未初始化数据段结尾处下一字节的地址。代码如下:
#include
#include
#include
extern char etext,edata,end;
int main()
{
printf("%p\n",&etext);
printf("%p\n",&edata);
printf("%p\n",&end);
}
#include
#include
int main()
{
printf("page-size:%d\n",sysconf(_SC_PAGESIZE));
}
通过读取proc/PID/cmdline
可以得到任一进程的命令行参数信息,如果想获取程序本身的命令行参数,可以使用proc/self/cmdline
来读取,对于如何获取进程的程序名有如下两种方法:
/proc/self/exe
的符号链接内容,这个文件会通过符号链接到真正的可执行文件路径,是绝对路径,通过readlink可以读取其中链接的绝对路径名称#include
#include
#include
char * get_program_path(char *buf,int count);
char * get_program_name(char *buf,int count);
int main()
{
//程序测试
char buf[1024];
bzero(buf,sizeof(buf));
//打印路径名称
printf("%s\n",get_program_path(buf,sizeof(buf)));
bzero(buf,sizeof(buf));
//打印程序名称
printf("%s\n",get_program_name(buf,sizeof(buf)));
}
/*
* 获取程序的路径名称
*/
char * get_program_path(char *buf,int count)
{
int i=0;
int retval = readlink("/proc/self/exe",buf,count-1);
if((retval < 0 || retval >= count - 1))
{
return NULL;
}
//添加末尾结束符号
buf[retval] = '\0';
char *end = strrchr(buf,'/');
if(NULL == end)
buf[0] = '\0';
else
*end = '\0';
return buf;
}
/*
* 获取这个程序的文件名,其实这有点多余,argv[0]
* 就代表这个执行的程序文件名
*/
char * get_program_name(char *buf,int count)
{
int retval = readlink("/proc/self/exe",buf,count-1);
if((retval < 0 || retval >= count - 1))
{
return NULL;
}
buf[retval] = '\0';
//获取指向最后一次出现'/'字符的指针
return strrchr(buf,'/');
}
#define _GNU_SOURCE
#include
#include
extern char * program_invocation_name;
extern char * program_invocation_short_name;
int main()
{
printf("%s\n",program_invocation_name);
printf("%s\n",program_invocation_short_name);
}
将变量声明为volatile是告诉优化器不要对其进行优化,从而避免了代码重组。例如下面这段程序:
int a = 10;
int main()
{
a = a + 1;
while(a == 2);
}
对上面的代码使用gcc -O -S
进行优化编译,查看其汇编代码。关键代码如下:
movl a(%rip), %eax
addl $1, %eax //a = a + 1
movl %eax, a(%rip) //写回内存
cmpl $2, %eax //while(a == 2)
编译器对齐进行优化,发现a = a + 1
和while(a == 2)
中间没有对a进行修改,因此根据代码的上下文分析后进行优化,直接拿%eax
进行比较。但是编译器的优化仅仅只能根据当前的代码上下文来优化,如果在多线程场景下另外一个函数中对a进行了修改,但是这里却使用的是a的旧值,这就会导致代码逻辑上出现了问题,很难debug。我们来看看加了volatile关键字后情况变成什么样了。下面是加了volatile后的汇编代码:
movl a(%rip), %eax
addl $1, %eax
movl %eax, a(%rip)
movl a(%rip), %eax //在比较之前重新读取了a的值
cmpl $2, %eax
volatile关键字远远在比我这里描述的更加复杂,这里有篇文章建议大家阅读一下,深刻了解下这个关键字的作用。C/C++ Volatile关键词深度剖析。
brk和sbrk是linux提供给我们的两个用于分配内存的系统调用,内存的分配其实就是将堆区的内存空间进行隐射和物理内存页进行关联。我们的程序会大量的调用这两个系统调用,这导致一个问题就是大量的系统调用开销的产生,为此malloc和free封装了这两个函数,通过brk和sbrk预先分配一段比较大的内存空间,然后一点点的分配出去,通过维护内部的一个数据结构记录分配出去的内存块信息,方便后面的回收和合并这样就避免了大量系统调用的调用开销。下面是这两个函数的函数原型:
#include
int brk(void *addr);
void *sbrk(intptr_t increment);
brk
可以调整program break
的位置,program break
是堆的顶端,也就是堆最大可以增长到的地址,而sbrk则是设置program break
为原有地址加上increment后的位置。sbrk(0)
返回当前的program break
位置。
glibc提供了一些malloc调试库分别如下:
[root@localhost test]# cat mtrace.c
#include
#include
#include
int
main(int argc, char *argv[])
{
int j;
mtrace();
for (j = 0; j < 2; j++)
malloc(100); /* Never freed--a memory leak */
calloc(16, 16); /* Never freed--a memory leak */
exit(EXIT_SUCCESS);
}
进行编译,生成mtrace调试信息,因为调试信息叫复杂,glibc提供了mtrace命令用户分析调试信息
[root@localhost test]# gcc -g mtrace.c
[root@localhost test]# export MALLOC_TRACE="/tmp/t" //设置这个环境变量,mtrace会读取这个环境变量,把调试信息输出到这个环境变量所指向的文件
[root@localhost test]# ./a.out
[root@localhost test]# cat /tmp/t
= Start
@ ./a.out:[0x400637] + 0x132a460 0x64
@ ./a.out:[0x400637] + 0x132a4d0 0x64
@ ./a.out:[0x400650] + 0x132a540 0x100
[root@localhost test]# mtrace ./a.out $MALLOC_TRACE
Memory not freed:
-----------------
Address Size Caller //在12行进行了二次内存分配,大小是0x64,在16行进行了一次内存分配,分配的大小是0x100
0x000000000132a460 0x64 at /root/test/mtrace.c:12 (discriminator 2)
0x000000000132a4d0 0x64 at /root/test/mtrace.c:12 (discriminator 2)
0x000000000132a540 0x100 at /root/test/mtrace.c:16
可以看出mtrace起到了内存分配的跟踪功能,会把所有的内存分配和释放操作就记录下来。
mtrace命令是用来分析mtrace()的输出,默认是没有安装的,它是glibc提供的,所以需要额外安装glibc-utils。
[root@localhost test]# cat mcheck.c
#include
#include
#include
int main(int argc, char *argv[])
{
char *p;
if (mcheck(NULL) != 0) { //需要在第一次调用malloc前调用。
fprintf(stderr, "mcheck() failed\n");
exit(EXIT_FAILURE);
}
p = malloc(1000);
free(p);
free(p); //doubel free
exit(EXIT_SUCCESS);
}
[root@localhost test]# ./a.out
block freed twice
Aborted
上面只是简单的演示了其基本用法,更详细的用法参见man 文档。
MALLOC_CHECK_
环境变量 提供了类似于mcheck
的功能和mprobe的功能,但是MALLOC_CHECK_
这种方式无需进行修改和重新编译,通过设置不同的值来控制对内存分配错误的响应方式下面是一个使用MALLOC_CHECK_
环境变量的实现方式mcheck
的功能的例子:#include
#include
#include
int main(int argc, char *argv[])
{
char *p;
p = malloc(1000);
++p;
free(p); //非法释放
free(p); //double free
exit(EXIT_SUCCESS);
}
编译上面得到代码之前先导出下MALLOC_CHECK_环境变量
[root@localhost test]# export MALLOC_CHECK_=1 //其值应该是一个单数字,具体的含义可以参考man 3 mallopt
[root@localhost test]# gcc mcheck.c -lmcheck //编译的时候链接mcheck即可
[root@localhost test]# ./a.out
memory clobbered before allocated block
Aborted
上面的三种方式都是通过函数库的形式给程序添加了内存分配的检测,和追踪功能,我们也可以使用一些第三方的工具来完成这些功能,比较流行的有Valgrind,Insure++等。
linux提供了mallopt用来修改各选参数,以控制malloc所采用的算法,例如:何时进行sbrk进行堆收缩。规定从堆中分配内存块的上限,超出上限的内存块则使用mmap系统调用,此外还提供了mallinfo函数,这个函数会返回一个结构包含了malloc分配内存的各种统计数据。下面是mallinfo的接口声明和基本使用。
#include
struct mallinfo mallinfo(void);
struct mallinfo {
int arena; /* Non-mmapped space allocated (bytes) */
int ordblks; /* Number of free chunks */
int smblks; /* Number of free fastbin blocks */
int hblks; /* Number of mmapped regions */
int hblkhd; /* Space allocated in mmapped regions (bytes) */
int usmblks; /* Maximum total allocated space (bytes) */
int fsmblks; /* Space in freed fastbin blocks (bytes) */
int uordblks; /* Total allocated space (bytes) */
int fordblks; /* Total free space (bytes) */
int keepcost; /* Top-most, releasable space (bytes) */
};
下面是一段代码显示了当前进程的malloc分配内存信息
#include
#include
#include
#include
static void display_mallinfo(void)
{
struct mallinfo mi;
mi = mallinfo();
printf("Total non-mmapped bytes (arena): %d\n", mi.arena);
printf("# of free chunks (ordblks): %d\n", mi.ordblks);
printf("# of free fastbin blocks (smblks): %d\n", mi.smblks);
printf("# of mapped regions (hblks): %d\n", mi.hblks);
printf("Bytes in mapped regions (hblkhd): %d\n", mi.hblkhd);
printf("Max. total allocated space (usmblks): %d\n", mi.usmblks);
printf("Free bytes held in fastbins (fsmblks): %d\n", mi.fsmblks);
printf("Total allocated space (uordblks): %d\n", mi.uordblks);
printf("Total free space (fordblks): %d\n", mi.fordblks);
printf("Topmost releasable block (keepcost): %d\n", mi.keepcost);
}
int main(int argc, char *argv[])
{
char *p;
p = malloc(1000);
display_mallinfo();
free(p);
printf("+++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++\n");
display_mallinfo();
exit(EXIT_SUCCESS);
}
下面是运行后的结果:
[root@localhost test]# ./a.out
Total non-mmapped bytes (arena): 135168
# of free chunks (ordblks): 1
# of free fastbin blocks (smblks): 0
# of mapped regions (hblks): 0
Bytes in mapped regions (hblkhd): 0
Max. total allocated space (usmblks): 0
Free bytes held in fastbins (fsmblks): 0
Total allocated space (uordblks): 1024 //这是分配的内存,我的代码中分配的是1000,因为malloc会字节对齐,因此变成了1024
Total free space (fordblks): 134144
Topmost releasable block (keepcost): 134144
+++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++
Total non-mmapped bytes (arena): 135168
# of free chunks (ordblks): 1
# of free fastbin blocks (smblks): 0
# of mapped regions (hblks): 0
Bytes in mapped regions (hblkhd): 0
Max. total allocated space (usmblks): 0
Free bytes held in fastbins (fsmblks): 0
Total allocated space (uordblks): 0
Total free space (fordblks): 135168
Topmost releasable block (keepcost): 135168
关于mallopt的使用这里就略过了,因为这东西较复杂,笔者自己也没认真看过。如果你希望了解,我给你推荐的第一手资料绝对是man 3 mallopt
。
关于为什么要内存对齐,我推荐给大家一篇文章Data alignment: Straighten up and fly right,通常我们在讨论内存的时候常常会使用byte来作为内存的最小分配单位,于是乎大家就认为内存是一个字节一个字节的进行读取的……,但其实这是一个误区,byte做内存的基本单位这是从程序员的角度来看待内存的,如果是CPU的话,它不会也这样看待,毕竟一次只读一个字节似乎有点太慢,的确,对于CPU来说,内存是一个个内存块来读取,内存块的大小通常是2的整数次幂。不同的硬件架构不同,一般是4或8个字节,如果字节不对齐会有什么后果呢?最直接的后果就是会导致你的程序变慢。具体分析如下:
对于单字节对齐的系统来说(这也正是程序员看到的内存状态)从地址0开始读取4个字节和从地址1开始读取4个字节没有任何区别,所以也不存在字节对齐的概念,对不对齐其实都一样。对于4字节对齐的系统来说,CPU一次要读取4个字节的内容,从地址0开始读取4个字节0~3,只需要读取一次就ok了。如果从1开始读取的话,需要读二次,第一次读0~3,第二次读4~7,然后截取这两个内存块的1~4这个区域,就是读取到的四个字节的内容了。因为CPU只会一个个内存块的边界开始读取一个内存块,地址1并不是内存块的边界,因此CPU会从0开始读取。就是这样的一个简单操作导致了CPU多进行了一次读操作,可想而知内存对齐该有多重要。关于内存对齐的更多分析请看我给大家推荐的文章。linux提供了posix_memalign和memalign两个函数用于分配字节对齐的内存地址,其函数原型如下:
#include
int posix_memalign(void **memptr, size_t alignment, size_t size);
#include
void *memalign(size_t alignment, size_t size);
我们知道malloc是在堆上进行内存分配的,但是你有听过在栈上也可以分配内存的嘛,的确是可以的alloca就可以在栈上进行内存的分配,因为当前函数的栈帧是位于堆栈的顶部。帧的上方是存在可扩展空间,只需要改堆栈指针值即可,其函数原型如下:
#include
void *alloca(size_t size);
通过alloca分配的内存不需要进行释放,因为函数运行结束后自动释放对应的栈帧,修改器堆栈指针为前一个栈帧的末尾地址。alloca是不是很神奇,笔者很想知道其实现原理。尽管上文中已经说到了,其实就是利用栈上的扩展空间,扩展了栈的空间,使用栈上的扩展空间来进行内存的分配。下面是其实现代码的汇编表示.
#include
#include
#include
int main()
{
void *y = NULL;
y = alloca(4);
}
pushq %rbp //保存上一个栈帧的基址寄存器
movq %rsp, %rbp //设置当前栈帧的基址寄存器
subq $16, %rsp //开闭16个字节的空间,因为是向下增长,所以是subq
movq $0, -8(%rbp) //void *y = NULL
movl $16, %eax //下面是一连串的地址大小计算,现在可以不用管这些细节
subq $1, %rax
addq $19, %rax
movl $16, %ecx
movl $0, %edx
divq %rcx
imulq $16, %rax, %rax
subq %rax, %rsp //修改rsp的地址,也就是栈顶地址
movq %rsp, %rax
addq $15, %rax
shrq $4, %rax
salq $4, %rax
movq %rax, -8(%rbp) //将分配的地址赋值给y 也就是y = alloca(4)
leave
ret
打印下y本身的地址和分配的地址如下:
y的地址:0x7ffd366b7fd8
分配的地址:0x7ffd366b7fb0
根据y
的地址结合汇编代码可知,栈顶的地址是0x7ffd366b7fd8 - 8 =0x7ffd366b7fd0
分配的地址是0x7ffd366b7fb0
, 两者相差0x20
。也就是说虽然分配的是4个字节,但是栈顶却减少了0x20
个字节,那么现在的栈顶就是0x7ffd366b7fb0
,之前的栈顶是0x7ffd366b7fd0
,这中间的区域就是分配的空间,至于为什么是0x20
这一应该是和malloc
的初衷相同,考虑到字节对齐吧。