这两天在移植libhugetlbfs到2.6.36 for Loogson上,移植完成后需要测试linpack在大页面支持下的性能。但是却发现大页面对linpack无效,linpack死活不利用大页面。怎么回事?莫非linpack使用mmap接口分配内存?怎么这样呢~!
于是今天分析了linpack源码,结果发现它里面的内存分配都是用malloc实现的。那为什么大页面支持会对其无效呢?
刚才做了个试验,分别将一个应用按照static模式 和普通模式 编译,然后用大页面支持他们,测试结果表明:
static模式下,应用内部的malloc函数不能被大页面库截获,大页面没有被利用。
普通模式下,应用内部的malloc函数能够被大页面库截获,大页面被利用。
所以我认为:hpl(high performance Linpack)程序在编译时采用了static选项,导致无法用大页面对其进行支持。需要得到hpl的源码,去掉static选 项,重新编译即可。
科普:
1. LD_PRELOAD的原理就是截取对函数库的调用,使用static后,库函数被内联到了应用中,LD_PRELOAD没有了任何可乘之机。
2. gcc static 编译选项: http://blog.19lou.com/10061845/viewspace-384095
3. 大页面: http://www.ibm.com/developerworks/cn/linux/l-cn-hugetlb/index.html
===================================================================================
memory_alloc_test.c
#include <stdio.h> #include <stdlib.h> #define ARR_SIZE 1024*1024*64 int main() { char * m = NULL; int i = 0; int j = 100; m = (char*)malloc(ARR_SIZE); while(j--) for (i = 0; i < ARR_SIZE; i+=1024) { m[i] = 'a'; } free(m); }
root@Loong:# gcc -static memory_alloc_test.c -o static
root@Loong:# gcc memory_alloc_test.c -o dynamic
root@Loong:# LD_PRELOAD=/usr/local/libhugetlbfs.so HUGETLB_MORECORE=yes ./static
//FreeHugePage数量不变
root@Loong:# LD_PRELOAD=/usr/local/libhugetlbfs.so HUGETLB_MORECORE=yes ./dynamic
//FreeHugePage数量减少3页(32MB每页)
===================================================================================