网上对于tbb和tcmalloc的介绍一堆,到底哪个效率高,,亲手测测,以飨读者。
1.tbb的用法,编译tbb工程生成相应文件。注意其中的***_debug.lib 是我手动修改文件名***.lib 得到的,哈哈,方法比较低俗。
2. 新建一个控制台程序,设置项目路径(include的路径都需要设置),将我们生成的lib和dll文件都拷贝到当前工程的文件夹下面,tbb的工程不需要设置“输入库(lib文件)(例如tcmalloc就需要,“附件依赖”库,如第5步所示),因为在tbb的头文件会帮我们自动引入依赖的tbb 库(头文件里用到的是#pragma comment(lib,"tbb_**.lib")的语句)。
3. 在源文件中包含#include <tbb/tbbmalloc_proxy.h> 即可
4. tcmalloc 的设置,先编译生成lib文件和dll文件。
5. 设置用到的tcmalloc lib文件,并且要设置一个特殊的连接器选项:如图
6. 将生成的tcmalloc相关的dll文件拷贝到 exe生成目录,如图:
7 ok了,贴代码,其中有结果,何不在你自己的电脑上面试一下。
注意(1)用tcmalloc时保留“强制符号引用”的链接选项,去掉tbb相关头文件包含。
(2) 用tbb时保留头文件包含, 去掉“强制符号引用”的链接选项
(3)用系统默认malloc时,把头文件和”强制符号引用”的链接选项都干掉
#include <Windows.h> #include <iostream> #include <malloc.h> //#include <tbb/tbbmalloc_proxy.h> //这是tbb包含的头文件, win32系统默认malloc是只要注释该头文件引用 using namespace std; // 执行多少轮 #define MAX_SCALE (4000) //每轮生成 2 4 8 16 32 64 126 256 512 1024 2048 4096 。。。。共16种规格的内存 #define MAX_SIZE 16 DWORD WINAPI worker(LPVOID lpThreadParameter){ int iterations = MAX_SCALE; void* ps[MAX_SCALE][MAX_SIZE]; while(iterations-- ) { for (int i = 0; i < MAX_SIZE; i ++){ int size = (int)pow(2.0, i); void * p = malloc(size); memset(p,0,size); ps[iterations][i] = p; } } iterations = MAX_SCALE; while(iterations-- ) { for (int i = 0; i < MAX_SIZE; i ++){ free(ps[iterations][i]); } } return NULL; } void main(){ int scale = 4; cout << "start " << endl; HANDLE* handles = new HANDLE[scale]; cout << "HANDLE newed" << endl; DWORD start = ::GetTickCount(); for (int i = 0; i < scale; i ++){ DWORD threadID; handles[i] = CreateThread(0, 0x1000000000, worker, NULL, NULL, &threadID); } WaitForMultipleObjects(scale, handles, true, INFINITE); DWORD end = ::GetTickCount(); cout << end-start << endl; } // tbb 运行结果 797 // win 系统运行结果 1594 // tcmalloc 运行结果 984 (__tcmalloc;%(ForceSymbolReferences) //这是tcmalloc的连接选项)
确实都比系统自带的强一些,,你会选择哪个呢?
欢迎朋友们留言,,得到回音是幸福的!!