性能测试的时候,一个问题就是时间间隔,有很多时间函数能获取时间,从而求取时间间隔。关于这方面的文章很多,我就不重复了,这里只是提供一些基本的信息,从而方便我自己做性能测试使用:
(1)C语言时间函数clock()和clock_t:
time.h中的c语言时间函数clock()能获取当前时间。需要注意的是,这个函数在Windows和Linux下是通用的,但是其返回值的单位是不同的,一个是毫秒,一个是微秒。
从单位也可以看出该方式获取时间的精度。总体来说,其精度在毫秒级,所以测试性能的时候,对于粗时间间隔的测试,用这个函数就足够了。
需要注意的是:在linux上,clock()获取的是CPU时间,不是wall-clock时间,所以如果使用了sleep()等函数,那么是不会计算在内的。但是在Windows平台上,clock()获取的时间包括Sleep()等函数的时间,所以使用clock()的时候要注意这一点,在Linux上得到的很可能不是一个正确的Elapsed time。
(2)利用CPU获取高精度时间rdtsc寄存器
rdtsc是一个64位的寄存器,新的CPU都具备这个寄存器,用于记录从计算机启动开始CPU经过的时钟周期,可见其精度之高是和CPU的频率级别的。
可以参考http://blog.sina.com.cn/s/blog_5d9051c00100jcsn.html的文章。
由于是寄存器,所以只要使用汇编读取寄存器的值就可以得到时间了,具体关于汇编的写法有一些不同的形式,具体可以参考网上的写法,而且windows和Linux下也可能是有一些区别。需要注意的是,即使都是在Linux下或都是Windows下,编译64位和32位的时候,其写法也会不一样,参考:http://www.phpzy.com/php/1068620.html和http://www.uplook.cn/index-Index-show-view2681.html?treeid=624(如果错误使用,得到的时间间隔可能为负数)
PS:在Linux上,-m32和-m64选项分别表示生成32位和64位程序,使用-m32会定义__i386__宏,使用-m64则使用__x86_64__宏。
关于Windows上,也可以使用rdtsc寄存器,但是windows上生成64位程序的时候,不知道该如何获得正确值,参考http://sunxiunan.com/?p=983里面有64位的情况,但是只能用于Itanium CPU上。根据MSDN的说明(http://msdn.microsoft.com/en-us/library/ee417693.aspx),不建议使用rdtsc寄存器,建议使用更精确的windows API的QueryPerformanceCounter和QueryPerformanceFrequency。
(3)Windows平台的QueryPerformanceCounter和QueryPerformanceFrequency的使用:
参考:http://www.oschina.net/code/snippet_197161_6789
(4)Timing.h和测试:
下面是能运行于Linux和Windows的代码,可以用于计算程序运行时间,对于一样的性能测试,应该可以胜任。
-
- #ifndef TIMING_H
- #define TIMING_H
-
- #include
- #include
-
- #ifdef WIN
- #include
- #define timing_t double
- static _LARGE_INTEGER time_start, time_over;
- static double dqFreq;
-
- static inline void startTiming()
- {
- _LARGE_INTEGER f;
- QueryPerformanceFrequency(&f);
- dqFreq=(double)f.QuadPart;
-
- QueryPerformanceCounter(&time_start);
- }
-
-
- static inline timing_t stopTiming()
- {
- QueryPerformanceCounter(&time_over);
- return ((double)(time_over.QuadPart-time_start.QuadPart)/dqFreq*1000);
- }
-
- static inline timing_t stopWithPrintTiming()
- {
- timing_t timing;
- QueryPerformanceCounter(&time_over);
- timing = ((double)(time_over.QuadPart-time_start.QuadPart)/dqFreq*1000);
- printf("----------Elapsed Timing(ms) : %.3lf\n", timing);
- printf("----------------------------------------\n");
-
- return timing;
- }
-
- #else
- #include
- typedef unsigned long long int64;
- #define timing_t int64
- #if defined(__i386__)
- inline int64 GetCycleCount() {
- int64 result;
- __asm__ __volatile__ ("rdtsc" : "=A" (result));
- return result;
- }
- #elif defined(__x86_64__)
- inline int64 GetCycleCount()
- {
- int64 hi, lo;
- __asm__ __volatile__ ("rdtsc" : "=a"(lo), "=d"(hi));
- return ( (int64)lo)|( ((int64)hi)<<32 );
- }
- #endif
-
- static int64 ticks_start, ticks_end;
-
- static inline void startTiming()
- {
- ticks_start = GetCycleCount();
- }
-
-
- static inline int64 stopTiming()
- {
- ticks_end = GetCycleCount();
- return (ticks_end - ticks_start);
- }
-
- static inline int64 stopWithPrintTiming()
- {
- int64 timing;
- ticks_end = GetCycleCount();
- timing = (ticks_end - ticks_start);
- printf("----------Elapsed Timing(Cycles) : %llu\n", timing);
- printf("----------------------------------------\n");
-
- return timing;
- }
- #endif
-
-
- static inline void wait(int ms)
- {
- #ifdef WIN32
- Sleep(ms);
- #else
- usleep(ms*1000);
- #endif
- }
-
- #endif
-
- #include "timing.h"
-
- int main()
- {
- timing_t ticks_start, ticks_end;
- startTiming();
-
- wait(3000);
- timing_t timing = stopWithPrintTiming();
-
- return 1;
- }
Windows上编译:cl foo.cpp /DWIN,分别启动64bit和32bit的VS控制台进行测试。
Linux上编译:gcc foo.cpp -m32和gcc foo.cpp -m64进行测试。
C语言中常用计时方法总结
1. time()
头文件:time.h
函数原型:time_t time(time_t * timer)
功能:返回以格林尼治时间(GMT)为标准,从1970年1月1日00:00:00到现在的此时此刻所经过的秒数。
用time()函数结合其他函数(如:localtime、gmtime、asctime、ctime)可以获得当前系统时间或是标准时间。
用difftime函数可以计算两个time_t类型的时间的差值,可以用于计时。用difftime(t2,t1)要比t2-t1更准确,因为C标准中并没有规定time_t的单位一定是秒,而difftime会根据机器进行转换,更可靠。
用法:
- time_t start,end;
- start =time(NULL);
-
- end =time(NULL);
- printf("time=%d\n",difftime(end,start));
总结:C标准库中的函数,可移植性最好,性能也很稳定,但精度太低,只能精确到秒,对于一般的事件计时还算够用,而对运算时间的计时就明显不够用了。
2. clock()
头文件:time.h
函数原型:clock_t clock(void);
功能:该函数返回值是硬件滴答数,要换算成秒,需要除以CLK_TCK或者 CLK_TCKCLOCKS_PER_SEC。比如,在VC++6.0下,这两个量的值都是1000。
用法:
- clock_t start,end;
- start = clock();
-
- end = clock();
- printf("time=%f\n",(double)end-start)/CLK_TCK);
总结:可以精确到毫秒,适合一般场合的使用。
3. timeGetTime()
WIN32API
头文件:Mmsystem.h 引用库: Winmm.lib
函数原型:DWORD timeGetTime(VOID);
功能:返回系统时间,以毫秒为单位。系统时间是从系统启动到调用函数时所经过的毫秒数。注意,这个值是32位的,会在0到2^32之间循环,约49.71天。
用法:
- DWORDstart,end;
- start= timeGetTime();
-
- end= timeGetTime();
- printf("time=%d\n",end-start);
总结:该函数的时间精度是五毫秒或更大一些,这取决于机器的性能。可用timeBeginPeriod和timeEndPeriod函数提高timeGetTime函数的精度。如果使用了,连续调用timeGetTime函数,一系列返回值的差异由timeBeginPeriod和timeEndPeriod决定。
4. GetTickCount()
WIN32API
头文件:windows.h
函数原型:DWORD WINAPI GetTickCount(void);
功能:返回自设备启动后的毫秒数(不含系统暂停时间)。
用法:
- DWORDstart,end;
- start= GetTickCount();
-
- end= GetTickCount();
- printf("time=%d\n",end-start);
总结:精确到毫秒。对于一般的实时控制,使用GetTickCount()函数就可以满足精度要求。
5. QueryPerformanceCounter()、QueryPerformanceFrequency()
WIN32API
头文件:windows.h
函数原型:BOOLQueryPerformanceCounter(LARGE_INTEGER *lpPerformanceCount);
BOOLQueryPerformanceFrequency(LARGE_INTEGER *lpFrequency);
功能:前者获得的是CPU从开机以来执行的时钟周期数。后者用于获得你的机器一秒钟执行多少次,就是你的时钟周期。
补充:LARGE_INTEGER既可以是一个8字节长的整型数,也可以是两个4字节长的整型数的联合结构, 其具体用法根据编译器是否支持64位而定:
- typedef union_LARGE_INTEGER
- {
- struct
- {
- DWORD LowPart ;
- LONG HighPart;
- };
- LONGLONG QuadPart ;
- }LARGE_INTEGER;
用法:
在进行定时之前,先调用QueryPerformanceFrequency()函数获得机器内部定时器的时钟频率,然后在需要严格定时的事件发生之前和发生之后分别调用QueryPerformanceCounter()函数,利用两次获得的计数之差及时钟频率,计算出事件经历的精确时间。
- LARGE_INTEGER num;
- longlong start,end,freq;
- QueryPerformanceFrequency(&num);
- freq=num.QuadPart;
- QueryPerformanceCounter(&num);
- start= num.QuadPart;
-
- QueryPerformanceCounter(&num);
- end= num.QuadPart;
- printf("time=%d\n",(end-start)*1000/freq);
总结:这种方法的定时误差不超过1微秒,精度与CPU等机器配置有关,一般认为精度为透微秒级。在Windows平台下进行高精度计时的时候可以考虑这种方法。
6. gettimeofday()
Linux C函数。
头文件:sys/time.h
函数原型:int gettimeofday(struct timeval *tv,struct timezone *tz);
说明:其参数tv是保存获取时间结果的结构体,参数tz用于保存时区结果(若不使用则传入NULL即可)。
timeval的定义为:
- struct timeval {
- long tv_sec;
- long tv_usec;
- }
可见该函数可用于在linux中获得微秒精度的时间。
用法:
- struct timeval start,end;
- gettimeofday(&start, NULL );
-
- gettimeofday(&end, NULL );
- long timeuse =1000000 * ( end.tv_sec - start.tv_sec ) + end.tv_usec - start.tv_usec;
- printf("time=%f\n",timeuse /1000000.0);
总结:使用这种方式计时,精度可达微秒。经验证,在arm+linux的环境下此函数仍可使用。推荐。
7. RDTSC - 读取时间标签计数器
X86架构CPU汇编指令。
操作码:0F 31 指令:RDTSC
功能:将时间标签计数器读入 EDX:EAX寄存器中。
说明:在Pentium以上的CPU中,提供了一条机器指令RDTSC来读取这个时间戳的数字,并将其保存在EDX:EAX寄存器对中。由于EDX:EAX寄存器对恰好是Win32平台下C++语言保存函数返回值的寄存器,所以我们可以把这条指令看成是一个普通的函数调用:
- inline unsigned long longGetCycleCount()
- {
- __asm RDTSC
- }
如果编译器不允许直接用RDTSC的话,可以用_emit伪指令直接嵌入该指令的机器码形式0X0F、0X31:
- inline unsigned long long GetCycleCount()
- {
- __asm _emit 0x0F
- __asm _emit 0x31
- }
计算时还需要将得到的数字除以CPU的主频(单位GHZ),就能得到纳秒级的时间了。暂时我还没找到好的获得机器主频的方法,Windows平台下可以考虑用QueryPerformanceFrequency()函数,但这样一来就没办法在Linux下使用此方法。后来我考虑配合sleep函数,获取1秒中的机器周期数的方法来得到CPU主频。如果哪位有更好的方法,还请多多请教。
- #ifdef WIN32
- #include
- #else
- #include
- #endif
- inline unsigned long long GetNTime()
- {
- __asm("RDTSC");
- }
-
- static double hz=0.0;
-
- void init_timer()
- {
- longlong t1=GetNTime();
- #ifdef WIN32
- Sleep(1000);
- #else
- sleep(1);
- #endif
- longlong t=GetNTime()-t1;
- hz=(double)t/1000000000;
- printf("hz=%fGhz\n",hz);
- }
-
- long long u_timer(long long *t,int mode)
- {
- if(hz<0.001)
- init_timer();
- if(!mode)
- {
- *t=GetNTime();
- return0;
- }
-
- longlong t1=GetNTime()-*t;
- t1/=hz;
- longlong ns=t1%1000;
- longlong us=(t1/1000)%1000;
- longlong ms=(t1/1000000)%1000;
- longlong s=t1/1000000000;
-
- printf("time=");
- if(s!=0)
- printf("%llds",s);
- if(ms!=0)
- printf("%lldms",ms);
- if(us!=0)
- printf("%lldus",us);
- if(ns!=0)
- printf("%lldns",ns);
- printf("\n");
-
- *t=GetNTime();
- returnt1;
- }
总结:这种方法精确到纳秒,但缺点是非常短时间的计时会不稳定。最近因为项目需要,我也找了一下ARM+Linux平台上可以用的计时方法,后来选择了gettimeofday()。不知道ARM+Linux平台上有没有类似RDTSC的这种指令。