补充:测量程序运行时间的几种方法

     在从前写的一篇blog中,我介绍了测量程序运行时间的方法,其中在讲到基于Timer的测量方法时,介绍了一个Win32函数QueryPerformanceCounter(),其实使用这种这个函数比起嵌入汇编的方法还是方便很多,但是也容易引起一些问题。下面是一段示例代码.

LARGE_INTEGER freq;
LARGE_INTEGER startTime, endTime;
LARGE_INTEGER elapsedTime, elapsedMilliseconds;
QueryPerformanceFrequency(&freq);                       //得到处理器的主频
QueryPerformanceCounter(&startTime);

// 可以在这里放置程序代码


QueryPerformanceCounter(&endTime);
elapsedTime = endTime - startTime;
elapsedMilliseconds = (1000 * elapsedTime) / freq;


     但是随着目前计算机多处理器并行计算的日渐普遍,这样的方式有可能引起极大的错误,假如这样的代码:

QueryPerformanceCounter(&startTime);
QueryPerformanceCounter(&endTime);

      在不同的处理器上执行,有可能是endTime在startTime执行之前完成,那么这样,最后计算的结果就会引起错误.

       MSDN针对QueryPerformanceCounter也有以下一段说明文字:

On a multiprocessor computer, it should not matter which processor is called. However, you can get different results on different processors due to bugs in the basic input/output system (BIOS) or the hardware abstraction layer (HAL). To specify processor affinity for a thread, use the SetThreadAffinityMask function.

    具体的做法在Game Timing and Multicore Processor这篇文章中有介绍,在该文章中,也建议不要使用RDTSC指令来获取时间,当然考虑到兼容性的需要,也提供了相应的工具修补这个问题.

    P.S:  这里有一个关于Timer的实现类,处理了QueryPerformanceCounter引起的常见错误.

你可能感兴趣的:(thread,timer,汇编,Integer,basic,bugs)