在从前写的一篇blog中,我介绍了测量程序运行时间的方法,其中在讲到基于Timer的测量方法时,介绍了一个Win32函数QueryPerformanceCounter(),其实使用这种这个函数比起嵌入汇编的方法还是方便很多,但是也容易引起一些问题。下面是一段示例代码.
LARGE_INTEGER freq;
LARGE_INTEGER startTime, endTime;
LARGE_INTEGER elapsedTime, elapsedMilliseconds;
QueryPerformanceFrequency(&freq); //得到处理器的主频
QueryPerformanceCounter(&startTime);
// 可以在这里放置程序代码
QueryPerformanceCounter(&endTime);
elapsedTime = endTime - startTime;
elapsedMilliseconds = (1000 * elapsedTime) / freq;
但是随着目前计算机多处理器并行计算的日渐普遍,这样的方式有可能引起极大的错误,假如这样的代码:
QueryPerformanceCounter(&startTime);
QueryPerformanceCounter(&endTime);
在不同的处理器上执行,有可能是endTime在startTime执行之前完成,那么这样,最后计算的结果就会引起错误.
MSDN针对QueryPerformanceCounter也有以下一段说明文字:
On a multiprocessor computer, it should not matter which processor is called. However, you can get different results on different processors due to bugs in the basic input/output system (BIOS) or the hardware abstraction layer (HAL). To specify processor affinity for a thread, use the SetThreadAffinityMask function.
具体的做法在Game Timing and Multicore Processor这篇文章中有介绍,在该文章中,也建议不要使用RDTSC指令来获取时间,当然考虑到兼容性的需要,也提供了相应的工具修补这个问题.
P.S: 这里有一个关于Timer的实现类,处理了QueryPerformanceCounter引起的常见错误.