从奔腾系列开始,Intel X86 处理器中增加了一个64位的时间戳寄存器(TSC),每个经过一个时钟周期,该寄存器加1;机器重启时,该寄存器将清空。
现在的处理器其主频都在1G以上,也就是说其时钟周期是纳秒级的(1秒/1000000000=1纳秒)。
那该寄存器会不会溢出呢?我们可以计算一下,假设机器的主频是3GMHz, 也就是说1秒钟包含3,000,000,000个时钟周期,每个时钟周期为0.33333纳秒,则64位寄存器溢出所需要的时间为:
2^64 / 3000000000 ≈ 6148914691 秒 ≈71168天 ≈ 195年
因此TSC溢出基本是不可能的了。
RDTSC 是一条机器指令用于读取该时间戳寄存器中的值。
下面的程序就是通过在C语言调用RDTSC来得到时钟周期:
#include <windows.h>
#include <stdio.h>
__int64 __declspec(naked)read_time_stamp_counter()
{
__asm cpuid;
__asm rdtsc;
__asm ret;
}
int main()
{
float ticks_1, ticks_2;
unsigned int i,j=0;
unsigned int loop = 4000000000;
ticks_1= (float)read_time_stamp_counter();
for(i=0;i<loop;i++)
{
j++;
j++;
}
ticks_2= (float)read_time_stamp_counter();
printf("\ntotal ticks is : %f\n",ticks_2-ticks_1);
printf("\ntotal ticks per loop is :%f\n", (ticks_2-ticks_1)/loop);
printf("\ntotal time is %f seconds\n",(ticks_2 - ticks_1)/3300000000);
return 1;
}
说明:
(1)子函数read_time_stamp_counter()并没有明确的指定返回值,为什么程序中仍然可以得到正确的值?原因在于指令RDTSC将时间戳的放在EDX:EAX中,而这与C语言子函数的返回值的存放地址是一致的(参见http://blog.sina.com.cn/s/blog_5d9051c00100jcnj.html)
(2)子函数read_time_stamp_counter()的定义中加入__deslspec(naked),是避免编译器在编译该函数时添加其他的语句,通过下面的C代码的反汇编可以看到__deslspec(naked)的作用:
(3)运行程序的计算机的CPU是3.3GHZ。
(4) 程序的运行结果如下,从中可以看出, 每个循环所耗费的时钟周期是12左右,(注意时钟周期不同于指令周期,指令周期是指执行一条指令所花费的时间,可以用时钟周期表示,一般一个指令周期等于1个或多个时钟周期);根据时钟周期总数和CPU的主频,我们可以计算出整个循环所花费的时间大约是14.83秒。