如何利用rdtsc计算纳秒级的时间

    从奔腾系列开始,Intel X86 处理器中增加了一个64位的时间戳寄存器(TSC),每个经过一个时钟周期,该寄存器加1;机器重启时,该寄存器将清空。

    现在的处理器其主频都在1G以上,也就是说其时钟周期是纳秒级的(1秒/1000000000=1纳秒)。 

    那该寄存器会不会溢出呢?我们可以计算一下,假设机器的主频是3GMHz, 也就是说1秒钟包含3,000,000,000个时钟周期,每个时钟周期为0.33333纳秒,则64位寄存器溢出所需要的时间为:

         2^64 / 3000000000 ≈ 6148914691 秒 ≈71168天 ≈ 195年

因此TSC溢出基本是不可能的了。


    RDTSC 是一条机器指令用于读取该时间戳寄存器中的值。

   下面的程序就是通过在C语言调用RDTSC来得到时钟周期:


#include
#include

__int64 __declspec(naked)read_time_stamp_counter()
{
     __asm cpuid;  
     __asm rdtsc;
     __asm ret;
}


int main()


     float ticks_1, ticks_2;
     unsigned int i,j=0;
     unsigned int loop = 4000000000;

     ticks_1= (float)read_time_stamp_counter();
     for(i=0;i      {
         j++;
         j++;
     }

     ticks_2= (float)read_time_stamp_counter();
 
     printf("\ntotal ticks is : %f\n",ticks_2-ticks_1);
     printf("\ntotal ticks per loop is :%f\n", (ticks_2-ticks_1)/loop);
     printf("\ntotal time is %f seconds\n",(ticks_2 - ticks_1)/3300000000);
     return 1;
}
 

说明:
(1)子函数read_time_stamp_counter()并没有明确的指定返回值,为什么程序中仍然可以得到正确的值?原因在于指令RDTSC将时间戳的放在EDX:EAX中,而这与C语言子函数的返回值的存放地址是一致的(参见http://blog.sina.com.cn/s/blog_5d9051c00100jcnj.html
(2)子函数read_time_stamp_counter()的定义中加入__deslspec(naked),是避免编译器在编译该函数时添加其他的语句,通过下面的C代码的反汇编可以看到__deslspec(naked)的作用:




(3)运行程序的计算机的CPU是3.3GHZ。


(4) 程序的运行结果如下,从中可以看出, 每个循环所耗费的时钟周期是12左右,(注意时钟周期不同于指令周期,指令周期是指执行一条指令所花费的时间,可以用时钟周期表示,一般一个指令周期等于1个或多个时钟周期);根据时钟周期总数和CPU的主频,我们可以计算出整个循环所花费的时间大约是14.83秒。

如何利用rdtsc计算纳秒级的时间_第1张图片

 

你可能感兴趣的:(C/C++)