intel-pcm简单介绍

Performance Counter Monitor(PCM)是一个由英特尔开发的,也是基于PMU(performance monitoring unit)一个性能检测工具。

它是运行在msr 内核模块(perf是内核系统调用吧?)上的,提供了C++ API。


相关的源码可以从git上查看

https://github.com/erikarn/intel-pcm/blob/ecc0cf608dfd9366f4d2d9fa48dc821af1c26f33/src/cpucounters.cpp


这里主要记录下PCM在程序中的简单使用




使用性能计数器之前,应首先对它们进行初始化。完成初始化后,可在相关代码段之前和之后,也就是两个时间点捕获计数器状态。

不同例程会捕获面向内核、插槽或整个系统的计数器,并将它们的状态存储于相应的数据结构中。其它例程则可基于这些状态计算性能指标。

下方代码片段展示了一个具体的使用示例:

PCM * m = Monitor::getInstance(); 
   if (m->program() != PCM::Success) // program counters 
       return -1;  // error occured during programming 
   SystemCounterState before_sstate = getSystemCounterState();  
      [run your code here]  
   SystemCounterState after_sstate = getSystemCounterState();  
   cout << “Instructions per clock:“ << getIPC(before_sstate,after_sstate)  
      << “L3 cache hit ratio:” << getL3CacheHitRatio(before_sstate,after_sstate)  
      << “Bytes read:”<< getBytesReadFromMC(before_sstate,after_sstate)  
      << [and so on]… 
m->cleanup();


另外,还可以有其他用法,如:

std::vector cstates1, cstates2;
std::vector sktstate1, sktstate2;
SystemCounterState sstate1, sstate2;
m->getAllCounterStates(sstate1, sktstate1, cstates1);

sleep(2);

m->getAllCounterStates(sstate2, sktstate2, cstates2);

getIPC(cstates1[coreid],cstates2[coreid]); 



参考:

http://www.cnblogs.com/rickyz/archive/2011/08/24/2152009.html

http://stackoverflow.com/questions/21250695/difference-in-perf-and-intel-pcm

你可能感兴趣的:(intel-pcm简单介绍)