利用NT Native API获取NT系统的CPU使用率(支持多核)

转载请注明原处,自:http://blog.csdn.net/JPEXE/article/details/3541270


说明:

最近公司的新项目网管系统二期功能 进行监控优化,业务人员希望分别看到 总CPU使用率(多核)及单核CPU使用率的监控告警,参考总CPU使用率的计算原理,转帖记录。


以下为转载原文:


[前言]

本文的目的不是贴代码,而是希望通过较浅显的文字,讲明白求解CPU使用率的方法.所以急功近利的人并不适合阅读本文.


[概述]

其实,获取Windows系统的CPU使用率已经是老问题了.大概是有以下几种方法:

1.查询注册表(HKEY_DYN_DATA),这个适用于Win9x,太老的东西,觉得现在基本没有什么必要再去了解它.
2.利用性能计数器(PDH)接口查询,支持NT系统,功能全面,用起来也方便,不过不是本文讨论的重点,只提一下.
3.利用Windows NT Native API(以下简称Native API,它们是ntdll.dll中的一些未公开API)来获取数据并计算CPU使用率.(本文主要讲它)
(也许还有其它的吧?...)

利用Native API来获取CPU使用率的方法,网上已有很多介绍的文章,也不乏代码.不过,现在双核(甚至更多)的CPU比较普及,然而网上的文章主要介绍了获取总的CPU使用率的方法,我却未找到关于怎样使用Native API来获取多核中每个单独核心CPU使用率的方法的相关文章.也许是我视力不好,没注意看到也说不定.

不能发扬"拿来主义",那就应该"自己动手",才能"丰衣足食".学习了前辈文章的一些方法,自己再仔细研究了Native API(对此有兴趣的朋友可以去读读
<<Windows NT/2000 Native API Reference>>),终于找到了支持多核的方法.在此拿出来和大家分享.


[什么是CPU使用率?]

首先,我要谈到一个概念:"什么是CPU使用率"(认为明白此概念的朋友可以跳过这节),为什么要强调它?是因为我发现有些人误解了这个概念,而这样的话,就不能正确地设计出CPU使用率的计算方法.我们在Windows的任务管理器中可以实时地看到CPU使用率,每1秒(默认刷新频率是1秒/次)都在变化,因而某些人可能就会误认为,CPU使用率是一个瞬时值,在任何一个时刻它都有一个值,那么这些人可能会说:"在5分12秒这一时刻,CPU使用率为10%."这样的话,那就错了!实际上,了解一点CPU工作原理的人应该知道,在某一个时刻,CPU只有一个状态:"工作"或者"空闲",即0和1,照前面的理解,岂不是使用率只有0%和100%这两个值了吗?显然不对.对CPU使用率的正确理解应该是:在某一个时间段(T)中,CPU总共工作的时间(W)占这个整个时间段的百分比.即W/T*100%.可以对这个公式变更一下,如果我们知道的是这个时间段中CPU的空闲(没有工作)时间(I),那也可以通过(T-I)/T*100%或(1-I/T)*100%来算出CPU使用率.因此,正确的说法应该是:"在5分12秒到5分13秒这1秒钟内,CPU使用率为10%."这样理解就对了!


[CPU使用率计算公式]

通过了对CPU使用率这一概念的认识和理解,我们能得出CPU使用率的计算公式如下:
T:某个时间段(就是要计算这个时间段的CPU使用率)
W:在这个时间段中CPU处于工作状态的时间
I:在这个时间段中CPU处于空闲状态的时间
CPU%=W/T*100% 或
CPU%=(T-I)/T*100%
显然,只要知道了上面公式中的相关因素(T和W,或者,T和I)的值,就能计算出CPU使用率.


[代码相关说明]

因为最近工作中都在使用Delphi(跟VC比的话,用着确实舒服,个人感觉),下面就以Delphi代码简要说明使用Native API求解CPU使用率的过程.主要用到NtQuerySystemInformation函数,以及一些相关枚举/结构等,具体的声明/定义略掉,因为这些都能很容易在网上或书上(
<<Windows NT/2000 Native API Reference>>)找到,因此就不写在这里占据篇幅了.

先简单列出会用到的相关函数/枚举/结构等.
函数:NtQuerySystemInformation
枚举:SYSTEM_INFORMATION_CLASS
结构:SYSTEM_BASIC_INFORMATION
     SYSTEM_PERFORMANCE_INFORMATION
     SYSTEM_TIME_OF_DAY_INFORMATION
     SYSTEM_PROCESSOR_TIMES


[计算总的CPU使用率]

还是先说怎么求总的CPU使用率.因为前面已经提到,这个在网上已经讲得很多了,但为了本文的完整性,这里就再COPY一下前辈们的知识,当然也有一些自己的补充和完善.

通过Native API我们可以获取到公式中的T和I,方法分别如下:

view plain
  1. {获取T}  
  2. var  
  3.   stodi: SYSTEM_TIME_OF_DAY_INFORMATION;  
  4. begin  
  5.   NtQuerySystemInformation(  
  6.     SystemTimeOfDayInformation,  
  7.     @stodi,  
  8.     SizeOf(SYSTEM_TIME_OF_DAY_INFORMATION),  
  9.     nil  
  10.   );  
  11.   {stodi.CurrentTime就是我们需要的,它是LARGE_INTEGER格式的时间, 
  12.   描述了系统从开机到现在运行的累计总时间,单位为100纳秒.}  
  13. end;  
  14. {获取I}  
  15. var  
  16.   spi: SYSTEM_PERFORMANCE_INFORMATION;  
  17. begin  
  18.   NtQuerySystemInformation(  
  19.     SystemPerformanceInformation,  
  20.     @spi,  
  21.     SizeOf(SYSTEM_PERFORMANCE_INFORMATION),  
  22.     nil  
  23.   );  
  24.   {spi.IdleTime就是我们需要的,它是LARGE_INTEGER格式的时间, 
  25.   描述了CPU开机到现在所累计的总的空闲时长,单位为100纳秒.}  
  26. end;  

通过上面的方法,我们获取到的T和I都是从开机起计时的累计总时长,而我们这里需要的只是某一个小小的时段(如前面说的"5分12秒到5分13秒这1秒钟内"),因此我们需要前/后取到两个时刻的值,后值减去前值,就得到我们想要的某个时段的时间长度了.

那么,我们的公式需要对T和I进行展开,如下:
T=T后-T前
I=I后-I前
CPU%=(T-I)/T*100% 

通过上面的方法,前/后间隔取值,再代入公式,就可以计算出某个时段CPU的使用率了.而在实际运用中,一般是设计循环过程(或使用TTimer),每隔一段时间,轮循地应用公式,就能依次不断地计算出相邻每个时段的CPU使用率,即实时效果.(具体的过程设计就略了吧)

然而,到目前这个公式还只能对单核CPU有效,多核的情况下会有问题.通过多种途径的对比分析,发现了这个问题因素是I.在多核情况下,这时I(即spi.IdleTime)的值是记录了全部CPU核心的总空闲时间的和(有点绕口).多核CPU在工作时是并行的,但计算它们时间还是做了累加,问题就在此!以双核CPU为例来做进一步的解释,spi.IdleTime(即I)的值是累加了2个CPU核心的空闲时间(两份),而stodi.CurrentTime(即T)则只是一份时间.所以修正的方法是T需要乘以当前CPU核心的数量(N).希望下面的简图能进一步帮助大家理解这个问题.
view plain
  1. {下图描述了10秒之间的情况,-表示空闲,+表示工作,每个符号的时间单位为1秒}  
  2. |========++| {CPU核心1,I1=8秒}  
  3. |======++++| {CPU核心2,I2=6秒}  
  4. {说明:两个CPU核心并行工作,实际经历了"两份"时间,I=I1+I2.}  
  5. |==========| {系统时段,T=10秒}  
  6. {说明:而记录的系统时段只有"一份",所以需要修正,乘以CPU核心数量}  

那又该怎么获取CPU核心数量,依然使用Native API,如下:
view plain
  1. var  
  2.   sbi: SYSTEM_BASIC_INFORMATION;  
  3. begin  
  4.   NtQuerySystemInformation(  
  5.     SystemBasicInformation,  
  6.     @sbi,  
  7.     SizeOf(SYSTEM_BASIC_INFORMATION),  
  8.     nil  
  9.   );  
  10.   {CPU核心数量N=sbi.NumberProcessors}  
  11. end;  

所以,修正后的计算总的CPU使用率的公式如下:
T=(T后-T前)*N
I=I后-I前
CPU%=(T-I)/T*100% 



[计算多核中单个核心CPU使用率]

搞定了总的CPU使用率问题,现在再来讲讲怎么计算多核中单个核心CPU使用率.顺藤摸瓜,依葫画瓢,当然先把前面的公式套用过来,原理都是一样的嘛.那么公式理应如下:
T[i]=T后[i]-T前[i]
I[i]=I后[i]-I前[i]
CPU%[i]=(T[i]-I[i])/T[i]*100% 
(i为CPU核心编号0,1,2...)
注意,这里并没有使用乘以CPU核心数量N来修正时段T,因为这里已经是在针对"单个"核心的部分进行计算,所以不会存在上面的问题需要修正.或者说,单个核心部分,N肯定等于1.

这里的关键,同样是要获取T[i]和I[i].方法如下:
view plain
  1. {前提:先获取CPU核心数量N,因为下面需要用到.}  
  2. var  
  3.   i: Integer;  
  4.   spt: array of SYSTEM_PROCESSOR_TIMES; {这个数组对应多个CPU核心的相关数据}  
  5. begin  
  6.   SetLength(spt, N); {根据CPU核心数量N分配数组空间}  
  7.   NtQuerySystemInformation(  
  8.     SystemProcessorTimes,  
  9.     spt,  
  10.     SizeOf(SYSTEM_PROCESSOR_TIMES),  
  11.     nil  
  12.   );  
  13.   for i := 0 to N - 1 do  
  14.   begin  
  15.    {通过分析数据得知: 
  16.     spt[i].KernelTime,spt[i].UserTime,spt[i].DpcTime和spt[i].InterruptTime的总和为累计系统总时间. 
  17.     stp[i].IdleTime为CPU运行的累计空闲时间. 
  18.     因为也是累计时间,所以同样要使用"T=后-前"来计算.}  
  19.   end;  
  20. end;  

最后代入公式就能计算出每个CPU核心的使用率,再设计循环过程(或使用TTimer),就能获取实时使用率了.


[性能计数器PDH]

如果直接使用性能计数器(PDH)接口来查询CPU使用率,是很方便的,所用到的查询串分别如下:
'/Processor(_Total)/% Processor Time' 用于查询总的CPU使用率.
'/Processor(%d)/%% Processor Time' 用于查询单个核心CPU使用率.
用PDH还可以查询到更多的系统数据,比较全面.至于PDH的具体用法,就不再此多说,网上有,也可以查看MSDN,这里则点到为止.


[最后]

本文完,最后留给大家的,应该是更多的"理解"和"实践",希望能对大家有所帮助,目的则是共同进步.
以上方法目前仅在Windows XP (SP3)单/双核系统中测试通过,大家也可以试试其它环境.
有空了我再补上Demo代码,方便大家学习和使用.

你可能感兴趣的:(利用NT Native API获取NT系统的CPU使用率(支持多核))