多核技术可以看成是一种CPU的集成技术,在一个CPU处理模块上,可以集成2个或者是多个CPU,但是,他们还是单独的物理CPU。并发多线程技术则需要OS的支持,是在OS级别上,可以实现一个物理CPU的多线程并发处理,提高oltp环境模式下的CPU利用率。
先说多核技术,如在IBM的POWER5中,就有如下几种不同的CPU集成模式:如Dual-Core Module(双核),表示一个CPU模块中其实有2个物理的CPU(也叫core),他们共享L2与L3 cache。这种CPU模块一般用在520/550上,所以,象采用这种模式的550最多可以有4颗CPU(2个CPU模块)。而Quad Core Module [QCM],这个不知道怎么翻译了,这种技术下,在一个CPU模块中,有4个物理CPU,相当与2个Dual-Core Module集成在一个CPU模块中,从55Q以后的机型,如55Q、55A都支持这样的CPU模块,所以,如果采用这样的模块,55A就可以达到8颗物理CPU。最后说Multi-Chip Module,这个就叫多核技术了,如一个CPU模块中,可以有8个物理CPU,相当于4个Dual-Core Module,一般用在590与595上。如图,则是一个采用了Multi-Chip Module技术的CPU模块:
从以上的图片与描述可以看到,这种多核技术不过是物理CPU的高集成度技术,让更小的地方,可以放更多的CPU,如550空间大小不变,同样2个CPU模块,如果采用双核的CPU模块,则只可以支持4颗CPU,如果采用Quad Core Module [QCM]技术的CPU模块,则最多可以支持到8颗CPU。
需要注意的是,这个时候550的CPU模块(CPU插槽)并没有增加,所以,如果在开始选型的时候,只选择4颗CPU(或以下),而又想留有扩展余地的话,则一定要选择Quad Core Module [QCM]技术的CPU模块,否则,以后只能通过更换CPU模块(而不是增加CPU模块)来升级CPU个数了,这样会比较麻烦。
在不同的厂商,对这个多核技术可能略有差别,如Sun將其多核心架构命名为CMT(Chip Multi-Threaded),把一个芯片(类似IBM的CPU模块,内含2个或多个core)叫成一个CPU(physical processor)。CMT技术能够将更多的晶体管压缩到一个芯片中,同时能够简化每一个CPU的设计,把更多的CPU压在一个芯片当中以提高整个芯片处理交易事务的能力。需要知道的是,这里与ibm的core的定义将有所差别,IBM认为一个core是一个CPU(physical processor),而SUN认为一个芯片是一个CPU。更多的人习惯拿CMT技术与下面说的SMT技术来对比,但是CMT是硬件技术,SMT更多是软件技术,所以,我个人认为与多核技术对比比较合适。
因为以上的差别,以CPU为收费对象的厂商,如Oracle,则在不同的CPU类型上,一般有不同的处理方式,现在一般已经不在按物理的CPU来购买license,而是CPU模块方式来购买,例如oracle规定,在IBM Dual-Core Module(双核模块)的POWER芯片上,一个双核模块(内含2颗物理CPU)只需要购买1.5个license。
看了多核技术,我们再说并发多线程技术,在POWER5的构架上,以及AIX 5.3以上,或运行在其上的linux 2.6核心以上,都可以支持这个技术,也叫SMT(simultaneous multi-threading)技术。一个物理的CPU,在IBM中也就是一个core,在OS层面上,将显示为2颗(或多颗,这需要看未来的发展可能性)逻辑的CPU。
注意的是,这种技术与硬件构架以及OS都是有关系的,如SMT就是POWER5才支持的,而且也要特定的OS,如Aix 5.3才支持,也就是说,POWER5上跑5.2,也是不支持这样的技术的。在这样的技术中,每个POWER5 CPU两个硬件线程,SMT旨在利用POWER5处理器的超标量特性,以便同时执行多个指令。它的基本理念是:没有一个单一应用可使向POWER5这样的超标量处理器达到完全饱和的状态,因此,部署同时提供输入的多个应用效果更理想。如图,如果把CPU的指令处理分成很多小的单元的话,它们是可以并发的。
那么,按照这样的设计思想,那么,SMT技术将在细小的OLTP应用中受益,而大型的计算业务,如浮点密集型的工作(耗费单个CPU很长时间,对浮点单元与内存带宽消耗比较大),是不适合使用SMT技术的。当然,我们可以在OS级别决定是否打开SMT技术,主要取决于这个技术是否为我们带来好处,默认则是打开SMT。
在实际的使用中,我们可能发现,一个物理CPU分化的2个逻辑CPU可能存在分配不平等的现象,如topas可以看到:
#topas
CPU User% Kern% Wait% Idle%
CPU6 31.7 7.5 51.6 9.1
CPU4 30.4 10.1 45.2 14.3
CPU0 19.4 6.6 28.2 45.8
CPU2 15.4 5.7 31.4 47.5
CPU3 0.0 1.5 0.0 98.5
CPU5 0.0 1.3 0.0 98.7
CPU7 0.0 1.3 0.0 98.7
CPU1 0.0 1.6 0.0 98.4
如以上,1,3,5,7比较闲,而2,4,6,8会比较忙,按照IBM的官方说法是,在SMT技术中,如果仅仅是其中一半的逻辑CPU(对应到具体个数的物理CPU)能满足需求的话,另外的一半逻辑CPU将一般比较闲置,只有当系统业务比较繁忙的时候,另外一半的逻辑CPU是可以参与计算的。我猜想,估计这样处理的规则是,避免在简单任务的时候,也采用复杂的分发机制。
以上介绍了多核技术与多线程技术,多核技术一般指CPU的集成度,一般的厂家规则都是一个core对应到一个物理CPU,所以,一个CPU模块中可能存在多个物理CPU,而并发多线程技术(SMT)则是指单一物理处理器能够同时分发来自多于一个硬件线程上下文的指令,可以虚化成2个逻辑的CPU。我们看一个POWER5的Dual-Core Module技术的CPU模块与逻辑CPU的对照图:
我们也可以采用如下的命令查看AIX 5L上物理CPU的个数,他们的数目不同于开启过SMT技术以后的topas中的CPU个数,简单的说,采用SMT技术的os上,topas看到的CPU个数是物理CPU的2倍。
查看系统物理CPU的个数:
# lsdev -Cc processor
proc0 Available 00-00 Processor
proc2 Available 00-02 Processor
查看系统逻辑CPU的个数:
# bindprocessor -q
The available processors are: 0 1 2 3
# vmstat
System configuration: LCPU=4 mem=3920MB
kthr memory page faults CPU
—– ———– ———————— ———— ———–
r b avm fre re pi po fr sr cy in sy cs us sy id wa
1 1 145025 840638 0 0 0 0 0 0 1 1336 67 0 0 99 0
查看CPU位数
# prtconf | grep CPU
CPU Type: 64-bit
查看CPU的详细信息,如主频,是否支持SMT,是否开启了SMT等等:
#lsattr -El proc0
frequency 1896102000 Processor Speed False
SMT_threads 2 Processor SMT threads False
state enable Processor state False
type POWERPC_POWER5 Processor type False
查看CPU类型
# prtconf | grep Type
Processor Type: PowerPC_POWER5
CPU Type: 64-bit
Kernel Type: 64-bit
# lsattr -El proc0/2
frequency
1898100000 Processor Speed False
smt_enabled true
Processor SMT enabled False
smt_threads 2
Processor SMT threads False
state
enable Processor state False
type
PowerPC_POWER5 Processor type False
查看各个逻辑CPU处理不同大小数据包的状态:
# netstat -m
Kernel malloc statistics:
******* CPU 0 *******
By size inuse calls failed delayed free hiwat freed
32 102 108 0 0 26 5016 0
64 52 14268 0 1 76 5016 0
128 376 2449 0 11 72 2508 0
256 264 7493 0 16 120 5016 0
512 4285 152507777 0 531 195 6270 0
1024 117 2486 0 35 27 2508 0
2048 4128 58476 0 2100 112 3762 0
4096 70 92 0 6 3 1254 0
8192 2 86 0 13 25 627 0
16384 1008 1099 0 130 7 313 0
32768 0 252 0 5 12 156 0
65536 1 30 0 5 5 156 0
131072 2 2 0 0 98 196 0
******* CPU 1 *******
By size inuse calls failed delayed free hiwat freed
64 8 4750 0 0 56 5016 0
128 0 25 0 0 32 2508 0
256 0 842 0 0 32 5016 0
512 0 7120495 0 0 168 6270 0
1024 0 1681 0 1 4 2508 0
2048 16 13800 0 29 66 3762 0
4096 0 5 0 1 9 1254 0
8192 0 13 0 2 2 627 0
16384 0 35 0 3 4 313 0
32768 0 150 0 5 12 156 0
65536 0 17 0 3 4 156 0
131072 0 0 0 0 8 16 0
******* CPU 2 *******
By size inuse calls failed delayed free hiwat freed
32 23 27 0 0 105 5016 0
64 59 9257 0 2 69 5016 0
128 39 1663 0 1 57 2508 0
256 13 6609 0 1 195 5016 0
512 48 151786408 0 8 200 6270 0
1024 41 2191 0 15 19 2508 0
2048 38 46224 0 55 104 3762 0
4096 0 26 0 3 6 1254 0
8192 2 72 0 14 21 627 0
16384 16 72 0 5 5 313 0
32768 0 178 0 4 12 156 0
65536 0 53 0 5 5 156 0
131072 2 2 0 0 11 22 0
******* CPU 3 *******
By size inuse calls failed delayed free hiwat freed
64 5 4287 0 0 59 5016 0
128 0 4 0 0 32 2508 0
256 0 712 0 0 16 5016 0
512 5 6319949 0 0 163 6270 0
1024 0 1163 0 1 4 2508 0
2048 9 12104 0 35 75 3762 0
4096 0 5 0 1 5 1254 0
8192 0 17 0 3 6 627 0
16384 0 41 0 4 5 313 0
32768 0 191 0 4 11 156 0
65536 0 8 0 2 4 156 0
131072 0 0 0 0 8 16 0
查看整体的SMT信息,更多的信息可以查看man SMTctl:
#SMTctl
This system is SMT capable.
SMT is currently enabled.
SMT boot mode is not set.
SMT threads are bound to the same physical processor.
proc0 has 2 SMT threads.
Bind processor 0 is bound with proc0
Bind processor 1 is bound with proc0
proc2 has 2 SMT threads.
Bind processor 2 is bound with proc2
Bind processor 3 is bound with proc2
proc4 has 2 SMT threads.
Bind processor 4 is bound with proc4
Bind processor 5 is bound with proc4
proc6 has 2 SMT threads.
Bind processor 6 is bound with proc6
Bind processor 7 is bound with proc6
删除系统可用的CPU
如果需要动态减少系统可用的CPU,可以使用’CPU_DEALLOCATE CPU_ID’命令减去指定ID的CPU
#CPU_deallocate logical_CPU_id
CPU_deallocate的使用方法很简单,只是在后面加上CPU的ID号即可。
#CPU_deallocate
CPU_deallocate requires a logical CPU number
Usage: CPU_deallocate logical_CPU_id [-P]
比如,删去ID号为16的CPU,如下:
#CPU_deallocate 16
查看系统errpt,可以看到记录信息如下:
#errpt
IDENTIFIER TIMESTAMP T C RESOURCE_NAME DESCRIPTIO
804E987A 0415140308 I O proc16 CPU DEALLOCATED
1B963892 0415140208 P H proc16 CPU FAILURE PREDICTEDb
查看系统CPU的资源使用情况
查看系统CPU资源整体使用情况,可以使用’vmstat’、’sar’命令或是’topas’。vmstat和sar在监控系统CPU资源表现时,都是需要加时间间隔和运行次数参数的;不同的是vmstat统计的是整体变化,sar可以列出每个CPU的表现。topas则统计的系统资源更为丰富一些。
比如,每隔2s统计CPU资源,共统计5次,
# vmstat 2 5
System configuration: lCPU=4 mem=3920MB
kthr memory page faults CPU
—– ———– ———————— ———— ———–
r b avm fre re pi po fr sr cy in sy cs us sy id wa
0 0 855942 2675 0 0 0 0 0 0 90 1890 290 2 0 96 1
0 0 855941 2672 0 0 0 0 0 0 57 1760 197 1 0 98 0
0 0 855942 2663 0 0 0 0 0 0 42 1559 191 1 0 97 2
0 0 855942 2654 0 0 0 0 0 0 22 1537 136 1 0 98 1
0 0 855942 2646 0 0 0 0 0 0 76 1935 235 2 0 97 1
# sar -P ALL 2 5
AIX IBMSim 3 5 00059EC6D700 08/18/08
System configuration: lCPU=4
12:51:03 CPU %usr %sys %wio %idle physc
12:51:05 0 0 1 0 99 0.53
1 0 0 0 100 0.47
2 4 0 2 94 0.55
3 0 0 0 100 0.45
- 1 0 1 98 2.00
12:51:07 0 2 1 1 96 0.53
1 0 0 0 100 0.47
2 2 0 2 96 0.55
3 0 0 0 100 0.45
- 1 0 1 98 2.00
12:51:09 0 1 0 2 96 0.53
1 0 0 0 100 0.47
2 1 0 1 98 0.55
3 0 0 0 100 0.45
- 1 0 1 98 2.00
12:51:11 0 2 1 2 95 0.53
1 0 0 0 100 0.47
2 0 0 1 98 0.55
3 0 0 0 100 0.45
- 1 0 1 98 2.00
12:51:13 0 2 1 2 95 0.53
1 0 0 0 100 0.47
2 1 0 0 99 0.55
3 0 0 0 100 0.45
- 1 0 0 98 2.00
Average 0 2 1 2 96 0.53
1 0 0 0 100 0.47
2 2 0 1 97 0.55
3 0 0 0 100 0.45
- 1 0 1 98 2.00
#topas
Name PID CPU% PgSp Owner
oracle 1114294 1.4 4.5 oracle
oracle 1241342 0.3 4.9 oracle
oracle 868490 0.3 4.9 oracle
oracle 766004 0.2 5.3 oracle
dtgreet 114772 0.1 1.3 root
topas 1126546 0.1 1.3 root
oracle 1249510 0.0 4.5 oracle
oracle 1061108 0.0 4.4 oracle
gil 69666 0.0 0.9 root
xmgc 49176 0.0 0.4 root
oracle 348330 0.0 8.8 oracle
oracle 360630 0.0 4.1 oracle
aioserve 417996 0.0 0.4 root
oracle 356526 0.0 4.9 oracle
X 143470 0.0 3.6 root
nfsd 831622 0.0 1.8 root
rpc.lock 204976 0.0 1.2 root
netm 65568 0.0 0.4 root
xmwlm 319680 0.0 0.8 root
syncd 135292 0.0 0.5 root
如果需要监控某个CPU一定时期的资源表现,则需要使用sar命令,比如:
监控ID为0、2的CPU资源表现,每隔2s统计1次,共统计4次,使用命令如下:
# sar -P 0,2 2 4
AIX IBMSim 3 5 00059EC6D700 08/18/08
System configuration: lCPU=4
12:56:21 CPU %usr %sys %wio %idle physc
12:56:23 0 2 1 6 91 0.53
2 1 0 2 97 0.55
12:56:25 0 1 0 4 94 0.53
2 0 0 4 96 0.55
12:56:27 0 3 1 1 96 0.53
2 10 1 1 89 0.57
12:56:29 0 1 1 3 95 0.53
2 1 0 4 94 0.55
Average 0 2 1 3 94 0.53
2 3 0 3 94 0.55
注:HMT的激活将导致一些性能检测工具统计异常。
激活HMT的方法:
bosdebug -H on
关闭HMT的方法:
bosdebug -H off
显示HMT的方法:
bosdebug,如果HMT处于激活状态,可以看到HMT on字样。
进程绑定
绑定某个进程在指定的CPU上,使用命令’bindprocessor PID CPUID’
比如绑定’vmstat’的进程在ID为3的CPU上运行
#ps -ef|grep vmstat
root 168232 151706 0 13:48:56 pts/2 0:00 vmstat 1
root 172342 118896 0 13:49:35 pts/4 0:00 grep vmstat
#bindprocessor 168232 3
http://www.orablogger.com/2009/03/%E5%A4%9A%E6%A0%B8%E6%8A%80%E6%9C%AF%E4%B8%8E%E5%B9%B6%E5%8F%91%E5%A4%9A%E7%BA%BF%E7%A8%8B%E6%8A%80%E6%9C%AF%E4%BB%8B%E7%BB%8D/