分享一个cisco设备CPU利用率高的解决方法与思路

拓扑:一台6509-1下联另一台6509-2,这2台6509之间是3层互联,通过192.168.1.0/30,6509-1上指了段地址到6509-2上


   故障现象:6509-1CPU利用率到90%,6509-2由于不再我的机房,不明,虽然用户不丢包,但问题还是要解决。

   首先用netfluke查看6509-1上联城域网的流量,正常
   查看6509-1上联城域网的流速,发现IPA,进站速率明显高于其他,占到了76%,(如图1),IPB和IPC出站速率明显高于其他,(如图2),将IPA封了,CPU降到70%,将IPB和IPC拔网线,CPU降到50%左右.还有50%怎么办?

   查看CPU利用率
   show proc cpu
CPU utilization for five seconds: 63%/50%; one minute: 58%; five minutes: 58
25   101868424  30627416   3326   8.76%  9.04% 10.41%   0 IP Input
    50%是指由于Interrupt switching 导致的CPU utilization, 所谓的Interrupt switch
ing 也就是指所有除了process switching 的交换方式,例如fast switching, optimu
m switching, cef switching....所产生的CPU负载
Average utilization due to interrupts, during last five seconds
63%指的是最近5秒的CPU utilization总和,包括(interrupts + processes)
Average total utilization during last five seconds (interrupts + processes)
用63%-50%=13%, 这13%是基本由于process switching导致的CPU消耗,理解Cisco 路由
器交换方式的人都知道,有一些流量路由器是必须使用process switching,例如icmp,
也就ping, snmp等都是必须使用process switching
通常看来,如果打开了cef switching但是process switching部分的cpu utilization(
63%-50%=13%)非常高,很可能目前情况不太正常,,因为如果打开cef的话,基本上除
了icmp, snmp等类型的包外,都应该采用cef switching,但这部分差值由谁导致的,就
要看show process cpu了,
PID  Runtime(ms)  Invoked  uSecs    5Sec   1Min   5Min TTY Process
25   101868424  30627416   3326   8.76%  9.04% 10.41%   0 IP Input
由于此路由器已经打开了cef,但为什么还有这么多的IP Input流量是通过process swi
tching处理呢?

   使用show ip traffic命令来确认到底是那一种流量过大。
   发现在UDP statistics中no port数量每秒都在增加,no port一般都是由于某些hacker软件扫描端口造成的, 如果每隔几秒敲一次show ip traffic命令,发现不断有数量增加,建议关掉proxy-arp,那么问题是关掉哪个接口的proxy-arp呢?
   使用show  interface state可以看到每个接口不同swiching方式产生的流量,如果某个
接口的process部分很高,那很可能问题就出在这个端口。show  interface state把数据保存下来,隔几秒后再show  interface state一次,再把数据保存下来,然后对比下,哪个接口在这几秒内的Processor,增加了,本案例中
第一次
Vlan30
         Switching path    Pkts In   Chars In   Pkts Out  Chars Out
              Processor 2211588926 174743225410  239849365 18609640977
第二次
Vlan30
         Switching path    Pkts In   Chars In   Pkts Out  Chars Out
              Processor 2211627293 174747279177  239849766 18609672219
这2次我是隔了5秒,但是Processor却增加了将近4W个
问题就出在vlan 30
inr vlan 30
no ip proxy-arp
故障恢复
图一
0



图二
0


你可能感兴趣的:(CPU利用率高)