JAVA进程占用CPU200%-300%的问题处理过程

故事背景

今天后台管理系统出现cpu 200%-300%,导致总CPU使用忽高忽低,系统访问速度忽快忽慢。这个问题出现过一次,准备排查一下。
后台管理系统使用ssm框架,用户量小,所以排除高并发的情况。

java version "1.8.0_11"

处理过程

1.使用top查看进程的CPU使用情况

[root logs]# top
top - 14:34:51 up 513 days,  4:42,  3 users,  load average: 3.27, 2.81, 2.34
Tasks: 147 total,   1 running, 146 sleeping,   0 stopped,   0 zombie
Cpu(s): 59.8%us,  0.2%sy,  0.0%ni, 40.0%id,  0.0%wa,  0.0%hi,  0.1%si,  0.0%st
Mem:  16270528k total, 10517928k used,  5752600k free,   178872k buffers
Swap:        0k total,        0k used,        0k free,  1333952k cached

  PID USER      PR  NI  VIRT  RES  SHR S %CPU %MEM    TIME+  COMMAND                                                                                                                                    
15984 root      20   0 7867m 3.9g  18m S 235.5 25.0 929:15.66 java                                                                                                                                       
16102 root      20   0 7860m 3.9g  14m S  4.3 24.9 743:39.72 java                                                                                                                                        
21631 root      20   0 15032 1276  944 R  0.3  0.0   0:00.06 top                                                                                                                                         
    1 root      20   0 19368 1232  912 S  0.0  0.0   0:01.55 init      

可以看到是pid为15984的进程占用了CPU。
先用jstat -gcutil (查看GC汇总信息),看下对应的堆内存各部分的使用量

[root@ logs]# jstat -gcutil 15984
  S0     S1     E      O      M     CCS    YGC     YGCT    FGC    FGCT     GCT   
  0.00   0.00 100.00 100.00  55.48  79.70  72824 1046.497  1339 3559.981 4606.479

显示列名 具体描述
S0 年轻代中第一个survivor(幸存区)已使用的占当前容量百分比
S1 年轻代中第二个survivor(幸存区)已使用的占当前容量百分比
E 年轻代中Eden(伊甸园)已使用的占当前容量百分比
O old代已使用的占当前容量百分比
M 元数据空间使用比例
CCS 压缩使用比例
YGC 从应用程序启动到采样时年轻代中gc次数
YGCT 从应用程序启动到采样时年轻代中gc所用时间(s)
FGC 从应用程序启动到采样时old代(全gc)gc次数
FGCT 从应用程序启动到采样时old代(全gc)gc所用时间(s)
GCT 从应用程序启动到采样时gc用的总时间(s)

可以看到
年轻代Eden区和老年代的使用容量都是100%

补充个知识点:
大多数情况下,对象在新生代Eden区分配。(大对象会直接在老年代分配,使用参数进行设置)当Eden区分配足够的空间进行分配时,就会触发MinorGc(新生代GC)。将超过GC年龄的对象移动到老年代中。

大致就能断定是对象Eden区分配内存时容量不够触发了GC,而导致的GC停顿。但是由于新生代和老年代的使用都是100%而对象又全都在被使用。所以无法回收内存。导致一直GC,一直停顿。。。
问题找到了,这没办法了。直接重启服务,毕竟没有什么是重启不能解决的,但是在重启之前先做一件事情。把堆内存的快照dump下来,找找为什么4G的内存都被用完了,还无法回收。。。

使用 jmap -dump:live 生成快照
jmap -dump:live,format=b,file=15984.hprof 15984
使用scp 远程上传文件到跳板机

下载到本地只用使用java/bin/jvisualvm.exe 工具打开。可以进行快照文件的分析…
文件 > 装入 >选择下载的堆内存快照。
内存快照大的会需要很大的内存才能打开…我的快照文件3.7G,装入之后大概使用了7G内存。
JAVA进程占用CPU200%-300%的问题处理过程_第1张图片
因为堆内存太大,自己电脑的配置太小了,所以找了台内存大的电脑弄。结果堆内存太大导致看到了类信息之后想打开实例信息没成功。提示分析工具的内存不足…我太难了…
JAVA进程占用CPU200%-300%的问题处理过程_第2张图片

原因分析

看了一些网上的帖子和项目组种种分析得到的结论大概率是因为tomcat间的session共享导致的session没有回收。

项目用了两个tomcat,配置了tomcat自身session共享机制,但是由于配置的是双向共享。所以session永远都不会清掉。。。导致了session占用的内存越来越多。
因为上次出现这个问题也是加入session共享之后出现的,而且出现问题时系统session存活的数量也差不多。所以有了这种猜想。。

解决方案

就把seesion共享改成单方式的试试。
…还在弄,目前不知道怎么整单方向的共享方式…
…我太难了…

你可能感兴趣的:(jvm笔记)