WebSphere 是 IBM 的软件平台。它包含了Web 应用程序和跨平台、跨产品解决方案所需要的整个中间件基础设施,如服务器、服务和工具等。在使用WebSphere的过程中,大家会遇到这样那样的问题,在此就常见错误做个解析与总结。 

 一、WAS应用无法正常停启

有时会碰到正常停是停不了的应用,这是因为系统里进程的连接释放不了。这时候直接在系统里把应用的进程杀掉即可。
Scm01的停启如下
首先登进10.8.2.201,执行以下命令
ps –ef|grep ScmWeb01
找到应用的进程,正常情况应该有两个,一个为node的进程,一个为server的进程,如下

WebSphere经典错误解析与总结_第1张图片

先杀掉node的进程
kill -9 7427
注:                       //7427为进程的pid号
接着杀掉server进程
kill -9 20287           //20287也是pid号
 
这时候应用就停了
启动方法如下
先执行
/opt/IBM/WebSphere/ScmWeb01/bin/startNode.sh
然后执行
/opt/IBM/WebSphere/ScmWeb01/bin/startServer.sh Scm01
等到进程的pid号出现,server即启起来了,这时候就可以通过访问单个server的方式访问了。
 
二、WAS 节点不同步解决办法
 
节点不同步易产生的错误现象:
 
1、启动应用的时候特别慢,报“可能已经启动成功,但没有在预定的时间启动完成,详情请参考日志。
2、 “企业级应用程序”下应用的状态好像不对,在WebSphere企业应用程序中启动起来的应用在这里仍然是“红X”状态。
3、系统管理下的节点状态不对,同步节点后仍然显示未同步。
4、部署新应用后启动时,会报
[12-4-11 20:08:07:127 CST] 0000002b DefaultTokenP I   HMGR0149E: 尝试打开到核心组 DefaultCoreGroup 的连接被拒绝。发送进程的名称为
fqztestapCell01\fqztestapCellManager01\dmgr 且 IP 地址为172.18.251.23。本地进程中的全局安全性为 Disabled。发送进程中的全局安全性为 Enabled。接收到的标记以????+?Qe?? 开头。异常为
[12-4-11 20:20:40:736 CST] 00000017 AdminHelper   A   ADMN1009I: 尝试启动 rews_message_parse 应用程序。
[12-4-11 20:20:40:740 CST] 00000017 ApplicationMg W   WSVR0215W: 启动应用程序 rews_message_parse 失败。尚未安装该应用程序。
[12-4-11 20:42:21:326 CST] 00000016 AdminHelper   A   ADMN1009I: 尝试启动 rews_message_parse 应用程序。
[12-4-11 20:42:21:330 CST] 00000016 ApplicationMg W   WSVR0215W: 启动应用程序 rews_message_parse 失败。尚未安装该应用程序。
 
但实际部署的整个过程中,日志没有报错且控制台上提示部署成功。这种Was控制台节点显示同步状态不正常,无法完成同步,问题解决如下:
1、切换到bin目录下,执行相应命令,依次停止 server 、 node 、dmgr(严格按照此顺序)
/opt/IBM/WebSphere/AppServer/profiles/AppSrv02/bin/stopServer.sh  server1  
/opt/IBM/WebSphere/AppServer/profiles/AppSrv02/bin/stopNode.sh
/opt/IBM/WebSphere/AppServer/bin/stopManager.sh

2、删除 wstemp, temp 和 config/temp 文件夹下面的临时文件
/opt/IBM/WebSphere/AppServer/profiles/Dmgr01/temp、wstemp、tranlog目录下内容删除。
/opt/IBM/WebSphere/AppServer/profiles/Dmgr01/config/temp目录下内容删除。
 
3、同步节点:
##同步节点信息
切换到“/opt/IBM/WebSphere/AppServer/profiles/AppSrv02/bin/”下:
执行 :syncNode.sh kmtest 8879 -username wasadmin -password 000000
 其中 “kmtest”是was所部署在的主机名第二项即为主机名

4、依次启动 dmgr、node、server (严格按照此顺序)      #依次停止 server 、 node 、dmgr
 
/opt/IBM/WebSphere/AppServer/bin/startManager.sh
/opt/IBM/WebSphere/AppServer/profiles/AppSrv02/bin/startNode.sh
/opt/IBM/WebSphere/AppServer/profiles/AppSrv02/bin/startServer.sh  server1 
 

三、节点未激活
 
错误提示:Server cannot be started because the node agent for server server1 on node server1Node01 is not active.
 
在/opt/IBM/WebSphere/AppServer/bin下用startNode.sh起节点的时候报
ADMU0111E: Program exiting with error: java.io.FileNotFoundException:
           /opt/IBM/WebSphere/AppServer/profiles/Dmgr01/config/cells/server1Cell01/nodes/server1CellManager01/servers/nodeagent/server.xml
           (No such file or directory)
这是因为WAS管理控制台上,节点启停的真正的文件并不在这个目录下
可以进到这个/opt/IBM/WebSphere/AppServer/profiles/AppSrv01/bin目录下
先启节点
server1:/opt/IBM/WebSphere/AppServer/profiles/AppSrv01/bin # ./startNode.sh
ADMU0116I: Tool information is being logged in file
           /opt/IBM/WebSphere/AppServer/profiles/AppSrv01/logs/nodeagent/startServer.log
ADMU0128I: Starting tool with the AppSrv01 profile
ADMU3100I: Reading configuration for server: nodeagent
ADMU3200I: Server launched. Waiting for initialization status.
ADMU3000I: Server nodeagent open for e-business; process id is 5894
再启服务器
server1:/opt/IBM/WebSphere/AppServer/profiles/AppSrv01/bin # ./startServer.sh server1
ADMU0116I: Tool information is being logged in file
           /opt/IBM/WebSphere/AppServer/profiles/AppSrv01/logs/server1/startServer.log
ADMU0128I: Starting tool with the AppSrv01 profile
ADMU3100I: Reading configuration for server: server1
ADMU3200I: Server launched. Waiting for initialization status.
ADMU3000I: Server server1 open for e-business; process id is 6121
然后向WAS管理控制台加入该节点
server1:/opt/IBM/WebSphere/AppServer/profiles/AppSrv01/bin # ./addNode.sh 192.168.0.8 8879 -username wasadmin -password 12345
ADMU0116I: Tool information is being logged in file
           /opt/IBM/WebSphere/AppServer/profiles/AppSrv01/logs/addNode.log
ADMU0128I: Starting tool with the AppSrv01 profile
CWPKI0308I: Adding signer alias "datapower" to local keystore
           "ClientDefaultTrustStore" with the following SHA digest:
           A9:BA:A4:B5:BC:26:2F:5D:2A:80:93:CA:BA:F4:31:05:F2:54:14:17
ADMU0001I: Begin federation of node server1Node01 with Deployment Manager at
           192.168.0.8:8879.
ADMU0009I: Successfully connected to Deployment Manager Server:
           192.168.0.8:8879
ADMU0033E: The node server1Node01 already has been added to the cell.
 
 
ADMU0027E: An error occurred during federation ADMU0033E: The node
           server1Node01 already has been added to the cell.; rolling back to
           original configuration.
ADMU0211I: Error details may be seen in the file:
           /opt/IBM/WebSphere/AppServer/profiles/AppSrv01/logs/addNode.log
ADMU0111E: Program exiting with error:
           com.ibm.ws.management.tools.DoNotDoAddNodeException: ADMU0033E: The
           node server1Node01 already has been added to the cell.
ADMU1211I: To obtain a full trace of the failure, use the -trace option.
ADMU0211I: Error details may be seen in the file:
           /opt/IBM/WebSphere/AppServer/profiles/AppSrv01/logs/addNode.log
然后在控制台里看节点已正常并已运行了。
 

另一种解决办法:我是先到server1\bin中把节点关联起来:操作方法:到WAS控制台>>>切换到server01\bin>>>输入命令同步关联>>>syncNode.sh localhost 8879 -username XXX -password XXX  >>>然后
>>>addNode.sh localhost 8879 -username  XXX -password XXX  按回车键 >>>startNode.bat >>>按回车键 就OK了。现在,重新你的管理控制台,然后到页面上查看你的节点,状态是可以启动了。