有人动了WAS的集群环境导致这个问题,只能一点一点排查:
1.查看下目前的控制台端口
在 /usr/WebSphere/AppServer/profiles/demo/logs/下有个文件AboutThisProfile.txt(我是在lab的环境下有)文件内容是 (这个demo可以是XXXDmgr)
Application server environment to create: Application server
Location: /usr/WebSphere/AppServer/profiles/demo
Disk space required: 200 MB
Profile name: demo
Make this profile the default: True
Node name: WC_demo_node
Host name: psvt30.cn.ibm.com
Enable administrative security (recommended): True
Administrative console port: 9061
Administrative console secure port: 9063
HTTP transport port: 9060
HTTPS transport port: 9062
Bootstrap port: 9064
SOAP connector port: 9065
这里面有常用的端口
2.查看节点下服务器进程号:
ps -ef | grep XXXN01S01 (节点文件夹下有servers文件夹中可查看到) 查询结果第二列就是进程编号
通过 top 命令 查看该进程是否启动 (属于java进程)
其他命令:
1.查看所有WAS进程
其中WAS控制台对应一个进程, 每个节点每个服务对应一个进程
ps -ef|grep wasadmin
(其中wasadmin为WAS服务器用户名, 可根据实际情况修改)
2.查看节点进程
ps -ef|grep 'nodename nodeagent'
(其中单引号部分为节点名, 可根据实际情况修改)
3.查看服务进程
ps -ef|grep servername
(其中servername为服务名, 可根据实际情况修改)
服务命令:
1.启动管理控制台
cd $WAS_HOME/profiles/Dmgr01/bin
./startManager.sh
(其中Dmgr01为DM名, 可根据实际情况修改)
2.启动节点
cd $WAS_HOME/profiles/AppSrv01/bin
./startNode.sh
(其中AppSrv01为概要文件名, 可根据实际情况修改)
3.启动应用服务器
cd $WAS_HOME/profiles/AppSrv01/bin
./startServer.sh server1
(其中AppSrv01 server1为概要文件名和服务名, 可根据实际情况修改)
4.停止应用服务器
cd $WAS_HOME/profiles/AppSrv01/bin
./stopServer.sh server1
(其中AppSrv01 server1为概要文件名和服务, 可根据实际情况修改)
5.停止节点
cd $WAS_HOME/profiles/AppSrv01/bin
./stopNode.sh
(其中AppSrv01为概要文件, 可根据实际情况修改)
6.停止管理控制台
cd $WAS_HOME/profiles/Dmgr01/bin
./stopManager.sh
(其中Dmgr01为DM名, 可根据实际情况修改)
#./startManager.sh -trace 注:trace参数可以让startServer.log显示详细报错日志,日志量很大,很细。
特殊情况:
./stopServcer.sh server1如果停不掉websphere服务。则强制杀掉其进程!
1、查看websphere进程号
bejqylc06:~ # ps -ef|grep websphere
root 20350 1 13 Jun20 ? 1-10:36:34 /home/websphere/IBM/WebSphere/AppServer/java/bin/java bejqylc06Node01Cell bejqylc06Node01 server1
root 24796 24655 0 17:27 pts/1 00:00:00 grep websphere
bejqylc06:~ #
2、kill -9 20350
3、./startServcer.sh server1