在IBMWASND产品中,管理配置数据都存储在XML文件中。单元保留了它每个节点中每台服务器的主配置文件。同时每个节点和服务器也有其自己的本地配置文件。如果服务器已经属于单元,则对于本地节点或服务器配置文件的更改都是临时的,通过在本地提交更改生效时,本地更改覆盖单元配置,但是当执行单元配置文档同步到节点的操作时,在单元级别上对主控服务器和主节点配置文件所作的更改将会替换对该节点所作的任何临时更改。
同步操作在指定的事件发生时进行,如启动server或者停止server的时候,以及在修改了应用程序服务器配置、更新了应用程序及其他情况。
节点不同步现象:
在管理控制台,节点的状态显示未同步状态;
在管理控制台修改了配置,保存的时候,无法同步到各个节点及单元;
管理控制台中显示的server状态异常且无法启停server或者启停异常;
集群中部分server的启停异常,且访问该server上的应用异常;
节点后台日志有关于“凭证”“管理员”等字眼的报错日志;
管理控制台启停异常;
管理控制台和节点日志有某个节点节点成员被怀疑的报错;
其他现象待补充;
节点不同步原因:
服务器异常断电;
各个节点及dmgr所在服务器的系统时间误差超过3分钟;
非法操作,如启停server的时候,反复启停;
强制结束server、node的进程;
增加或者修改了WAS管理控制台的密码;
修改了/etc/hosts文件;
各个节点所在服务器的主机名有冲突;
增加或者删除了WAS的节点后没及时同步;
其他原因待补充;
解决方法:
禁用全局安全性;
停止节点,在命令行下做全部再同步;
启动节点,启用全局安全性;
停止节点,做全部再同步;
备注:禁用安全性,可以在管理控制台全局安全性里取消,也可以在配置文件security.xml中将大约第三行的位置“enable=true”改成“false”;
命令行同步命令:./syncNode.shdmgr_host8879
故障现象:管理控制台无法同步未同步的节点,直接导致该节点上的server启动失败或者异常。
故障原因:服务器异常断电,或者在命令强行结束WAS进程都可能导致节点无法同步。
故障分析:启动节点,查看SystemOut.log,报错如下:
SECJ0305I:对于admin-authz操作JVM,基于角色的授权检查失败:getCurren
tTimeInMillis。用户UNAUTHENTICATED(唯一标识:unauthenticated)未被授予下列任何必需角色:adminsecuritymanager,administrator,monitor,configurator,operator,deployer。
ADMS0036E:配置同步失败。
处理思路:
1.禁用全局安全性(即去掉访问控制台的密码),重启dmgr;
2.停止所有节点;
3.进到节点的bin目录下,做手动强制同步;
4.启用全局安全性并重启dmgr和所有节点;
5.登陆管理控制台做全部再同步;
6.如果上一步做完还是不能同步,停止所有节点,到命令行下做手动强制同步;
7.重启dmgr,启动节点。
处理过程:
1、编辑/opt/IBM/WebSphere/AppServer/profiles/Dmgr01/config/cells/app1Cell01/security.xml
将第三行useLocalSecurityServer="true"useDomainQualifiedUserNames="false"enabled="true"
中的enabled="true"改为enabled="false"
或登陆管理控制台,导航到安全性,安全管理、应用程序和基础结构,将启用管理安全性前的勾去掉
2、然后重启dmgr服务,并停止所有节点服务;
3、停止所有节点服务
/opt/IBM/WebSphere/AppServer/profiles/AppSrv01/bin/stopNode.sh
4、做手动强制同步
./syncNode.shdmgr_hostname8879
5、启用全局安全性,并重启dmgr和所有节点
/opt/IBM/WebSphere/AppServer/profiles/AppSrv01/bin/startNode.sh
6、登陆管理控制台,依次点击系统管理,节点,选择所有节点,点击全部再同步;
7、停止所有节点,到命令行下做手动全部再同步(建议每个节点都做)
./syncNode.shdmgr_hostname8879-usernamewasadmin-password*****
8、重启dmgr和所有节点