WebSphere MQ收发通道异常的问题处理

1、摘要

    一直和公司有数据交换的一家单位,由于最近机房搬迁,导致服务器故障无法恢复应用,只能另外重新部署一套应用。在搭建IBM WebSphere MQ时,发送通道始终无法正常连接。经过几日的折腾,终于发现问题所在,更换服务器安装后搞定,再次记录以备后查。

2、部署环境

   双方系统环境基本一致,Windwos2003 EE sp2,JDK 1.5,WebSphere MQ 5.3

   甲方PC 服务器,乙方刀片服务器(最后得知)

3、故障描述

   双方创建完队列、通道后,启动时一切正常,发送和接收通道都可以正常启动,状态为“正在运行”。但几分钟后乙方接收通道状态变为“非活动”,但甲方状态一切正常。查看系统日志定期会显示如下:

    甲方:

事件类型: 错误
事件来源: WebSphere MQ
事件种类: 无
事件 ID: 9206
日期:  2010-7-20
事件:  15:57:36
用户:  N/A
计算机: AAA
描述:
数据发送到主机 BBB (192.168.1.2) 的错误。 

在将数据通过 TCP/IP 发送到 BBB (192.168.1.2)  时发生错误。其原因可能是通信故障。 

TCP/IP(send)调用的返回码是10054 X('2746')。 记录这些值并通知系统管理员。

    乙方:

事件类型: 错误
事件来源: WebSphere MQ
事件种类: 无
事件 ID: 9208
日期:  2010-7-18
事件:  16:21:22
用户:  N/A
计算机: BBB
描述:
由主机 192.168.1.1 接收的错误。 

从 192.168.1.1通过TCP/IP接收数据时发生错误。其原因可能是通信故障。 

TCP/IP (recv)调用的返回码是10054 (X'2746')。 记录这些值并通知系统管理员。

此现在仅出现在甲方发送到乙方的情况,而乙方发送到甲方则一切正常。并且如果甲方有消息需要传输时,通道又能够正常连接并将报文完整发送到乙方。虽不影响正常业务,但是每个5分钟的报错系统在系统日志中显示实在无法接收。

4、故障处理

    根据网络提供的线索信息,依次进行排查。

    A、服务器由于采用的双网卡绑定技术,解除绑定并卸载绑定程序,未果

    B、修改网卡硬件属性,因为厂家在网卡性能的优化上做的一些设置会导致此问题出现,对网卡属性中的高级选项依次进行排除,未果

    C、更换一台服务器安装测试,问题依旧。

    D、将两天乙方服务器搭建MQ通道互联,发现此问题两台服务器都会出现,说明问题在乙方服务器上。

    E、追问服务器型号,厂家等时发现安装的两台都为IBM 刀片服务器,怀疑刀片服务器网卡总线与WebSphere MQ5.3存在BUG导致。

    F、重新申请一台独立PC服务器进行安装,但是在创建队列管理器时出现错误,经查由于系统数据执行保护的原因,将MQ程序加入允许范围后,搭建成功。

PS:可能需要复位一下通道,保证两边序号一致才能传输,不然会报错。

 

 

 

 

你可能感兴趣的:(Application)