“你们的agent占了好多系统的端口,把我们的很多业务系统都给整死了,给我们造成了很大的损失,要求你们的相关领导下周过来道歉” -- 来自我们的一个客户。
怎么可能呢,我们都不相信,我们的agent只占一个端口啊!
事实胜过雄辩,经过查证,确实是由于我们的agent占了好多系统的端口,我看了一下日志,基本把系统可用的端口占完了!
为什么呢?MINA框架私自开的!
由于我们的agent端使用了NIO通信框架MINA,但并没有使用好,造成了这一几乎毁灭行的灾难。
还是先看代码吧。
/** * 异步发送消息 * @param agent * @param request */ public void sendMessageToAgent(Agent agent, HyRequest request) { IoSession session = null; IoConnector connector=null; long startTime = System.currentTimeMillis(); try { // 创建一个非阻塞的客户端程序 connector = new NioSocketConnector(); // 设置链接超时时间 connector.setConnectTimeoutMillis(connectTimeoutMillis); ObjectSerializationCodecFactory objsCodec = new ObjectSerializationCodecFactory(); objsCodec.setDecoderMaxObjectSize(DEFAULTDECODER); objsCodec.setEncoderMaxObjectSize(DEFAULTDECODER); ProtocolCodecFilter codecFilter = new ProtocolCodecFilter( objsCodec); // 数据转换,编码设置 connector.getFilterChain() .addLast("codec", codecFilter); // 消息 connector.setHandler(clientHandler); SocketAddress socketAddress = new InetSocketAddress( agent.getIpAddr(), agent.getAgentPort()); ConnectFuture future = connector.connect(socketAddress); future.awaitUninterruptibly(); session = future.getSession(); String json = mapper.writeValueAsString(request); session.write(json); long endTime = System.currentTimeMillis(); logerr.debug("send-time:" + (endTime - startTime)); } catch (Exception e) { logerr.error("host:" + agent.getIpAddr() + ", AgentPORT:" + agent.getAgentPort() + ", 连接异常..."+e.getMessage()); clientHandler.handlerConnectError(agent, request); } }
public class MinaClientHandler extends IoHandlerAdapter { // 日志 private Logger log = Logger.getLogger(getClass()); private MinaResponseProcesser minaResponseProcesser; ObjectMapper mapper=null; @Override public void messageReceived(IoSession session, Object message) throws Exception { String msg = message.toString(); log.info("receive message from " + session.getRemoteAddress().toString() + ",message:" + message); if(null == mapper){ mapper = new ObjectMapper(); } //请求消息转换为HyResponse对象 HyResponse response = mapper.readValue(msg, HyResponse.class); String remoteIp= ((InetSocketAddress)session.getRemoteAddress()).getAddress().getHostAddress(); response.setRemoteIp(remoteIp); HyRequest request = minaResponseProcesser.processResponse(response); if(request == null){ //关闭当前session closeSessionByServer(session,response); }else{ session.write(mapper.writeValueAsString(request)); } } }
上面的逻辑就是,当要发送一个消息时,创建一个新的connector,并获取一个session发送消息后直接返回,在MinaClientHandler类的messageReceived里面处理接受到的响应数据,并进行业务处理,最后如果不需要再次发送请求,则关闭当前session。
其实出现本文一开始的问题就是在这里造成的。
在出现我们的agent占用大量端口后,我们这边的工程人员就迅速定位到了这个问题,并很快修复了,但修复并不理想,但修复过后的代码。
/** * 异步发送消息 * @param agent * @param request */ public void sendMessageToAgent(Agent agent, HyRequest request) { IoSession session = null; IoConnector connector=null; long startTime = System.currentTimeMillis(); try { // 创建一个非阻塞的客户端程序 connector = new NioSocketConnector(); // 设置链接超时时间 connector.setConnectTimeoutMillis(connectTimeoutMillis); ObjectSerializationCodecFactory objsCodec = new ObjectSerializationCodecFactory(); objsCodec.setDecoderMaxObjectSize(DEFAULTDECODER); objsCodec.setEncoderMaxObjectSize(DEFAULTDECODER); ProtocolCodecFilter codecFilter = new ProtocolCodecFilter( objsCodec); // 数据转换,编码设置 connector.getFilterChain() .addLast("codec", codecFilter); // 消息 connector.setHandler(clientHandler); SocketAddress socketAddress = new InetSocketAddress( agent.getIpAddr(), agent.getAgentPort()); ConnectFuture future = connector.connect(socketAddress); future.awaitUninterruptibly(); session = future.getSession(); String json = mapper.writeValueAsString(request); session.write(json); // 等待断开连接 session.getCloseFuture().awaitUninterruptibly(); long endTime = System.currentTimeMillis(); logerr.debug("send-time:" + (endTime - startTime)); //connector.dispose(); } catch (Exception e) { logerr.error("host:" + agent.getIpAddr() + ", AgentPORT:" + agent.getAgentPort() + ", 连接异常..."+e.getMessage()); clientHandler.handlerConnectError(agent, request); }finally{ if(null!=session){ session.close(true); session=null; } if(null !=connector){ connector.dispose(); } } }
只改了一个地方,就是在发送完消息后,加了一个等待断开连接语句和finally语句块-关闭session和connector。
虽然不会出现程序占用大量的系统端口这个问题,但会造成另外一个问题-当有一个消息队列需要异步调用上面语句发送消息时,有原来的异步(发送完直接返回,相当于快速并发发送)变成伪异步(发送完消息后并等待消息返回处理后返回,相当于顺序处理队列里面的消息)。
上面的修改并不是我们想要的结果,但至少修复了占用大量端口的问题。
由于怀着想彻底修复这个问题的想法,我想还是深入了解一下MINA源码吧。