【经验总结】NIO常见的陷阱解析

NIO编程很容易吗?不容易吗?很容易吗?不容易

吗?……

有些陷阱你需要知道

 

陷阱1:处理事件忘记移除key

在select返回值大于0的情况下,循环处理

Selector.selectedKeys 集合,每处理一个必须移除
Iterator<SelectionKey> it=set.iterator();
While(it.hasNext()){
    SelectionKey key=it.next();
    it.remove(); //切记移除
    ……处理事件
}

不移除的后果是本次的就绪的key集合下次会再次返

回,导致无限循环,CPU消耗100%

 

陷阱2:Selector返回的key集合非线程安全

1、Selector.selectedKeys/keys 返回的集合都是非线程安全的

2、Selector.selectedKeys返回的可移除

3、Selector.keys 不可变

4、 对selected keys的处理必须单线程处理或者适当同步

 

陷阱3:正确注册Channel和更新interest

1、 直接注册不可吗?

      channel.register(selector, ops, attachment);

2、 不是不可以,效率问题

3、 至少加两次锁,锁竞争激烈

4、 Channel本身的regLock,竞争几乎没有

5、 Selector内部的key集合,竞争激烈

6、更好的方式:加入缓冲队列,等待注册,reactor单线程处理

If(isReactorThread()){
     channel.register(selector, ops, attachment);
}
else{
     register.offer(new Event(channel,ops,attachment));
     selector.wakeup();
}

 

7、屏蔽平台差异,避免锁的激烈竞争,采用类似注册channel的方式:

if (this.isReactorThread()) {
    key.interestOps(key.interestOps() | SelectionKey.OP_READ);
}
else {
    this.register.offer(new Event(key,SelectionKey.OP_READ));
    selector.wakeup();
}

 

 

 陷阱4:正确处理OP_WRITE

1、 OP_WRITE处理不当很容易导致CPU 100%

2、 OP_WRITE触发条件

       前提:interest了OP_WRITE

       触发条件:

            socket发送缓冲区可写

            远端关闭

            有错误发生

3 、正确的处理方式

4、 仅在已经连接的channel上注册

5、 仅在有数据可写的时候才注册

6、 触发之后立即取消注册,否则会继续触发导致循环

7、 处理完成后视情况决定是否继续注册

       没有完全写入,继续注册

       全部写入,无需注册

 

 

陷阱5:正确取消注册channel

1、 SelectableChannel一旦注册将一直有效直到明确取消

2、 怎么取消注册?

      channel.close(),内部会调用key.cancel()

       key.cancel();

3 、中断channel的读写所在线程引起的channel关闭

      但是这样还不够!

      key.cancel()仅仅是将key加入cancelledKeys 直到下一次select才真正处理,并且channel的socketfd只有在真正取消注册后才会close(fd)

4、后果是什么?

      服务端,问题不大,select调用频繁

      客户端,通常只有一个连接,关闭channel之后,没有调用select就关闭了selector

      sockfd没有关闭,停留在CLOSE_WAIT状态

      正确的处理方式,取消注册也应当作为事件交给reactor处理,及时wakeup做select

5、 适当的时候调用selector.selectNow()

6、 Netty 在超过256 连接关闭的时候主动调用一次selectNow

 

陷阱6:同时注册OP_ACCPET和OP_READ,同时注册OP_CONNECT和OP_WRITE

1、在底层来说,只有两种事件:read和write

     Java NIO还引入了OP_ACCEPT和OP_CONNECT

     OP_ACCEPT、OP_READ == Read

     OP_CONNECT、OP_WRITE == Write

    同时注册OP_ACCEPT和OP_READ ,或者同时注册OP_CONNECT和OP_WRITE在不同平台上产生错误的行为,避免这样做!

 

陷阱8:NIO的那些bug

 http://bugs.sun.com/bugdatabase/view_bug.do?bug_id=6403933

 http://bugs.sun.com/view_bug.do?bug_id=6693490

1、现象:导致已经关闭的连接一直处于就绪状态,select(timeout)不阻塞,CPU消耗100%

     解决:

     升级到jdk 6u4以上版本

     代码上进行规避

2、代码如何规避此bug?

      简单方案:在每次channel.close()之后马上调用select

     Jetty 6的方案:

     当select阻塞时间远远小于设置值

     取消所有interest为0的key

     重新创建Selector并注册有效的key

     还不够健壮,select可能由于中断或者wakeup唤醒,导致误判

     更完善:加入wakeup判断和中断状态判断

     Mina有规避此bug的代码

     Netty3,定期调用selectNow

 

最后忠告

1、 尽量不要尝试实现自己的nio框架,除非有经验丰富的工程师

2、 尽量使用经过广泛实践的开源NIO框架Mina、Netty3、xSocket

3、 尽量使用最新稳定版JDK

4、 遇到问题的时候,也许你可以先看下java的bug database

你可能感兴趣的:(nio)