可伸缩的网络编程(Scalable Network Programming)中最重点的几个因素在Linux2.4,NetBSD 1.6.1,Linux2.6,FreeBSD 5.1,OpenBSD3.4下的对比:
(1).fork()进程时的延时:Linux2.6比FreeBSD 5.1性能更好,这两个系统在fork新进程时的延时时间不会随着进程数目的增大而有所变化。
(2).静态联接时的fork与动态联接时fork的比较:静态链接性能有显著提高。Linux 2.6 static>FreeBsd 5.1 static > Linux 2.6 dynamic>FreeBSD 5.1 dynamic.
(3).进程调试比较:Linux每10ms中断一次当前进程,Alpha系统上是1ms中断一次。Linux 2.6的进度调度器是O(1).
(4).进程与线程:fork是慢的,可以用thread代替。在Linux 2.6中的测试结果,400个左右的连接后fork()的性能要超过pthread_create()的性能。IBM对Linux做过优化后,一个进程可以处理10万个连接。fork()在每一个连接时都fork()一次成本太高,多线程在于线程安全(thread-safe)与死锁(deadlock),以及内存泄露问题这些问题都要考虑。
(5).内存消耗:Apache2的worker模型是一个比较好的方案,多线程(multithread)避免了内存消耗,多进程(multyprocess),解决了单一进程文件描述符上限的问题。
(6).超时(time-out)问题:使用select,其缺点是有打开文件描述符的限制。使用poll,根据linux与freebsd的测试表明,基本于fork的web server比poll更好。sun os中使用/dev/poll,linux中使用epoll。FreeBSD中使用kqueue.kqueue比epoll性能相当。
(7).其它高延时因素1:POSIX规定每当新打开一个文件,内核必须使用最小,未被使用的描述符。这显然是达不到O(1)的。Linux使用的是位向量。Linux与BSD在这点上相比“还算是”scales well的。
(8).其它高延时因素2:客户端应用与proxy代理服务器在由内核选择使用端口号时都有相同的问题。在Linux与FreeBSD上这点还可以算是scales well的。
(9).磁盘呑吐量(disk throughput):这也是一个主要必须面对的问题之一。一般磁盘在顺序读写时是很快的,但是在移动磁头进行seek时,就会很慢了。
(10).sendfile:避免了将文件数据copy到用户空间,然后再copy回内核空间传递给write,即其中多了两种不必要的copy操作。现在的gigabit的以太网卡都能支持scatter-gather I/O,也就是从kernel buffer取得packet header,而packet content从buffer cache中取得(csum_partial_copy_from_user)。这就是所谓的Zero Copy TCP,这是其终极目标。Linux与FreeBSD支持sendfile。
(11).内存映射I/O(Memory Mapped I/O),使用内存映射文件避免了buffer的copy.mmap系统调用性能最好是Linux 2.6,再次是Linux 2.4,FreeBSD 5.1最差。随着mmap页面数目的增加,从mmap新页面中读取性能最好的是FreeBSD 5.1其次是Linux 2.6/2.4。
(12).文件系统延时(filesystem latency),处理同一个目录下大量文件使用XFS,reiserfs这样的文件系统比较好。
(13).异步IO(AIO-Async I/O),AIO仅对文件有意义,而不是socket。例如,如果希望从一个巨大的数据库里读取1000个块,使用lseek和read来完成,那就意味着让OS通过指定的顺序读取文件,而不论这些块是在disk上如何排列的。通过AIO,OS可以基于这些块在disk上的排列重新调整顺序,然后磁头一次性读取这些数目而无需来回移动那道。但是问题是,you have no idea which of the queued requests was finished when you get the signal.FreeBSD提供了AIO的功能。
(14).writev,TCP_CORK(Linux),TCP_NOPUSH(BSD),以及FreeBSD的sendfile.
(15).fork VS vfork:fork并不做真正的内容复制,而仅仅是复制表。于是linux与bsd都提供了vfork。在linux 2.6上测试静态链接glibc表明vfork比fork慢,250ms vs 320ms.
结论:linux 2.6是一个很优秀的系统,在所有的benchmark中都达到O(1)的水准。FreeBSD 6.1其次,除了mmap外,都是O(1)。
详细文档参考:http://bulk.fefe.de/scalable-networking.pdf