当一个进程打开的文件描述符达到了上限,这时有新连接到来的sockt 如何处理?

 

#ifndef _ASM_GENERIC_ERRNO_BASE_H
#define _ASM_GENERIC_ERRNO_BASE_H

#define EPERM   1 /* Operation not permitted */
#define ENOENT   2 /* No such file or directory */
#define ESRCH   3 /* No such process */
#define EINTR   4 /* Interrupted system call */
#define EIO   5 /* I/O error */
#define ENXIO   6 /* No such device or address */
#define E2BIG   7 /* Argument list too long */
#define ENOEXEC   8 /* Exec format error */
#define EBADF   9 /* Bad file number */
#define ECHILD  10 /* No child processes */
#define EAGAIN  11 /* Try again */
#define ENOMEM  12 /* Out of memory */
#define EACCES  13 /* Permission denied */
#define EFAULT  14 /* Bad address */
#define ENOTBLK  15 /* Block device required */
#define EBUSY  16 /* Device or resource busy */
#define EEXIST  17 /* File exists */
#define EXDEV  18 /* Cross-device link */
#define ENODEV  19 /* No such device */
#define ENOTDIR  20 /* Not a directory */
#define EISDIR  21 /* Is a directory */
#define EINVAL  22 /* Invalid argument */
#define ENFILE  23 /* File table overflow */
#define EMFILE  24 /* Too many open files */
#define ENOTTY  25 /* Not a typewriter */
#define ETXTBSY  26 /* Text file busy */
#define EFBIG  27 /* File too large */
#define ENOSPC  28 /* No space left on device */
#define ESPIPE  29 /* Illegal seek */
#define EROFS  30 /* Read-only file system */
#define EMLINK  31 /* Too many links */
#define EPIPE  32 /* Broken pipe */
#define EDOM  33 /* Math argument out of domain of func */
#define ERANGE  34 /* Math result not representable */

#endif

假如accept返回EMFILE该如何应对?这意味着本进程打开的文件描述符已经打到上限,无法为新连接创建socket文件描述符。但是,既然没有sockt文件描述符来表示这个连接,我们无法close它。程序会继续运行,回到再次调用的epoll_wait。这个时候epoll_wait会立刻返回,因为有新连接还等待处理,listenning fd 还是可读的(POLLIN事件)。这样程序会陷入busy loop状态,CPU占有率接近100%,会影响本系统的其他服务,也会影响同一机器上的其他服务。

如何处理那?

1、调高进程的文件描述符数目。治标不治本,因为只要有足够多的客户端,就一定能把一个服务进程的文件描述符用户

2、死等。鸵鸟算法(传说中鸵鸟看到危险就把头埋在地底下。当你对某一件事情没有一个很好的解决方法时,那就忽略它,就像鸵鸟面对危险时会把它深埋在沙砾中,装作看不到。这样的算法称为“鸵鸟算法“。鸵鸟算法,是平衡性能和复杂性而选择的一种方法。)

3、退出程序。似乎小题大做,为这种暂时的错误而中断现有的服务似乎不值得

4、关闭监听listenning fd。那么什么时候重新打开那

5、改用edge trigger。如果漏掉了一次accept(2),程序再也不会收到连接

6、准备一个空闲的文件描述符。如遇到这种情况,先关闭这个空闲的文件,获得了一个文件描述符的名额;再accept拿到新socket连接的描述符;随后立刻关闭close它,这样就优雅的断开了客户端连接;最后重新打开一个空闲的文件,把“坑”占住,已被再次出现这种情况时使用。

7、file descriptor是hard limit,我们可以自己设一个稍微第一点的soft limit,如果超过soft limit 就主动关闭新连接,这样就避免触及“file descriptor耗尽”这种边界条件。比方说当前进程的max file descriptor是1024,那么我们可以在连接数打到1000的时候进入“拒绝新连接”的状态

 

第2、5种做法会导致客户端认为连接已经建立,但是无法获取服务,因为服务端程序没有拿到连接的文件描述符

 

代码形式如下:

 int idleFd_=::open("/dev/null", O_RDONLY | O_CLOEXEC);
  int connfd = acceptSocket_.accept();
  if (connfd >= 0)
  {
   .............................

  }
  else
  {
    if (errno == EMFILE)
    {
      ::close(idleFd_);
      idleFd_ = ::accept(acceptSocket_.fd,NULL,NULL)
     :close(idleFd_);
      idleFd_ = ::open("/dev/null", O_RDONLY | O_CLOEXEC);
    }
  }


你可能感兴趣的:(Linux总结)