TCP三次握手中listen()与accept()原理

目录

listen()队列剖析

accept()函数

阻塞与非阻塞I/O

同步与异步I/O

listen()队列剖析

  • listen():监听端口,用在 TCP连接 中的 服务器端 角色。
  • listen()函数调用格式: 
int listen(int sockfd, int backlog)
    
    
      
      
      
      
  • 要理解好backlog这个参数,需要先谈一谈 “监听套接字 队列”的话题

【监听套接字的队列】

TCP三次握手中listen()与accept()原理_第1张图片

  • 对于一个调用listen()进行监听的套接字,操作系统会给这个套接字 维护两个队列

TCP三次握手中listen()与accept()原理_第2张图片

TCP三次握手中listen()与accept()原理_第3张图片

【未完成连接队列 (保存连接用的)】

  • 当客户端 发送tcp连接三次握手的第一次【syn包】给服务器的时候,服务器就会在未完成队列中创建一个 跟这个 syn包对应的一项
  • 其实,我们可以把这项看成是一个半连接【因为连接还没建立起来呢】,这个半连接的状态会从LISTEN变成SYN_RCVD状态,同时给客户端返回第二次握手包【syn,ack】 这个时候,其实服务器是在等待完成第三次握手。

【已完成连接队列 (保存连接用的)】

  • 当第三次握手完成了,这个连接就变成了ESTABLISHED状态,每个已经完成三次握手的客户端 都放在这个队列中作为一项
  • backlog曾经的含义:已完成队列和未完成队列里边条目之和 不能超过 backlog
  • 客户端这个connect()什么时候返回,其实是收到三次握手的第二次握手包(也就是收到服务器发回来的syn/ack)之后就返回了
  • RTT是未完成队列中任意一项在未完成队列中留存的时间,这个时间取决于客户端和服务器
    • 对于客户端,这个RTT时间是第一次和第二次握手加起来的时间
    • 对于服务器,这个RTT时间实际上是第二次和第三次握手加起来的时间
  • 如果这三次握手包传递速度特别快的话,大概187毫秒能够建立起来这个连接这个时间挺慢,所以感觉建立TCP连接的成本挺高。
  • 如果一个恶意客户,迟迟不发送三次握手的第三个包。那么这个连接就建立不起来,那么这个处于SYN_RCVD的这一项【服务器端的未完成队列中】,就会一致停留在服务器的未完成队列中,这个停留时间大概是75秒,如果超过这个时间,这一项会被操作系统干掉。

accept()函数

  • accept()函数,就使用来 从 已完成连接队列 中 的队首【队头】位置取出来一项【每一项都是一个已经完成三路握手的TCP连接】,返回给进程。
  • 如果已完成连接队列是空的呢?
    • 那么accept()会一致卡在这里【休眠】等待,一直到已完成队列中有一项时才会被唤醒。
  • 从编程角度,我们要尽快的用accept()把已完成队列中的数据【TCP连接】取走。
  • accept()返回的是个套接字,这个套接字就代表那个已经用三次握手建立起来的那个tcp连接,因为accept()是从 已完成队列中取的数据。
  • 服务器程序,必须要严格区分两个套接字:
    • a)监听9000端口这个套接字,这个东西叫“监听套接字【listenfd】”,只要服务器程序在运行,这个套接字就应该一直存在
    • b)当客户端连接进来,操作系统会为每个成功建立三次握手的客端再创建一个套接字【当然是一个已经连接套接字】,accept()返回的就是这种套接字。也就是从已完成连接队列中取得的一项。随后,服务器使用这个accept()返回的套接字和客户端通信的。
  • 思考题
  • (1)如果两个队列之和【已完成连接队列,和未完成连接队列】达到了listen()所指定的第二参数,也就是说队列满了,此时,再有一个客户发送syn请求,服务器怎么反应?
    •  实际上服务器会忽略这个syn,不给回应 客户端这边,发现syn没回应,过一会会重发syn包。
  • (2)从连接被扔到已经完成队列中去,到accept()从已完成队列中把这个连接取出这个之间是有个时间差的,如果还没等accept()从已完成队列中把这个连接取走的时候,客户端如果发送来数据,这些数据被怎样处理?
    • 这个数据就会被保存再已经连接的套接字的接收缓冲区里,这个缓冲区有多大, 最大就能接收多少数据量。

【syn攻击(syn flood)】

  • 典型的利用TCP/IP协议涉及弱点进行恶意的一种行为。
  • 拒绝服务攻击(DOS/DDOS)。
  • backlog:进一步明确和规定了指定给定套接字上内核为之排队的最大已完成连接数【已完成连接队列中最大条目数】。
  • 大家在写代码时尽快用accept()把已完成队列里边的连接取走,尽快 留出空闲为止给后续的已完成三路握手的条目用,那么这个已完成队列一般不会满, 一般这个backlog值给300左右。

阻塞与非阻塞I/O

  • 阻塞和非阻塞主要是指调用某个系统函数时,这个函数是否会导致我们的进程进入sleep()【卡在这休眠】状态而言的

【阻塞I/O】

TCP三次握手中listen()与accept()原理_第4张图片

  • 调用一个函数,这个函数就卡在在这里,整个程序流程不往下走了【休眠sleep】,该函数卡在这里等待一个事情发生,只有这个事情发生了,这个函数才会往下走。。
  • 比如阻塞函数accept(),recvfrom()。
  • 这种阻塞,并不好,效率很低,一般我们不会用阻塞方式来写服务器程序。

【非阻塞I/O】

TCP三次握手中listen()与accept()原理_第5张图片

  • 不会卡住,充分利用时间片,执行更高。
  • 非阻塞模式的两个鲜明特点:
    • (1)不断的调用accept(),recvfrom()函数来检查有没有数据到来,如果没有,函数会返回一个特殊的错误标记来告诉你,这种标记可能是EWULDBLOCK,也可能是EAGAIN如果数据没到来,那么这里有机会执行其他函数,但是也得不停的再次调用accept(),recvfrom()来检查数据是否到来,非常累。
    • (2)如果数据到来,那么就得卡在这里把数据从内核缓冲区复制到用户缓冲区,所以复制这个阶段是卡着完成的。

TCP三次握手中listen()与accept()原理_第6张图片

同步与异步I/O

 

TCP三次握手中listen()与accept()原理_第7张图片

【异步I/O】

  • 调用一个异步I/O函数时,要给这个函数指定一个接收缓冲区,还要给定一个回调函数。
  • 调用完一个异步I/O函数后,该函数会立即返回。 其余判断交给操作系统,操作系统会判断数据是否到来,如果数据到来了,操作系统会把数据拷贝到你所提供的缓冲区里,然后调用你所指定的这个回调函数来通知你。
  • 很容易区别非阻塞和异步I/O的差别:
    • (1)非阻塞I/O要不停的调用I/O函数来检查数据是否来,如果数据来了,就得卡在I/O函数这里把数据从内核缓冲区复制到用户缓冲区,然后这个函数才能返回
    • (2)异步I/O根本不需要不停的调用I/O函数来检查数据是否到来,只需要调用一次,然后就可以干别的事情去了
  •  内核判断数据到来,拷贝数据到你提供的缓冲区,调用你的回调函数来通知你,你并没有被卡在那里的情况

【同步I/O】

TCP三次握手中listen()与accept()原理_第8张图片

  • 如select/poll,epoll。
  • 1)调用select()判断有没有数据,有数据,走下来,没数据卡在那里。
  • 2)select()返回之后,用recvfrom()去取数据当然取数据的时候也会卡那么一下。
  • 同步I/O感觉更麻烦,要调用两个函数才能把数据拿到手,但是同步I/O和阻塞式I/O比,就是所谓的 I/O复用【用两个函数来收数据的优势】 能力

【I / O复用】

  • 所谓I/O复用,就是我多个socket【多个TCP连接】可以弄成一捆【一堆】,我可以用select这种同步I/O函数在这等数据。
  • select()的能力是等多条TCP连接上的任意一条有数据来,然后哪条TCP有数据来,我再用具体的比如recvfrom()去收。
  • 所以,这种调用一个函数能够判断一堆TCP连接是否来数据的这种能力,叫I/O复用,英文I/O multiplexing【I/O多路复用】
  • 很多资料把 阻塞I/O,非阻塞I/O,同步I/O归结为一类 ,因为他们多多少少的都有阻塞的行为发生,甚至有的资料直接就把 阻塞I/O,非阻塞I/O 都归结为同步I/O模型,这也是可以的。
  • 把异步I/O单独归结为一类,因为异步I/O是真正的没有阻塞行为发生的。

你可能感兴趣的:(tcp/ip,服务器,网络)