kcp-go 源码分析(二)

 一:基础

        上一篇主要是分析kcp-go上层应用包装,这一篇再来分析kcp算法层面的东西。kcp是一个快速可靠协议,设计的目的就是解决在网络拥堵的情况下TCP协议网络速度慢这个问题。相比TCP而言,KCP增大了网络传输速率但是牺牲了部分带宽。有个形象的比如就是TCP是一条大河,大河里边的水流速慢但是能容纳的水多,而KCP就是小激流,水流速快但是少。

        KCP并没有规定下层使用什么协议来传输数据,它只是对数据层进行包装。一般情况下下层是使用UDP作为传输协议,KCP层的数据包是在UDP数据报文的基础上加了控制头,这样数据报就变大了。当用户的数据很大时,大于一个UDP报文能曾受的范围(大于MSS),KCP会将数据分片存储到多个KCP包中,因此每个KCP包称为一个分片。

        由于KCP算法是仿照TCP来的,弄清楚网络协议的一些基本概念对于理解TCP和KCP很有帮助。TCP通过确认机制来保证数据传输的可靠性,下面我们来复习一下基本的知识

1:超时重传(RTO)

超时重传指的是,发送数据包在一定的时间内没有收到相应的ACK,等待一定的时间,超时之后就认为这个数据包丢失,就会重新发送。这个等待时间被称为RTO,即重传超时时间。

2:确认和重传机制

        a:停等机制。在早期的时候是采用停等的模式来实现的,具体就是发送方在发送完数据之后会启动定时器,在规定的时间内没有收到ACK报文就认为发送失败,会重新发送数据知道成功为止。必须等待确认之后才能发送下一个包,传输速度慢,效率低。

        b:滑动窗口机制。为了提高传输速度,发送方没必要发一个数据包然后等待回复,可以一下子发送多个数据包然后再等对方一一确认,发送方也不是说想发送多少就发送多少的,这得看接收方能接收多少,所以说需要限制一下发送方往网络中发送的数据量。在没有收到确认之前,发送方最多只能发送wnd大小的数据,这个就是滑动窗口机制。TCP的每一端都可以收发数据,每个TCP连接的a、b两端都维护一个发送窗口和接收窗口。其实弄明白4个概念就很好理解滑动窗口:已发送已确认数据段   已发送未确认数据段   可发送还未发送数据段   不可发送数据段

kcp-go 源码分析(二)_第1张图片

kcp-go 源码分析(二)_第2张图片  关于滑动窗口请参考:TCP协议详解 滑动窗口_sandyznb的博客-CSDN博客_tcp协议的滑动窗口

二:正式进入KCP

kcp-go 源码分析(二)_第3张图片 

 1:源码中的有关的名词解析

MSS:最大报文长度Maximum Segment Size

MTU:最大传输单元Maximum Transmission Unit

snd_una:第一个未确认的包

snd_nxt:下一个待分配包的序号

rcv_nxt:待接收消息序号

snd_wnd:当前端的发送窗口   默认大小 IKCP_WND_SND = 32

rcv_wnd:当前端的接收窗口    默认大小 IKCP_WND_RCV = 32

rmt_wnd:远端的接收窗口       默认大小 IKCP_WND_RCV = 32

cwnd:当前端的拥塞窗口

nocwnd:值为1时 表示取消拥塞控制(字面理解就是没有拥塞窗口)

stream:值为1时  表示会将几个小包合并成一个大包 

2:kcp的协议组成说明

kcp-go 源码分析(二)_第4张图片

 来看看KCP协议头segment具体字段的含义

type segment struct {
	conv     uint32    //会话编号,和TCP的con一样,conv一致才会通信
	cmd      uint8     //指令类型 有4种
	frg      uint8     //标识segment分片ID,用户数据可能被分成多个kcp包发送,倒序->0
	wnd      uint16    //剩余接收窗口大小
	ts       uint32    //发送时刻的时间戳
	sn       uint32    //分片segment的序号,按1累加递增
	una      uint32    //待接收消息序号,代表编号前面的所有报都收到了的标志
	rto      uint32    //超时重传时间,根据网络去定
	xmit     uint32    //重传次数
	resendts uint32    //重传的时间戳。超过当前时间重发这个包
	fastack  uint32    //快速重传机制,记录被跳过的次数,超过次数进行快速重传
	acked    uint32    // mark if the seg has acked
	data     []byte    //数据内容
}
conv一般都是服务器先分配好然后发给客户端,kcp-go是随机生成的。
CMD 4种类型:
IKCP_CMD_PUSH    = 81 // cmd: push data          数据分片
IKCP_CMD_ACK     = 82 // cmd: ack                ack分片
IKCP_CMD_WASK    = 83 // cmd: window probe (ask) 请求告知窗口大小
IKCP_CMD_WINS    = 84 // cmd: window size (tell) 告知窗口大小

3:KCP类分析 

type KCP struct {
    conv, mtu, mss, state                  uint32
	snd_una, snd_nxt, rcv_nxt              uint32
	ssthresh                               uint32
	rx_rttvar, rx_srtt                     int32
	rx_rto, rx_minrto                      uint32
	snd_wnd, rcv_wnd, rmt_wnd, cwnd, probe uint32
	interval, ts_flush                     uint32
	nodelay, updated                       uint32
	ts_probe, probe_wait                   uint32
	dead_link, incr                        uint32
	fastresend     int32
	nocwnd, stream int32
	snd_queue []segment
	rcv_queue []segment
	snd_buf   []segment
	rcv_buf   []segment
	acklist []ackItem
	buffer   []byte
	reserved int
	output   output_callback
}

conv:会话ID

mtu:最大传输单元,默认数据是1400,最小是50

mss:最大分片大小 不大于mtu

state:连接状态 0xFFFFFFFF表示断开连接

snd_una:第一个未确认的包

snd_nxt:待发送包的序号

rcv_nxt:待接收消息的序号。

sshthresh:拥塞窗口的阈值,以包为单位(TCP以字节为单位)

rx_rttval:ack接收rtt浮动值 代表连接的抖动情况

rx_srtt:ack接收rtt平滑值(smoothed)

rx_rto:由ACK接收延迟计算出来的重传超时时间

rx_minrto:最小重传超时时间

snd_wnd:发送窗口大小

rcv_wnd:接收窗口大小

rmt_wnd:远端接收窗口大小

cwnd:拥塞窗口大小

probe:探查变量。IKCP_ASK_TELL表示告知远端窗口大小,IKCP_ASK_SEND表示请求远端告知窗口大小

current:当前的时间戳

interval:内部flush刷新间隔

ts_flush:下次flush刷新时间戳

nodelay:是否启动无延迟模式 

updated:是否调用过update函数的标记(kcp需要上层通过不断的update和check来驱动kcp收发)

ts_probe:下次探查窗口的时间戳

probe_wait:探查窗口需要等待的时间

dead_link:最大重传次数 超过了就被认为连接中断

incr:可发送的最大数据量

snd_queue:发送消息的队列

rcv_queue:接收消息的队列

snd_buf:发送消息的缓存

rcv_buf:接收消息的缓存

ack_list:等待发送的ack列表

buffer:储存消息字节流的内存

fastresend:触发快速重传的重复ack个数

nocwnd:取消拥塞控制

stream:是否采用流传输模式。Send的时候用到。为1的话 frg都是0,为0的话frg 倒序--->0

reserved:保留的字节数,这个变量是kcp-go自己加的,目的是为加密和FEC这部分功能预留位置

4:kcp相关api分析 

func (kcp *KCP) ReserveBytes(n int) bool {
	if n >= int(kcp.mtu-IKCP_OVERHEAD) || n < 0 {
		return false
	}
	kcp.reserved = n
	kcp.mss = kcp.mtu - IKCP_OVERHEAD - uint32(n)
	return true
}
/*
    newUDPSession中
    if sess.block != nil {
		sess.headerSize += cryptHeaderSize
	}
	if sess.fecEncoder != nil {
		sess.headerSize += fecHeaderSizePlus2
	}
	sess.kcp.ReserveBytes(sess.headerSize)
*/

        ReserveBytes是为上层引用的加密和FEC提供的,不考虑这些的话mss = mtu-head,为了实现加密和前向纠错就得给它预留空间,这样的话mss就得重置

func (kcp *KCP) PeekSize() (length int) {
	if len(kcp.rcv_queue) == 0 {
		return -1
	}

	seg := &kcp.rcv_queue[0]
	if seg.frg == 0 {
		return len(seg.data)
	}

	if len(kcp.rcv_queue) < int(seg.frg+1) {
		return -1
	}

	for k := range kcp.rcv_queue {
		seg := &kcp.rcv_queue[k]
		length += len(seg.data)
		if seg.frg == 0 {
			break
		}
	}
	return
}

         PeekSize是提前获取一个完整包的长度,通过frg来判断一个包是不是被分成了多片,如果有多个分片(比如3个),frg是倒序来赋值的(frg分别是2 1 0),这样的话碰到frg为0 就表示当前这个分片是最后一个分片。当queue里边没有数据 或者 有数据但是不能组成一个完整的包时,返回-1

func (kcp *KCP) Recv(buffer []byte) (n int) {
	peeksize := kcp.PeekSize()
	if peeksize < 0 {
		return -1
	}

	if peeksize > len(buffer) {
		return -2
	}

	var fast_recover bool
	if len(kcp.rcv_queue) >= int(kcp.rcv_wnd) {
		fast_recover = true
	}

	// merge fragment
	count := 0
	for k := range kcp.rcv_queue {
		seg := &kcp.rcv_queue[k]
		copy(buffer, seg.data)
		buffer = buffer[len(seg.data):]
		n += len(seg.data)
		count++
		kcp.delSegment(seg)
		if seg.frg == 0 {
			break
		}
	}
	if count > 0 {
		kcp.rcv_queue = kcp.remove_front(kcp.rcv_queue, count)
	}

	// move available data from rcv_buf -> rcv_queue
	count = 0
	for k := range kcp.rcv_buf {
		seg := &kcp.rcv_buf[k]
		if seg.sn == kcp.rcv_nxt && len(kcp.rcv_queue)+count < int(kcp.rcv_wnd) {
			kcp.rcv_nxt++
			count++
		} else {
			break
		}
	}

	if count > 0 {
		kcp.rcv_queue = append(kcp.rcv_queue, kcp.rcv_buf[:count]...)
		kcp.rcv_buf = kcp.remove_front(kcp.rcv_buf, count)
	}

	// fast recover
	if len(kcp.rcv_queue) < int(kcp.rcv_wnd) && fast_recover {
		// ready to send back IKCP_CMD_WINS in ikcp_flush
		// tell remote my window size
		kcp.probe |= IKCP_ASK_TELL
	}
	return
}

        Recv()主要是上层调用收数据的逻辑,先通过调用前边的PeekSize探测一个完整包的长度,如果rcv_queue没有包(peeksize=-1)或者queue里边完整包的数量超过了buff的剩余空间的话都返回错误码,正常情况下从rcv_queue中把data拷贝到buffer中,然后从rcv_queue中弹出已经copy好的数据,这个时候rcv_queue已经腾出空间了就从rcv_buf中拷贝一些合法数据到rcv_queue。

        从这可以看出 读取数据的流程是 rcv_buf->rcv_queue->buffer。rcv_buf中数据包的sn是连续的,rcv_queue中如果数据包被分片了,那frg也是要连续的。

func (kcp *KCP) Send(buffer []byte) int {
	var count int
	if len(buffer) == 0 {
		return -1
	}

	// append to previous segment in streaming mode (if possible)
	if kcp.stream != 0 {
		n := len(kcp.snd_queue)
		if n > 0 {
			seg := &kcp.snd_queue[n-1]
			if len(seg.data) < int(kcp.mss) {
				capacity := int(kcp.mss) - len(seg.data)
				extend := capacity
				if len(buffer) < capacity {
					extend = len(buffer)
				}

				// grow slice, the underlying cap is guaranteed to
				// be larger than kcp.mss
				oldlen := len(seg.data)
				seg.data = seg.data[:oldlen+extend]
				copy(seg.data[oldlen:], buffer)
				buffer = buffer[extend:]
			}
		}

		if len(buffer) == 0 {
			return 0
		}
	}

	if len(buffer) <= int(kcp.mss) {
		count = 1
	} else {
		count = (len(buffer) + int(kcp.mss) - 1) / int(kcp.mss)
	}

	if count > 255 {
		return -2
	}

	if count == 0 {
		count = 1
	}

	for i := 0; i < count; i++ {
		var size int
		if len(buffer) > int(kcp.mss) {
			size = int(kcp.mss)
		} else {
			size = len(buffer)
		}
		seg := kcp.newSegment(size)
		copy(seg.data, buffer[:size])
		if kcp.stream == 0 { // message mode
			seg.frg = uint8(count - i - 1)
		} else { // stream mode
			seg.frg = 0
		}
		kcp.snd_queue = append(kcp.snd_queue, seg)
		buffer = buffer[size:]
	}
	return 0
}

        Send是应用层把数据发送到KCP里边。如果kcp启用了stream模式,就看看snd_queue中最后一个seg里边还能不能加数据,如果len(seg.data)

        如果说剩余的buffer没有了,也就是完全塞到上一个seg里边了的话直接返回,本次send结束。如果还剩余有buffer,那么就要生成新的seg 然后进行相应的动作。计算剩余的buffer需要seg的个数count,count最小为1最大不能超过255,为啥不能超过255尼?因为frg的值跟count有关系,如果count>=256,那么第一个seg的frg就>=255了,而kcp的协议头里边frg是由一个字节长度存放的,最多只能存255,所以这里对于count的大小是有要求的。cout计算完了之后,剩余的操作就是创建seg然后把seg存放到snd_queue中。

        

你可能感兴趣的:(TCP,tcp)