kcp协议

KCP 是一个快速可靠协议,能以比 TCP浪费10%-20%的带宽的代价,换取平均延迟降低 30%-40%,且最大延迟降低三倍的传输效果。纯算法实现,并不负责底层协议(如UDP) 的收发,需要使用者自己定义下层数据包的发送方式,以 callback的方式提供给 KCP。 连时钟都需要外部传递进来,内部不会有任何一次系统调用。

整个协议只有 ikcp.h, ikcp.c两个源文件,可以方便的集成到用户自己的协议栈中。 也许你实现了一个P2P,或者某个基于 UDP的协议,而缺乏一套完善的ARQ可靠协议实现, 那么简单的拷贝这两个文件到现有项目中,稍微编写两行代码,即可使用。

KCP一些名词说明

  • 用户数据:应用层发送的数据,比如一张图片2KB的数据。
  • MTU:最大传输单元,即每次发送的最大数据。
  • RTO:Retransmission TimeOut,重传超时时间。
  • cwnd:ongestion window,拥塞窗口,表示发送方可发送多少个KCP数据包。与接收方窗口有关,与网络状况(拥塞控制)有关,与发送窗口大小有关。
  • rwnd:receiver window,接收方窗口大小,表示接收方还可接收多少个KCP数据包。MTU就是最大数据包
  • snd_queue:待发送KCP数据包队列。
  • snd_nxt:下一个即将发送的kcp数据包序列号。
  • snd_una:下一个待确认的序列号。

技术特性

TCP是为流量设计的(每秒内可以传输多少KB的数据),讲究的是充分利用带宽。而KCP 是为流速设计的(单个数据包从一端发送到一端需要多少时间),以10%-20%带宽浪费 的代价换取了比 TCP快30%-40%的传输速度。TCP信道是一条流速很慢,但每秒流量很大 的大运河,而KCP是水流湍急的小激流。KCP有正常模式和快速模式两种,通过以下策略 达到提高流速的结果:

RTO翻倍vs不翻倍:

TCP超时计算是RTOx2,这样连续丢三次包就变成RTOx8了,十分恐怖,而KCP启动快速   模式后不x2,只是x1.5(实验证明1.5这个值相对比较好),提高了传输速度。

选择性重传 vs 全部重传:

TCP丢包时会全部重传从丢的那个包开始以后的数据,KCP是选择性重传,只重传真正   丢失的数据包。

快速重传:

发送端发送了1,2,3,4,5几个包,然后收到远端的ACK: 1, 3, 4, 5,当收到ACK3时,   KCP知道2被跳过1次,收到ACK4时,知道2被跳过了2次,此时可以认为2号丢失,不用   等超时,直接重传2号包,大大改善了丢包时的传输速度。

延迟ACK vs 非延迟ACK:

TCP为了充分利用带宽,延迟发送ACK(NODELAY都没用),这样超时计算会算出较大   RTT时间,延长了丢包时的判断过程。KCP的ACK是否延迟发送可以调节。

UNA vs ACK+UNA:

ARQ模型响应有两种,UNA(此编号前所有包已收到,如TCP)和ACK(该编号包已收到   ),光用UNA将导致全部重传,光用ACK则丢失成本太高,以往协议都是二选其一,而   KCP协议中,除去单独的 ACK包外,所有包都有UNA信息。

非退让流控:

KCP正常模式同TCP一样使用公平退让法则,即发送窗口大小由:发送缓存大小、接收   端剩余接收缓存大小、丢包退让及慢启动这四要素决定。但传送及时性要求很高的小   数据时,可选择通过配置跳过后两步,仅用前两项来控制发送频率。以牺牲部分公平   性及带宽利用率之代价,换取了开着BT都能流畅传输的效果。

基本使用

  1. 创建 KCP对象:

    // 初始化 kcp对象,conv为一个表示会话编号的整数,和tcp的 conv一样,通信双
    // 方需保证 conv相同,相互的数据包才能够被认可,user是一个给回调函数的指针
    ikcpcb *kcp = ikcp_create(conv, user);
  2. 设置回调函数:

    // KCP的下层协议输出函数,KCP需要发送数据时会调用它
    // buf/len 表示缓存和长度
    // user指针为 kcp对象创建时传入的值,用于区别多个 KCP对象
    int udp_output(const char *buf, int len, ikcpcb *kcp, void *user)
    {
     ....
    }
    // 设置回调函数
    kcp->output = udp_output;
  3. 循环调用 update:

    // 以一定频率调用 ikcp_update来更新 kcp状态,并且传入当前时钟(毫秒单位)
    // 如 10ms调用一次,或用 ikcp_check确定下次调用 update的时间不必每次调用
    // 其实主要就是检测哪些数据包该重传了
    ikcp_update(kcp, millisec);
  4. 第四步,发送数据。调用ikcp_send之后,KCP最后会使用上面设置的output函数来将发送数据(KCP自己并不关心如何发送数据)。  

   int ikcp_send(ikcpcb *kcp, const char *buffer, int len)

5. 输入一个下层数据包:预接收数据。先手动预接收数据,然后再调用ikcp_input将裸数据交给KCP,这些数据有可能是KCP控制报文,并不是我们要的数据。

// 收到一个下层数据包(比如UDP包)时需要调用:
ikcp_input(kcp, received_udp_packet, received_udp_size);

 
 .第六步,接收数据。此时收到的数据才是真正的数据,重组操作在调用ikcp_recv之前就完成了。


int ikcp_recv(ikcpcb *kcp, char *buffer, int len)


处理了下层协议的输出/输入后 KCP协议就可以正常工作了,使用 ikcp_send 来向 远端发送数据。而另一端使用 ikcp_recv(kcp, ptr, size)来接收数据。

协议配置

协议默认模式是一个标准的 ARQ,需要通过配置打开各项加速开关:

  1. 工作模式:

    int ikcp_nodelay(ikcpcb *kcp, int nodelay, int interval, int resend, int nc)

    nodelay :是否启用 nodelay模式,0不启用;1启用。 interval :协议内部工作的 interval,单位毫秒,比如 10ms或者 20ms resend :快速重传模式,默认0关闭,可以设置2(2次ACK跨越将会直接重传) nc :是否关闭流控,默认是0代表不关闭,1代表关闭。 普通模式:`ikcp_nodelay(kcp, 0, 40, 0, 0); 极速模式: ikcp_nodelay(kcp, 1, 10, 2, 1);

  2. 最大窗口:

    int ikcp_wndsize(ikcpcb *kcp, int sndwnd, int rcvwnd);

    该调用将会设置协议的最大发送窗口和最大接收窗口大小,默认为32.

  3. 最大传输单元:

    纯算法协议并不负责探测 MTU,默认 mtu是1400字节,可以使用ikcp_setmtu来设置 该值。该值将会影响数据包归并及分片时候的最大传输单元。

  4. 最小RTO:

    不管是 TCP还是 KCP计算 RTO时都有最小 RTO的限制,即便计算出来RTO为40ms,由 于默认的 RTO是100ms,协议只有在100ms后才能检测到丢包,快速模式下为30ms,可 以手动更改该值:

    kcp->rx_minrto = 10;

最佳实践

内存分配器

默认KCP协议使用 malloc/free进行内存分配释放,如果应用层接管了内存分配,可以  用ikcp_allocator来设置新的内存分配器,注意要在一开始设置:

ikcp_allocator(my_new_malloc, my_new_free);

前向纠错注意

为了进一步提高传输速度,下层协议也许会使用前向纠错技术。需要注意,前向纠错会根 据冗余信息解出原始数据包。相同的原始数据包不要两次input到KCP,否则将会导致kcp 以为对方重发了,这样会产生更多的ack占用额外带宽。

比如下层协议使用最简单的冗余包:单个数据包除了自己外,还会重复存储一次上一个数 据包,以及上上一个数据包的内容:

Fn = (Pn, Pn-1, Pn-2)

P0 = (0, X, X)
P1 = (1, 0, X)
P2 = (2, 1, 0)
P3 = (3, 2, 1)

这样几个包发送出去,接收方对于单个原始包都可能被解出3次来(后面两个包任然会重 复该包内容),那么这里需要记录一下,一个下层数据包只会input给kcp一次,避免过 多重复ack带来的浪费。

管理大规模连接

如果需要同时管理大规模的 KCP连接(比如大于3000个),比如你正在实现一套类 epoll 的机制,那么为了避免每秒钟对每个连接调用大量的调用 ikcp_update,我们可以使用 ikcp_check来大大减少 ikcp_update调用的次数。 ikcp_check返回值会告诉你需要 在什么时间点再次调用 ikcp_update(如果中途没有 ikcp_send, ikcp_input的话, 否则中途调用了 ikcp_send, ikcp_input的话,需要在下一次interval时调用 update)

标准顺序是每次调用了 ikcp_update后,使用 ikcp_check决定下次什么时间点再次调用 ikcp_update,而如果中途发生了 ikcp_send, ikcp_input的话,在下一轮 interval 立马调用 ikcp_update和 ikcp_check。 使用该方法,原来在处理2000个 kcp连接且每 个连接每10ms调用一次update,改为 check机制后,cpu从 60%降低到 15%。

ikcp_check它的作用就是判断,再没有新的数据包输入的情况下,什么时候需要再发送下一个包(窗口探测,或者重发等)。而如果有新的数据包输入了(不管是ACK还是PUSH),或者你调用了 ikcp_send,那么下一个interval就需要调度update,然后再check。你可以创建后 kcp->interval = 1,或者更我一样使用核心interval=10ms的时钟调度器(比如linux内核的那个timer实现版本)。不过如果你不需要管理1000个以上的 kcp对象的话,还是不要用check比较好,这部分代码写起来比较烦。

github地址

GitHub - skywind3000/kcp: KCP - A Fast and Reliable ARQ Protocol

lua版本kcp

GitHub - linxiaolong/lua-kcp: lua binding for kcp

c++ demo

GitHub - bamboo-blue/KCP_Learn: kcp学习demo

另外一个c++ demo

什么是KCP_Hello,C++!的博客-CSDN博客_kcp

原理

UDP可靠性传输KCP实现原理和应用 - 知乎

KCP 协议:为流速和低延时设计的协议 - 知乎

自己理解

1.  发送kcp->output = udpOutPut 设置一个回调函数, 发送流程就是

        1.1    int ret = ikcp_send(send.pkcp, temp, (int) sizeof(temp));  // 这里是放到发送消息队列中snd_queue

        1.2 调用ikcp_update -> 会给消息加上kcp包头 -> 回调到udpOutPut 函数

        1.3 直接发送sendto(send->sockfd, buf, len, 0, (struct sockaddr *) &send->addr, sizeof(struct sockaddr_in));

2. 接收

        1. 轮训 如: 每一秒 ikcp_check 函数  -> recvfrom

        2. ret = ikcp_input(send->pkcp, buf, n);   // 处理报文类型.报文4种类型,主要有四种报文格式,ACK报文、数据报文、探测window报文、响应窗口报文四种。

        3. ikcp_recv , kcp将接收到的kcp数据包还原成之前kcp发送的buffer数据

3.游戏控制数据

大部分逻辑严密的 TCP 游戏服务器,都是使用无阻塞的 TCP 连接配套个 epoll 之类的东西,当后端业务向用户发送数据时会追加到用户空间的一块发送缓存,比如 ring buffer 之类,当 epoll 到 EPOLL_OUT 事件时(其实也就是 TCP 发送缓存有空余了,不会 EAGAIN/EWOULDBLOCK 的时候),再把 ring buffer 里面暂存的数据使用 send 传递给系统的 SNDBUF,直到再次 EAGAIN。

那么 TCP Server 的后端业务持续向客户端发送数据,而客户端又迟迟没能力接收怎么办呢?此时 epoll 会长期不返回 EPOLL_OUT事件,数据会堆积再该用户的 ring buffer 之中,如果堆积越来越多,ring buffer 会自增长的话就会把 Server 的内存给耗尽。因此成熟的 TCP 游戏服务器的做法是:当客户端应用层发送缓存(非 TCP 的 sndbuf)中待发送数据超过一定阈值,就断开 TCP 链接,因为该用户没有接收能力了,无法持续接收游戏数据。

使用 KCP 发送游戏数据也一样,当 ikcp_waitsnd 返回值超过一定限度时,你应该断开远端链接,因为他们没有能力接收了。

但是需要注意的是,KCP 的默认窗口都是 32,比 TCP 的默认窗口低很多,实际使用时应提前调大窗口,但是为了公平性也不要无止尽放大(不要超过 1024)。

4. 实战: 

1. 标记消息类型 ,

        1. SYN连接(握手) 用来确认双方接下来使用kcp协议通信

        2. ack ,返回给客户端 udp_send_ack_until_confirm(from,linkid,endpoint_linkid)

        3. fiN ,收到客户端标记,和主动发送给客户端断开连接 ,, 多长时间没有活跃,主动断开连接

        4 MSG , 通信包

2.  启动一个定时器10ms定时器. 每次轮训所有的connection ,如果长时间不活跃断开 我看的例子是600ms 没有活跃包,就断开 或者使用 ikcp_waitsnd 判断阈值(消息堆积了多少)

        否侧kcp_check  

                local nexttime = kcp:lkcp_check(now)

                if nexttime <= now then

                    kcp:lkcp_update(now)

                end

下面是lua 的一个check 例子

function handler.tick(now)
    local skynet_now = skynet.now()
    for linkid,agent in pairs(connection) do
        if type(linkid) == "number" then
            local kcp = agent.kcp
            if timeout > 0 and (skynet_now - agent.active >= timeout) then
                socket_close(linkid,"timeout close")
            else
                local nexttime = kcp:lkcp_check(now)
                if nexttime <= now then
                    kcp:lkcp_update(now)
                end
                while true do
                    local ok,len = xpcall(handler.recv_message,skynet.error,agent)
                    if not ok then
                        break
                    end
                    if len <= 0 then
                        break
                    end
                end
            end
        end
    end
end

function handler.dispatch_connection()
    skynet.fork(function ()
        while true do
            skynet.sleep(1)
            handler.tick(getms())
        end
    end)
end

主动断开连接,,就是开一个 0.5s 的定时器重发3次 fin包

udp: 

udp: 其实就是一直轮训本地socket (服务端绑的socket), recvfrom 后会返回客户端的addr

n = recvfrom(send->sockfd,buf,512,MSG_DONTWAIT,(struct sockaddr *) &send->addr,&len);

这时候就要和客户端约定好 一些握手 ,撒手的包..然后维护这个addr.列表.  ,然后要send 的时候直接找到对应玩家的addr 然后send就可以

如: 

function handler.dispatch_message(from,msg)
    local ctrl = string.unpack("

kcp服务器做成单线程服务器 ,也行,,收到就解包..解包就做逻辑,,然后 直接 ikcp_send 

3. 我看有的项目会使用epoll 去监听读事件 服务端listen 的那个socketfd,,, 这样的好处,就是网络线程单线程的情况下,可以兼顾udp + tcp

4. 用tcp实现帧同步的时候应该关闭Nagle算法

你可能感兴趣的:(服务端,网络,tcp/ip,p2p)