最近开始学习一下游戏后台的一些知识,一直很好奇多个玩家之间的数据是如何同步的,查了一下,目前使用的比较多的是状态同步和帧同步。
同步的是游戏中的各种状态。
一般的流程是客户端上传操作到服务器,服务器收到后计算游戏行为的结果,即技能逻辑,战斗计算都由服务器运算,然后以广播的方式下发游戏中各种状态,客户端收到状态后,更新自己本地的动作状态、Buff状态,位置等就可以了,但是为了给玩家好的体验,减少同步的数据量,客户端也会做很多的本地运算,减少服务器同步的频率以及数据量,该方式多用于回合制的游戏。
状态同步其实是一种不严谨的同步。它的思想中,不同玩家屏幕上的表现的一致性并不是重要指标, 只要每次操作的结果相同即可。所以状态同步对网络延迟的要求并不高。像玩RPG游戏,200-300ms的延迟也可以接受。 但是在RTS游戏中,50ms的延迟却会很受伤。
举个移动的例子,在状态同步中, 客户端甲上操作要求从A点移动到B点,但在客户端乙上, 甲对象从A移动到C,然后从C点移动到了B。这是因为, 客户端乙收到A的移动状态时, 已经经过了一个延迟。这个过程中,需要客户端乙本地做一些平滑的处理,最终达到移动到B点的结果。(可通过增加动作前后摇来减少延迟——多播一点动画,给服务器多争取一些时间!)
RTS(即时战略游戏)游戏常采用的一种同步技术 ,上一种状态同步方式数据量会随着需要同步的单位数量增长,对于RTS游戏来讲动不动就是几百个的单位可以被操作,如果这些都需要同步的话,数据量是不能被接受的,所以帧同步不同步状态,只同步操作。
大家小时候应该看过这样的小人书:快速翻看就可以看到漫画上的人物会动起来。
由于人类眼睛的特殊生理结构,如果所看画面之帧率高于每秒约10-12帧的时候,就会认为是连贯的, 此现象称之为视觉暂留。
游戏中的所有动画也是采用这种方式来渲染,只不过帧率是由GPU来控制,你所看到的画面都是由GPU一帧帧渲染的,比如30帧/s,你所看到的画面就比较流畅了,帧率越高你所看到的越流畅。
帧同步可以说是通过帧率延伸过来的,你可以把一个游戏看成一个巨大的状态机,所有的参与者都采用同一个逻辑帧率来不断的向前推进。
我们把游戏的前进分为一帧帧,这里的帧和游戏的渲染帧率并不是一个,只是借鉴了帧的概念,自定义的帧,我们称为turn。游戏的过程就是每一个turn不断向前推进,每一个玩家的turn推进速度一致。
每一帧只有当服务器集齐了所有玩家的操作指令,也就是输入确定了之后,才可以进行广播(并不计算游戏行为),进入下一个turn,否则就要等待最慢的玩家,如此才能保证帧一致。
Lockstep的游戏是严格按照turn向前推进的,如果有人延迟比较高,其他玩家必须等待该玩家跟上之后再继续计算,不存在某个玩家领先或落后其他玩家若干个turn的情况。使用Lockstep同步机制的游戏中,每个玩家的延迟都等于延迟最高的那个人。
由于大家的turn一致,以及输入固定,所以每一步所有客户端的计算结果都一致的。
这种囚徒模式的帧同步,因为某个玩家有延迟,而导致该帧的同步时间发生延迟,从而导致所有玩家都在等待,出现卡顿现象。
囚徒模式的帧同步,有一个致命的缺陷就是,若联网的玩家有一个网速慢了,势必会影响其他玩家的体验,因为服务器要等待所有输入达到之后再同步到所有的c端。另外如果中途有人掉线了,游戏就会无法继续或者掉线玩家无法重连,因为在严格的帧同步的情况下,中途加入游戏从技术上来讲是非常困难的。因为你重新进来之后,你的初始状态和大家不一致,而且你的状态信息都是丢失状态的,比如,你的等级,随机种子,角色的属性信息等。
为了解决这个问题,服务器可保存玩家当场游戏的游戏指令以及状态信息,在玩家断线重连的时候,能够恢复到断线前的状态。不过这个还是无法解决帧同步的问题,因为严格的帧同步,是要等到所有玩家都输入之后,再去通知广播client更新,如果A服务器一直没有输入同步过来,大家是要等着的,那么如何解决这个问题?
采用“定时不等待”的乐观方式,在每次Interval时钟发生时固定将操作广播给所有用户,不依赖具体每个玩家是否有操作更新。如此帧率的时钟由服务器控制,当客户端有操作的时候及时的发送服务器,然后服务端每秒钟20-50次向所有客户端发送更新消息。(如果没有操作, 也要广播空指令来驱动游戏帧前进)
在这种情况下,服务器不会等到搜集完所有用户输入再进行下一帧,而是按照固定频率来同步玩家的输入信息到每一个c端,如果有玩家网络延迟,服务器的帧步进是不会等待的,网速慢的玩家不会卡到快的玩家,只会感觉自己操作延迟而已。
游戏中有很多是和概率相关的,比如说技能的伤害有一定概率的暴击伤害或者折光被击等。按照帧同步的话,基于相同的输入,每个玩家的client都是独立计算伤害的,那么如何保证所有电脑的暴击伤害一致呢。这个时候就需要用到伪随机了。
大部分编程语言内置库里的随机数都是利用线性同余发生器产生的,如果不指定随机种子(Random Seed),默认以当前系统时间戳作为随机种子。一旦指定了随机种子,那么产生的随机数序列就是确定的。就是说两台电脑采用相同的随机种子,第N次随机的结果是一致的。
所以在游戏开始前,服务器为每个玩家分配一个随机种子,然后同步给client,如此每个client在计算每个角色的技能时候,就能保证伤害是一致的。
帧同步的特性导致客户端的逻辑实现和表现实现必须完全分离。Unity中的一些方法接口(如 Invoke, Update、动画系统等)是不可靠的,所有要自己实现一套物理引擎、数学库,做到逻辑和表现分离。 这样即使Unity的渲染是不同步的,但是逻辑跑出来是同步的。
霸三国(端游):
采用Client-Server模式,服务器做判定,客户端纯表现。
好处:
缺点:
王者荣耀:
采用帧同步,对网络要求苛刻,下发的执行序列不允许丢包,如果中间出现丢包,需要等待丢的包重新到达后才能顺序后续执行。
技术要点:
lockstep是一种基于相同的初始状态,相同的输入,相同的处理逻辑,最终有相同的输出的同步方式。每个客户端开始load相同的数据,然后等待同步信号的驱动,每一个step到来之后,才能驱动推进一帧的update,帧间隔(delta)是相同的,如果没收到期望的那一个step驱动则需要挂起逻辑。每个客户端上报自己的输入参数,服务器按固定间隔将输入收集起来,带上step编号广播给所有客户端。
整体的网络结构,分三层:服务器、客户端逻辑层、客户端表现层。
服务器主要负责的功能有两部分:一是收集所有玩家上行的输入,把它按定时的间隔打包成输入的序列,投放给所有客户端;二是当客户端出现丢包的时候,服务器进行补发;还有把客户端上行冗余的信息替换掉,比如有新的输入到了,就把老的输入Drop或者替换掉。王者我们的逻辑是66毫秒一次,1秒同步15个包,这是不能少的,因为帧同步不能丢包,数据包必须有严格的执行序列。
客户逻辑层理解为客户端本地的服务,就是所有客户端运行的结果必须强一致,不能有真的随机,不能有本地逻辑,不能有浮点数的运算,拿到相同的输入,产生结果必须一致。
客户端表现层是根据逻辑层的数据去做Copy或者镜像,然后在表现层进行平滑,帧数不一样,但是不会影响最终的运算结果,只影响动画和动作的表现。
TCP技术当外网出现丢包或者抖动的时候,受限于实现方式,比如窗口、慢启动各方面的原因,会发现当出现重联的时候会非常卡,所以PVP没有用TCP,改为了采用udp。如果出现丢包,服务器会在应用层做补发。客户端不需要做反向ACK,因为帧是有序的,如果客户端收到一个1,然后收到一个3,那么肯定2丢失了,然后就请求服务器重发。
上行和下行都会有冗余,对于客户端消息上行的冗余,当客户端放了2个技能,收到回包之后,发现没有消息来抵消刚刚的操作,则会进行补发。对于下行的冗余,每一帧都会带上至少3帧的数据(会根据具体情况浮动),这样子如果最近3帧数据有丢包,则客户端直接可用,不需要再重发,减少延迟。冗余尽量放在同一个mtu里面。udp受限于mtu的大小,大于mtu,会出现分包,可能也会出现整包的丢失。所以我们也会有些比较大的包会在应用层由服务器做分包,中间出现丢包再由服务器补发,把零碎的包拼成整包再做解包。
帧同步的消息比较小,按照理论1秒15个驱动帧来算,20分钟的录像是10M左右。但是我们外网统计,正常的5V5对局20分钟,录像的大小大概是3M左右。服务器会把玩家的操作做纯内存的存储,当出现丢包的时候,服务器会通过编号快速找到缓存信息进行下发(可靠UDP下发)。同时根据丢包的情况,我们会计算给这个人发送冗余量的变化量。最开始发送每个包会冗余前面3帧的信息,如果丢包严重,我们会尝试冗余更多信息再下发。客户端拿到之后会尽量压缩逻辑执行的过程。帧同步有比较麻烦的模式在于,它不像CLIENT-SERVER的模式随进随出,崩溃之后重回必须从一开始运行,中间运算过程不能少掉。
一些尝试最后放弃:
客户端上行之后,不需要服务器定时的间隔去做收集然后下发,而是通过染色帧编号直接下发,这样响应更及时,操作反馈更强、更快。当时我们做出来的结果是,这对手感的提升微乎其微,但是带来的负面问题却很大,因为不再是一秒15个包固定的下发,下发包的数量非常多,完全和这个人的操作习惯有关系,有可能一个人一秒之内产生了十几二十个输入,就需要把这些输入打包之后对客户端下发。客户端因为收包很多,设备也会明显发烫。
传统的帧同步的方式会做延迟投递,这个我们也有尝试过。如果间隔时间内出现丢包,或者出现包下行的时网络波动,可以通过延迟投递这种方式抹平抖动和丢包的情况。我们尝试过这个方案但最终没有这样做的原因在于:《王者荣耀》里面一些英雄体验起来感觉偏动作,对反应要求比较快,延迟投递虽然抗抖动和抗丢包的能力确实不错,但是手感上达不到我们的要求。
做CLIENT-SERVER方式的实现,一般都会有一个套路,客户端提前表现,根据服务器的表现做平滑或者拉扯。这个方案我们也尝试过,但最终还是放弃了,因为这个技术会让角色本身的表现有点发飘。客户端本地动,马上客户端表现就跟着动,但根据服务器的下行,其实会做一些偏移或者修正。当网络抖动出现的时候,角色会有一点发飘,所以这个方案我们放弃掉了。(目前的预表现是大概20帧,一秒多,之后如果没有收到包会卡住不动了)
帧同步方案,所有客户端进行运算,期望产生一致的结果,但如果因为bug或者某个人使用修改器,跑出来的结果会和其他人不一样,当不一样出现,我们的说法是不同步了。我们会定时把一些关键信息提取出来做hash,不同步的人的hash和其他人会不一样。这是时候把这个人踢掉重连。
安全方面: