为什么游戏公司的server不愿意微服务化?

hongjic93:

比如moba类游戏,就看LOL的客户端吧,想象一下。

  • 账号系统,符文系统,英雄系统,皮肤系统,好友系统,好友之间messaging,这些都是常规操作,如果流量足够大,当然可以用微服务的架构去做。

不过这不是这个游戏的核心,核心是MOBA:Multiplayer online battle arena。特性是什么?

  • 10个人之间各种游戏事件的高速多向通讯 streaming/broadcast/multicast/pubsub各种通讯模式

所以游戏的核心在于小规模群体之间的高速网络通信。就是对方说的realtime。多了一个10ms的延迟玩家就要骂娘了。

  • 微服务为了把业务完美拆解,把原来的同一个进程里的模块拆分成不同的服务,显著增加额外的网络开销。更别说什么service mesh,各种gateway,proxy,sidecar,简直就是担心延迟太低。
  • 微服务基本只有request/response的模式。做不了streaming?微服务通常要求应用是无状态的才能做到水平扩展。streaming本身就是加入了状态
  • 我可以想像,为了提高通讯的性能,一场英雄联盟游戏很可能会使用同一个服务器负责这10个玩家之间的通讯,这样就使得数据可以在本地交换,性能最大化。这对客户端或者说服务端统一网关的要求是必须支持sticky routing。假设客户端连接断了,接下来的必须重连之前的同一个服务器。微服务的stateless,水瓶扩展要求本身就是反sticky routing的,因为sticky routing本身就是状态。
  • 对服务端集群来说,同时有无数个LOL比赛在进行,每个都可以看成一个沙盒,每个沙盒都处于一个不同的状态:塔被推了几个了,你被杀了几次了,对面几个超神了,20分钟到了没。 这些都是长时间存在的状态,直到游戏结束,服务端才可以清理一场游戏的状态。所以虽然不用把这些状态写进持久性存储,但是必然会在内存中存在很长时间。都是状态,反正有状态,就别想用微服务。除非你说把这些状态都移到redis里去,那么在服务器在信息流传输到一半还要做一个remote request,一来一回,延迟就上升了。总之怎样都不好。(比如想象对方在A你的水晶,每一次A的操作都是一个event,被streaming到服务端的沙盒中,沙盒中有一个流处理器,每次接收到一个你水晶被A的event都会计算一下你水晶爆了没。这个计算需要极快,你是不可能把你水晶生命值的数据存在远端的)

像这类游戏,都是对网络,内存,CPU的优化需求很高,整个游戏进行过程中,几乎不存在什么RPC call,真的需要remote data,也应该是prefetch,就是在游戏刚开始的时候加载好

微服务不是什么银弹,也就是方便拆解一下原来的CRUD应用罢了而已,一没触及高级的交互方式,二没触及分布式系统真正的难点:状态,其实没有大家想的那么有用。之所以感觉上好像微服务改变了互联网,只不过90%的互联网应用都只是简单小规模的CRUD而已。

对方没有听说过微服务完全没有问题,因为这本身就不是什么高深的概念,反而对方听你一说一下就知道微服务不适合游戏,说明对方理解能力很强,对游戏系统设计也了解足够深。

(虽然我没的确没写过游戏,以上仅供参考)

 

放浪者:

。。。有些国民级moba游戏的微服务化过程,可能有保密问题,我就不谈了。

拿中年人喜闻乐见的WOW来说,你们不知道有专门的排队服务器、场景服务器、副本服务器么这些么?你以为每次切换场景时的loading界面在做啥?就是完成service的切换啊。

你非要用web那一套来套在游戏上面,那当然不行,那说明你对microservice的理解太狭隘了。microservice重点是业务逻辑的拆分和独立,难道你以为这么多mmorpg,是一个巨大无比的monolithic的应用在跑?怎么可能。

多人游戏和互联网app相比,最大的差别不是microservice还是monolithic,也不是啥实时还是非实时,而是stateful和stateless的差别。互联网app大量的工作是在数据读写上,为了能疯狂scale,service本身一般是stateless的,最简单的一个例子就是web server的session概念(现在比较过时了,但是是个很好的例子),既可以本地,也可以存入redis或者db。游戏的server其实也是保存这样一个当前场景涵盖所有人的巨大session(比如副本,比如moba中的游戏全局状态)。由于游戏过程本身并没有什么保存价值,所以对这些实时进行的游戏状态进行持久化没啥意义,因此才有专门的对战服务器等等。

其实你把什么对战服务器、排队服务器、匹配服务器等等都叫做xx service,就会发现其实就是微服务概念。

补充一点个人不保证正确的私货:其实整个游戏开发行业和互联网行业的技术思维差异就在于stateful vs stateless,做习惯了游戏开发的人(无论客户端还是backend),习惯了直接在内存读写数据,不习惯从远程读写(无论是redis还是db或者nosql或者啥),换句话说他们不太习惯原始数据不在本地机器上,而恰恰业务逻辑和数据分离是互联网架构的重要指导思想。这使得游戏开发程序员的技术思维很有些不一样,我不能说不好,但是确实有点技能点的配置不同的感觉,这当实现非游戏项目的时候是有障碍的。

*********************************************

评论中的朋友是一个较为典型的例子,始终固守在传统(国内)对游戏单体开发的思路上,你当然可以这么做,但是不意味着就必须这么做,更不意味着这么做就是好的。

一开始我说的国民级游戏之一就是LOL,搜了一下公开资料,,发现他们也略微谈过一点他们后台微服务化的事情 ,有兴趣的可以看看。

《英雄联盟》在线服务运维之道-InfoQ​www.infoq.cn

不过他们也是比较含糊其辞的,没谈具体功能模块划分,只含糊举了些抽象例子。所以为了避免有些问题,我也就不提了。

微服务本身就是个模块化的概念,国内喜欢眉毛胡子一把抓强调单机性能单机并发(实质是发懒),而要把单体应用的各种模块分拆出来,问题主要是团队管理、服务治理、开发协调、部署、功能边界和定义这些微服务本身的坑。至于很多人说的性能、响应速度等等,这些都是拆分时要考虑的因素之一罢了,并不是啥模块都要纠结这些的。

 

李宁:

1,没有银弹。微服务相对于单体程序是有优点,但缺点也不少。比如测试调试环节,不是你认为的方便了,而是变得麻烦复杂了。另外,绝大部分的项目前后端的程序员数量加起来不会超过20人,在这个规模下的团队,如果单体的开发都做不好,又怎么能做好微服务呢?即便是web开发,其实大多数的项目也没有上微服务的必要。

2,游戏服务器相比web服务器,主要的区别在于:

    • 对延迟要求苛刻,一个网站,延迟是500ms还是1s无关痛痒,用户的操作不会很频繁,往往点击一下就能看上一会。但对于游戏,尤其是FPS类型的游戏,150ms以上的延迟都会使游戏体验大打折扣,客户端发往服务器的请求一秒钟内往往有十几个之多,微服务那种调用链的开销,绝大部分的游戏都承受不起。哪怕是一个棋牌游戏,你能忍受出牌要卡上1秒吗?不说调用链,即便是把数据放在redis里,每次去取,也承受不起。像MMO,MOBA,FPS这种实时性要求高的游戏,服务器的帧率在10hz到60hz,一秒钟更新最少10次,每一次更新大约几十(moba,fps)甚至几千(mmo)个unit,留给每一个unit的处理时间最多几毫秒甚至几微秒,而同个数据中心内一个roundtrip time平均就要0.5ms
    • 游戏服务器的用户之间,具有高度的交互性,状态性极强。web服务器的用户与用户之间,你操作你的我操作我的,你我之间没关系。在数据库之上这一层,用户之间同步数据以及顺序性的需求几乎没有。如果有,那也是在数据库,缓存这一层,比如事务操作一下,缓存同步一下即可。web服务器天然的无状态性,弱状态性适合横向扩展,做分布式。同一个用户的不同请求,往往可以由负载均衡路由到不同的服务器处理。而游戏很难做到这一点,往往都是通过分服,开房间等手段解决。
    • 游戏服务器的数据库数据,具有高度的反范式特点。从用户登录后,基本上用户的所有数据都需要load进内存中。不像web比如购物网站,登录后,只需要用户名和购物车中物品数量。点开购物车,加载购物车数据。点订单,加载历史订单。每个服务都有自己的数据库,服务自身保证数据的invariants,数据库之间通过最终一致性达成一致即可。游戏不一样,不可能等到你被砍的时候再去数据库里把你的装备读出来算一下防御力看看该扣多少血。
    • 元数据依赖。游戏的用户数据,可以说是高度依赖元数据,你的装备属性,外形,技能效果等等都是依赖策划配置出的数据表(元数据)。而web服务器其实没有所对应的这一层的的元数据。一般说到web服务器元数据,基本都是描述服务之间的契约,比如RESTFUL API的JSON定义等。游戏服务器对元数据的依赖是全局性的。假如有一个微服务化的游戏,想削弱某职业的技能而不重启其他服务比如战斗服务?绝无可能。因为上面几点原因,数据都是保存在进程内的。
    • 没有统一的框架。游戏玩法多种多样,即便是同一种类型的游戏,也可以是脑洞大开,很难抽象出一个行业内可复用的逻辑流程然后再通过框架去做事情,比如spring那一套。
    • 测试理念不同。web项目,从理论上讲,其逻辑分支是可以覆盖的完的。游戏没有这种可能,不同的职业不同的技能,不同的怪物,不同的站位走位,技能触发顺序。。。其逻辑可能性基本就是无穷无尽的,而且策划还会随时对元数据进行调整修改。传统的CI CD那套东西所带来的价值相对于web项目较低。

 

reference:

https://www.zhihu.com/question/359630395

你可能感兴趣的:(为什么游戏公司的server不愿意微服务化?)