专业版再增强 | MSE 无缝兼容 Eureka 协议,性能提升50%

简介:MSE 注册配置中心专业版完全兼容了 Eureka 协议,并对其读写性能、实例容量进行了大幅优化。

作者:涌月

审核&校对:彦林、草谷、望宸

编辑&排版:酒圆

Eureka 是一款优秀的注册与发现产品,其作为 Netflix 公司重要的开源项目,已经成为 Spring-cloud-netflix 生态默认的注册中心。在过去的数年中,Eureka 为大量的中国互联网公司提供了开箱即用的注册中心服务解决方案。

但由于 Eureka 开源社区停止维护,并且在业务规模增大的时候存在性能问题,因此需要寻找一个可替代的高性能注册中心,进行平滑迁移和演进。

Eureka 的性能问题

随着业务的发展,Eureka 逐步暴露出一些性能问题。上万量级实例的频繁变更、洪水般的流量请求,即便通过部署高配服务器,也无法解决 Eureka 的性能瓶颈:

1、服务状态更新滞后:由于 Eureka 存在缓存机制,基于其搭建的微服务系统通常会出现服务状态更新滞后,30-60s 才能够获取到准确的服务实例列表;

2、同步速度慢:当业务流量大时,为了保证高可用和高性能,通常 Eureka 需要以集群模式运行。然而,Eureka 集群之间的读写同步速度相对缓慢,即在一台 Eureka 上注册实例,需要等待较长延迟之后,才能在另一台机器上查询到相关信息,导致了业务出现经常线上 Bug。

专业版再增强 | MSE 无缝兼容 Eureka 协议,性能提升50%_第1张图片

Eureka的社区问题

除了上述的性能问题外,Eureka 社区当前已经宣布停止维护(如下图),锁死在一个不发展的社区上有很高的技术风险和不确定性。

专业版再增强 | MSE 无缝兼容 Eureka 协议,性能提升50%_第2张图片

MSE注册配置中心专业版的优势

为了降低 Eureka 技术体系停止维护的不确定性,并增强 Eureka 注册中心的稳定性和高并发能力,我们首次在 MSE 注册配置中心专业版(以下简称专业版)上完全兼容了 Eureka 协议,并对其读写性能、实例容量进行了大幅优化。

某大型教育机构用户反馈,相对于开源 Eureka,专业版性能大幅提升,目前已经在其业务场景中落地。专业版的核心能力和性能表现如下:

1、多协议支持:用户使用 Eureka 注册中心的实例,完全可以使用 Nacos 协议进行发现,保证用户技术栈的多层次兼容性;

2、高性能支持:极大地优化了读写同步速度,使得基于此搭建的微服务系统具有更高的性能和易用性;根据实验室的压测数据,MSE-Nacos 下的 Eureka 注册中心的读写性能、实例容量均提升达 50%以上。

3、融入服务网格生态:通过支持 MCP 协议和 XDS 协议,服务网格生态领域已完全兼容专业版的 Eureka 协议,为 Istio 接入 Eureka 提供零侵入、高性能的微服务以及网关解决方案。

1、对比压测报告

我们对开源 Eureka 和专业版,在读写性能、容量评估上进行了压测,主要包括如下两个场景。

  • 场景1: 容量评估测试

注册尽可能多的 App 和 Instance,并维持心跳,观察注册中心的容量。测试指标包括 Instance 容量、是否发生 Full GC 以及 CPU 开销。实验机器包括3*8C16G或10*8C16G,我们进行了不同注册规模的多次压测实验。

专业版再增强 | MSE 无缝兼容 Eureka 协议,性能提升50%_第3张图片

容量方面,Eureka 容量较小,3 台机器容量超过 1.5w 就会出现大量同步超时报错,频繁发生 Full GC(每分钟至少发生一次)。

经过问题定位,Eureka 在容量测试场景中,其集群间批量复制较为频繁;另外,开源 Eureka 在初次超时之后,很快会将复制请求重试,导致泛滥,这是造成 CPU 飙升接近100%的主要原因。该问题也导致了 Eureka 的横向扩展性能瓶颈。

而专业版的容量超过 Eureka,只需 9 台机器就可以支持 6w 左右的实例规模;另外,其 Full GC 的频率大大降低,CPU 使用率维持在较低水位。

  • 场景2: 读写性能 TPS 测试

经过测试发现,Eureka 在大量频繁的写操作场景中,其集群间批量复制操作更加频繁,导致大量的 Timewait 线程;另外,Eureka 在初次超时之后,很快会将复制请求重试,导致泛滥,这是造成 CPU 飙升接近100%的主要原因。其表现形式是,在 Eureka 的 CPU 打满之后,Eureka 端会出现下方的报错,每台节点的响应速度达到瓶颈。

com.sun.jersey.api.client.ClientHandlerException: java.net.SocketTimeoutException: Read timed out

而专业版采用阿里云自研的 Distro 协议,对于数据进行分片,其集群间的数据同步粒度相对于开源 Eureka 更小。因此,专业版兼容的 Eureka 集群间数据同步量相对较低,CPU 开销较小。其 TPS 提升,RT 下降,整体性能提升了约50%。下面,我们再分别从读场景和写场景,分别对专业版和 Eureka 进行比对:

专业版再增强 | MSE 无缝兼容 Eureka 协议,性能提升50%_第4张图片

读场景

专业版再增强 | MSE 无缝兼容 Eureka 协议,性能提升50%_第5张图片

写场景

如何将开源 Eureka 迁移至专业版

相信看到这里,你一定想早点上车,但是你接着会问,是否支持无缝迁移呢?我们针对不同的场景分别提供了对应的解决方案。

1、云上自建 Eureka 用户如何迁移?

云上自建 Eureka 用户,可以直接按照 《将Spring Cloud应用从开源Nacos迁移到MSE Nacos》平滑迁移(见文末链接)。

2、已经购买 MSE 的用户如何迁移?

对于已经购买了 MSE 注册配置中心基础版的用户,我们也提供了平滑升级至专业版的能力。可以直接通过点击“实例规格变更”,并选择“专业版”进行操作。

 title=

专业版再增强 | MSE 无缝兼容 Eureka 协议,性能提升50%_第6张图片

整个迁移过程完全平滑,业务基本无感知。升级完成之后,用户便可以在专业版上,进行高性能的 Eureka 协议服务发现与注册了。

参考链接

 《将Spring Cloud 应用从开源 Nacos 迁移到 MSE Nacos》:

https://help.aliyun.com/document\_detail/263565.html

双十一大促,微服务引擎 MSE (注册配置中心和云原生网关)首购 8 折优惠!

点击下方链接,了解更多!

https://cn.aliyun.com/product/aliware/mse

版权声明:本文内容由阿里云实名注册用户自发贡献,版权归原作者所有,阿里云开发者社区不拥有其著作权,亦不承担相应法律责任。具体规则请查看《阿里云开发者社区用户服务协议》和《阿里云开发者社区知识产权保护指引》。如果您发现本社区中有涉嫌抄袭的内容,填写侵权投诉表单进行举报,一经查实,本社区将立刻删除涉嫌侵权内容。

你可能感兴趣的:(阿里云开发者)