Eureka报错“EMERGENCY! EUREKA MAY BE INCORRECTLY CLAIMING INSTANCES ARE UP WHEN THEY'RE NOT. RENEWALS ”

背景1:Eureka自我保护机制

  默认情况下,如果Eureka Server在一定时间内(默认90秒)没有接收到某个微服务实例的心跳,Eureka Server将会移除该实例。但是当网络分区故障发生时,微服务与Eureka Server之间无法正常通信,而微服务本身是正常运行的,此时不应该移除这个微服务,所以引入了自我保护机制。
  自我保护机制的工作机制是如果在15分钟内超过85%的客户端节点都没有正常的心跳,那么Eureka就认为客户端与注册中心出现了网络故障,Eureka Server自动进入自我保护机制,此时会出现以下几种情况:

1、Eureka Server不再从注册列表中移除因为长时间没收到心跳而应该过期的服务。
2、Eureka Server仍然能够接受新服务的注册和查询请求,但是不会被同步到其它节点上,保证当前节点依然可用。
3、当网络稳定时,当前Eureka Server新的注册信息会被同步到其它节点中。


背景2:关于自我保护的两个参数renews和threshold

eureka默认心跳周期30s,即一分钟两次。
Renews threshold:过去一分钟eureka server期望收到的心跳数目
Renews (last min):过去一分钟eureka server实际收到的心跳数目
RenewalPercentThreshold:保护机制触发阈值,默认0.85
示例:假如你起了一个eureka server和一个client,eureka最小threashold是1(写死在eureka代码中),另client一分钟发两次心跳,那么threshold=1+2*1
如果Renews(last min) < threashold * RenewalPercentThreshold则触发保护机制,并报出如题的错误。2 < 0.85*3,因此报错。


解决方法:

1、deploy two Eureka server and enable registerWithEureka.
原因分析如下:

s:count of server
c:count of client

2(s+c) < [1 + 2(s+c)] * 0.85

set 2(s+c) as A

A < (1 + A) * 0.85
A < 5.666

因此,只有server与client的数量和大于2.83,才不会触发保护机制,两个server加一个client,3>2.83,不会触发保护机制。

2、If you just want to deploy in demo/dev environment, you can set eureka.server.renewalPercentThreshold to 0.49, so when you start up a Eureka server alone, threshold will be 0.

参考:
https://www.jianshu.com/p/ee4785a212f6
https://stackoverflow.com/questions/33921557/understanding-spring-cloud-eureka-server-self-preservation-and-renew-threshold

你可能感兴趣的:(分布式/集群/容器)