Nacos通过OpenAPI主动发送心跳失效问题

一、 背景

由于之前使用永久实例时,因为使用的是TCP探测,后端PHP服务又经过Nginx服务,所以当Nginx正常,但是PHP挂掉,或者其它原因不影响时,服务不能正常从服务列表踢除,造成服务失败,所以改成PHP服务端主动发送心跳。

二、问题

先看一下官方文档:
Nacos通过OpenAPI主动发送心跳失效问题_第1张图片
Nacos通过OpenAPI主动发送心跳失效问题_第2张图片

实际测试返回情况:
![在这里插入图片描述](https://img-blog.csdnimg.cn/d8e97713ca6949bba01b21b70463e8f1.pngNacos通过OpenAPI主动发送心跳失效问题_第3张图片
这里发现官方文档的示例和实际返回的不一致,先不管,然后你会发现这个心跳实际不生效,服务还是15秒变成不健康,30秒从服务列表踢除

三、问题原因溯源

1、由于官方文档没有其它说明,这里选择从JAVA的请求(JAVA服务的心跳是正常的)里面去找问题原因。

2、JAVA服务的心跳参数
Nacos通过OpenAPI主动发送心跳失效问题_第4张图片
从这里我们看到这个参数和官方文档里面的参数完全不一样。

3、测试
通过构造一样的参数进行发送心跳后进行测试
Nacos通过OpenAPI主动发送心跳失效问题_第5张图片
心跳成功,服务也正常,尝试几秒发送一次心跳,服务正常,说明这个是正确的心跳参数。

4、加上官方文档的 beat 参数进行测试
Nacos通过OpenAPI主动发送心跳失效问题_第6张图片
发现返回结果还是一样,不过服务还是会15秒后不健康,然后从服务列表剔除掉了,说明心跳的时候不能传 beat 信息。

5、问题原因
从上面可以得出,失败原因,是因为官方文档没有更新,传的参数不对,所以心跳失败(接口不管成功还是失败,返回的结果都是一样的)

四、测试结论

1、官方有一个返回 lightBeatEnabled ,这个代表是否是已开启轻量级心跳
2、如果开启了轻量级心跳后,不能再传 beat 信息,否则心跳失效
3、如果服务没有注册,采用重量级心跳(传了beat信息),会自动进行服务注册。
4、如果服务没有注册,采用轻量级心跳,会返回失败,如下图:
Nacos通过OpenAPI主动发送心跳失效问题_第7张图片

所以正常的心跳方式应该是:
第一次心跳采用重量级心跳,然后根据返回的 lightBeatEnabled 参数看后面的心跳信息中是否需要传beat 信息。

你可能感兴趣的:(nginx,php,java)