SpringCloudAlibaba 【7】Sentinel 熔断降级

熔断降级

circuit-breakingcircuit-breakinghttps://sentinelguard.io/zh-cn/docs/circuit-breaking.html

除了流量控制以外,对调用链路中不稳定的资源进行熔断降级也是保障高可用的重要措施之一。一个服务常常会调用别的模块,可能是另外的一个远程服务、数据库,或者第三方 API 等。例如,支付的时候,可能需要远程调用银联提供的 API;查询某个商品的价格,可能需要进行数据库查询。然而,这个被依赖服务的稳定性是不能保证的。如果依赖的服务出现了不稳定的情况,请求的响应时间变长,那么调用服务的方法的响应时间也会变长,线程会产生堆积,最终可能耗尽业务自身的线程池,服务本身也变得不可用。

SpringCloudAlibaba 【7】Sentinel 熔断降级_第1张图片

​    现代微服务架构都是分布式的,由非常多的服务组成。不同服务之间相互调用,组成复杂的调用链路。以上的问题在链路调用中会产生放大的效果。复杂链路上的某一环不稳定,就可能会层层级联,最终导致整个链路都不可用。因此我们需要对不稳定的弱依赖服务调用进行熔断降级,暂时切断不稳定调用,避免局部不稳定因素导致整体的雪崩。熔断降级作为保护自身的手段,通常在客户端(调用端)进行配置。

熔断策略

Sentinel 提供了一下几种熔断策略:

慢调用比例 (SLOW_REQUEST_RATIO):

选择以慢调用比例作为阈值,需要设置允许的慢调用 RT(即最大的响应时间),请求的响应时间大于该值则统计为慢调用。当单位统计时长(`statIntervalMs`)内请求数目大于设置的最小请求数目,并且慢调用的比例大于阈值,则接下来的熔断时长内请求会自动被熔断。经过熔断时长后熔断器会进入探测恢复状态(HALF-OPEN 状态),若接下来的一个请求响应时间小于设置的慢调用 RT 则结束熔断,若大于设置的慢调用 RT 则会再次被熔断。

异常比例 (ERROR_RATIO):

当单位统计时长(`statIntervalMs`)内请求数目大于设置的最小请求数目,并且异常的比例大于阈值,则接下来的熔断时长内请求会自动被熔断。经过熔断时长后熔断器会进入探测恢复状态(HALF-OPEN 状态),若接下来的一个请求成功完成(没有错误)则结束熔断,否则会再次被熔断。异常比率的阈值范围是 `[0.0, 1.0]`,代表 0% - 100%。

异常数 (ERROR_COUNT):

当单位统计时长内的异常数目超过阈值之后会自动进行熔断。经过熔断时长后熔断器会进入探测恢复状态(HALF-OPEN 状态),若接下来的一个请求成功完成(没有错误)则结束熔断,否则会再次被熔断。

Sentinel在1.8.0版本对熔断降级做了大的调整,可以定义任意时长的熔断时间,引入了半开启恢复支持。下面梳理下相关特性。

熔断状态

有三种状态,非别为  OPEN、   HALF_OPEN、   CLOSED

状态         说明
OPEN 表示熔断开启,拒绝所有请求 
HALF_OPEN 探测恢复状态,如果接下来的一个请求顺利通过则表示结束熔断,否则继续熔断 
CLOSED 表示熔断关闭,请求顺利通过      

熔断规则

熔断降级规则包含下面几个重要的属性:

Field 说明 默认值
resource 资源名,即规则的作用对象
grade 熔断策略,支持慢调用比例/异常比例/异常数策略   慢调用比例
count 慢调用比例模式下为慢调用临界 RT(超出该值计为慢调用);异常比例/异常数模式下为对应的阈值
timeWindow  熔断时长,单位为 s    
minRequestAmount 熔断触发的最小请求数,请求数小于该值时即使异常比率超出阈值也不会熔断(1.7.0 引入) 5
statIntervalMs  统计时长(单位为 ms),如 60*1000 代表分钟级(1.8.0 引入) 1000ms
slowRatioThreshold 慢调用比例阈值,仅慢调用比例模式有效(1.8.0 引入) 

Sentinel 熔断策略 - 慢调用比例


​    概念:选择以慢调用比例作为阈值,需要设置允许的慢调用 RT(即最大的响应时间),请求的响应时间大于该值则统计为慢调用。当单位统计时长(`statIntervalMs`)内请求数目大于设置的最小请求数目,并且慢调用的比例大于阈值,则接下来的熔断时长内请求会自动被熔断。经过熔断时长后熔断器会进入探测恢复状态(HALF-OPEN 状态),若接下来的一个请求响应时间小于设置的慢调用 RT 则结束熔断,若大于设置的慢调用 RT 则会再次被熔断。

慢调用理解: 

假设在 1秒内(统计时长=1000ms) 有10个请求过来(满足了最小请求数5),
这10个请求 中有4个请求的响应时间超过了300ms(最大RT300),属于慢调用。 
10个请求乘以比例阈值0.1 = 1。 4个慢请求 > 1 (阈值比例)。   
所以触发熔断,熔断时长10秒

新建熔断规则 

SpringCloudAlibaba 【7】Sentinel 熔断降级_第2张图片

新建Java 接口 

@GetMapping("/testC")
    public String testC() throws InterruptedException {
        Thread.sleep(2000);
        return "--testC";
    }

 使用 Jmeter 调用接口,效果如下

 


 Sentinel 熔断策略 - 异常比例

概念:异常比例 (`ERROR_RATIO`):当单位统计时长(`statIntervalMs`)内请求数目大于设置的最小请求数目,并且异常的比例大于阈值,则接下来的熔断时长内请求会自动被熔断。经过熔断时长后熔断器会进入探测恢复状态(HALF-OPEN 状态),若接下来的一个请求成功完成(没有错误)则结束熔断,否则会再次被熔断。异常比率的阈值范围是 [0.0, 1.0],代表 0% - 100%。

​    注意:异常降级 仅针对业务异常,对 Sentinel 限流降级本身的异常(BlockException)不生效。

SpringCloudAlibaba 【7】Sentinel 熔断降级_第3张图片

 SpringCloudAlibaba 【7】Sentinel 熔断降级_第4张图片

新建 Java 接口

@GetMapping("/testD")
public String testD(Integer id){
    if(id != null && id > 1){
        throw new RuntimeException("异常比例测试");
    }
    return "------------testD";
}

使用 Jmeter 调用接口,效果如下

SpringCloudAlibaba 【7】Sentinel 熔断降级_第5张图片

 


 Sentinel 熔断策略 - 异常数

概念:异常数 (ERROR_COUNT):当单位统计时长内的异常数目超过阈值之后会自动进行熔断。经过熔断时长后熔断器会进入探测恢复状态(HALF-OPEN 状态),若接下来的一个请求成功完成(没有错误)则结束熔断,否则会再次被熔断。

​    注意:异常降级仅针对业务异常,对 Sentinel 限流降级本身的异常(BlockException)不生效。


设置异常数策略,当1秒钟内请求超过5并且异常数大于5个的时候触发熔断

SpringCloudAlibaba 【7】Sentinel 熔断降级_第6张图片

 新建接口

@GetMapping("/testE")
public String testE(Integer id){
    if(id != null && id > 1){
        throw new RuntimeException("异常数测试");
    }
    return "------------testE";
}

使用 Jmeter 调用接口,效果如下

 SpringCloudAlibaba 【7】Sentinel 熔断降级_第7张图片

 


你可能感兴趣的:(spring,cloud,java,微服务)