【SpringCloud-11】SCA-sentinel

sentinel是一个流量控制、熔断降级的组件,可以替换第一代中的hystrix。 hystrix用起来没有那么方便:

1、要在调用方引入hystrix,没有ui界面进行配置,需要在代码中进行配置,侵入了业务代码。

2、还要自己搭建监控平台dashboard。

而sentinel就很方便,在微服务引入依赖就可以。 对于控制台,下载jar包启动运行即可。

下载地址:https://github.com/alibaba/Sentinel/releases   

启动:jar -jar sentinel-dashboard-1.7.1.jar &

访问:ip:端口/#/dashboard/home

基本使用:

微服务引入sentinel依赖:

        
        
            com.alibaba.csp
            sentinel-datasource-nacos
        

yml配置:

server:
  port: 8098
spring:
  application:
    name: lagou-service-autodeliver
  cloud:
    nacos:
      discovery:
        server-addr: 127.0.0.1:8848,127.0.0.1:8849,127.0.0.1:8850

    sentinel:
      transport:
        dashboard: 127.0.0.1:8080 # sentinel dashboard/console 地址
        port: 8719   #  sentinel会在该端口启动http server,那么这样的话,控制台定义的一些限流等规则才能发送传递过来,
                      #如果8719端口被占用,那么会依次+1
      
management:
  endpoints:
    web:
      exposure:
        include: "*"
  # 暴露健康接口的细节
  endpoint:
    health:
      show-details: always
#针对的被调用方微服务名称,不加就是全局生效
lagou-service-resume:
  ribbon:
    #请求连接超时时间
    ConnectTimeout: 2000
    #请求处理超时时间
    ##########################################Feign超时时长设置
    ReadTimeout: 3000
    #对所有操作都进行重试
    OkToRetryOnAllOperations: true
    ####根据如上配置,当访问到故障请求的时候,它会再尝试访问一次当前实例(次数由MaxAutoRetries配置),
    ####如果不行,就换一个实例进行访问,如果还不行,再换一次实例访问(更换次数由MaxAutoRetriesNextServer配置),
    ####如果依然不行,返回失败信息。
    MaxAutoRetries: 0 #对当前选中实例重试次数,不包括第一次调用
    MaxAutoRetriesNextServer: 0 #切换实例的重试次数
    NFLoadBalancerRuleClassName: com.netflix.loadbalancer.RoundRobinRule #负载策略调整
logging:
  level:
    # Feign日志只会对日志级别为debug的做出响应
    com.lagou.edu.controller.service.ResumeServiceFeignClient: debug

微服务启动后,就可以在控制台查看监控情况。 

sentinel流量控制: 

 在sentinel后台进行配置。

【SpringCloud-11】SCA-sentinel_第1张图片

  • 资源名:默认请求路径
  • 针对来源:填写微服务名称,默认default(不区分来源)
  • 阈值类型/单机阈值:
    • QPS:每秒钟请求数量。
    • 线程数:线程处理请求的时候, 如果说业务逻辑执⾏时间很⻓,流量洪峰来临时,会耗费很多线程资源,最终可能服务雪崩。
  • 是否集群:是否集群限流
  • 流控模式:
    • 直接:资源调⽤达到限流条件时,直接限流
    • 关联:关联的资源调⽤达到阈值时候限流⾃⼰ ⽐如⽤户注册接⼝,需要调⽤身份证校验接⼝,如果身份证校验接⼝请求达到阈值,可以对⽤户注册接⼝进⾏限流。
    • 链路:只记录指定链路上的流量。 比如两条链路都调用了nodeA,可以配置只限制某条链路的请求。
  • 流控效果:
    • 快速失败:直接失败,抛出异常
    • Warm Up:根据冷加载因⼦(默认3)的值,从阈值/冷加载因⼦,经过预热时⻓, 才达到设置的QPS阈值。 这样可以防止突然暴增导致服务不可用,比如秒杀。
    • 排队等待:匀速排队,让请求匀速通过,阈值类型必须设置为QPS,否则⽆效。
      例如, QPS 配置为 5 ,则代表请求每 200 ms 才能通过⼀个,多出的请求将排队等
      待通过。超时时间代表最⼤排队时间,超出最⼤排队时间的请求将会直接被拒绝。
      排队等待模式下, QPS 设置值不要超过 1000 (请求间隔 1 ms )。

sentinel服务降级: 

Sentinel 降级在调用某个资源出现不稳定状态时(例如调⽤超时或异常⽐例升⾼),对这个资源的调⽤进⾏限制,让请求快速失败,避免影响到其它的资源⽽导致级联错误。当资源被降级后,在接下来的降级时间窗⼝之内,对该资源的调⽤都⾃动熔断。

另外,sentinel不会像hystrix,在时间窗内对每一次请求都尝试自我修复,而是明确在时间窗后才恢复。 它的熔断策略是:

  • RT(平均响应时间):
    • RT超过500ms的调用是慢调用,统计最近10000ms内的请求,如果请求量超过10次,且慢调用比例>=0.5,则触发熔断,熔断时长为5秒。
    • 【SpringCloud-11】SCA-sentinel_第2张图片
  • 异常比例:
    • 异常比例或异常数:统计指定时间内的调用,如果调用次数超过指定请求数,并且出现异常的比例达到设定的比例阈值(或超过指定异常数),则触发熔断
    • 【SpringCloud-11】SCA-sentinel_第3张图片

 自定义兜底逻辑:

以上的配置,发生降级后,会抛出降级的相关异常。 可以自定义兜底逻辑。

    @GetMapping("/checkState/{userId}")
    @SentinelResource(value = "findResumeOpenState",blockHandlerClass = SentinelHandlersClass.class,
            blockHandler = "handleException",fallbackClass = SentinelHandlersClass.class,fallback = "handleError")
    public Integer findResumeOpenState(@PathVariable Long userId) {
        return resumeService.findDefaultResumeByUserId(userId);
    }

如上,使用@SentinelResource来指定。 

value:指定资源,用方法名。
blockHandlerClass:指定sentinel规则异常后,兜底逻辑所在的类。
blockHandler:指定sentinel规则异常后,兜底逻辑所在的方法。

以上的配置是针对抛出sentinel异常,可能在代码中还会抛出java异常,所以还可以定义异常的降级方法。

fallbackClass:指定java异常后,兜底逻辑所在的类。
fallback:指定java异常后,兜底逻辑所在的方法。

兜底方法:

public class SentinelHandlersClass {

    // 整体要求和当时Hystrix一样,这里还需要在形参最后添加BlockException参数,用于接收异常
    // 注意:方法是静态的
    public static Integer handleException(Long userId, BlockException blockException) {
        return -100;
    }

    public static Integer handleError(Long userId) {
        return -500;
    }

}

基于 Nacos 实现 Sentinel 规则持久化:

在dashboard后台配置的规则,都是在内存中。 如果微服务停掉就会消失,所以,生产环境下,可以持久化到nacos配置中心,让微服务从nacos获取规则。

  • 微服务引入依赖:
        
        
            com.alibaba.csp
            sentinel-datasource-nacos
        
  • 在yml中配置nacos数据源(sentinel下的datasource)        
  • server:
      port: 8098
    spring:
      application:
        name: lagou-service-autodeliver
      cloud:
        nacos:
          discovery:
            server-addr: 127.0.0.1:8848,127.0.0.1:8849,127.0.0.1:8850
    
        sentinel:
          transport:
            dashboard: 127.0.0.1:8080 # sentinel dashboard/console 地址
            port: 8719   #  sentinel会在该端口启动http server,那么这样的话,控制台定义的一些限流等规则才能发送传递过来,
                          #如果8719端口被占用,那么会依次+1
          # Sentinel Nacos数据源配置,Nacos中的规则会自动同步到sentinel流控规则中
          datasource:
            # 数据源自己取名,这里定义了两个:flow和degrade,代表流控和降级
            # 自定义的流控规则数据源名称
            flow:
              nacos: #类型要指定为nacos,因为sentinel还可以持久化到其他类型中
                server-addr: ${spring.cloud.nacos.discovery.server-addr}
                data-id: ${spring.application.name}-flow-rules
                groupId: DEFAULT_GROUP
                data-type: json
                rule-type: flow  # 类型来自RuleType类
            # 自定义的降级规则数据源名称
            degrade:
              nacos:
                server-addr: ${spring.cloud.nacos.discovery.server-addr}
                data-id: ${spring.application.name}-degrade-rules
                groupId: DEFAULT_GROUP
                data-type: json
                rule-type: degrade  # 类型来自RuleType类
    management:
      endpoints:
        web:
          exposure:
            include: "*"
      # 暴露健康接口的细节
      endpoint:
        health:
          show-details: always
    #针对的被调用方微服务名称,不加就是全局生效
    lagou-service-resume:
      ribbon:
        #请求连接超时时间
        ConnectTimeout: 2000
        #请求处理超时时间
        ##########################################Feign超时时长设置
        ReadTimeout: 3000
        #对所有操作都进行重试
        OkToRetryOnAllOperations: true
        ####根据如上配置,当访问到故障请求的时候,它会再尝试访问一次当前实例(次数由MaxAutoRetries配置),
        ####如果不行,就换一个实例进行访问,如果还不行,再换一次实例访问(更换次数由MaxAutoRetriesNextServer配置),
        ####如果依然不行,返回失败信息。
        MaxAutoRetries: 0 #对当前选中实例重试次数,不包括第一次调用
        MaxAutoRetriesNextServer: 0 #切换实例的重试次数
        NFLoadBalancerRuleClassName: com.netflix.loadbalancer.RoundRobinRule #负载策略调整
    logging:
      level:
        # Feign日志只会对日志级别为debug的做出响应
        com.lagou.edu.controller.service.ResumeServiceFeignClient: debug
  • 配置文件中指定好dataid后,就需要去nacos配置管理中配置了(注意:命名空间,分组,dataid等要和yml中对应上),
    • 流控规则:
    • [
          {
              "resource":"findResumeOpenState",
              "limitApp":"default",
              "grade":1,
              "count":1,
              "strategy":0,
              "controlBehavior":0,
              "clusterMode":false
          }
      ]

      所有属性来⾃源码FlowRule

      • resource:资源名称
      • limitApp:来源应⽤
      • grade:阈值类型 0 线程数 1 QPS
      • count:单机阈值
      • strategy:流控模式,0 直接 1 关联 2 链路
      • controlBehavior:流控效果,0 快速失败 1 Warm Up 2 排队等待
      • clusterModetrue/false 是否集群
    • 降级规则
      • [
            {
                "resource":"findResumeOpenState",
                "grade":2,
                "count":1,
                "timeWindow":5
            }
        ]
      • 所有属性来⾃源码 DegradeRule
        • resource:资源名
        • grade :降级策略 0 RT 1 异常⽐例 2 异常数
        • count :阈值
        • timeWindow :时间窗
​​​

你可能感兴趣的:(spring,cloud,sentinel)