18. SpringCloud之Hystrix源码

image.png

1、前言

hystrix是通过对 接口方法 进行AOP代理的方式 来 达到 对某一个请求 进行熔断降级的功能的。

所以,我们研究hystrix的核心源码,首先是要找到这个切面在哪生成的,干了什么。

2、@EnableCircuitBreaker

我们引入hystrix的时候,除了导入依赖之外,还会在启动类上加上@EnableCircuitBreaker注解表示启用hystrix的熔断降级等组件。

@Enable****之类的注解都表示启动什么什么功能。点进源码看, 其实一般都会做一些导入类,注册的事情。

比如@EnableCircuitBreaker 点进去就会 import EnableCircuitBreakerImportSelector类。

@Target(ElementType.TYPE)
@Retention(RetentionPolicy.RUNTIME)
@Documented
@Inherited
@Import(EnableCircuitBreakerImportSelector.class)
public @interface EnableCircuitBreaker {

}

所以我们先看这个类干了什么、

2.1、EnableCircuitBreakerImportSelector

点进源码,发现集成了 SpringFactoryImportSelector类

@Order(Ordered.LOWEST_PRECEDENCE - 100)
public class EnableCircuitBreakerImportSelector extends
      SpringFactoryImportSelector {

   @Override
   protected boolean isEnabled() {
      return getEnvironment().getProperty(
            "spring.cloud.circuit.breaker.enabled", Boolean.class, Boolean.TRUE);
   }

}

点进 SpringFactoryImportSelector 类

可以看到 实现了DeferredImportSelector接口,

DeferredImportSelector接口又 继承 ImportSelector接口,实现selectImports方法。

image.png

实现ImportSelector接口的类主要就是用来 导入一些类的。

那么实现ImportSelector接口的类,被实例化bean的时候,会调到selectImports,传入@Import它的那个类的元数据对象, 然后返回 一个 需要被 注册到Spring容器中的 类全限定性名数组。

2.1.1、SPI机制

而SpringFactoryImportSelector 父类实现的selectImports 则会返回META-INF/Spring.factories里配置的 key = org.springframework.cloud.client.circuitbreaker.EnableCircuitBreaker 的 类的全限定性列表, 让Spring 注册这些类的实例。

image.png

2.1.2、META-INF/Spring.factories

这个文件在org.springframework.cloud:spring-cloud-netflix-core:2.0.0.RELEASE2包下

image.png

所以最终SpringFactoryImportSelector类的selectImports最终返回(导入)org.springframework.cloud.netflix.hystrix.HystrixCircuitBreakerConfiguration这个类,让Spring注册它的实例。

3、切面的注册

点进org.springframework.cloud.netflix.hystrix.HystrixCircuitBreakerConfiguration

可以看到用@Bean注册了一个切面

image.png

就是我们平时用的aop,切入点为加了@HystrixCommand的方法, 我们使用hystrix的时候用的就是这个注解。

image.png

最终会用 环绕通知 @Around 来 对 加了@HystrixCommand的方法进行 增强。那么hystrix对接口方法的 熔断降级,服务隔离等功能就在这个methodsAnnotatedWithHystrixCommand方法里。

4、代理逻辑

接下来我们看下 环绕通知里 关于 熔断降级,服务隔离的核心源码。

CommandExecutor.execute 会返回结果,最终return出去,点进去

image.png

里面分同步调用,异步调用。

image.png

异步调用的话,会调用HystrixExecutable的queue()方法,返回一个Future对象,异步执行,不等待返回结果。

image.png

同步调用在调用queue方法返回Future对象之外, 还会调用Future对象的get方法,阻塞等待返回结果,以达到同步的效果。

image.png

所以,我们看queue()方法就好了。

HystrixCommand.queue()

点进toObservable()方法

image.png

toObservable() 会创建一堆的匿名对象,我们看Hystrix主体的逻辑的那个

image.png

代码applyHystrixSemantics对象的call方法,最终调用applyHystrixSemantics(_cmd)方法

点进去。

image.png

这里就是Hystrix的核心逻辑所在。

4.1、判断是否允许接受请求

circuitBreaker.attemptExecution()是用来判断是否允许接受请求

点进HystrixCircuitBreakerImpl实现的attemptExecution()方法

image.png

4.1.1、是否强制开启断路器和是否强制关闭断路器

是否强制开启断路器和是否强制关闭断路器都是 由我们的配置决定的,对应HystrixCommandProperties的这两个属性。

image.png

默认值都为false

image.png
image.png

4.1.2、滚动窗口时间的判断

回顾一下熔断机制里的滚动窗口时间的作用, 就是当 熔断开启后, 拒绝请求,过了滚动窗口时间之后, 熔断器状态会变成 半开状态,然后下一次请求成功,则将熔断器从半开状态变为 关闭状态,如果请求失败,则还是变为 开启状态,拒绝请求。等再过了滚动窗口时间之后,又进行这样的机制,周而复始。

看下isAfterSleepWindow()源码 对 是否需要开启半开状态的判断

private boolean isAfterSleepWindow() {
    // 上一次熔断器开启的的时间
    final long circuitOpenTime = circuitOpened.get();
    // 当前时间
    final long currentTime = System.currentTimeMillis();
    // 滚动窗口的时间
    final long sleepWindowTime = properties.circuitBreakerSleepWindowInMilliseconds().get();
    // 如果当前时间 > 上一次 开启熔断器的时间 + 滚动窗口的时间,则返回ture,更新为半开状态
    return currentTime > circuitOpenTime + sleepWindowTime;
}

这里滚动窗口时间也是一个配置

image.png

默认5s

image.png
image.png

4.1.3、总结

允许接受请求的条件 :

  1. 如果配置强制关闭熔断器
  2. 或者是 熔断器关闭
  3. 或者是 熔断器非关闭状态下,上次开启熔断器的时间到现在,已经过了滚动窗口时间,可以设置为半开状态的话,则允许接受请求

不允许接受请求的条件 :

  1. 如果没配置强制关闭熔断器,配置了强制开启熔断器,
  2. 或者是熔断器 打开,且上次开启熔断器的时间到现在,还没有过滚动窗口时间

4.2、如果允许,那么则会尝试结合隔离策略,判断是否 真的会执行业务方法。

image.png

4.2.1、信号量隔离

首先getExecutionSemaphore() 就会去获取 隔离策略。

如果是信号量隔离,判断是否存在信号量隔离对象, 没有 就会创建一个TryableSemaphoreActual对象,并传入最大请求数。有就直接返回。

如果不是信号量隔离,返回默认的TryableSemaphore对象。

image.png

TryableSemaphoreActual 对象会有一个原子型的Integer计数器,这个就是用来记录当前正在并发处理的请求数的。接受请求,就+1,请求处理完就减1。tryAcquire方法里 会与最大允许请求数判断,如果是否达到上线了,就不接受请求。信号量隔离的原理就是这样。

image.png

如果是信号量隔离的话,那么就返回TryableSemaphoreActual对象,代码回到外面。

会定义一个匿名类对象

image.png

这个对象的call方法 是请求处理完成后,用来 对TryableSemaphoreActual对象里的 计数器减一的。

image.png

4.2.1.1、判断是否 接受请求

代码接下来就调用TryableSemaphoreActual对象的tryAcquire方法判断当前是否正在处理的请求数是否大于 最大允许请求数。

image.png

点进tryAcquire(),先对计数器+1,然后拿计数器加1后的值 与配置的最大允许请求数进行比较。

image.png

4.2.1.2、计数器加过后的结果<= 配置的最大允许请求数

如果计数器加过后的结果大于 配置的最大允许请求数,则允许接受请求。那么,接下来就会调用 业务方法。并且再调用业务方法完成后,会调 对计数器-1的那个匿名类对象 对计数器减1。


image.png

4.2.1.3、计数器加过后的结果> 配置的最大允许请求数,降级

如果计数器加过后的结果大于 配置的最大允许请求数,则不允许接受请求。走else, 拒绝请求。

image.png
image.png

然后 走降级方法

image.png

4.2.2、线程池隔离

前面讲到 getExecutionSemaphore() 会获取 隔离策略。如果不是信号量隔离的话,会返回TryableSemaphoreNoOp对象。

image.png

这个对象的tryAcquire()方法恒返回true, release()方法也是空的

image.png

就相当于信号量隔离完全不起作用。

那么这里的判断就一定会走这里,因为TryableSemaphoreNoOp对象的tryAcquire() 恒返回true。代码会往下执行。

image.png

4.2.2.1、业务方法的调用

点进executeCommandAndObserve(_cmd),看executeCommandWithSpecifiedIsolation(_cmd)方法

image.png

再看return的 getUserExecutionObservable(_cmd)方法,点进getExecutionObservable()

image.png

选择HystrixCommand实现类

image.png

Run

image.png
image.png

点execute方法

image.png

选择MethodExecutionAction,点进executeWithArgs方法

image.png

再点execute

image.png

最终反射调用method

image.png

4.2.2.2、如果线程池满了就会走降级方法。

4.3、如果不允许接受请求,降级

  1. 如果是不允许的话,则会走else,调用handleShortCircuitViaFallback()方法 ,调用降级方法。

    image.png
image.png

4.4、降级总结

比如熔断器开启,线程池,信号量都满了,则会走到降级方法,也是会反射调用到 fallback 方法,fallback 降级方法也是有信号量和线程池的大小控制 的,也就是信号量或线程池是多少大小,fallback 降级方法也会接收多少降级的请求。

如果调用降级方法的信号量或线程池 都满了,则抛出响应的异常信息

你可能感兴趣的:(18. SpringCloud之Hystrix源码)