1、前言
hystrix是通过对 接口方法 进行AOP代理的方式 来 达到 对某一个请求 进行熔断降级的功能的。
所以,我们研究hystrix的核心源码,首先是要找到这个切面在哪生成的,干了什么。
2、@EnableCircuitBreaker
我们引入hystrix的时候,除了导入依赖之外,还会在启动类上加上@EnableCircuitBreaker注解表示启用hystrix的熔断降级等组件。
@Enable****之类的注解都表示启动什么什么功能。点进源码看, 其实一般都会做一些导入类,注册的事情。
比如@EnableCircuitBreaker 点进去就会 import EnableCircuitBreakerImportSelector类。
@Target(ElementType.TYPE)
@Retention(RetentionPolicy.RUNTIME)
@Documented
@Inherited
@Import(EnableCircuitBreakerImportSelector.class)
public @interface EnableCircuitBreaker {
}
所以我们先看这个类干了什么、
2.1、EnableCircuitBreakerImportSelector
点进源码,发现集成了 SpringFactoryImportSelector类
@Order(Ordered.LOWEST_PRECEDENCE - 100)
public class EnableCircuitBreakerImportSelector extends
SpringFactoryImportSelector {
@Override
protected boolean isEnabled() {
return getEnvironment().getProperty(
"spring.cloud.circuit.breaker.enabled", Boolean.class, Boolean.TRUE);
}
}
点进 SpringFactoryImportSelector 类
可以看到 实现了DeferredImportSelector接口,
DeferredImportSelector接口又 继承 ImportSelector接口,实现selectImports方法。
实现ImportSelector接口的类主要就是用来 导入一些类的。
那么实现ImportSelector接口的类,被实例化bean的时候,会调到selectImports,传入@Import它的那个类的元数据对象, 然后返回 一个 需要被 注册到Spring容器中的 类全限定性名数组。
2.1.1、SPI机制
而SpringFactoryImportSelector 父类实现的selectImports 则会返回META-INF/Spring.factories里配置的 key = org.springframework.cloud.client.circuitbreaker.EnableCircuitBreaker 的 类的全限定性列表, 让Spring 注册这些类的实例。
2.1.2、META-INF/Spring.factories
这个文件在org.springframework.cloud:spring-cloud-netflix-core:2.0.0.RELEASE2包下
所以最终SpringFactoryImportSelector类的selectImports最终返回(导入)org.springframework.cloud.netflix.hystrix.HystrixCircuitBreakerConfiguration这个类,让Spring注册它的实例。
3、切面的注册
点进org.springframework.cloud.netflix.hystrix.HystrixCircuitBreakerConfiguration
可以看到用@Bean注册了一个切面
就是我们平时用的aop,切入点为加了@HystrixCommand的方法, 我们使用hystrix的时候用的就是这个注解。
最终会用 环绕通知 @Around 来 对 加了@HystrixCommand的方法进行 增强。那么hystrix对接口方法的 熔断降级,服务隔离等功能就在这个methodsAnnotatedWithHystrixCommand方法里。
4、代理逻辑
接下来我们看下 环绕通知里 关于 熔断降级,服务隔离的核心源码。
CommandExecutor.execute 会返回结果,最终return出去,点进去
里面分同步调用,异步调用。
异步调用的话,会调用HystrixExecutable的queue()方法,返回一个Future对象,异步执行,不等待返回结果。
同步调用在调用queue方法返回Future对象之外, 还会调用Future对象的get方法,阻塞等待返回结果,以达到同步的效果。
所以,我们看queue()方法就好了。
HystrixCommand.queue()
点进toObservable()方法
toObservable() 会创建一堆的匿名对象,我们看Hystrix主体的逻辑的那个
代码applyHystrixSemantics对象的call方法,最终调用applyHystrixSemantics(_cmd)方法
点进去。
这里就是Hystrix的核心逻辑所在。
4.1、判断是否允许接受请求
circuitBreaker.attemptExecution()是用来判断是否允许接受请求
点进HystrixCircuitBreakerImpl实现的attemptExecution()方法
4.1.1、是否强制开启断路器和是否强制关闭断路器
是否强制开启断路器和是否强制关闭断路器都是 由我们的配置决定的,对应HystrixCommandProperties的这两个属性。
默认值都为false
4.1.2、滚动窗口时间的判断
回顾一下熔断机制里的滚动窗口时间的作用, 就是当 熔断开启后, 拒绝请求,过了滚动窗口时间之后, 熔断器状态会变成 半开状态,然后下一次请求成功,则将熔断器从半开状态变为 关闭状态,如果请求失败,则还是变为 开启状态,拒绝请求。等再过了滚动窗口时间之后,又进行这样的机制,周而复始。
看下isAfterSleepWindow()源码 对 是否需要开启半开状态的判断
private boolean isAfterSleepWindow() {
// 上一次熔断器开启的的时间
final long circuitOpenTime = circuitOpened.get();
// 当前时间
final long currentTime = System.currentTimeMillis();
// 滚动窗口的时间
final long sleepWindowTime = properties.circuitBreakerSleepWindowInMilliseconds().get();
// 如果当前时间 > 上一次 开启熔断器的时间 + 滚动窗口的时间,则返回ture,更新为半开状态
return currentTime > circuitOpenTime + sleepWindowTime;
}
这里滚动窗口时间也是一个配置
默认5s
4.1.3、总结
允许接受请求的条件 :
- 如果配置强制关闭熔断器
- 或者是 熔断器关闭
- 或者是 熔断器非关闭状态下,上次开启熔断器的时间到现在,已经过了滚动窗口时间,可以设置为半开状态的话,则允许接受请求
不允许接受请求的条件 :
- 如果没配置强制关闭熔断器,配置了强制开启熔断器,
- 或者是熔断器 打开,且上次开启熔断器的时间到现在,还没有过滚动窗口时间
4.2、如果允许,那么则会尝试结合隔离策略,判断是否 真的会执行业务方法。
4.2.1、信号量隔离
首先getExecutionSemaphore() 就会去获取 隔离策略。
如果是信号量隔离,判断是否存在信号量隔离对象, 没有 就会创建一个TryableSemaphoreActual对象,并传入最大请求数。有就直接返回。
如果不是信号量隔离,返回默认的TryableSemaphore对象。
TryableSemaphoreActual 对象会有一个原子型的Integer计数器,这个就是用来记录当前正在并发处理的请求数的。接受请求,就+1,请求处理完就减1。tryAcquire方法里 会与最大允许请求数判断,如果是否达到上线了,就不接受请求。信号量隔离的原理就是这样。
如果是信号量隔离的话,那么就返回TryableSemaphoreActual对象,代码回到外面。
会定义一个匿名类对象
这个对象的call方法 是请求处理完成后,用来 对TryableSemaphoreActual对象里的 计数器减一的。
4.2.1.1、判断是否 接受请求
代码接下来就调用TryableSemaphoreActual对象的tryAcquire方法判断当前是否正在处理的请求数是否大于 最大允许请求数。
点进tryAcquire(),先对计数器+1,然后拿计数器加1后的值 与配置的最大允许请求数进行比较。
4.2.1.2、计数器加过后的结果<= 配置的最大允许请求数
如果计数器加过后的结果大于 配置的最大允许请求数,则允许接受请求。那么,接下来就会调用 业务方法。并且再调用业务方法完成后,会调 对计数器-1的那个匿名类对象 对计数器减1。
4.2.1.3、计数器加过后的结果> 配置的最大允许请求数,降级
如果计数器加过后的结果大于 配置的最大允许请求数,则不允许接受请求。走else, 拒绝请求。
然后 走降级方法
4.2.2、线程池隔离
前面讲到 getExecutionSemaphore() 会获取 隔离策略。如果不是信号量隔离的话,会返回TryableSemaphoreNoOp对象。
这个对象的tryAcquire()方法恒返回true, release()方法也是空的
就相当于信号量隔离完全不起作用。
那么这里的判断就一定会走这里,因为TryableSemaphoreNoOp对象的tryAcquire() 恒返回true。代码会往下执行。
4.2.2.1、业务方法的调用
点进executeCommandAndObserve(_cmd),看executeCommandWithSpecifiedIsolation(_cmd)方法
再看return的 getUserExecutionObservable(_cmd)方法,点进getExecutionObservable()
选择HystrixCommand实现类
Run
点execute方法
选择MethodExecutionAction,点进executeWithArgs方法
再点execute
最终反射调用method
4.2.2.2、如果线程池满了就会走降级方法。
4.3、如果不允许接受请求,降级
-
如果是不允许的话,则会走else,调用handleShortCircuitViaFallback()方法 ,调用降级方法。
4.4、降级总结
比如熔断器开启,线程池,信号量都满了,则会走到降级方法,也是会反射调用到 fallback 方法,fallback 降级方法也是有信号量和线程池的大小控制 的,也就是信号量或线程池是多少大小,fallback 降级方法也会接收多少降级的请求。
如果调用降级方法的信号量或线程池 都满了,则抛出响应的异常信息