雪崩效应
在微服务架构中通常会有多个服务层调用,基础服务的故障可能会导致级联故障,进而造成整个系统不可用的情况,这种现象被称为服务雪崩效应。服务雪崩效应是一种因“服务提供者”的不可用导致“服务消费者”的不可用,并将不可用逐渐放大的过程。
如果下图所示:A作为服务提供者,B为A的服务消费者,C和D是B的服务消费者。A不可用引起了B的不可用,并将不可用像滚雪球一样放大到C和D时,雪崩效应就形成了。
熔断器
熔断器的原理很简单,如同电力过载保护器。它可以实现快速失败,如果它在一段时间内侦测到许多类似的错误,会强迫其以后的多个调用快速失败,不再访问远程服务器,从而防止应用程序不断地尝试执行可能会失败的操作,使得应用程序继续执行而不用等待修正错误,或者浪费CPU时间去等到长时间的超时产生。熔断器也可以使应用程序能够诊断错误是否已经修正,如果已经修正,应用程序会再次尝试调用操作。
熔断器模式就像是那些容易导致错误的操作的一种代理。这种代理能够记录最近调用发生错误的次数,然后决定使用允许操作继续,或者立即返回错误。 熔断器开关相互转换的逻辑如下图:
(1) 防止单个服务的故障,耗尽整个系统服务的容器(比如tomcat)的线程资源,避免分布式环境里大量级联失败。通过第三方客户端访问(通常是通过网络)依赖服务出现失败、拒绝、超时或短路时执行fallback回退逻辑。
(2) 用快速失败代替排队(每个依赖服务维护一个小的线程池或信号量,当线程池满或信号量满,会立即拒绝服务而不会排队等待)和优雅的服务降级;当依赖服务失效后又恢复正常,快速恢复。
(3) 提供接近实时的监控和警报,从而能够快速发现故障和修复。监控信息包括请求成功,失败(客户端抛出的异常),超时和线程拒绝。如果访问依赖服务的错误百分比超过阈值,断路器会跳闸,此时服务会在一段时间内停止对特定服务的所有请求。
(4) 将所有请求外部系统(或请求依赖服务)封装到HystrixCommand或HystrixObservableCommand对象中,然后这些请求在一个独立的线程中执行。使用隔离技术来限制任何一个依赖的失败对系统的影响。每个依赖服务维护一个小的线程池(或信号量),当线程池满或信号量满,会立即拒绝服务而不会排队等待。
(1)请求熔断:
断路器很好理解, 当Hystrix Command请求后端服务失败数量超过一定比例(默认50%), 断路器会切换到开路状态(Open). 这时所有请求会直接失败而不会发送到后端服务. 断路器保持在开路状态一段时间后(默认5秒), 自动切换到半开路状态(HALF-OPEN). 这时会判断下一次请求的返回情况, 如果请求成功, 断路器切回闭路状态(CLOSED), 否则重新切换到开路状态(OPEN). Hystrix的断路器就像我们家庭电路中的保险丝, 一旦后端服务不可用, 断路器会直接切断请求链, 避免发送大量无效请求影响系统吞吐量, 并且断路器有自我检测并恢复的能力。
(2)服务降级:
当请求后端服务出现异常的时候, 可以使用fallback方法返回的值. fallback方法的返回值一般是设置的默认值或者来自缓存。
(3)依赖隔离:
在Hystrix中, 主要通过线程池来实现资源隔离. 通常在使用的时候我们会根据调用的远程服务划分出多个线程池. 例如调用产品服务的Command放入A线程池, 调用账户服务的Command放入B线程池. 这样做的主要优点是运行环境被隔离开了. 这样就算调用服务的代码存在bug或者由于其他原因导致自己所在线程池被耗尽时, 不会对系统的其他服务造成影响. 但是带来的代价就是维护多个线程池会对系统带来额外的性能开销. 如果是对性能有严格要求而且确信自己调用服务的客户端代码不会出问题的话, 可以使用Hystrix的信号模式(Semaphores)来隔离资源。
(4)请求缓存:
Hystrix中提供了请求缓存的功能,可以通过一个注解或者一个方法来开启缓存,进而减轻高并发环境下系统的压力,当系统访问相同参数访问同一个接口时,会优先从缓存中获取
(5)请求合并:
Hystrix中的请求合并,就是利用一个合并处理器,将对同一个服务发起的连续请求合并成一个请求进行处理(这些连续请求的时间窗默认为10ms)
实例是基于eureka注册中心
1、创建eureka服务端:eureka-server
application.yml 配置文件:
server:
port: 8761
#eureka服务端
eureka:
instance:
hostname: localhost
client:
registerWithEureka: false
fetchRegistry: false
serviceUrl:
defaultZone: http://${eureka.instance.hostname}:${server.port}/eureka/
2、创建服务提供者:Hystrix-Provider
(1)创建项目添加依赖
(2)在项目启动项中添加注解,支持服务发现
@EnableEurekaClient
(3)增加配置项
#端口
server:
port: 9001
#eureka注册中心地址
eureka:
client:
service-url:
defaultZone: http://localhost:8761/eureka/
#服务名
spring:
application:
name: provider-server
(4)创建ProviderController接口用于访问
@RestController
@RequestMapping("/provider")
public class ProviderController {
@Value("${server.port}")
private String port;
@RequestMapping("/hello")
public Object hello(){
return "Success connect : "+port;
}
}
3、创建服务消费端:Hystrix-Consumer
(1)创建项目添加依赖
org.springframework.boot
spring-boot-starter-web
org.springframework.cloud
spring-cloud-starter-netflix-eureka-client
org.springframework.cloud
spring-cloud-starter-netflix-hystrix
org.springframework.cloud
spring-cloud-starter-netflix-ribbon
org.springframework.boot
spring-boot-starter-test
test
(2)修改服务消费者启动类
引入hystrix之后,我们需要在入口类上通过@EnableCircuitBreaker开启断路器功能,如下:
@SpringBootApplication
@EnableEurekaClient
@EnableCircuitBreaker
public class HystrixConsumerApplication {
public static void main(String[] args) {
SpringApplication.run(HystrixConsumerApplication.class, args);
}
@LoadBalanced
@Bean
RestTemplate restTemplate() {
return new RestTemplate();
}
}
我们也可以使用一个名为@SpringCloudApplication的注解代替这三个注解,@SpringCloudApplication注解的定义如下:
@Target({ElementType.TYPE})
@Retention(RetentionPolicy.RUNTIME)
@Documented
@Inherited
@SpringBootApplication
@EnableDiscoveryClient
@EnableCircuitBreaker
public @interface SpringCloudApplication {
}
实际上就是这三个注解的一个整合。
(3)增加配置项application.yml
#端口
server:
port: 9100
#eureka注册中心地址
eureka:
client:
service-url:
defaultZone: http://localhost:8761/eureka/
#服务名
spring:
application:
name: consumer-server
(4) 创建接口用于访问
@RestController
@RequestMapping("/consumer")
public class ConsumerController {
@Autowired
RestTemplate restTemplate;
@RequestMapping("test01")
@HystrixCommand(fallbackMethod = "test01Fail")
public Object test01(){
String result = restTemplate.getForObject("http://provider-server/provider/hello", String.class);
return result;
}
public Object test01Fail(){
return "Connect server provider fail";
}
}
到此我们就搭建好了 RestTemplate + Hystrix 带有服务熔断降级的项目
我们先确认服务注册中心8761,三个服务提供者的实例,端口号分别是9001、9002、9003,一个服务消费者,端口号为9100,一共五个实例都启动成功,启动成功之后,此时访问http://localhost:9100/consumer/test01,结果如下:
我们再关掉一个服务提供者,再次访问,结果如下:
参考资料:
https://segmentfault.com/a/1190000011201184
http://www.ityouknow.com/springcloud/2017/05/16/springcloud-hystrix.html