SpringCloud【Greenwich版本】第三章 熔断器(Hystrix)和熔断监控集群(Hystrix Dashboard/Turbine)

序言

上一章节我们已经学习了最基本的Feign服务的提供者与消费者,本章主要想和大家分享下SpringCloud的Hystrix、Hystrix Dashboard、Turbine,为各个Feign client提供熔断、数据监控机制,使各个微服务更稳定、更高效运作和使用。

雪崩效应

在微服务架构中通常会有多个服务层调用,基础服务的故障可能会导致级联故障,进而造成整个系统不可用的情况,这种现象被称为服务雪崩效应。服务雪崩效应是一种因“服务提供者”的不可用导致“服务消费者”的不可用,并将不可用逐渐放大的过程。

熔断器

熔断器的原理很简单,如同电力过载保护器。它可以实现快速失败,如果它在一段时间内侦测到许多类似的错误,会强迫其以后的多个调用服务快速失败,不再访问远程服务器,从而防止应用程序不断地尝试执行可能会失败的操作,使得应用程序继续执行而不用等待修正错误,或者浪费CPU时间去等到长时间的超时产生。熔断器也可以使应用程序能够诊断错误是否已经修正,如果已经修正,应用程序会再次尝试调用操作。

Hystrix特性

断路器机制

断路器很好理解, 当Hystrix Command请求后端服务失败数量超过一定比例(默认50%), 断路器会切换到开路状态(Open). 这时所有请求会直接失败而不会发送到后端服务. 断路器保持在开路状态一段时间后(默认5秒), 自动切换到半开路状态(HALF-OPEN). 这时会判断下一次请求的返回情况, 如果请求成功, 断路器切回闭路状态(CLOSED), 否则重新切换到开路状态(OPEN). Hystrix的断路器就像我们家庭电路中的保险丝, 一旦后端服务不可用, 断路器会直接切断请求链, 避免发送大量无效请求影响系统吞吐量, 并且断路器有自我检测并恢复的能力。

Fallback

Fallback相当于是降级操作. 对于查询操作, 我们可以实现一个fallback方法, 当请求后端服务出现异常的时候, 可以使用fallback方法返回的值. fallback方法的返回值一般是设置的默认值或者来自缓存。

资源隔离

在Hystrix中, 主要通过线程池来实现资源隔离. 通常在使用的时候我们会根据调用的远程服务划分出多个线程池. 例如调用产品服务的Command放入A线程池, 调用账户服务的Command放入B线程池. 这样做的主要优点是运行环境被隔离开了. 这样就算调用服务的代码存在bug或者由于其他原因导致自己所在线程池被耗尽时, 不会对系统的其他服务造成影响. 但是带来的代价就是维护多个线程池会对系统带来额外的性能开销. 如果是对性能有严格要求而且确信自己调用服务的客户端代码不会出问题的话, 可以使用Hystrix的信号模式(Semaphores)来隔离资源.

添加Hystrix

前期准备

  • 启动Eureka Server
  • 在data-spi接口jar中添加Hystrix Callback抽象类UserHytrix
public abstract class UserHystrix implements UserProvider {
}

在UserProvider中声明callback

@FeignClient(value = "data-user-provider", fallback = UserHystrix.class)
public interface UserProvider {
    @GetMapping("user/{id}")
    User userInfo(@PathVariable(value = "id", required = true) Long id);
}
  • 启动Feign Provider

新增熔断机制

添加pom依赖

找到Feign-consumer项目的pom.xml,添加如下代码


    org.springframework.cloud
    spring-cloud-starter-netflix-hystrix

添加注解

@SpringBootApplication
@EnableFeignClients(basePackageClasses = {UserProvider.class})
@EnableEurekaClient
@EnableDiscoveryClient
@EnableHystrix
public class FeignConsumerApplication {

    public static void main(String[] args) {
        SpringApplication.run(FeignConsumerApplication.class, args);
    }

}

实现UserHytrix类

在项目中新建UserHystrixImpl实现类

@Component
public class UserHystrixImpl extends UserHystrix {
    @Override
    public User userInfo(Long id) {
        User u = new User();
        u.setName("user hytrix 服务中断了");
        return u;
    }
}

开启Hystrix开关

在application.properties中开启Hystrix开关

feign.hystrix.enabled=true

测试效果

  • 启动服务,正常访问
SpringCloud【Greenwich版本】第三章 熔断器(Hystrix)和熔断监控集群(Hystrix Dashboard/Turbine)_第1张图片
hystrix normal
  • 停掉Feign-provider服务,再次访问之前的链接
SpringCloud【Greenwich版本】第三章 熔断器(Hystrix)和熔断监控集群(Hystrix Dashboard/Turbine)_第2张图片
hystrix show

如果能得到上述结果,恭喜你,已经成功配置Hystrix _

添加Hystrix Dashboard

虽然熔断机制很实用,但随着服务数量增多,我们很难监控要各个微服务的使用情况,为了减少人工维护的成本,Spring Cloud给大家提供了Hystrix监控机制 -- Hystrix Dashboard。Hystrix Dashboard是作为断路器状态的一个组件,提供了数据监控和友好的图形化界面。

添加pom依赖

找到Feign-consumer项目,添加Hystrix Dashboard依赖


    org.springframework.cloud
    spring-cloud-starter-netflix-hystrix-dashboard



    org.springframework.boot
    spring-boot-starter-actuator

添加注解

在FeignConsumerApplication添加Hystrix Dashboard注解

@SpringBootApplication
@EnableFeignClients(basePackageClasses = {UserProvider.class})
@EnableEurekaClient
@EnableDiscoveryClient
@EnableHystrix
@EnableHystrixDashboard
@EnableCircuitBreaker
public class FeignConsumerApplication {

    public static void main(String[] args) {
        SpringApplication.run(FeignConsumerApplication.class, args);
    }

}

启动服务

浏览器输入http://localhost:8790/hystrix

SpringCloud【Greenwich版本】第三章 熔断器(Hystrix)和熔断监控集群(Hystrix Dashboard/Turbine)_第3张图片
hystrix dashborad

图中会有一些提示

Cluster via Turbine (default cluster): http://turbine-hostname:port/turbine.stream
Cluster via Turbine (custom cluster): http://turbine-hostname:port/turbine.stream?cluster=[clusterName]
Single Hystrix App: http://hystrix-app:port/actuator/hystrix.stream

前两个是集群监控(下面会讲解),我们先来看下针对单个Hystrix的监控,浏览器输入http://localhost:8790/actuator/hystrix.stream

可能会出现的异常

  • 页面访问404
    问题原因:springboot 针对actuator/hystrix.stream的URI有拦截,需要配置文件中手动开放设置
    解决方案:在application.properties添加配置
management.endpoints.web.exposure.include=*
  • 进入页面有会一直显示Loading...
    问题原因:Dashboard是实时监控数据的,如果没有数据的时候就一直会显示Loading...
    解决方案:请求服务>> http://localhost:8790/consumer/hello/1

如果一切正常的话,就是下面的截图

SpringCloud【Greenwich版本】第三章 熔断器(Hystrix)和熔断监控集群(Hystrix Dashboard/Turbine)_第4张图片
hystrix dashborad

针对图中的监控数据做个简要的说明(详细的可以从官网慢慢学习)

  • 实心圆:颜色代表健康度,(绿-黄-红-橙递减);大小代表并发量。
  • 曲线:请求量的变化
  • 方法名(userInfo)下面第一行,绿色代表成功次数,百分比代表错误比例
  • Cluster 代表请求频率
  • Circuit 代表是否熔断
  • Hosts、Median、Mean 代表处理速率,后面的时间代表延时时长

添加Hystrix Turbine

Hystrix Dashboard仅支持单个Hystrix.stream进行监控,跟与我们实际开发情况不相符合,若有多个Hystrix.stream就需要开多个窗口进行dashboard监控,如果这样的就非常繁琐,不过你不用担心,Spring Cloud给你提供了Turbine,它能提供把多个hystrix.stream的内容聚合为一个数据源供Dashboard展示。

前期准备

复制Feign-consumer,服务名为Feign-consumer-jim, 端口号改为8791

新建Hystrix Turbine 工程

在Intellij -> new Project,选择Cloud Circuit Breaker -> Hystrix Dashboard & Turbine,最后点击完成

SpringCloud【Greenwich版本】第三章 熔断器(Hystrix)和熔断监控集群(Hystrix Dashboard/Turbine)_第5张图片
turbine

添加注解

@SpringBootApplication
@EnableHystrixDashboard
@EnableTurbine
public class TurbineApplication {

    public static void main(String[] args) {
        SpringApplication.run(TurbineApplication.class, args);
    }

}

添加配置

在application.properties里面添加turbine相关配置(详情可查看官网)

spring.application.name=hystrix-dashboard-turbine
server.port=9001
turbine.appConfig=feign-consumer,feign-consumer-jim
turbine.aggregator.clusterConfig=default
turbine.clusterNameExpression=new String("default")

eureka.client.serviceUrl.defaultZone=http://localhost:8761/eureka/

启动项目

  • 打开eureka后台可以看到注册了四个服务

[图片上传失败...(image-f676f-1571013901348)]

  • 接着浏览输入 http://localhost:9001/hystrix
    输入集合stream URL -> http://localhost:9001/turbine.stream
    最后点击 Monitor Stream ,进入监控列表

  • 分别请求服务 http://localhost:8790/consumer/hello/1 和 http://localhost:8791/consumer/hello/1,然后查看监控列表,就会看到有两个服务发生请求服务

SpringCloud【Greenwich版本】第三章 熔断器(Hystrix)和熔断监控集群(Hystrix Dashboard/Turbine)_第6张图片
turbine

如果你能做到上图的效果,恭喜第三章已经全部学习啦 _

项目示例地址

https://github.com/lenvonsam/spring-cloud-training/tree/master/chapter-third

你可能感兴趣的:(SpringCloud【Greenwich版本】第三章 熔断器(Hystrix)和熔断监控集群(Hystrix Dashboard/Turbine))