SpringCloud学习笔记之分布式服务跟踪Sleuth

SpringCloud学习笔记之分布式服务跟踪Sleuth

源码链接:https://github.com/simba1949/springcloud-learn

实战演练

服务端

pom.xml

<dependency>
    <groupId>org.springframework.cloudgroupId>
    <artifactId>spring-cloud-starter-netflix-eureka-clientartifactId>
dependency>

<dependency>
    <groupId>org.springframework.cloudgroupId>
    <artifactId>spring-cloud-starter-sleuthartifactId>
dependency>

配置文件

spring.application.name=spring-cloud-sleuth-service
server.port=7000

eureka.instance.hostname=localhost
eureka.client.service-url.defaultZone=http://${eureka.instance.hostname}:8761/eureka

客户端

pom.xml

<dependency>
    <groupId>org.springframework.cloudgroupId>
    <artifactId>spring-cloud-starter-netflix-eureka-clientartifactId>
dependency>
<dependency>
    <groupId>org.springframework.cloudgroupId>
    <artifactId>spring-cloud-starter-openfeignartifactId>
dependency>
<dependency>
    <groupId>org.springframework.cloudgroupId>
    <artifactId>spring-cloud-starter-sleuthartifactId>
dependency>

配置文件

spring.application.name=spring-cloud-sleuth-client
server.port=8081

eureka.instance.hostname=localhost
eureka.client.service-url.defaultZone=http://${eureka.instance.hostname}:8761/eureka

# 需要配置超时时间,否则会请求多个服务,返回错误
ribbon.ConnectTimeout=5000

hystrix.command.default.execution.isolation.thread.tiemoutInMilliseconds=5000
# 打开熔断器
feign.hystrix.enabled=true

日志分析

# 客户端请求日志
2019-08-03 12:01:19.352  INFO [spring-cloud-sleuth-client,b5e10e3c4bf53798,b5e10e3c4bf53798,false] 31604 --- [nio-8081-exec-9] top.simba1949.controller.UserController  : the quest coming
# 服务端请求日志
2019-08-03 12:01:19.356  WARN [spring-cloud-sleuth-service,b5e10e3c4bf53798,c8c228cc3683ecdb,false] 8316 --- [nio-7000-exec-2] top.simba1949.controller.UserController  : the request's data of UserController-getUser is User(id=null, username=null, birthday=null)
  1. 第一个值 spring-cloud-sleuth-service:记录应用的名称
  2. 第二个值 b5e10e3c4bf53798:SpringCloudSleuth 生成的一个 ID,成为 Trece ID,用来表示一条请求链路。一个请求链路包含一个 Trace ID,多个 Span ID
  3. 第三个值 c8c228cc3683ecdb:SpringCloudSleuth 生成的另外一个 ID,成为 Span ID,表示一个基本的工作单元,比如发送一个 HTTP 请求
  4. 第四个值 false:表示是否要将该信息输出到 Zipkin 等服务中来收集和展示。

上面的四个值得 Trace ID 和 Span ID 是 SpringCloudSleuth 实现分布式服务跟踪的核心。在一次服务请求链路的调用过程中,会保持并传递同一个 Trace ID,从而将整个分布于不同微服务进程中的请求跟踪信息串联起来。在上面输出的内容为例,spring-cloud-sleuth-client 和 spring-cloud-sleuth-service 同属于一个前端服务请求来源,所以他们的 Trace ID 是相同的,处于同一条请求链路中。

跟踪原理

分布式系统中的服务跟踪在理论上并不复杂,它主要包括下面两个关键点。

  1. 为了实现请求跟踪,当请求发送到分布式系统的入口端点时,只需要服务跟踪框架为该请求创建一个唯一的跟踪标识,同时在分布式系统流转的时候,框架始终保持传递这个唯一标识,直到返回给请求方为止,这个唯一标识就是 Trace ID。通过 Trace ID 的记录,就能将所有请求过程的日志关联起来。
  2. 为了统计各个处理单元的时间延迟,当请求到达各个组件时,或是处理逻辑到达某个状态时,也通过一个唯一标识来标记它的开始、具体过程以及结束,该表示就是 Span ID。对于每个 Span ID来说,他必须有两个开始和结束两个节点,通过记录开始 Span 和结束 Span 的时间戳,就能统计出该 Span 的时间延迟,除了时间戳记录之外,他还可以包含一些其他元数据,比如事件名称、请求信息等。

在实战演练中,在 spring-cloud-sleuth-client 发送到 spring-cloud-sleuth-service 之前,Sleuth 会在该请求的 Header 中增加实现跟踪需要的重要信息,主要有下面几个

  • X-B3-TraceId:一个请求链路(Trace)的唯一标识,必需的值
  • X-B3-SpanId:一个工作单元(Span)的唯一标识,必需的值
  • X-B3-ParentSpanId:标识当前工作单元所属的上一个工作单元,Root Span(请求链路的第一个单元)的该值为空
  • X-B3-Sampled:是否被抽样输出的标识,1 表示需要被输出,0 表示不需要被输出
  • X-Span-Name:工作单元的名称
log.info("X-B3-TraceId is {}, X-B3-SpanId is {}, X-B3-ParentSpanId is {}, X-B3-Sampled  is {}, X-Span-Name is {}",
         request.getHeader("X-B3-TraceId"),
         request.getHeader("X-B3-SpanId"),
         request.getHeader("X-B3-ParentSpanId"),
         request.getHeader("X-B3-Sampled"),
         request.getHeader("X-Span-Name")
        );

抽样收集

# 抽样比例, 0.1 代表 10% 的请求跟踪信息
spring.sleuth.sampler.probability=0.1

与 Logstash 整合

由于日志文件都离散地存储在各个服务实例的文件系统之上,仅仅通过查看日志文件来分析请求链路依然是件相当麻烦的事情,所以需要引入一些工具帮忙集中收集、存储和搜索这些跟踪信息。引入基于日志的分析系统是一个不错的选择,ELK。

ELK 平台主要有 ElasticSearch、Logstash 和 Kibana 三个开源工具组成

  • ElasticSearch 是一个开源分布式搜索引擎,他的特点是:分布式、零配置,自动发现,索引自动分片,索引副本机制,RESTful 风格接口,多数据源,自动搜索负载等。
  • Logstash 是一个完全开源的工具,他可以对日志进行收集、过滤,并将其存储供以后使用。
  • Kibana 也是一个开源和免费的工具,它可以为 Logstash 和 ElasticSearch 提供日志分析友好的 Web 界面,可以帮助汇总、分析和搜索重要数据日志。

pom 依赖


<dependency>
    <groupId>net.logstash.logbackgroupId>
    <artifactId>logstash-logback-encoderartifactId>
    <version>6.1version>
dependency>

日志配置文件


<configuration scan="true" scanPeriod="60 seconds" debug="false">
    <include resource="org/springframework/boot/logging/logback/defaults.xml"/><springProperty scope="context" name="springAppName" source="spring.application.name"/>
    
    <property name="LOG_FILE" value="${BUILD_FOLDER:-build}/${springAppName}"/><property name="CONSOLE_LOG_PATTERN"
              value="%clr(%d{yyyy-MM-dd HH:mm:ss.SSS}){faint} %clr(${LOG_LEVEL_PATTERN:-%5p}) %clr([${springAppName:-},%X{X-B3-TraceId:-},%X{X-B3-SpanId:-},%X{X-Span-Export:-}]){yellow} %clr(${PID:- }){magenta} %clr(---){faint} %clr([%15.15t]){faint} %clr(%-40.40logger{39}){cyan} %clr(:){faint} %m%n${LOG_EXCEPTION_CONVERSION_WORD:-%wEx}"/>

    
    <appender name="console" class="ch.qos.logback.core.ConsoleAppender">
        <filter class="ch.qos.logback.classic.filter.ThresholdFilter">
            
            <level>INFOlevel>
        filter>
        <encoder>
            <pattern>${CONSOLE_LOG_PATTERN}pattern>
            <charset>utf8charset>
        encoder>
    appender>

    
    
    
    
    
    
    
    
    
    
    
    <appender name="logstash" class="ch.qos.logback.core.rolling.RollingFileAppender">
        <file>${LOG_FILE}.jsonfile>
        <rollingPolicy class="ch.qos.logback.core.rolling.TimeBasedRollingPolicy">
            <fileNamePattern>${LOG_FILE}.json.%d{yyyy-MM-dd}.gzfileNamePattern>
            <maxHistory>7maxHistory>
        rollingPolicy>
        <encoder class="net.logstash.logback.encoder.LoggingEventCompositeJsonEncoder">
            <providers>
                <timestamp>
                    <timeZone>UTCtimeZone>
                timestamp>
                <pattern>
                    <pattern>
                        {
                        "severity": "%level",
                        "service": "${springAppName:-}",
                        "trace": "%X{X-B3-TraceId:-}",
                        "span": "%X{X-B3-SpanId:-}",
                        "exportable": "%X{X-Span-Export:-}",
                        "pid": "${PID:-}",
                        "thread": "%thread",
                        "class": "%logger{40}",
                        "rest": "%message"
                        }
                    pattern>
                pattern>
            providers>
        encoder>
    appender>
    
<root level="INFO">
        <appender-ref ref="console"/>
        <appender-ref ref="logstash"/>
        
    root>
configuration>

与 Zipkin 整合

ELK 平台提供的收集、存储、搜索等强大功能,我们对跟踪信息的管理和使用已经变得非常便利。但是,在 ELK 平台中的数据分析维度缺少对请求链路中各个阶段时间延迟的关注,很多时候我们追溯请求链路的一个原因是为了找到调用链路中出现延迟过高的瓶颈源,或为实现对分布式系统做延迟监控等与时间消耗相关的需求。需要引入 Zipkin 得以轻松整合。

Zipkin 的基础架构,有四个核心组件构成:

  • Collector:收集器组件,主要处理从外部系统发送过来的跟踪信息,将这些信息转换为 Zipkin 内部处理的 Span 格式,以支持后续的存储、分析、展示等功能。
  • Storage:存储组件,它主要处理收集器收到的跟踪信息,默认会将这些信息存储在内存中。也可以修改存储策略,通过使用其他存储组件将跟踪信息存储到数据库中。
  • RESTful API:API 组件,主要用来提供外部访问接口。比如给客户端展示跟踪信息,或是外接系统访问以实现监控。
  • Web UI:基于 API 组件实现的上层应用。通过 UI 组件,用户可以方便而又直观地查询和分析跟踪信息。

Zipkin Server

SpringCloud 不推荐通过 SpringCloud & SpringBoot 构建 Zipkin Server 服务。

官网推荐的构建方式:https://zipkin.io/pages/quickstart

docker 方式构建

docker run -d -p 9411:9411 openzipkin/zipkin

java 方式构建,至少java8

curl -sSL https://zipkin.io/quickstart.sh | bash -s
java -jar zipkin.jar

从源码构建

# get the latest source
git clone https://github.com/openzipkin/zipkin
cd zipkin
# Build the server and also make its dependencies
./mvnw -DskipTests --also-make -pl zipkin-server clean install
# Run the server
java -jar ./zipkin-server/target/zipkin-server-*exec.jar

Zipkin 客户端

服务提供者

pom

<dependency>
    <groupId>org.springframework.cloudgroupId>
    <artifactId>spring-cloud-starter-netflix-eureka-clientartifactId>
dependency>

<dependency>
    <groupId>org.springframework.cloudgroupId>
    <artifactId>spring-cloud-starter-sleuthartifactId>
dependency>

<dependency>
    <groupId>org.springframework.cloudgroupId>
    <artifactId>spring-cloud-sleuth-zipkinartifactId>
dependency>

配置文件

application.properties

spring.application.name=spring-cloud-sleuth-zipkin-service
server.port=7000

eureka.instance.hostname=localhost
eureka.client.service-url.defaultZone=http://${eureka.instance.hostname}:8761/eureka

# 抽样比例, 0.1 代表 10% 的请求跟踪信息
spring.sleuth.sampler.probability=1.0

# 配置 zipkin 地址
spring.zipkin.base-url=http://192.168.128.5:9411

logback-spring.xml


<configuration scan="true" scanPeriod="60 seconds" debug="false">
    <include resource="org/springframework/boot/logging/logback/defaults.xml"/><springProperty scope="context" name="springAppName" source="spring.application.name"/>

    <property name="CONSOLE_LOG_PATTERN"
              value="%clr(%d{yyyy-MM-dd HH:mm:ss.SSS}){faint} %clr(${LOG_LEVEL_PATTERN:-%5p}) %clr([${springAppName:-},%X{X-B3-TraceId:-},%X{X-B3-SpanId:-},%X{X-Span-Export:-}]){yellow} %clr(${PID:- }){magenta} %clr(---){faint} %clr([%15.15t]){faint} %clr(%-40.40logger{39}){cyan} %clr(:){faint} %m%n${LOG_EXCEPTION_CONVERSION_WORD:-%wEx}"/>

    
    <appender name="console" class="ch.qos.logback.core.ConsoleAppender">
        <filter class="ch.qos.logback.classic.filter.ThresholdFilter">
            
            <level>INFOlevel>
        filter>
        <encoder>
            <pattern>${CONSOLE_LOG_PATTERN}pattern>
            <charset>utf8charset>
        encoder>
    appender>

    <root level="INFO">
        <appender-ref ref="console"/>
    root>
configuration>

服务消费者

pom

<dependency>
    <groupId>org.springframework.cloudgroupId>
    <artifactId>spring-cloud-starter-netflix-eureka-clientartifactId>
dependency>
<dependency>
    <groupId>org.springframework.cloudgroupId>
    <artifactId>spring-cloud-starter-openfeignartifactId>
dependency>

<dependency>
    <groupId>org.springframework.cloudgroupId>
    <artifactId>spring-cloud-starter-sleuthartifactId>
dependency>

<dependency>
    <groupId>org.springframework.cloudgroupId>
    <artifactId>spring-cloud-sleuth-zipkinartifactId>
dependency>

配置文件

application.properties

server.port=8081

eureka.instance.hostname=localhost
eureka.client.service-url.defaultZone=http://${eureka.instance.hostname}:8761/eureka

# 需要配置超时时间,否则会请求多个服务,返回错误
ribbon.ConnectTimeout=5000

hystrix.command.default.execution.isolation.thread.tiemoutInMilliseconds=5000
# 打开熔断器
feign.hystrix.enabled=true

# 抽样比例, 0.1 代表 10% 的请求跟踪信息
spring.sleuth.sampler.probability=1.0

# 配置 zipkin 地址 
spring.zipkin.base-url=http://192.168.128.5:9411

bootstrap.properties

spring.application.name=spring-cloud-sleuth-zipkin-client

logback-spring.xml


<configuration scan="true" scanPeriod="60 seconds" debug="false">
    <include resource="org/springframework/boot/logging/logback/defaults.xml"/><springProperty scope="context" name="springAppName" source="spring.application.name"/>

    <property name="CONSOLE_LOG_PATTERN"
              value="%clr(%d{yyyy-MM-dd HH:mm:ss.SSS}){faint} %clr(${LOG_LEVEL_PATTERN:-%5p}) %clr([${springAppName:-},%X{X-B3-TraceId:-},%X{X-B3-SpanId:-},%X{X-Span-Export:-}]){yellow} %clr(${PID:- }){magenta} %clr(---){faint} %clr([%15.15t]){faint} %clr(%-40.40logger{39}){cyan} %clr(:){faint} %m%n${LOG_EXCEPTION_CONVERSION_WORD:-%wEx}"/>

    
    <appender name="console" class="ch.qos.logback.core.ConsoleAppender">
        <filter class="ch.qos.logback.classic.filter.ThresholdFilter">
            
            <level>INFOlevel>
        filter>
        <encoder>
            <pattern>${CONSOLE_LOG_PATTERN}pattern>
            <charset>utf8charset>
        encoder>
    appender>

    <root level="INFO">
        <appender-ref ref="console"/>
    root>
configuration>

访问测试

lter.ThresholdFilter">

INFO


${CONSOLE_LOG_PATTERN}
utf8


    

```

访问测试

SpringCloud学习笔记之分布式服务跟踪Sleuth_第1张图片

你可能感兴趣的:(SpringCloud)