SpringCloud Sleuth+Zipkin 分布式链路追踪

 

Sleuth+Zipkin用来实现分布式系统的链路追踪。

Sleuth组件用于日志埋点、记录链路数据,Zipkin组件用于展示链路数据。

 

 


 

 

Sleuth的使用

(1)创建消费者、提供者时勾选Spring Cloud Tracing -> Sleuth

也可以手动添加依赖:

    <dependency>
        <groupId>org.springframework.cloudgroupId>
        <artifactId>spring-cloud-starter-sleuthartifactId>
    dependency>

 

 

(2)在消费者、提供者处理业务的类中添加成员变量

//使用的是slf4j的日志,不要导错了
private final Logger logger = LoggerFactory.getLogger(this.getClass());

 

在处理业务的方法中(消费者调用提供者、提供者处理业务的方法中),输出日志

logger.info("正在执行user-service的findOrdersByUserId方法,调用服务order-service");

内容根据需要修改。

 

 

Sleuth输出的日志往往是空的,只输出服务名:[order-service,,,]

第(2)步是为了解决此问题,使Sleuth输出的日志有内容。

 

[order-service,cd99e95b12d13310,b6e08d7f788441bf,false]

  • 第一个是spring.application.name,服务名
  • 第二个是sleuth生成的Trace ID,唯一标识一条请求链路
  • 第三个是sleuth生成的Span ID,Span ID是链路的基本单元,标识一个http请求的元数据,比如一个服务调用产生的http请求。1条链路中包含1个Trace ID、多个Span ID。
  • 第四个表示是否会将该信息传输到zipkin服务中收集、展示,配置了zipkin就是true,没配置就是false

 

 

 


 

  

 

zipkin的使用

zipkin是大规模分布式系统的一个APM工具(Application Performance Management),基于Google Dapper实现,搭配sleuth可以实现可视化的链路调用分析。

APM工具常用的还有EagleEye 鹰眼、CAT。

 

zipkin组成:Collector、Storage、Restful API、Web UI组成。

 

 

(1)搭建zipkin服务器

https://zipkin.io/pages/quickstart.html   提供的方式下载速度都很慢,不推荐

 

到下面的地址直接下载编译打包好的jar,下载的是最新版的zipkin:

https://search.maven.org/remote_content?g=io.zipkin&a=zipkin-server&v=LATEST&c=exec

 

zipkin是springboot项目,运行jar需要jdk环境,如果没有配置jdk环境的需要先配置jdk环境。

双击jar运行(在Linux上可以使用java  -jar命令来运行),浏览器地址栏输入 127.0.0.1:9411 进入zipkin页面,ip是zipkin所在机器的ip,zipkin默认使用的端口时9411。

 

 

(2)创建消费者、生产者时勾选Spring Cloud Tracing -> Zipkin Client

也可以手动加依赖:

    <dependency>
        <groupId>org.springframework.cloudgroupId>
        <artifactId>spring-cloud-starter-zipkinartifactId>
    dependency>

 

 

(3)在消费者、提供者中添加配置

spring:
  application:
    #服务名称
    name: order-service
  zipkin:
    #zipkin服务器的地址,sleuth会将链路数据传输到zipkin服务器,默认是localhost:9411
    base-url: 192.168.1.9:9411
  sleuth:
    sampler:
      #采样率,0-1上的小数,比如0.5是将sleuth 50%的链路的数据传输给zipkin
      probability: 1.0

采样率以前我搞的时候默认是0.1,现在的默认值似乎好像是1.0(不确定),开发的时候可以设置大些,上线的时候设置小些,

因为采样太多很占网络带宽,而且zipkin把采样的链路数据直接存储在内存中(定时清理),采样率太高zipkin服务器会很占机器内存。

 

 

启动应用,调用服务,在zipkin页面可看到链路各部分的耗时情况,优化耗时多的部分,比如加多线程、异步、缓存。

 

你可能感兴趣的:(SpringCloud Sleuth+Zipkin 分布式链路追踪)