Spring Cloud Sleuth 线程池打印调用链日志(traceId)

背景

现在使用 Spring Cloud 框架的公司越来越多了,也希望写这篇文章对刚入手 Spring Cloud 的同学有所帮助,对系统做出更多更好用的功能。

问题举例

  • 打印 traceId 有何意义?
  • 如何在日志中打印 Zipkin traceId?
  • 如何在子线程或线程池中如何获取 Zipkin traceId 并打印?

所需知识

如何在子线程和线程池中使用 ThreadLocal 传输上下文

问题解决

打印 traceId 意义

  • 分布式环境下,微服务之间的调用错综复杂,如果突然爆出一个错误,虽然有日志记录,但到底是哪个服务出了问题呢?是前端传的参数错误,还是系统X或系统Y提供的接口导致?在这种情况下,错误排查起来就非常费劲。
  • 为了追踪一个请求完整的流转过程,可以给每次请求分配一个唯一的 traceId,当请求调用其他服务时,通过传递这个 traceId。在输出日志时,将这个 traceId 打印到日志文件中,再使用日志分析工具(ELK)从日志文件中搜索,使用 traceId 就可以分析一个请求完整的调用过程,若更进一步,还可以做性能分析。

日志中打印 Zipkin traceId

使用 Spring Cloud 框架整合 Zipkin 特别方便,只需要在 maven pom 文件中配置 spring-cloud-sleuth-zipkin-stream(还需依赖其他 pom,可自行百度),再到 logback-spring.xml 文件中配置日志格式模板,Zipkin 默认 traceId 名称为 X-B3-TraceId


子线程或线程池中获取 Zipkin traceId 并打印

经过阅读 Spring Cloud Sleuth 源码,发现 Zipkin 使用 ThreadLocal 来存储 traceId,只能在当前线程获取,无法子线程传递或线程池传递,获取需要改造 Zipkin 使用 TransmittableThreadLocal 存储 traceId,对 TransmittableThreadLocal 不熟悉的同学,可以看 https://www.jianshu.com/p/4093add7f2cd。
通过看源码,发现存储 traceId 的代码逻辑在 SpanContextHolder

class SpanContextHolder {
    private static final ThreadLocal CURRENT_SPAN = new NamedThreadLocal("Trace Context");
}

NamedThreadLocal 继承于 ThreadLocal

public class NamedThreadLocal extends ThreadLocal {
}

然后我们再看哪里调用了 SpanContextHolder 类,我们发现在 DefaultTracer 类中调用了 SpanContextHolder,再看哪里初始化了 DefaultTracer,再追踪到了 TraceAsyncConfiguration

@Configuration
@ConditionalOnProperty(
    value = {"spring.sleuth.enabled"},
    matchIfMissing = true
)
@EnableConfigurationProperties({TraceKeys.class, SleuthProperties.class})
public class TraceAutoConfiguration {
    @Bean
    @ConditionalOnMissingBean({Tracer.class})
    public DefaultTracer sleuthTracer(Sampler sampler, Random random, SpanNamer spanNamer, SpanLogger spanLogger, SpanReporter spanReporter, TraceKeys traceKeys) {
        return new DefaultTracer(sampler, random, spanNamer, spanLogger, spanReporter, this.properties.isTraceId128(), traceKeys);
    }
}

看到这里,发现 DefaultTracer 的创建使用了 @ConditionalOnMissingBean({Tracer.class}) ,那就说明了只要我们自定义一个 TracerTraceAutoConfiguration 中的 DefaultTracer 就不再创建了。

获取 Zipkin traceId 步骤
第一步:
创建自己的 TraceAutoConfiguration 配置类

@Order
@Configuration
@ConditionalOnClass(TraceAsyncAspect.class)
@ConditionalOnProperty(value = {"spring.sleuth.async.enabled", "spring.sleuth.enabled"}, matchIfMissing = true)
@EnableConfigurationProperties({TraceKeys.class, SleuthProperties.class})
public class HtTraceAsyncConfiguration {

    @Autowired
    private SleuthProperties properties;

    @Bean
    public HtTracer sleuthTracer(Sampler sampler, Random random,
                                 SpanNamer spanNamer, SpanLogger spanLogger,
                                 SpanReporter spanReporter, TraceKeys traceKeys) {
        return new HtTracer(sampler, random, spanNamer, spanLogger,
                spanReporter, this.properties.isTraceId128(), traceKeys);
    }
}

第二步:
该配置类里面创建的 Trace 类则是我们自定义类,把原有的 DefaultTracer 拷贝出来改名成我们自定义类名(如上面的 HtTracer),把 HtTracer 类中使用了 SpanContextHolder 替换成自定义的 SpanContextHolder

第三步:
创建自定义的 SpanContextHolder ,拷贝 SpanContextHolder 进行改造,把里面使用的 NamedThreadLocal 替换成自定义的 NamedThreadLocal

class HtSpanContextHolder {
    private static final ThreadLocal CURRENT_SPAN = new NamedTransmittableThreadLocal<>("Trace Context");
}

第四步:
NamedThreadLocal 拷贝进行改造,继承于 TransmittableThreadLocal 即可。

public class NamedTransmittableThreadLocal extends TransmittableThreadLocal {
}

traceId 在子线程或线程池打印到日志中

  • Log4j2 MDC 集成 TTL

    com.alibaba
    log4j2-ttl-thread-context-map
    1.2.0

  • Logback MDC 集成 TTL

    com.ofpay
    logback-mdc-ttl
    1.0.2

具体使用,可以参考 TTL GitHub:https://github.com/alibaba/transmittable-thread-local

对代码不明白地方可联系讨论或对写的不好的地方望不吝指教。

你可能感兴趣的:(Spring Cloud Sleuth 线程池打印调用链日志(traceId))