腾讯mini项目-【指标监控服务重构】2023-08-01

今日已办

合并 Traefik 和 Profile 的 Trace

Traceparent Header 理解有误

腾讯mini项目-【指标监控服务重构】2023-08-01_第1张图片

Trace Context (w3.org)

腾讯mini项目-【指标监控服务重构】2023-08-01_第2张图片

故需要解析 TraceHeader 才能获取trace_id、parent_id

func (profileCtx *ProfileContext) UnpackKafkaMessage(ctx context.Context) (needBreak bool, tpsStatus string, contextErr error) {
	var traceID trace.TraceID
	var parentID trace.SpanID
	headers := profileCtx.msg.Headers
	for _, h := range headers {
		key := h.Key
		value := string(h.Value)
		if key == "Traceparent" {
            // eg: 00-4bf92f3577b34da6a3ce929d0e0e4736-00f067aa0ba902b7-01
			split := strings.Split(value, "-")
			traceID, _ = trace.TraceIDFromHex(split[1])
			parentID, _ = trace.SpanIDFromHex(split[2])
			break
		}
	}
	log.Logger.Info("[UnpackKafkaItem] parse header traceparent",
		zap.String("traceId", traceID.String()),
		zap.String("parentID", parentID.String()),
	)
	//otel.GetTextMapPropagator().Extract(profileCtx.Ctx, header)
	ctx = trace.ContextWithRemoteSpanContext(ctx,
		trace.NewSpanContext(trace.SpanContextConfig{
			TraceID: traceID,
		}))
	var span trace.Span
	profileCtx.Ctx, span = consumerTracer.Start(ctx, "UnpackKafkaMessage")
	//profileCtx.Ctx, span = consumerTracer.Start(profileCtx.Ctx, "UnpackKafkaMessage")
	defer span.End()
	// ...
	return
}

腾讯mini项目-【指标监控服务重构】2023-08-01_第3张图片

腾讯mini项目-【指标监控服务重构】2023-08-01_第4张图片

腾讯mini项目-【指标监控服务重构】2023-08-01_第5张图片

调研上下文传递 Propagator

参考 passthrough

Venus 服务中初始化 TextMapPropagator

func initPassthroughGlobals() {
	// We explicitly DO NOT set the global TracerProvider using otel.SetTracerProvider().
	// The unset TracerProvider returns a "non-recording" span, but still passes through context.
	log.Logger().Info("Register a global TextMapPropagator, but do not register a global TracerProvider to be in \"passthrough\" mode.")
	log.Logger().Info("The \"passthrough\" mode propagates the TraceContext and Baggage, but does not record spans.")
	otel.SetTextMapPropagator(propagation.NewCompositeTextMapPropagator(propagation.TraceContext{}, propagation.Baggage{}))
}

再根据 Fiber 的 Context 和 Header 来解包出 Context ,创建 Span

var (
	traceparent    string
	producerTracer = otel.Tracer("venus-producer",
		trace.WithInstrumentationAttributes(attribute.String("venus.work", "producer")))
)

func SplitAndValidate(c *fiber.Ctx) error {
	traceparent = c.Get("Traceparent", "default")
	log.Logger().Info("Traceparent", zap.Any("Traceparent", traceparent))
	log.Logger().Debug("split and validate", zap.String("client", c.IP()), zap.String("agent", string(c.Context().UserAgent())))
	header := make(propagation.HeaderCarrier)
	for k, v := range c.GetReqHeaders() {
		header.Set(k, v)
	}
	otel.SetTextMapPropagator(propagation.NewCompositeTextMapPropagator(propagation.TraceContext{}, propagation.Baggage{}))
	ctx := otel.GetTextMapPropagator().Extract(c.Context(), header)
	_, span := producerTracer.Start(ctx, "SplitAndValidate")
	defer span.End()
	// ...
	return c.Next()
}

腾讯mini项目-【指标监控服务重构】2023-08-01_第6张图片

Venus中注入,ctx 为 Kafka 的 WriteMessages 的,携带 TraceParentHeader

【感觉没有必要,确实我移除这部分代码正常运行】

  1. 因为 kafka 没有上下文机制,是使用 header 来传播 TraceParent
  2. TraceParent 包含了 trace-id、parent-id共4个字段
  3. Extract方法应该可以根据这个TraceParent的值来解析出tracespan的关系

image-20230801162219272

以相同的方式在 Profile 中处理,关于traceID、parentID的代码就可以移除了

腾讯mini项目-【指标监控服务重构】2023-08-01_第7张图片

腾讯mini项目-【指标监控服务重构】2023-08-01_第8张图片

现在的 venus 和 profile 是同一级,是因为 traefik 传播的 traceparent 没有修改,parent-id 是相同的,应该需要 venus 将最后一个 span 的 span_id 更新到 traceparent 的 parent-id 的部分,然后再用 kafka 的 header 传播下来

腾讯mini项目-【指标监控服务重构】2023-08-01_第9张图片

腾讯mini项目-【指标监控服务重构】2023-08-01_第10张图片

明日待办

  1. 组长会议汇报进度和问题

你可能感兴趣的:(重构,go,clickhouse)