开源分布式跟踪系统Zipkin介绍（如何写一个跟踪的代码库）（转） - 润新知

开源分布式跟踪系统Zipkin介绍（如何写一个跟踪的代码库）（转）
本文内容是Instrumenting a library的笔记，一般来说不需要自己写跟踪代码库，因为Zipkin已经有许多现有的各个语言的代码库了（Existing instrumentations）阅读本文只是为了更加深入的了解Zipkin的内部设计而已。

概述

你的代码库需要解决三个问题
- 用什么数据结构表示跟踪数据
- 如何创建Trace ID, Span ID和在服务间传递跟踪信息
- 如何记录操作的用时和时间戳
数据结构

openzipkin/zipkin-api 定义了跟踪数据的数据结构，它包含如下模块：
- 注解：用于标记事件
- 二进制注解：不包含时间信息，仅仅是一些附加的信息。比如对于一个HTTP请求，可以把请求的路径作为二进制注解记录下来进行分析。
- Span:
- Trace:
ID标识
- ID种类
- ID的产生
- 在服务调用之间传递的跟踪信息包括（具体请看openzipkin/b3-propagation）:
时间的记录

使用微秒来记录时间戳和操作用时(Span.Timestamp && Span.Duration)
- 所有的Zipkin时间戳都应该用微秒来表示，可以使用clock_gettime来获得。用64位的整数来存储
- 因为时钟偏差的因素，时间戳可能会倒退，因此应该尽可能的记录Span操作用时
设置Span时间戳和操作用时的时机
- 必须由Span的建立者在结束Span的时候设置时间戳和操作用时，Zipkin会合并所有具有相同Trace ID和Span ID的跟踪数据。
- 例子：
单方向RPC跟踪

单方向RPC的跟踪和一般的跟踪一样，唯一的区别是请求没有回复。因此单方向的请求只有cs和sr两个数据点，也没有记录Span时间戳和操作用时。具体如下图：
- 客户端代码
```
// 把跟踪信息加到请求的头部里
tracing.propagation().injector(Request::addHeader)
       .inject(span.context(), request);
// 发送请求
client.send(request);
// 记录Span CS并发送到Zipkin
span.kind(Span.Kind.CLIENT)
    .start().flush();
```
- 服务器端代码
```
// 从请求的头部获得跟踪信息
TraceContextOrSamplingFlags result =
    tracing.propagation().extractor(Request::getHeader).extract(request);
// 使用跟踪信息里面的Span ID
span = tracer.joinSpan(result.context())
// 记录Span SR并发送到Zipkin
span.kind(Span.Kind.SERVER)
    .start().flush();
```
消息跟踪

消息跟踪跟RPC跟踪不一样，因为消息的生产者和消费者不共用Span ID。在消息模型中，一个消息可能有多个消费者。和单方向跟踪一样，消息跟踪没有回复，只记录两个数据点ms和mr。因为生产者和消费者用不同的Span，所以他们可以分别记录Span的时间戳和操作用时，具体如下图：
- 生产者端代码
```
// 添加跟踪信息到消息头部
tracing.propagation().injector(Message::addHeader)
       .inject(span.context(), message);
// 生产者发送消息
producer.send(message);
// 记录Span MS并存储到Zipkin里
span.kind(Span.Kind.PRODUCER)
    .remoteEndpoint(broker.endpoint())
    .start().finish();
```
- 消费者端代码
```
// 从消息头部获得跟踪信息
TraceContextOrSamplingFlags result =
    tracing.propagation().extractor(Message::getHeader).extract(message);
// 基于生产者的Span建立一个子Span
span = tracer.newChild(result.context())
// 记录Span MR并存储到Zipkin里
span.kind(Span.Kind.CONSUMER)
    .remoteEndpoint(broker.endpoint())
    .start().finish();
```
- 因为一个消费者可能会处理多个消息，最好把Span信息放到消息的头部里面，以方便以后建立子Span可以直接从消息头部取出相信的跟踪信息，以下为Kafka的代码：
```
public ConsumerRecords<K, V> poll(long timeout) {
  ConsumerRecords<K, V> records = delegate.poll(timeout);
  for (ConsumerRecord<K, V> record : records) {
    handleConsumed(record);
  }
  return records;
}
void handleConsumed(ConsumerRecord record) {
  // 处理一个消息并获得当前Span
  Span span = startAndFinishConsumerSpan(record);
  // 用当前Span覆盖消息的头部
  injector.inject(span.context(), record.headers());
}
```
相关阅读:
webpack 打包报 ERROR in static/js/vendor.2eff2b5a1d36f4b7f033.js from UglifyJs
常见重构技巧
 Java常见重构技巧
 Python写基于非线性优化的2D-SLAM系统（已开源）
分享一个免费开源压缩视频软件！！！【视频压缩后质量还可以】
AJAX之超时与网络异常处理
 HTTP
Gin多次读取body
高效的数据压缩编码方式 Protobuf
TCP报文之-tcp dup ack 、tcp Out-of-Order
原文地址：https://www.cnblogs.com/wangbin/p/13395967.html

Copyright © 2020-2023 润新知