第05期:使用 prometheus 监控 clickhouse 集群

一、前言

本文介绍采用 clickhouse-exporter + grafana + prometheus 搭建监控 clickhouse 单节点和集群的监控体系。

二、部署 exporter

获取代码并编译

mkdir -p $GO_PATH/src/github.com/Percona-Lab
cd $GO_PATH/src/github.com/Percona-Lab
git clone https://github.com/Percona-Lab/clickhouse_exporter

因为生产环境的系统是基于 Linux,不能直接访问外网。故在自己的 mac 系统先编译成二进制,然后拷贝到生产环境。

在 mac 上编译 clickhouse_exporter,

再下载到源代码目录。

cd $GO_PATH/src/github.com/Percona-Lab
GO111MODULE=off `CGO_ENABLED`=0 GOOS=linux GOARCH=amd64 go build clickhouse_exporter.go

编译成功会看到二进制文件,

$ ./clickhouse_exporter  -h
Usage of ./clickhouse_exporter:
  -insecure
        Ignore server certificate if using https (default true)
  -log.level value
        Only log messages with the given severity or above. Valid levels: [debug, info, warn, error, fatal, panic].
  -scrape_uri string
        URI to clickhouse http endpoint (default "http://localhost:8123/")
  -telemetry.address string
        Address on which to expose metrics. (default ":9116")
  -telemetry.endpoint string
        Path under which to expose metrics. (default "/metrics")

配置比较简单,就是指定 scrape_uri=clickhouse_server_ip:port,

启动 exporter,

./clickhouse_exporter -scrape_uri=http://clickhouse_server_ip:8123/ -log.level=info

在 exporter 机器上查看是否能获取到 clickhouse 的数据。


成功。。

三、配置 prometheus

修改 prometheus.yml 文件,targets 指定 clickhouse_exporter 的 ip 地址和端口号,

  - job_name: 'clickhouse_exporter'
    scrape_interval: 10s
    static_configs:
      - targets:
        - "clickhouse_exporter_ip:9116"

修改完配置文件,重新加载,

curl 'http://localhost:9090/-/reload' -X POST

监控多个 clickhouse 节点

当然如果监控多个 clickhouse 集群节点要怎么处理?目前测试的 clickhouse_exporter 还不支持,要重写接受参数的处理逻辑。

或者有知道的朋友怎么操作,可以留言交流。

四、配置 grafna 图形

从 https://grafana.com/grafana/dashboards/882 获取 clickhouse 的监控采集数据模板 ,导入模板,选择 prometheus 数据源,监控展示。

五、小结

本文算是浅显的介绍了利用 clickhouse-exporter + grafana + prometheus 部署 clickhouse 的监控。看了 clickhouse 的性能展示模板还是比较粗糙,如果有需要更细粒度的展示 clickhouse 的集群状态,可以基于监控的 metrics 去配置更丰富的指标。

have fun with ClickHouse _


关于 ClickHouse 的技术内容,你们还有什么想知道的吗?赶紧留言告诉小编吧!

你可能感兴趣的:(第05期:使用 prometheus 监控 clickhouse 集群)