以太坊2.0 POS挖矿(ETH2 Staking)教程(二)Topaz测试网-监控篇

在上一篇教程中已经介绍了开启Staking的方法:
以太坊2.0 POS挖矿(ETH2 Staking)教程(一)Topaz测试网

由于Staking要求验证着24/7保持在线才能持续获得收益,如果验证者离线一小段时间,将会有少量的惩罚;如果长时间离线,惩罚金额会随着时间大幅上升。关于该机制的简单介绍,可见这篇文章中的“验证者激励措施”部分。
因此,有必要对Staking进行实时监控,以便在出现问题时接收到告警并及时处理,避免损失扩大。
本文将从简单到复杂,介绍几种监控的方法。

准备工作——获取验证者public key

1. 从存款交易获取

打开metamask,找到那笔32ETH的存款交易,然后点击“通过etherscan浏览”。可看到那笔交易对应的验证者public key。

2. 从验证者密钥目录查看

进入密钥目录后查看validatorprivate****的文件,找到"publickey"部分即可。

# 进入目录
cd ~/.eth2validators
# 打开validatorprivate开头的文件
vim validatorprivatekey*****
# 打开后找到"publickey"部分即可

区块链浏览器查看验证者状态

最简单的方式就是通过访问区块链浏览器网站监控验证者状态。https://beaconcha.in或者https://beacon.etherscan.io,输入Public Key即可查看当前状态和历史收益。
以太坊2.0 POS挖矿(ETH2 Staking)教程(二)Topaz测试网-监控篇_第1张图片

使用云主机服务提供商的的监控看板

大部分云主机服务提供商都提供了主机性能监控和告警的功能。如果在云主机上进行Staking,可使用云服务上提供的资源监控告警功能。
信标链客户端占用内存大约在2.5GB-3.5GB之间,进程如果终止内存会导致内存骤降,可通过内存使用率/使用量的异常进行侧面监控。
同时可对网络流量、机器是否正常运行设置更多维度的监控。

通过prometheus监控

Prometheus是一款流行的实时监控工具。按照要求开发服务并设置监听端口后,可通过prometheus访问端口获取数据进行监控。
prysm已经内置了针对prometheus的监听服务,因此可以只需对prometheus进行简单的配置即可对信标链和验证者客户端进行监控。
如果想自行研究,可参考官方教程。以下是简要步骤:

  • 下载相应的prometheus安装包到本地:Download the latest release
  • 解压并进入目录:
tar xvfz prometheus-*.tar.gz
cd prometheus-*
  • 用screen新建一个session并启动prometheus:
# 新建一个session
screen -S prometheusETH2
# 启动prometheus
./prometheus --config.file=prometheus.yml
# 启动完成后按住CTRL+A+D退出session
  • 修改配置文件prometheus.yml
    默认的配置文件底部可看到- targets: ['localhost:9090'],表示进程会从本机9090端口抓取数据。9090是prometheus提供的监控自己运行指标的端口。prysm的信标链和验证者的指标端口分别是8080和8081,将两个端口加入到配置文件的targets即可。完成后的prometheus.yml如下:
# my global config
global:
  scrape_interval:     15s # Set the scrape interval to every 15 seconds. Default is every 1 minute.
  evaluation_interval: 15s # Evaluate rules every 15 seconds. The default is every 1 minute.
  # scrape_timeout is set to the global default (10s).

# Alertmanager configuration
alerting:
  alertmanagers:
  - static_configs:
    - targets:
      # - alertmanager:9093

# Load rules once and periodically evaluate them according to the global 'evaluation_interval'.
rule_files:
  # - "first_rules.yml"
  # - "second_rules.yml"

# A scrape configuration containing exactly one endpoint to scrape:
# Here it's Prometheus itself.
scrape_configs:
  # The job name is added as a label `job=` to any timeseries scraped from this config.
  - job_name: 'prometheus'

    # metrics_path defaults to '/metrics'
    # scheme defaults to 'http'.

    static_configs:
    - targets: ['localhost:9090']

  # 添加以下targets以监控信标链和验证者
  - job_name: 'beacon-chain'
    static_configs:
    - targets: ['localhost:8080']

  - job_name: 'validator'
    static_configs:
    - targets: ['localhost:8081']

修改完成后,通过promtool检查配置文件正确性:

./promtool check config prometheus.yml

验证无误后可以看到如下信息:

Checking prometheus.yml
  SUCCESS: 0 rule files found
  • 使prometheus重新载入配置文件
    通过ps -aux | grep prometheus找到prometheus运行的进程号(PID),并通过以下命令通知该进程重新载入配置文档:
kill -HUP PID
  • 查看监控指标
    通过本机访问http://localhost:9090即可看到prometheus的图形化监控页面。如果使用linux云主机,则需要开放9090,8080,8081三个端口并通过浏览器访问服务器。
    点击菜单栏的Status >> Targets可看到配置文件中设置的targets:
    以太坊2.0 POS挖矿(ETH2 Staking)教程(二)Topaz测试网-监控篇_第2张图片
    回到prometheus
    点击Endpoint中的链接可看到看到该target中的所有指标。
    进入validator的Endpoint(http://localhost:8081/metrics),可在页面底部看到验证者相关指标:
    以太坊2.0 POS挖矿(ETH2 Staking)教程(二)Topaz测试网-监控篇_第3张图片
    选取其中的指标输入到Graph页面即可。例如想观测验证者的ETH余额增长情况,只需要点击菜单的Graph,输入validator_balance后点击Execute,并在下方切换到Graph标签即可查看走势(我这里有2个验证者,所以有2条曲线):
    以太坊2.0 POS挖矿(ETH2 Staking)教程(二)Topaz测试网-监控篇_第4张图片
    点击下方的Add Graph可添加任意数量的图表,实现多个图表的看板。

优缺点

以上不同的监控方式各有优劣。对比如下:

区块链浏览器 云主机监控告警 prometheus
监控维度 验证者节点状态和余额变动 主机性能指标波动 信标链和验证者的多项指标
指标丰富程度 一般 丰富
上手难度 简单 中等 较为复杂
是否需要信任第三方的区块链信息? -
是否直接监控验证者?
主机断电或网络断开时是否有效?
风险点 网站数据有误、网站无法访问时无法监控 进程运行但执行异常时无法监控到 主机断电或网络断开时无法监测;
prometheus进程终止或出现异常时监测功能失效。

综上,较为保险的做法是主机性能指标监控+prometheus,另外亦可将prometheus部署在另一台机器上,这样当主机宕机或网络断开时也能观测到异常指标。

监控有了,告警呢?

说了这么多,难道需要一个人啥事不干整天盯着指标吗?当然不是啦,下一篇就会介绍如何对异常进行告警。不要错过哦。

你可能感兴趣的:(区块链)