活学活用Prometheus:解决“INVALID“ is not a valid start token问题

问题出现场景

Prometheus、对应的服务发现和项目的配置都配置完成后,在prometheus管理界面也显示发现了服务,但是服务的State是down状态,Error栏显示 "INVALID" is not a valid start token,如下图:

活学活用Prometheus:解决“INVALID“ is not a valid start token问题_第1张图片

问题解决过程和解决方法

因为Prometheus版本和配置方法和其它已经在正常使用的都是一致的,偏偏就这个出问题,所以怀疑是项目的问题。项目暴露的用于抓取指标数据的接口返回的数据格式可能不正确,所以查看了下接口返回的数据和响应header,从响应header信息里面发现项目开启了gizp压缩功能,因为header信息里面有如下一项:

content-encoding: gzip

查看项目代码(Golang代码),发现使用了gizp Middleware:

r := gin.New()
r.Use(gin.Logger())
r.Use(gin.Recovery())
// 开启gzip
r.Use(gzip.Gzip(gzip.DefaultCompression))

去掉相关代码并部署后,在Prometheus管理界面看到项目的状态正常了。

导致此问题的其他情况

解决问题的过程中,在网上搜了一下,发下其他人导致这个问题的情况和我的不太一样,Prometheus配置里面可能报此错误的几个相关选项:

- job_name: 'port_status'

  metrics_path: /probe //注意这里,否则会报:"INVALID" is not a valid start token错误

  params:

    format: [prometheus] //注意这里,否则会报:"INVALID" is not a valid start token错误

看网上有人是因为这个例子里面的配置导致的报错,没有试过,希望多提供一点信息,可以帮助到遇到一样问题的人吧。

小结

我这次报 "INVALID" is not a valid start token 错误是因为项目开启了gzip压缩导致Prometheus不能正确解析指标数据,另外Prometheus配置文件的语法错误或者值不正确也会导致此问题,所以务必要确保配置文件配置正确。

你可能感兴趣的:(活学活用Prometheus,prometheus,云计算,后端,系统架构,运维)