Prometheus实现Spring cloud应用监控

最近项目上使用spring cloud作为微服务分布式架构替代原来的dubbo架构,但随着应用的不断增长,每个服务的具体状态,一些指标就需要进行监控,以便于时刻了解各服务的运行状态,于是便有了搭一个监控系统的想法。查询网上的资料,很多都是用Prometheus配上Grafana作为监控展现(毕竟颜值即正义),我也试着搭了个。闲话少说,进入实际操作。

Spring cloud应用改动

  • 加入依赖 :
        
            org.springframework.boot
            spring-boot-starter-actuator
        
        
            io.prometheus
            simpleclient_spring_boot
            0.0.26
        
  • 修改Application类:加入@EnablePrometheusEndpoint@EnableSpringBootMetricsCollector注解
@SpringBootApplication
@EnableDiscoveryClient
@EnablePrometheusEndpoint
@EnableSpringBootMetricsCollector
public class AuthApplication {

    public static void main(String[] args) {
        SpringApplication.run(AuthApplication.class, args);
    }
}

  • 修改application.yml:
security:
  basic:
    enabled: false

management:
  security:
    enabled: false

我这是为了方便,禁用了相关安全认证选项,你可不要把这个配置应用到生产环境,不然你就要背锅咯

Prometheus实现Spring cloud应用监控_第1张图片
背锅.png

接着启动你的应用,打开浏览器输入http://localhost:2222/auth/prometheus,正常情况下你就可以在页面上看到很多键值对:

Prometheus实现Spring cloud应用监控_第2张图片
key value.png

就像这样。

Prometheus:

  • 安装:
    去官网下载,根据你自己的操作系统选择版本,我这本地测试玩,就弄了个windows版本下的。下载完,解压,找到prometheus.yml改配置:
# my global config
global:
  scrape_interval:     15s # Set the scrape interval to every 15 seconds. Default is every 1 minute.
  evaluation_interval: 15s # Evaluate rules every 15 seconds. The default is every 1 minute.
  # scrape_timeout is set to the global default (10s).

  # Attach these labels to any time series or alerts when communicating with
  # external systems (federation, remote storage, Alertmanager).
  external_labels:
      monitor: 'codelab-monitor'

# Load rules once and periodically evaluate them according to the global 'evaluation_interval'.
rule_files:
  # - "first.rules"
  # - "second.rules"

# A scrape configuration containing exactly one endpoint to scrape:
# Here it's Prometheus itself.
scrape_configs:
   - job_name: auth-service
     scrape_interval: 5s
     scrape_timeout: 5s
     metrics_path: /auth/prometheus
     scheme: http
     static_configs:
       - targets:
         - 127.0.0.1:2222

这个是我自己的配置,你根据需要更改为你的应用合适的配置,主要更改在scrape_configs节点下。

  • 启动Prometheus:
    windows下,进入命令行模式,进入到Prometheus的目录中,运行prometheus -config.file=prometheus.yml,启动成功后,在http://localhost:9090/targets你会看到你所监控的目标,但在这里,你会发现居然有错:
Prometheus实现Spring cloud应用监控_第3张图片
error.png

然后Google一下,发现了这个https://github.com/prometheus/client_java/issues/130简直一模一样啊,莫非有救了,淡定,实际上并没有救,你会见证Prometheus client_java项目组和spring boot以及spring cloud项目组之间的互相扯皮踢皮球,最后我只好用了个暂且有用的办法,就是去掉那些产生问题的指标,在你的Spring boot应用配置文件中加上:

spring:
  application:
    name: auth
##去除有问题的指标,因为指标名重复产生bug    
  metrics:
    servo:
      enabled: false
server:
  port: 2222
  context-path: /auth

eureka:
    client:
      serviceUrl:
        defaultZone: http://localhost:1111/eureka/
    instance:
      prefer-ip-address: true
security:
  basic:
    enabled: false

management:
  security:
    enabled: false
endpoints:
  actuator:
    enabled: true

好啦,我们改好重新启动应用,重新刷新Prometheus的页面http://localhost:9090/targets,就会很欣喜的看到没错了,正常了。

Prometheus实现Spring cloud应用监控_第4张图片
normal.png

要看有哪些指标可以现成使用的,可以在Graph菜单下,那个下拉列表中查找:

Prometheus实现Spring cloud应用监控_第5张图片
1508582902911.png

你可以选中一个指标,然后execute,就可以看到一个简陋的图表,显示指标的数据:


Prometheus实现Spring cloud应用监控_第6张图片
1508582963614.png

当然这个Prometheus自带的图表肯定不给力,这时就要请出Grafana了。

Grafana:

  • 安装:
    同样的进入官网http://docs.grafana.org/installation/windows/下载,请根据你的操作系统下载。解压进入bin目录,然后启动,访问http://localhost:3000你就会看到登录界面,默认的账户和密码都是admin

  • 配置:
    add datasource ,加上Prometheus的数据源配置。

    Prometheus实现Spring cloud应用监控_第7张图片
    1508583706422.png

接着我们新加入一个Dashboards:


Prometheus实现Spring cloud应用监控_第8张图片
1508583782500.png

新增一个Graph:

Prometheus实现Spring cloud应用监控_第9张图片
1508583850530.png

接着选择edit:


Prometheus实现Spring cloud应用监控_第10张图片
1508583879453.png

然后在metric中编辑数据源和指标,比如我们新增一个threads(线程数)的指标,完成后就可以看到美丽的图表了:


Prometheus实现Spring cloud应用监控_第11张图片
1508583977567.png

好了,暂时写到这里了,要去做饭了。

Prometheus实现Spring cloud应用监控_第12张图片
1508584880773.png

你可能感兴趣的:(Prometheus实现Spring cloud应用监控)