[监控部署实操]基于granfana展示Prometheus的图表和loki+promtail的图表

目录

  • 本文安装版本
    • loki的日志监控安装包版本
    • pometheus的监控安装包版本
  • pometheus的监控
    • node_exporter的启动
    • Prometheus的安装和启动
    • granfana的启动
  • loki的日志监控
    • 编写配置文件(启动需要)
    • promtail的启动
    • loki的启动
    • granfana添加loki
  • 遇到的问题
    • 1.需要机器之间的时间同步。
    • 2.检查Prometheus的配置文件
    • 3.检查loki,promtail的配置
    • 4.granfana添加source的时候ip错误
    • 5.只有个别图标显示no data

本文安装版本

grafana-6.4.2.linux-amd64.tar.gz


loki的日志监控安装包版本

loki-linux-amd64.zip
promtail-linux-amd64.zip


pometheus的监控安装包版本

node_exporter-1.1.2.linux-amd64.tar.gz
prometheus-2.35.0.linux-amd64.tar.gz

pometheus的监控

解压tar包:

tar -zxvf Prometheus和node-export的包

node_exporter的启动

node-export解压完直接就可以启动,这里可以指定port

/opt/node_exporter-1.1.2.linux-amd64/node_exporter --web.listen-address="ip:9100"

Prometheus的安装和启动

Prometheus解压完只需要配置prometheus.yml,添加监控的job

(base) [root@yxkj153 opt]# cd prometheus-2.35.0.linux-amd64/
(base) [root@yxkj153 prometheus-2.35.0.linux-amd64]# ll
total 198236
drwxr-xr-x  2 root root        23 May  6 17:32 config
drwxr-xr-x  2 3434 3434        38 Apr 21 17:59 console_libraries
drwxr-xr-x  2 3434 3434       173 Apr 21 17:59 consoles
drwxr-xr-x 10 root root       281 May 27 01:00 data
-rw-r--r--  1 3434 3434     11357 Apr 21 17:59 LICENSE
-rw-r--r--  1 3434 3434      3773 Apr 21 17:59 NOTICE
-rwxr-xr-x  1 3434 3434 105576684 Apr 21 17:55 prometheus
-rw-r--r--  1 3434 3434      1730 May 26 23:57 prometheus.yml
-rwxr-xr-x  1 3434 3434  97394322 Apr 21 17:58 promtool
(base) [root@yxkj153 prometheus-2.35.0.linux-amd64]#

[监控部署实操]基于granfana展示Prometheus的图表和loki+promtail的图表_第1张图片
如上图的配置:

vi prometheus.yml
  - job_name: 'node_exporter'
    static_configs:
      - targets: ['192.168.80.161:9100']

然后可以启动Prometheus

 /opt/prometheus-2.35.0.linux-amd64/prometheus

通过命令行检查node-export的监控,

curl http://192.168.80.161:9100/metircs

[监控部署实操]基于granfana展示Prometheus的图表和loki+promtail的图表_第2张图片

或者通过网页看node-export的监控,显示成功
[监控部署实操]基于granfana展示Prometheus的图表和loki+promtail的图表_第3张图片


登录http://ip:port,查看Prometheus的界面

[监控部署实操]基于granfana展示Prometheus的图表和loki+promtail的图表_第4张图片
出现如下表示部署成功
在这里插入图片描述
然后可以看到node的监控指标
[监控部署实操]基于granfana展示Prometheus的图表和loki+promtail的图表_第5张图片
[监控部署实操]基于granfana展示Prometheus的图表和loki+promtail的图表_第6张图片

granfana的启动

也是直接解压,然后就可以启动

/opt/grafana-6.4.2/bin/grafana-server web

访问http://192.168.80.161:3000/,账号密码都是admin,添加data sources
[监控部署实操]基于granfana展示Prometheus的图表和loki+promtail的图表_第7张图片
然后点击 add source,添加Prometheus
[监控部署实操]基于granfana展示Prometheus的图表和loki+promtail的图表_第8张图片
[监控部署实操]基于granfana展示Prometheus的图表和loki+promtail的图表_第9张图片
然后导入export的插件,或者有实力可以自己开发一个监控模板,选择import
[监控部署实操]基于granfana展示Prometheus的图表和loki+promtail的图表_第10张图片

Prometheus已经提供了一些模板,https://grafana.com/grafana/dashboards,这里输入编码405,需要加载稍等一会,点击旁边的load,稍等一会,不用输入下面的json串,等加载完成点击下面的load。
granfana+node-expoter的视图:
[监控部署实操]基于granfana展示Prometheus的图表和loki+promtail的图表_第11张图片

[监控部署实操]基于granfana展示Prometheus的图表和loki+promtail的图表_第12张图片

granfana+Prometheus的试图:
[监控部署实操]基于granfana展示Prometheus的图表和loki+promtail的图表_第13张图片
[监控部署实操]基于granfana展示Prometheus的图表和loki+promtail的图表_第14张图片
[监控部署实操]基于granfana展示Prometheus的图表和loki+promtail的图表_第15张图片
这里就可以看出Prometheus里面监控的job已经都有了。例如我得zookeeper监控也能查到,如下
[监控部署实操]基于granfana展示Prometheus的图表和loki+promtail的图表_第16张图片


注:
可以查看启动参数帮助

/opt/grafana-6.4.2/bin/grafana-server --help
(base) [root@yxkj153 prometheus-2.35.0.linux-amd64]# ./prometheus --help

loki的日志监控

直接解压就可以
[监控部署实操]基于granfana展示Prometheus的图表和loki+promtail的图表_第17张图片

unzip 安装包

编写配置文件(启动需要)

vi promtail-local-config.yaml
server:
  http_listen_port: 9080
  grpc_listen_port: 0

positions:
  filename: /data/promtail/positions.yaml

clients:
  - url: http://192.168.80.161:3100/loki/api/v1/push

scrape_configs:
#- job_name: system
#  static_configs:
#  - targets:
#      - localhost
#    labels:
#      job: varlogs
#      __path__: /var/log/*log
- job_name: bdp
  static_configs:
  - targets:
      - 192.168.80.161
    labels:
      job: nginxlogs
      __path__: /tmp/*log


vi loki-local-config.yaml
auth_enabled: false

server:
  http_listen_port: 3100     #监听的端口

ingester:
  lifecycler:
    address: 192.168.80.161
    ring:
      kvstore:
        store: inmemory
      replication_factor: 1
    final_sleep: 0s
  chunk_idle_period: 5m
  chunk_retain_period: 30s
  max_transfer_retries: 0

schema_config:
  configs:
    - from: 2022-05-25
      store: boltdb
      object_store: filesystem
      schema: v11
      index:
        prefix: index_
        period: 168h

storage_config:
  boltdb:
    directory: /data/loki/index   #自定义boltdb目录

  filesystem:
    directory: /data/loki/chunks   #自定义filesystem目录

promtail的启动

/opt/promtail-linux-amd64  -config.file=promtail-local-config.yaml

loki的启动

/opt/loki-linux-amd64 -config.file=loki-local-config.yaml

granfana添加loki

granfana怎么启动参考上面~添加loki也可以参考上面
[监控部署实操]基于granfana展示Prometheus的图表和loki+promtail的图表_第18张图片
[监控部署实操]基于granfana展示Prometheus的图表和loki+promtail的图表_第19张图片

然后去explore可以查看日志
[监控部署实操]基于granfana展示Prometheus的图表和loki+promtail的图表_第20张图片
我自己在promtail配置文件的监控目录下,自定义了一个文件。然后通过追加测试的。

echo "内容" >> /tmp/a.log

在此页面输入:

{filename="/tmp/a.log"}

[监控部署实操]基于granfana展示Prometheus的图表和loki+promtail的图表_第21张图片

遇到的问题

granfana的图标一直显示 ”no data“
解决办法:

1.需要机器之间的时间同步。

Prometheus就出现问题了。才导致granfana出现问题。
打开Prometheus的界面有个warning的提示,关于时间的。
可以参考我的另一篇博客解决
https://blog.csdn.net/MyNameIsWangYi/article/details/124562779?spm=1001.2014.3001.5502
https://blog.csdn.net/MyNameIsWangYi/article/details/124562779?spm=1001.2014.3001.5502

2.检查Prometheus的配置文件

添加job的时候,不要出现tab键。

3.检查loki,promtail的配置

把localhost换成具体的ip

4.granfana添加source的时候ip错误

我主要是这个,192写成182了,找了各种方法都没成功

5.只有个别图标显示no data

这个可以通过edit,修改表达式来实现展示视图
[监控部署实操]基于granfana展示Prometheus的图表和loki+promtail的图表_第22张图片
[监控部署实操]基于granfana展示Prometheus的图表和loki+promtail的图表_第23张图片
[监控部署实操]基于granfana展示Prometheus的图表和loki+promtail的图表_第24张图片
改成一个能执行的表达式。可以去Prometheus的 ip:9090端口测试一下表达式
[监控部署实操]基于granfana展示Prometheus的图表和loki+promtail的图表_第25张图片


第一次使用,记个笔记,希望对同样第一次使用的你有帮助~

你可能感兴趣的:(监控,linux,bash,运维)