1. 安装 Prometheus
Prometheus 是一个开源的监控系统和时间序列数据库,适用于记录实时的度量指标。
• 下载并安装 Prometheus:
• 前往 Prometheus 官方网站 下载适用于您操作系统的版本。
• 解压并配置 prometheus.yml 文件,定义抓取目标(targets),如服务器、应用程序等。
• 配置 Prometheus:
• 编辑 prometheus.yml 文件,添加您要监控的服务器地址。例如:
scrape_configs:
- job_name: 'node'
static_configs:
- targets: [':9100']
• 确保 Prometheus 能够访问这些目标并获取监控数据。
• 运行 Prometheus:
• 启动 Prometheus,通常通过运行以下命令:
./prometheus --config.file=prometheus.yml
2. 安装 Node Exporter
Node Exporter 是一个用于在服务器上收集硬件和操作系统级别的指标的工具。
• 下载并安装 Node Exporter:
• 前往 Node Exporter 下载页面 下载适用于服务器的版本。
• 启动 Node Exporter,并确保它在服务器上运行。
• 默认情况下,Node Exporter 会在 :9100 端口上公开指标。
3. 安装和配置 Grafana
Grafana 是一个开源的分析和监控平台,适用于创建可视化仪表板。
• 安装 Grafana:
• 前往 Grafana 官方网站 下载并安装适合您的版本。
• 启动 Grafana 服务并访问 Web 界面(通常是 http://localhost:3000)。
• 配置数据源:
• 登录 Grafana 后,前往“Configuration” -> “Data Sources”,添加 Prometheus 作为数据源。
• 配置 Prometheus 的 URL,通常是 http://localhost:9090。
4. 创建 Grafana 仪表板
一旦配置了数据源,您就可以开始创建仪表板来可视化数据。
• 导入或创建仪表板:
• 可以从 Grafana 官方网站或社区中导入现成的仪表板模板。
• 您也可以从头开始创建仪表板,添加图表、仪表、热图等,并选择合适的 Prometheus 查询来获取数据。
• 常见的监控指标:
• CPU 使用率、内存使用、磁盘 I/O、网络流量等。
• 通过 Prometheus 查询语言(PromQL)编写自定义的查询以获取特定的指标。
5. 警报与通知
您可以配置 Prometheus 和 Grafana 来设置警报,当指标达到某个阈值时发送通知。
• Prometheus Alertmanager:用于管理告警的组件,能够与邮件、Slack、PagerDuty 等集成。
• Grafana 警报:Grafana 也支持在仪表板上设置警报,并通过 Webhook、邮件等方式发送通知。
6. 扩展和优化
• 集成更多的 Exporters:如 MySQL Exporter、Kafka Exporter 等,以获取更多应用级别的指标。
• 优化 Prometheus:根据数据量和查询复杂度进行优化,例如增加存储保留时间、分片等。