zilong_wen

Prometheus+Pushgateway+VictoriaMetrics+Grafana+Consul开源监控体系搭建

监控全局架构图
1. prometheus搭建和配置介绍
- 1.1 prometheus搭建
- 1.2 prometheus配置文件详解
- - 1.2.1 prometheus.yml详解
  - 1.2.2 node_job.yml详解
  - 1.2.3 alert_rules.yml详解
  - 1.2.4 remote_write详解
- 1.3 promql正则表达式
2. Pushgateway搭建
3. prometheus exporter讲解
- 3.1 node_exporter搭建
- 3.2 process_exporter搭建
- 3.3 自定义指标上报Pushgateway
- - 3.3.1 python上报核心业务metrics
  - 3.3.2 shell上报top10进程占用率
4. VictoriaMetrics远程存储搭建
5. Alertmanager告警组件介绍
- 5.1. Alertmanager组件搭建
- 5.2. Alertmanager 邮件和微信告警
- 5.3. Alertmanager webhook 推送dingding
6. Consul注册中心搭建
7. Grafana搭建
8. Grafana Dashboar配置详解
9. FAQ

监控全局架构图

本文基于prometheus开源全家桶 + 互联网企业实战经验，指导小白如何从零搭建一套完整的监控系统，教学内容从基础监控、业务监控、进程监控、自定义指标监控等等多个维度实战讲解；

其中告警中心为自研中间件，主要解决alertmanager没办法降噪、告警升级、按业务分流到人；（可直接通过alertmanager推送告警）

1. prometheus搭建和配置介绍

1.1 prometheus搭建

官网下载地址 https://prometheus.io/download/

创建存放目录和运行账号

//创建prometheus本地数据存放目录
mkdir /home/data/prometheus_data
//创建prometheus进程运行账号
groupadd prometheus
useradd -g prometheus prometheus -d /home/prometheus

下载及解压安装包

//进入到软件安装目录
cd /usr/local
//选择最新的稳定版本，下载安装包
wget https://github.com/prometheus/prometheus/releases/download/v2.14.0/prometheus-2.14.0.linux-amd64.tar.gz
//解压安装包
tar -xvf prometheus-2.14.0.linux-amd64.tar.gz
//重命名解压目录
mv  prometheus-2.14.0.linux-amd64  prometheus

配置标准化

//进入到prometheus目录
cd /usr/local/prometheus
//创建数据、配置、日志等目录
mkdir -p {cfg,bin}
//移动二进制文件到bin目录
mv prometheus promtool bin/
//移动主配置文件，到cfg目录
mv prometheus.yml cfg/
//目录和文件授权给prometheus用户
chown -R prometheus.prometheus /usr/local/prometheus
//设置环境变量
cat >> /etc/profile <<'EOF'
PATH=/usr/local/prometheus/bin:$PATH:$HOME/bin
EOF
source /etc/profile

创建systemctl服务文件

//生成配置文件
cat > /usr/lib/systemd/system/prometheus.service <<'EOF'
[Unit]
Description=Prometheus
After=network.target

[Service]
User=prometheus
Restart=always
ExecReload=/bin/kill -HUP $MAINPID
//指定本地时序存储路径storage.tsdb.path 60d为数据存储的天数
//通过api web更新cfg配置文件需要加 --web.enable-lifecycle 参数
ExecStart=/usr/local/prometheus/bin/prometheus --storage.tsdb.retention.time=60d --config.file=/usr/local/prometheus/cfg/prometheus.yml --storage.tsdb.path=/home/data/prometheus_data

[Install]
WantedBy=multi-user.target
EOF

1.5 使用systemctl 启动

//重新加载systemctl配置文件
systemctl daemon-reload
//加入到开启自启动
systemctl enable prometheus
//启动prometheus
systemctl start prometheus
//查看prometheus
systemctl status prometheus

//查看prometheus进程服务的详细日志
journalctl -u prometheus -f

搭建完成后，可以在http://prometheusIP:9090/targets 页面中查看各个监控agent的状态；

1.2 prometheus配置文件详解

1.2.1 prometheus.yml详解

详细介绍prometheus的几种常见配置方法，静态static_configs、file_sd_configs动态文件、consul_sd_configs 注册模式consul；

以及如何配置多个remote_write远程存储VictoriaMetrics、alertmanagers告警、rule_files告警规则等；

#my global config
global:
  //间隔时间，15秒pull一次
  scrape_interval:     15s # Set the scrape interval to every 15 seconds. Default is every 1 minute.
  evaluation_interval: 15s # Evaluate rules every 15 seconds. The default is every 1 minute.
  # scrape_timeout is set to the global default (10s).

#Alertmanager configuration
alerting:
  alertmanagers:
  - static_configs:
    //配置告警的alertmanagers地址，用于处理监控规则出发的告警
    - targets: ["127.0.0.1:9093"]

#Load rules once and periodically evaluate them according to the global 'evaluation_interval'.
rule_files:
  //存放告警规则组的文件，详细配置可查阅2.3
  - "alert_rules.yml"

#remote write VictoriaMetrics
remote_write:
  //写远程存储地址，支持多个prometheus写入，grafana从远程存储读取数据
  - url: http://127.0.0.1:8428/api/v1/write
    remote_timeout: 30s
    queue_config:
      capacity: 500000
      max_shards: 50
      max_samples_per_send: 20000
      batch_send_deadline: 5s
  //同时写入多个远程存储地址，配置多个url即可
  - url: http://127.0.0.1:8428/api/v1/write
    remote_timeout: 30s
    queue_config:
      capacity: 500000
      max_shards: 50
      max_samples_per_send: 20000
      batch_send_deadline: 5s
      max_retries: 3

#A scrape configuration containing exactly one endpoint to scrape:
#Here it's Prometheus itself.
scrape_configs:
  # The job name is added as a label `job=` to any timeseries scraped from this config.
  //prometheus 同类监控组的名称，自定义
  //static_configs，通过静态配置，适用于快速测试
  - job_name: 'node_exporter'
    scrape_interval: 30s
    scrape_timeout: 30s
    static_configs:
      - targets: ['127.0.0.1:9090']
        labels:
          instance: 127.0.0.1
          
  //file_sd_configs，通过文件的形式动态加载配置，适用于web化动态管理节点
  - job_name: 'node_monitor'
    scrape_interval: 30s
    scrape_timeout: 30s
    metrics_path: /node
    file_sd_configs:
    - files:
      - node_job.yml
    //可以通过正则表达式做标签过滤，可以省略
    relabel_configs:
    - source_labels: [__address__]
      regex: '(.*):.*'
      replacement: '$1'
      target_label: host
      
  //通过cunsul做动态发现，适用于java/php/go等业务程序上报的指标采集
  - job_name: 'java_metric'
    scrape_interval: 30s
    scrape_timeout: 30s
    metrics_path: /actuator/prometheus
    consul_sd_configs:
    - server: 'consul.cn:80'
      services: []
      //consul 认证的token，只需要consul node和servier的读权限
      token: 'ea298607-8e39-686e-7d05-d9068fe7f984'
      tags: ['java-cls']

  //通过pushgateway做监控监控，和自定义业务指标监控
  - job_name: 'push_metric'
    scrape_interval: 30s
    scrape_timeout: 30s
    static_configs:
      - targets: ['pushgatewayIP:9091']
        labels:
          //自定义业务标签
          typeName: pushgateway
    relabel_configs:
    - source_labels: [__address__]
      regex: '(.*):.*'
      replacement: '$1'
      target_label: host

1.2.2 node_job.yml详解

可以通过自定义业务程序，结合CMDB做监控节点的自动发现，然后通过调用prometheus的api做热更新；可以通过自定义的labels，达到为不同业务打不同标签，方便Alertmanager做告警降噪、告警到人等用途

//可以通过lables自定义各自标签
- labels:
    department: sso
    domains: sso.cn
    env: prd
    product_line: sre
    type: ecs
  //同一个业务绑定多个节点，用 - 持续追加即可
  targets:
  - 127.0.0.1:9090
  - 127.0.0.1:9091
  - 127.0.0.1:9092
//多个配置文件通过-labels持续累加
- labels:
    department: pay
    domains: pay.cn
    env: stg
    product_line: ers
    type: ecs
  targets:
  - 127.0.0.1:9090

1.2.3 alert_rules.yml详解

alert_rules.yml文件用于存放prometheus告警规则，groups监控规则组，用于同类型的监控规则放到一起，方便查阅，功能上和独立的监控规则无区别

#alert_rules.yml示例
groups:
//监控规则组名，可以按业务逻辑规则，也可以按告警类型规则
- name: 支付专用
  rules:
  - alert: pay 5分钟系统负载 >20
    annotations:
      description: pay 5分钟系统负载_当前值：{{$value}} > 20
      value: '{{$value}}'
    expr: node_load5{domains="pay.cn"} >20 //通过domains等于node_job.yml定义的domains标签，做告警规则精确匹配；node_load5 >20则对所有node_job.yml中的业务节点生效
    for: 1m
    //通过{{$labels.xxx}}的形式取node_job.yml中定义的标签信息，传递给alertmanagers做告警过滤
    labels:
      department: '{{$labels.department}}'
      domains: '{{$labels.domains}}'
      env: '{{$labels.env}}'
      product_line: '{{$labels.product_line}}'
      type: '{{$labels.type}}'
//多个规则组，用 - name 追加，格式内容一致
- name: sso专用
  rules:
  - alert: sso ECS_FS使用率 > 90%
    annotations:
      description: sso ECS_FS {{$labels.mountpoint}}使用率{{$value}}  > 90%
      value: '{{$value}}'
    expr: (1- node_filesystem_avail_bytes{fstype=~"ext4|xfs",software=~"sso.*"}
      / node_filesystem_size_bytes) * 100 * on(instance, domains) group_left(nodename)
      node_uname_info >90
    for: 1m
    labels:
      department: '{{$labels.department}}'
      domains: '{{$labels.domains}}'
      env: '{{$labels.env}}'
      product_line: '{{$labels.product_line}}'
      type: '{{$labels.type}}'

PS：监控规则乘 * 100 * on(instance, domains) group_left(nodename) 语句，用于获取主机名，promql语句支持正则表达式

配置完成后，可以在http://prometheusIP:9090/alerts 页面中查看监控规则的状态；

1.2.4 remote_write详解

prometheus remote_write参数调优官方参考：https://prometheus.io/docs/practices/remote_write/

capacity 建议将容量设置为3-10倍max_samples_per_send
max_shards 不建议增加超过默认值
min_shards 不建议增加超过默认值
max_samples_per_sendv 每个发送的最大样本数可以根据使用的后端进行调整
batch_send_deadline 批量发送期限设置单个分片发送之间的最长时间
min_backoff 控制重试失败请求之前等待的最小时间
max_backoff 控制重试失败请求之前等待的最长时间

remote_write:
- url: http://victoriametricsIP:8428/api/v1/write
  remote_timeout: 30s
  queue_config:
    capacity: 500000
    max_shards: 50
    min_shards: 1
    max_samples_per_send: 20000
    batch_send_deadline: 5s
    min_backoff: 30ms //默认时间，可以不需要配置
    max_backoff: 100ms //默认时间，可以不需要配置

1.3 promql正则表达式

#正则表达式说明，即时矢量选择器
=：//匹配与标签相等的内容
!=：不匹配与标签相等的内容
=~: 根据正则表达式匹配与标签符合的内容
!~：根据正则表达式不匹配与标签符合的内容

//示例：
node_load5{env==~"prd|gra",domains!="sso"} 
//这将匹配domains不等于sso,env匹配到prd，gra请求内容。
//向量选择器必须指定一个名称或至少一个与空字符串不匹配的标签匹配器。以下表达式是非法的
{job=~".*"} # Bad!
//相反，这些表达式是有效的，因为它们都有一个与空标签值不匹配的选择器。
{job=~".+"} # Good!
{job=~".*",method="get"} # Good!

2. Pushgateway搭建

官方参考：https://github.com/prometheus/pushgateway/
pushgateway提供api给其他业务组件使用push模式进行指标的上报，提供api给prometheus pull采集业务上报的指标，在不使用注册中心的前提下，可以很方便的实现自定义的业务指标上报；

//下载并解压到指定目录
cd /usr/local
wget https://github.com/prometheus/pushgateway/releases/download/v0.8.0/pushgateway-0.8.0.linux-amd64.tar.gz
tar zxvf pushgateway-0.8.0.linux-amd64.tar.gz
mv pushgateway-0.8.0.linux-amd64.tar.gz pushgateway

创建systemctl 服务，运行pushgateway；

cat  >> /usr/lib/systemd/system/pushgateway.service <<'EOF'
[Unit]
Description=Pushgateway
After=network.target

[Service]
Type=simple
ExecStart=/usr/local/pushgateway/pushgateway 
Restart=on-failure

[Install]
WantedBy=multi-user.target
EOF

运行systemctl启动process-exporter

systemctl daemon-reload
systemctl enable pushgateway.service
systemctl start pushgateway.service
systemctl status pushgateway.service

#查看系统日志，比较详细
journalctl -u pushgateway -f

通过curl查看pshgateway自身的指标，验证是否安装成功

curl http://pushgatewayIP:9091/metrics

搭建完成后，需要在prometheus.yml中配置job_name: ‘push_metric’，详细见【2.1 prometheus.yml详解】

配置完成后，可以在http://prometheusIP:9090/targets 页面中查看组件的状态；

3. prometheus exporter讲解

以常用的node_exporter、process_exporter为例，讲解PULL采集；以python_client为例，讲解push pushgateway采集方式；

3.1 node_exporter搭建

官网参考 https://github.com/prometheus/node_exporter，暴露本地端口，提供pull
选择最新版本，下载并解压node_exporter

cd /usr/local
wgat https://github.com/prometheus/node_exporter/releases/download/v1.0.0/node_exporter-1.0.0.linux-amd64.tar.gz
tar zxvf node_exporter-1.0.0.linux-amd64.tar.gz
mv node_exporter-1.0.0.linux-amd64 node_exporter

创建systemctl 服务，运行node_exporter；

cat > /usr/lib/systemd/system/lala_exporter.service <<'EOF'
[Unit]
Description=node_exporter
After=network.target

[Service]
ExecStart=/usr/local/node_exporter/node_exporter
Restart=on-failure

[Install]
WantedBy=multi-user.target
EOF

运行systemctl启动node_exporter

//加载配置
systemctl daemon-reload
//加入的开机自启
systemctl enable node_exporter
//启动
systemctl start node_exporter
//查询运行状态
systemctl status node_exporter

#查看系统日志，比较详细
journalctl -u node_exporter -f

通过curl查看node_exporter的指标

curl  http://127.0.0.1:9100/metrics

因为是pull模式，搭建完成后，统一把节点添加至node_job.yml中即可，详细见【2.2 node_job.yml详解】

配置完成后，可以在http://prometheusIP:9090/targets 页面中查看组件的状态；

3.2 process_exporter搭建

官方参考 https://github.com/ncabatoff/process-exporter，暴露本地端口，提供pull
选择最新版本，下载并解压node_exporter

cd /usr/local
wgat https://github.com/ncabatoff/process-exporter/releases/download/v0.6.0/process-exporter-0.6.0.linux-amd64.tar.gz
tar zxvf process-exporter-0.6.0.linux-amd64.tar.gz
mv process-exporter-0.6.0.linux-amd64.tar.gz process-exporter

创建systemctl 服务，运行node_exporter；

cat > /usr/lib/systemd/system/process-exporter.service <<'EOF'
[Unit]
Description=Process-exporter
After=network.target

[Service]
Restart=always
ExecReload=/bin/kill -HUP $MAINPID
//web.listen-address 为要指定的端口
ExecStart=/usr/local/process-exporter/process-exporter -config.path /usr/local/process-exporter/process.yaml -web.listen-address 0.0.0.0:9256

[Install]
WantedBy=multi-user.target
EOF

配置process.yaml规则，默认取全部，详细的过滤看官方文档

cat > /usr/local/process-exporter/process.yaml <<'EOF'
process_names:
  - name: "{{.Comm}}"
    cmdline:
    - '.+'
EOF

运行systemctl启动process-exporter

systemctl daemon-reload
systemctl enable process-exporter
systemctl start process-exporter
systemctl status process-exporter

#查看系统日志，比较详细
journalctl -u process-exporter -f

通过curl查看node_exporter的指标

curl  http://127.0.0.1:9256/metrics

因为是pull模式，搭建完成后，统一把节点添加至node_job.yml中即可，详细见【2.2 node_job.yml详解】

配置完成后，可以在http://prometheusIP:9090/targets 页面中查看组件的状态；

3.3 自定义指标上报Pushgateway

支持任意开发语言，如java/python/go/shell等，本文采用python、shell分别做业务和系统监控上报，采用push模式上报至pushgateway；

3.3.1 python上报核心业务metrics

官网参考 https://github.com/prometheus/client_python#exporting-to-a-pushgateway
自定义指标的时候需要了解一下，Prometheus提供4种类型Metrics：Counter, Gauge, Summary和Histogram，篇幅有限不做单独说明
下面通过使用python第三方包prometheus_client实现自定义指标，上报至pushgateway

//vi test.py,需用通过php3 install prometheus_client包
from prometheus_client import CollectorRegistry, Gauge, push_to_gateway

registry = CollectorRegistry()
//（指标名称，说明，标签）
g = Gauge('job_last_success_unixtime', 'Last time a batch job successfully finished', registry=registry)
g.set_to_current_time()
//job为prometheus.yml文件中的- job_name: 'push_metric'
push_to_gateway('http://pushgatewayIP:9091', job='push_metric', registry=registry)
//python3 test.py

需要自定义标签的参考下面代码生成标签

from prometheus_client import Counter
c = Counter('my_requests_total', 'HTTP Failures', ['method', 'endpoint'])
c.labels(method='get', endpoint='/').inc()
c.labels(method='post', endpoint='/submit').inc()

通过curl查看上报的指标

curl http://pushgatewayIP:9091/metrics |grep 'job_last_success_unixtime'

pushtageway上报成功后，需要在prometheus.yml文件中配置添加push_metrics job name配置即可，详细见【2.1 prometheus.yml详解】

配置完成后，可以在http://prometheusIP:9090/targets 页面中查看组件的状态；

3.3.2 shell上报top10进程占用率

官方参考： https://devconnected.com/monitoring-linux-processes-using-prometheus-and-grafana/

pushgateway的推送url示例： /metrics/job/{//} =
/metrics/job/push_metric/instance/$host_ip
是prometheus.yml文件中job_name，后面跟任意数量的标签对，instance标签可以有也可以没有。

下面通过shell演示上报系统进程占用cpu/memroy使用率的top10，使用相同方法完成其他进程占用率抓取即可，不挨个说明；

#!/bin/bash
host_ip=$(/sbin/ip addr | grep 'state UP' -A2 | tail -n1 | awk '{print $2}' | cut -f1 -d '/')
while true
do
        //ps auxw get process cpu metrics $3
        process_cpu=$(ps aux --sort=-%cpu|head -n 10)
        while read -r z
        do
        		//生成top10进程占用cpu情况，指标名称：cpu_usage
                awk '{print "cpu_usage{process=\""$11"\", pid=\""$2"\"}", $3z}'|curl --data-binary @- http://pushgatewayIP:9091/metrics/job/push_metric/instance/$host_ip
        done <<< "$process_cpu"

        //ps auxw get process memroy metrics $4
        process_mem=$(ps aux --sort=-rss |head -n 10)
        z=$(ps aux)
        while read -r z
        do
        		//生成top10进程占用内存情况，指标名称：memory_usage
                awk '{print "memory_usage{process=\""$11"\", pid=\""$2"\"}", $4z}' | curl --data-binary @- http://pushgatewayIP:9091/metrics/job/push_metric/instance/$host_ip
        done <<< "$process_mem"

        #push time
        sleep 10s
done

通过curl查看上报的指标

curl http://pushgatewayIP:9091/metrics |grep 'memory_usage'

pushtageway上报成功后，需要在prometheus.yml文件中配置添加push_metrics job name配置即可，详细见【2.1 prometheus.yml详解】

配置完成后，可以在http://prometheusIP:9090/targets 页面中查看组件的状态；

4. VictoriaMetrics远程存储搭建

官方参考 https://victoriametrics.github.io/
prometheus支持的TSDB存储类型说明https://prometheus.io/docs/operating/integrations/#remote-endpoints-and-storage

VictoriaMetrics是prometheus支持的TSDB时序数据存储，开箱即用，能够很方便的做到数据的读写分离，VictoriaMetrics完美兼容promql语句，grafana直接读取远程存储，最大程度的减少prometheus的压力；

//下载并解压到指定目录
cd /usr/local
wget https://github.com/VictoriaMetrics/VictoriaMetrics/releases/download/v1.36.3/victoria-metrics-v1.36.3.tar.gz
tar zxvf victoria-metrics-v1.36.3.tar.gz
mv victoria-metrics-v1.36.3 victoria-metrics

创建systemctl 服务，运行VictoriaMetrics；

vi /usr/lib/systemd/system/victoriaMetrics.service

[Unit]
Description=VictoriaMetrics
After=network.target

[Service]
Type=simple
StartLimitBurst=5
StartLimitInterval=0
Restart=on-failure
RestartSec=3s
PIDFile=/home/data/victoria-metrics-data/victoriaMetrics.pid
//retentionPeriod指定要存储的时间，月为单位；
ExecStart=/usr/local/victoria-metrics-prod -retentionPeriod 24 -storageDataPath /home/data/victoria-metrics-data
ExecStop=/bin/kill -s SIGTERM $MAINPID

[Install]
WantedBy=multi-user.target

运行systemctl启动victoriaMetrics

//加载配置
systemctl daemon-reload
//加入的开机自启
systemctl enable victoriaMetrics
systemctl start victoriaMetrics
systemctl status victoriaMetrics
//victoriaMetrics默认启动8428端口
netstat -nlp|grep 8428

#查看系统日志，比较详细
journalctl -u victoriaMetrics -f

搭建完成后，需要在prometheus.yml文件中配置remote_write，详细见【2.1 prometheus.yml详解】

配置完成后，可以在http://prometheusIP:9090/config 页面中查看prometheus配置情况；

5. Alertmanager告警组件介绍

官方参考：https://github.com/prometheus/alertmanager/
alertmanager是一个开源的监控告警组件，提供http api很方便的接收来着不同应用推送的监控告警，自带告警状态恢复通知，非常便捷；
缺点不支持查询业务cmdb系统，告警按业务分流到人，和告警自定义降噪等；
alertmanager提供了一个很好的功能来弥补这一块的坑缺，就是支持webhook推送，基于推送的告警做二次过滤，笔者就是使用go自演了告警中心，做更精细化的管理；（本文介绍邮件/微信/钉钉告警）

5.1. Alertmanager组件搭建

//下载并解压到指定目录
cd /usr/local
wget https://github.com/prometheus/alertmanager/releases/download/v0.19.0/alertmanager-0.19.0.linux-amd64.tar.gz
tar zxvf alertmanager-0.19.0.linux-amd64.tar.gz
mv alertmanager-0.19.0.linux-amd64 alertmanager

创建systemctl 服务，运行alertmanager；(alertmanager.yml配置请查看7.2章节)

cat  >> /usr/lib/systemd/system/alertmanager.service <<'EOF'
[Unit]
Description=Alertmanager
After=network.target

[Service]
Type=simple
User=prometheus
ExecStart=/usr/local/alertmanager/alertmanager --config.file=/usr/local/alertmanager/alertmanager.yml --storage.path=/home/data/alertmanager_data
Restart=on-failure

[Install]
WantedBy=multi-user.target
EOF

运行systemctl启动alertmanager

//加载配置
systemctl daemon-reload
//加入的开机自启
systemctl enable alertmanager
systemctl start alertmanager
systemctl status alertmanager

#查看系统日志，比较详细
journalctl -u alertmanager -f

搭建完成后，需要在prometheus.yml文件中配置alertmanager，详细见【2.1 prometheus.yml详解】

配置完成后，可以在http://alertmanagerIP:9093/#/alerts 页面中查看prometheus推送的告警信息；

5.2. Alertmanager 邮件和微信告警

Alertmanager配置主要分为如下几部分：
global：全局配置，用于定义一些全局的公共参数，如全局的SMTP配置，Slack配置等内容；
templates：模板，用于定义告警通知时的模板，如HTML模板，邮件模板等；
route：告警路由，根据标签匹配，确定当前告警应该如何处理；
receivers：接收人，接收人是一个抽象的概念，它可以是一个邮箱也可以是微信，Slack或者Webhook等，接收人一般配合告警路由使用；
inhibit_rules：抑制规则，合理设置抑制规则可以减少垃圾告警的产生
alertmanager.yml文件配置；

如下配置介绍alertmanager推送邮件告警、微信告警：

//全局变量
global:
  resolve_timeout: 5m
  smtp_from: altermanager@mail.cn
  smtp_auth_username: altermanager@mail.cn
  smtp_auth_password: xxxxxxxx
  smtp_require_tls: false
  smtp_smarthost: smtp.exmail.qq.com:25
  wechat_api_url: 'https://qyapi.weixin.qq.com/cgi-bin/'
  
//告警通知内容模版，没有配置就默认使用alertmanager原生模块
templates:
  - '/usr/local/alertmanager/template/wechat.tmpl'
  - 
//告警过滤规则
route:
  group_by: ['alertname']
  //需要等待至少group_wait时间来初始化通知
  group_wait: 10s
  //当第一个报警发送后，等待'group_interval'时间来发送新的一组报警信息
  group_interval: 10s
  //如果一个报警信息已经发送成功了，等待'repeat_interval'时间来重新发送他们
  repeat_interval: 1h
  //默认的receiver：如果一个报警没有被一个route匹配，则发送给默认的接收器
  receiver: 'admin.mail'
  routes:
  //配置规则发送给那个告警通知接收组名
  - receiver: dev.mail
    //alertmanager告警规则的标签
    match:
      //匹配app_name等于dev_pro的告警
      app_name: dev_pro
  - receiver: test.mail
    match:
      app_name: test_pro

//告警发送规则
receivers:
  //告警通知接收组名
  - name: 'dev.mail'
    email_configs:
    - to: dev@mail.cn,person1@mail.cn,person2@mail.cn
      //告警恢复后否发送通知
      send_resolved: true
  - name: 'test.mail'
    email_configs:
    - to: test@mail.cn,person3@mail.cn,person4@mail.cn
      send_resolved: true
  //配置企业微信，其他方式都类似，篇幅有限不挨个介绍
  - name: 'admin.mail'
    //演示同时配置多个告警接收渠道
    email_configs:
    - to: admin@mail.cn
    //企业微信
    wechat_configs:
    //企业id，在企业的配置页面可以看到
    - corp_id: 'xxxxid'
      //template文件中配置的 define名称
      message: '{{ template "wechat.default.message" . }}'
      to_party: '@all'
      //应用的AgentId，在应用的配置页面可以看到
      agent_id: '9527'
      //应用的secret，在应用的配置页面可以看到
      api_secret: 'BKjfJoTSjsm7MiO7KjHimHxIn5iiILJ_I7IVDtvtoC9'
      send_resolved: true

template 模版文件介绍，以wechat.tmpl文件配置如下：

{{ define "wechat.default.message" }}
{{ if gt (len .Alerts.Firing) 0 -}}
Alerts Firing:
{{ range .Alerts }}
告警环境：PRD
告警级别：{{ .Labels.severity }}
告警类型：{{ .Labels.alertname }}
告警实例：{{ .Labels.instance }}
告警详情: {{ .Annotations.summary }}
//触发时间: {{ .StartsAt.Format "2000-01-01 11:01:01" }}
=========
{{- end }}
{{- end }}
{{ if gt (len .Alerts.Resolved) 0 -}}
Alerts Resolved:
{{ range .Alerts }}
恢复环境：PRD
恢复级别：{{ .Labels.severity }}
恢复类型：{{ .Labels.alertname }}
恢复实例：{{ .Labels.instance }}
恢复详情: {{ .Annotations.summary }}
触发时间: {{ .StartsAt.Format "22000-01-01 11:01:01" }}
//恢复时间: {{ .EndsAt.Format "2000-01-01 11:01:01" }}
=========
{{- end }}
{{- end }}
{{- end }}

5.3. Alertmanager webhook 推送dingding

官方参考：https://github.com/timonwong/prometheus-webhook-dingtalk
alertmanager只做告警推送，会抑制所有告警，不会触发告警通知，达到告警又自定义的告警中心过滤处理；
alertmanager搭建方式7.1一致，唯一不同的就是alertmanager.yml 配置文件，替换alertmanager.yml webhook推送配置，重启alertmanager服务即可：
首先搭建并运行dingtalk，默认port 8060可以通过–web.listen-address=xxx指定

cd /usr/local
wget https://github.com/timonwong/prometheus-webhook-dingtalk/releases/download/v1.4.0/prometheus-webhook-dingtalk-1.4.0.linux-amd64.tar.gz
tar zxvf prometheus-webhook-dingtalk-1.4.0.linux-amd64.tar.gz
mv prometheus-webhook-dingtalk-1.4.0 prometheus-webhook-dingtalk

创建systemctl服务prometheus-webhook-dingtalk

cat  >> /usr/lib/systemd/system/prometheus-webhook-dingtalk.service <<'EOF'
[Unit]
Description=prometheus-webhook-dingtalk
After=network.target

[Service]
Type=simple
User=prometheus
ExecStart=/usr/local/dingtalk/prometheus-webhook-dingtalk --ding.profile="webhook=https://oapi.dingtalk.com/robot/send?access_token=your dingding token"
Restart=on-failure

[Install]
WantedBy=multi-user.target
EOF

运行systemctl启动prometheus-webhook-dingtalk

//加载配置
systemctl daemon-reload
//加入的开机自启
systemctl enable prometheus-webhook-dingtalk
systemctl start prometheus-webhook-dingtalk
systemctl status prometheus-webhook-dingtalk

#查看系统日志，比较详细
journalctl -u prometheus-webhook-dingtalk -f

alertmanager webhook推送告警至钉钉机器人yml配置

global:
  //在没有报警的情况下声明为已解决的时间
  resolve_timeout: 5m
  
route:
  group_by: ['alertname']
  //需要等待至少group_wait时间来初始化通知
  group_wait: 1m
  //当第一个报警发送后，等待'group_interval'时间来发送新的一组报警信息
  group_interval: 10m
  //如果一个报警信息已经发送成功了，等待'repeat_interval'时间来重新发送他们
  repeat_interval: 4h
  //默认的receiver：如果一个报警没有被一个route匹配，则发送给默认的接收器
  receiver: 'web.hook'
receivers:
//接收receiver配置信息
- name: 'web.hook'
  webhook_configs:
  //prometheus-webhook-dingtalk启动url，其中webhook为--ding.profile指定的名称
  - url: 'http://localhost:8060/dingtalk/webhook/send'
    send_resolved: true
//inhibit_rules是告警的抑制规则
inhibit_rules:
  - source_match:
      severity: 'critical'
    target_match:
      severity: 'warning'
    //抑制由'alertname', 'type'的告警，不出发告警通知
    equal: ['alertname', 'type']

6. Consul注册中心搭建

7. Grafana搭建

8. Grafana Dashboar配置详解

9. FAQ

有疑问的可以评论，尽可能及时回复

你可能感兴趣的:(#,prometheus,监控体系)

从零开始搭建Zabbix监控系统：安装配置全攻略，轻松掌握企业级监控利器磐基Stack专业服务团队 Zabbix zabbix adb
#作者：stackofumbrella文章目录前提安装及配置开始安装设置mysql编码开始安装查询是否启动成功编译安装zabbix前提selinux关闭#vim/etc/selinux/configSELINUX=disabled#setenforce0关闭防火墙#systemctlstopfirewalldyum安装mysql检查系统是否安装其他版本的MYSQL#yumlistinstalled
智能任务管理工具：提升团队协作与项目执行力的利器团队协作工具
智能任务管理工具是一类能够自动化处理任务分配、进度跟踪、团队协作等任务管理活动的软件。这类工具通常利用先进的算法和人工智能技术，帮助用户更高效地完成项目管理、日常任务规划等工作。以下是一些知名的智能任务管理工具及其特点：一、板栗看板●简介：一款智能驱动的高效任务管理工具，通过AI系统分析用户任务数据，自动设定任务优先级，并提供实时进度监控和智能任务分配功能。特点：○AI智能判断任务优先级，提高任务
教培机构的核心竞争力：项目管理如何赋能教学与运营？团队协作工具
教培机构项目管理教培机构项目管理是指通过科学的管理方法和工具，对教育培训机构的各项活动进行规划、组织、实施和监控，以确保教学目标的高效达成和机构的可持续发展。以下是教培机构项目管理的核心内容及实施策略：一、项目管理的核心内容课程设计与开发○需求分析：通过市场调研、家长反馈和学生评估，明确课程需求，确定教学目标。○课程规划：根据学生的年龄特点和学习能力，设计系统化、层次化的课程体系。○资源整合：结合
自然语言处理系列（5）——情感分析的原理与实战 DoYangTan 自然语言处理人工智能
自然语言处理系列（5）——情感分析的原理与实战情感分析（SentimentAnalysis）是自然语言处理中的一项经典任务，目的是通过分析文本，判断其表达的情感倾向性。情感分析广泛应用于社交媒体监控、市场调研、客户服务等领域，帮助企业和机构快速了解用户的情感态度。在本文中，我们将深入探讨情感分析的基本概念、常用方法，并展示如何使用Python和现代NLP工具实现情感分析任务。1.情感分析的基本概念
Java中字符流和字节流的区别刘小炮吖i Java后端开发面试题 Java java 开发语言
相同点在Java的I/O体系中，字节流和字符流都配备了缓冲机制的实现类，以此显著提升数据读写的效率。字符流：借助BufferedReader和BufferedWriter，它们在处理字符数据时，会将数据先缓存起来，减少与底层数据源或目标的交互次数，从而加速操作。例如，当逐行读取大文本文件时，BufferedReader的缓冲功能能避免频繁的磁盘I/O操作。字节流：BufferedInputStre
【目录】PMP项目管理—基础认知篇—十五至尊图洛北辰南 PMP PMP 项目管理目录
笔者已经3A通过PMP考试，近期抽空会把上网课记录的笔记腾到博客中，以此文为目录链接全部内容，欢迎订阅关注。已整理完成基础认知篇、整合管理篇。持续更新中…知识领域启动过程组规划过程组执行过程组监控过程组收尾过程组项目整合管理4.1制定项目章程4.2制定项目管理计划4.3指导和管理项目工作4.4管理项目知识4.5监控项目工作4.6实施整体变更控制4.7结束项目或阶段项目范围管理5.1规划范围管理5.
游戏开放经济系统的部分思考 ArimaMisaki 大数据人工智能
游戏内的经济系统设计确实与现实中的宏观经济调控有相似逻辑，而现实中的对抗“非法经济组织”（如黑市、洗钱集团、垄断企业）的策略，经过适当改造后可以迁移到游戏内对抗工作室。下文是具体对比与可借鉴方案:一、现实中的“工作室”类比与应对手段1.打击非法金融活动（类比游戏内黑市交易）现实手段：央行监控大额资金流动（如反洗钱系统）。对异常账户冻结调查（如频繁跨行转账、多账户资金归集）。游戏借鉴：交易链路追踪：
第14天：C++异常处理实战指南 - 构建安全的文件解析系统 JuicyActiveGilbert C++教程 c++安全开发语言
第14天：C++异常处理实战指南-构建安全的文件解析系统一、今日学习目标掌握C++异常处理的核心语法与流程️理解RAII在资源管理中的关键作用创建自定义文件解析异常体系实现安全的文件解析器原型二、C++异常处理核心机制1.异常处理基础语法#include#include#includevoidparseConfiguration(conststd::string&path){std::ifstre
基于STM32的无人机自主导航与避障系统 STM32发烧友 stm32 无人机嵌入式硬件
目录引言环境准备2.1硬件准备2.2软件准备无人机自主导航与避障系统基础3.1控制系统架构3.2功能描述代码实现：实现无人机自主导航与避障系统4.1数据采集模块4.2数据处理与控制算法4.3通信与远程监控实现4.4用户界面与数据可视化应用场景：无人机智能化与任务执行问题解决方案与优化收尾与总结1.引言无人机自主导航与避障技术是无人机系统实现智能化和高效任务执行的核心功能。基于STM32微控制器，该
【spug】使用勤不了一点 CI/CD python django ci/cd 运维 devops
目录简介下载与安装初始化配置启动与日志版本更新登录与使用工作台主机管理批量执行配置中心应用发布系统管理监控与告警使用问题简介手动部署|Spugwalle的升级版本轻量级无Agent主机管理主机批量执行主机在线终端文件在线上传下载应用发布部署在线任务计划配置中心监控报警如果有测试错误请指出。下载与安装测试环境：Python3.7.8CentOSLinuxrelease7.4.1708(Core)sp
《Spring Boot + MySQL高性能应用实战：性能优化技巧与最佳实践》扣丁梦想家 Spring spring boot mysql 后端
目录应用性能优化概述环境搭建与技术栈选择数据库设计优化SpringBoot与MySQL集成优化4.1使用JPA/Hibernate的性能优化4.2连接池的配置与优化4.3分页与查询优化MySQL性能优化5.1索引优化5.2查询缓存与慢查询分析应用性能监控与日志总结与最佳实践应用性能优化概述在高性能应用的构建过程中，我们不仅需要关注数据库性能，还要从以下几个方面进行优化：数据库设计优化：合理设计表结
java面试知识点总结-sql篇 weixin_42677025 面试职场和发展 sql 数据库后端 java
年底了，准备离职换工作了，在做面试准备时，发现自己的知识体系太零散，理论知识储备匮乏，之前也没有特别系统的去进行梳理，正好趁这次机会梳理一下知识体系，一方面为面试做准备，另一方面后续工作中设计到相关知识点时可以迅速定位到相关知识点，总结中会夹杂着面试问题或者知识点在工作中的实际应用。sql索引创建时，创建字段顺序对查询速度有影响吗？有关系，索引本身是一个排序的列表，存储这索引值和数据所在行的物理地
A股散户情绪综合评估指标探讨 @半良人 AI交易分析 python
文章目录一在A股市场中，虽然没有单一指标能完美衡量散户的看空或看多情绪，但可以通过多维度数据组合构建一个综合评估体系。1.融资融券余额（散户参与度）2.散户资金流向（小额交易监测）3.投资者情绪指数（调查与行为数据）4.市场活跃度指标5.社交媒体与搜索数据6.技术指标辅助二作为散户，在资源有限的情况下，可以通过更简化且易获取的指标结合行为策略来捕捉市场情绪，以下提供一套可行性较高的实操方案：一、简
无住之境：“灵魂“概念的消解与超越 109702008 杂谈人工智能
引言在《金刚经》的般若智慧中，"应无所住而生其心"犹如划破无明的闪电，揭示了超越一切执着的修行真谛。当现代人试图用"灵魂"概念解读这句话时，实则触及了佛教哲学最深层的认知革命。本文将深入剖析佛教"无住"智慧与"灵魂"概念的深刻对峙，揭示其背后完整的哲学体系。一、佛教认知革命：对灵魂实体的解构五蕴和合论的解剖刀佛教以"色受想行识"五蕴理论，将所谓灵魂解构为动态的意识流。就像拆解钟表发现没有"钟表灵魂
大模型替代程序猿？不可能，绝对不可能！进化路线来了来！！！ XiaoDuofCSDN 算法 leetcode 职场和发展 java 分布式深度学习神经网络
大模型后端开发面试指南：技术体系构建与实践路线一、背景说明随着大模型（LLM）技术进入工业化落地阶段，行业对大模型后端开发工程师的需求呈现爆发式增长。该岗位要求候选人不仅需要掌握传统分布式系统开发能力，还需深入理解大模型特有的计算范式。本文针对零基础转型场景，提供体系化的能力建设方案。二、核心目标建立大模型后端开发技术认知图谱构建可验证的工程项目实践体系形成持续跟踪技术演进的方法论三、持续关注的核
十、大数据资源平台功能架构 moton2017 大数据治理大数据大数据治理数据资产数据管理元数据架构数据资源
一、大数据资源平台的功能架构图总体结构大数据资源平台功能架构图关键组件：1.用户（顶行）此部分标识与平台交互的各种利益相关者。其中包括：市领导各部门分析师区政府外部组织公民开发人员运营经理2.功能模块（顶部水平部分）这些代表平台的主要功能区域：门户（Portal）：用户访问平台的入口。开放中心（开放中心）：方便数据共享和访问。共享中心（共享中心）：管理数据共享和协作。运营中心：监控和管理平台的运营
计算机网络压缩版编码的凯文 409 计算机网络
计算机网络到现在零零散散也算过了三遍，一些协议大概了解，但总是模模糊糊的印象，现在把自己的整体认识总结一下，（本来想去起名叫《看这一篇就够了》，但是发现网上好的文章太多了，还是看这篇吧），作为非通信或对网络有特殊要求的专业，理解到这应该也基本足够了。整体结构目前主流的分类模型是五层体系结构，分别为1，应用层，负责主机内报文对应应用的分发，如邮件SMTP，文件共享服务FTP和浏览器的超文本传输协议H
算力革新引领数字中国智能跃迁智能计算研究中心其他
内容概要算力作为数字经济的核心驱动力，正通过架构创新与场景融合加速重构技术生态。当前算力体系呈现三大演进方向：异构计算突破传统芯片性能瓶颈，实现CPU、GPU、FPGA等多元架构的协同调度；边缘计算推动工业设备、物联网终端等场景的实时响应能力提升，形成“云-边-端”三级计算网络；量子计算则在加密通信、药物研发等领域展现颠覆性潜力，其物理比特操控精度已达实用化临界点。技术方向核心特征典型应用场景异构
【openCV-89】人脸检测华东算法王华东算法王-opencv opencv 人工智能计算机视觉
人脸检测简介人脸检测是计算机视觉中的一个重要任务，旨在从图像或视频中识别并定位出人脸的位置。人脸检测不仅是人脸识别、表情分析、面部特征点检测等高级任务的前置步骤，而且在安防监控、智能家居、自动驾驶等多个领域都具有广泛应用。人脸检测的目标人脸检测的目标是从输入的图像或视频流中自动检测出所有人脸的区域，通常用矩形框（boundingbox）表示人脸的位置。人脸检测不仅要识别图像中的人脸，还要在各种条件
【数据仓库】指标管理数据仓库
一、指标介绍什么是指标？指标就是用来量化事物的一个工具，帮助我们去将一些抽象的事件得出一个轮廓上的描述。例如我们可以从指标上判断一个产品的好坏，用户粘性等等，例如我们通过日活能去判断出我们整个产品的用户量，从而能反应出我们这个产品的一个健康程度。那么数据仓库中，建立指标体系有以下几点核心意义：统一数据口径，消除歧义（各部门对指标定义不统一）支撑业务决策，提升效率（监控业务健康度）优化资源分配，成本
Python自动化运维实战，怎么构建分布式质量监控平台好知识传播者 Python实例开发实战运维 python 自动化分布式质量监控平台 linux
注意：本文的下载教程，与以下文章的思路有相同点，也有不同点，最终目标只是让读者从多维度去熟练掌握本知识点。下载教程：Python自动化运维项目开发实战_构建分布式质量监控平台_编程案例解析实例课程教程.pdf一、引言随着企业业务的不断扩展和复杂化，系统运维面临着越来越多的挑战。传统的运维方式已经无法满足现代企业的需求，因此，自动化运维成为了企业提升运维效率、保障系统稳定性的重要手段。在自动化运维中
Python工厂模式封装Webhook群聊机器人忆想不到的晖 python 机器人开发语言 webhook 飞书钉钉
引言企业存在给特定群组自动推送消息的需求，比如：监控报警推送、销售线索推送、运营内容推送等。你可以在群聊中添加一个自定义机器人，通过服务端调用webhook地址，即可将外部系统的通知消息即时推送到群聊中。飞书自定义机器人使用指南：https://open.feishu.cn/document/ukTMukTMukTM/ucTM5YjL3ETO24yNxkjN钉钉自定义机器人使用指南：https:/
IaaS、PaaS、SaaS是什么；算力共享商业模式；吸纳零散算力，提供高价值网络连接，促使算力流通；以SRv6 SID为抓手，构建算网SaaS生态运营体系 ZhangJiQun&MXP 2024大模型以及算力 2021 论文教学人工智能网络算法
目录IaaS、PaaS、SaaS是什么1.IaaS（基础设施即服务）2.PaaS（平台即服务）3.SaaS（软件即服务）算力共享商业模式云网融合，助力“东数西算”工程吸纳零散算力，提供高价值网络连接，促使算力流通以SRv6SID为抓手，构建算网SaaS生态运营体系IaaS、PaaS、SaaS是什么IaaS（InfrastructureasaService，基础设施即服务）、PaaS（Platfor
分布式服务监控点滴~ 分布式
目录分布式服务监控CAT（CentralApplicationTracking）监控对象和指标分布式服务监控分布式服务监控在保障分布式系统稳定运行中至关重要，通过各类监控组件对关键指标进行监测，能及时发现并解决问题。下面将从监控组件、其优缺点、监控指标及其作用展开介绍。监控组件Prometheus：一个开源的系统监控和报警工具包。它采用拉取式采集数据，支持多种数据采集方式，如直接采集应用程序暴露的
Linux--DNS 域名解析服务 lwww20 linux 运维服务器
目录一、DNS解析1.1DNS定义及作用1.2DNS服务器的分布1.3DNS使用的协议及端口号1.4DNS服务器平时可用地址1.5、DNS服务器类型1.6查询方式（两种）1.7域名代理商二、域名2.1域名体系结构图三、DNS域名解析过程3.1正向解析过程四、Bind服务器端配置文件4.1DNS服务搭建4.2DNS主从服务器及自动同步4.3DNS分离解析实验一、DNS解析1.1DNS定义及作用DNS
【Java 面试八股文】Spring Cloud 篇落啦啦 java java 面试 spring cloud
SpringCloud篇1.SpringCloud5大组件有哪些？2.服务注册和发现是什么意思？SpringCloud如何实现服务注册发现？3.我看你之前也用过nacos，你能说下nacos与eureka的区别？4.你们项目负载均衡如何实现的？5.Ribbon负载均衡策略有哪些？6.如果想自定义负载均衡策略如何实现？7.什么是服务雪崩，怎么解决这个问题？8.你们的微服务是怎么监控的？9.你们项目中
爬虫获取阿里巴巴 item_search 接口：根据关键字获取在售商品数据 Jelena15779585792 孔夫子API 爬虫
在电商领域，快速准确地获取商品信息对于市场分析、选品策略、库存管理以及价格监控等场景至关重要。阿里巴巴开放平台提供的item_search接口允许开发者通过关键字搜索在售商品，并获取相关商品的详细信息。本文将详细介绍如何使用爬虫技术调用item_search接口，获取在售商品数据，并提供完整的开发指南和代码示例。一、接口概述item_search是阿里巴巴开放平台提供的一个API接口，允许开发者通
基于 Python 开发分布式任务调度系统案例剖析 tekin Python网络编程 python 分布式分布式任务调度系统
基于Python开发分布式任务调度系统案例剖析本文深入探讨基于Python开发分布式任务调度系统的案例。详细阐述系统架构设计，涵盖任务分配、节点管理、任务执行监控等核心模块。通过代码示例展示关键功能实现，如任务队列管理、节点通信等，为开发者提供分布式系统开发的实践参考。文章目录基于Python开发分布式任务调度系统案例剖析一、项目背景与目标二、技术选型三、系统架构设计四、关键功能实现利用`cele
什么是项目库管理项目管理
项目库管理是指对所有项目进行集中管理、监控和优化的一种方法。项目库管理的核心目的是通过建立一个统一的管理平台，将所有项目进行合理的分类、排序和资源调配，以确保项目组合的最大化价值和效益。项目库管理不仅帮助组织实现项目的标准化和规范化管理，还能够优化资源分配，提高决策效率，并减少项目风险。其中，项目优先级排序、资源配置优化和风险评估是项目库管理的关键组成部分。本文将详细介绍项目库管理的概念、意义及实
DeepSeek全栈接入指南：从零到生产环境的深度实践量子纠缠BUG DeepSeek部署 AI DeepSeek 人工智能深度学习机器学习
第一章：DeepSeek技术体系全景解析1.1认知DeepSeek技术生态DeepSeek作为新一代人工智能技术平台，构建了覆盖算法开发、模型训练、服务部署的全链路技术栈。其核心能力体现在：1.1.1多模态智能引擎自然语言处理：支持文本生成（NLG）、语义理解（NLU）、情感分析等计算机视觉：提供图像分类、目标检测、OCR识别等CV能力语音交互：包含语音识别（ASR）、语音合成（TTS）及声纹识别
分享100个最新免费的高匿HTTP代理IP mcj8089 代理IP 代理服务器匿名代理免费代理IP 最新代理IP
推荐两个代理IP网站： 1. 全网代理IP：http://proxy.goubanjia.com/ 2. 敲代码免费IP：http://ip.qiaodm.com/ 120.198.243.130:80,中国/广东省 58.251.78.71:8088,中国/广东省 183.207.228.22:83,中国/
mysql高级特性之数据分区 annan211 java 数据结构 mongodb 分区 mysql
mysql高级特性 1 以存储引擎的角度分析，分区表和物理表没有区别。是按照一定的规则将数据分别存储的逻辑设计。器底层是由多个物理字表组成。 2 分区的原理分区表由多个相关的底层表实现，这些底层表也是由句柄对象表示，所以我们可以直接访问各个分区。存储引擎管理分区的各个底层表和管理普通表一样(所有底层表都必须使用相同的存储引擎)，分区表的索引只是
JS采用正则表达式简单获取URL地址栏参数 chiangfai js 地址栏参数获取
GetUrlParam:function GetUrlParam(param){ var reg = new RegExp("(^|&)"+ param +"=([^&]*)(&|$)"); var r = window.location.search.substr(1).match(reg); if(r!=null
怎样将数据表拷贝到powerdesigner (本地数据库表) Array_06 powerDesigner
================================================== 1、打开PowerDesigner12，在菜单中按照如下方式进行操作 file->Reverse Engineer->DataBase 点击后，弹出 New Physical Data Model 的对话框 2、在General选项卡中 Model name:模板名字，自
logbackのhelloworld 飞翔的马甲日志 logback
一、概述 1.日志是啥？当我是个逗比的时候我是这么理解的：log.debug()代替了system.out.print(); 当我项目工作时，以为是一堆得.log文件。这两天项目发布新版本，比较轻松，决定好好地研究下日志以及logback。传送门1：日志的作用与方法： http://www.infoq.com/cn/articles/why-and-how-log 上面的作
新浪微博爬虫模拟登陆随意而生新浪微博
转载自：http://hi.baidu.com/erliang20088/item/251db4b040b8ce58ba0e1235 近来由于毕设需要，重新修改了新浪微博爬虫废了不少劲，希望下边的总结能够帮助后来的同学们。现行版的模拟登陆与以前相比，最大的改动在于cookie获取时候的模拟url的请求
synchronized 香水浓 java thread
Java语言的关键字，可用来给对象和方法或者代码块加锁，当它锁定一个方法或者一个代码块的时候，同一时刻最多只有一个线程执行这段代码。当两个并发线程访问同一个对象object中的这个加锁同步代码块时，一个时间内只能有一个线程得到执行。另一个线程必须等待当前线程执行完这个代码块以后才能执行该代码块。然而，当一个线程访问object的一个加锁代码块时，另一个线程仍然
maven 简单实用教程 AdyZhang maven
1. Maven介绍 1.1. 简介 java编写的用于构建系统的自动化工具。目前版本是2.0.9，注意maven2和maven1有很大区别，阅读第三方文档时需要区分版本。 1.2. Maven资源见官方网站；The 5 minute test，官方简易入门文档；Getting Started Tutorial，官方入门文档；Build Coo
Android 通过 intent传值获得null aijuans android
我在通过intent 获得传递兑现过的时候报错，空指针,我是getMap方法进行传值，代码如下 1 2 3 4 5 6 7 8 9 public void getMap(View view){ Intent i =
apache 做代理报如下错误：The proxy server received an invalid response from an upstream baalwolf response
网站配置是apache＋tomcat,tomcat没有报错，apache报错是： The proxy server received an invalid response from an upstream server. The proxy server could not handle the request GET /. Reason: Error reading fr
Tomcat6 内存和线程配置 BigBird2012 tomcat6
1、修改启动时内存参数、并指定JVM时区（在windows server 2008 下时间少了8个小时）在Tomcat上运行j2ee项目代码时，经常会出现内存溢出的情况，解决办法是在系统参数中增加系统参数： window下，在catalina.bat最前面 set JAVA_OPTS=-XX:PermSize=64M -XX:MaxPermSize=128m -Xms5
Karam与TDD bijian1013 Karam TDD
一.TDD 测试驱动开发（Test-Driven Development,TDD）是一种敏捷（AGILE）开发方法论，它把开发流程倒转了过来，在进行代码实现之前，首先保证编写测试用例，从而用测试来驱动开发（而不是把测试作为一项验证工具来使用）。 TDD的原则很简单： a.只有当某个
[Zookeeper学习笔记之七]Zookeeper源代码分析之Zookeeper.States bit1129 zookeeper
public enum States { CONNECTING, //Zookeeper服务器不可用，客户端处于尝试链接状态 ASSOCIATING, //？？？ CONNECTED, //链接建立，可以与Zookeeper服务器正常通信 CONNECTEDREADONLY, //处于只读状态的链接状态，只读模式可以在
【Scala十四】Scala核心八：闭包 bit1129 scala
Free variable A free variable of an expression is a variable that’s used inside the expression but not defined inside the expression. For instance, in the function literal expression (x: Int) => (x
android发送json并解析返回json ronin47 android
package com.http.test; import org.apache.http.HttpResponse; import org.apache.http.HttpStatus; import org.apache.http.client.HttpClient; import org.apache.http.client.methods.HttpGet; import
一份IT实习生的总结 brotherlamp PHP php资料 php教程 php培训 php视频
今天突然发现在不知不觉中自己已经实习了 3 个月了，现在可能不算是真正意义上的实习吧，因为现在自己才大三，在这边撸代码的同时还要考虑到学校的功课跟期末考试。让我震惊的是，我完全想不到在这 3 个月里我到底学到了什么，这是一件多么悲催的事情啊。同时我对我应该 get 到什么新技能也很迷茫。所以今晚还是总结下把，让自己在接下来的实习生活有更加明确的方向。最后感谢工作室给我们几个人这个机会让我们提前出来
据说是2012年10月人人网校招的一道笔试题-给出一个重物重量为X,另外提供的小砝码重量分别为1，3，9。。。3^N。将重物放到天平左侧，问在两边如何添加砝码 bylijinnan java
public class ScalesBalance { /** * 题目： * 给出一个重物重量为X,另外提供的小砝码重量分别为1，3，9。。。3^N。（假设N无限大，但一种重量的砝码只有一个） * 将重物放到天平左侧，问在两边如何添加砝码使两边平衡 * * 分析： * 三进制 * 我们约定括号表示里面的数是三进制，例如 47=(1202
dom4j最常用最简单的方法 chiangfai dom4j
要使用dom4j读写XML文档,需要先下载dom4j包,dom4j官方网站在 http://www.dom4j.org/目前最新dom4j包下载地址:http://nchc.dl.sourceforge.net/sourceforge/dom4j/dom4j-1.6.1.zip 解开后有两个包,仅操作XML文档的话把dom4j-1.6.1.jar加入工程就可以了,如果需要使用XPath的话还需要
简单HBase笔记 chenchao051 hbase
一、Client-side write buffer 客户端缓存请求描述：可以缓存客户端的请求，以此来减少RPC的次数，但是缓存只是被存在一个ArrayList中，所以多线程访问时不安全的。可以使用getWriteBuffer()方法来取得客户端缓存中的数据。默认关闭。二、Scan的Caching 描述： next( )方法请求一行就要使用一次RPC,即使
mysqldump导出时出现when doing LOCK TABLES daizj mysql mysqdump 导数据
　　执行　mysqldump -uxxx -pxxx -hxxx -Pxxxx database tablename > tablename.sql　导出表时，会报 mysqldump: Got error: 1044: Access denied for user 'xxx'@'xxx' to database 'xxx' when doing LOCK TABLES 解决
CSS渲染原理 dcj3sjt126com Web
从事Web前端开发的人都与CSS打交道很多，有的人也许不知道css是怎么去工作的，写出来的css浏览器是怎么样去解析的呢？当这个成为我们提高css水平的一个瓶颈时，是否应该多了解一下呢？一、浏览器的发展与CSS
《阿甘正传》台词 dcj3sjt126com
Part Ⅰ: 《阿甘正传》Forrest Gump经典中英文对白 Forrest: Hello! My names Forrest. Forrest Gump. You wanna Chocolate? I could eat about a million and a half othese. My momma always said life was like a box ochocol
Java处理JSON dyy_gusi json
Json在数据传输中很好用，原因是JSON 比 XML 更小、更快，更易解析。在Java程序中，如何使用处理JSON，现在有很多工具可以处理，比较流行常用的是google的gson和alibaba的fastjson，具体使用如下： 1、读取json然后处理 class ReadJSON { public static void main(String[] args)
win7下nginx和php的配置 geeksun nginx
1. 安装包准备 nginx : 从nginx.org下载nginx-1.8.0.zip php：从php.net下载php-5.6.10-Win32-VC11-x64.zip， php是免安装文件。 RunHiddenConsole: 用于隐藏命令行窗口 2. 配置 # java用8080端口做应用服务器，nginx反向代理到这个端口即可 p
基于2.8版本redis配置文件中文解释 hongtoushizi redis
转载自： http://wangwei007.blog.51cto.com/68019/1548167 在Redis中直接启动redis-server服务时, 采用的是默认的配置文件。采用redis-server xxx.conf 这样的方式可以按照指定的配置文件来运行Redis服务。下面是Redis2.8.9的配置文
第五章常用Lua开发库3-模板渲染 jinnianshilongnian nginx lua
动态web网页开发是Web开发中一个常见的场景，比如像京东商品详情页，其页面逻辑是非常复杂的，需要使用模板技术来实现。而Lua中也有许多模板引擎，如目前我在使用的lua-resty-template，可以渲染很复杂的页面，借助LuaJIT其性能也是可以接受的。如果学习过JavaEE中的servlet和JSP的话，应该知道JSP模板最终会被翻译成Servlet来执行；而lua-r
JZSearch大数据搜索引擎颠覆者 JavaScript
系统简介：大数据的特点有四个层面：第一，数据体量巨大。从TB级别，跃升到PB级别；第二，数据类型繁多。网络日志、视频、图片、地理位置信息等等。第三，价值密度低。以视频为例，连续不间断监控过程中，可能有用的数据仅仅有一两秒。第四，处理速度快。最后这一点也是和传统的数据挖掘技术有着本质的不同。业界将其归纳为4个“V”——Volume，Variety，Value，Velocity。大数据搜索引
10招让你成为杰出的Java程序员 pda158 java 编程框架
如果你是一个热衷于技术的 Java 程序员，那么下面的 10 个要点可以让你在众多 Java 开发人员中脱颖而出。　　 1. 拥有扎实的基础和深刻理解 OO 原则　　对于 Java 程序员，深刻理解 Object Oriented Programming（面向对象编程）这一概念是必须的。没有 OOPS 的坚实基础，就领会不了像 Java 这些面向对象编程语言
tomcat之oracle连接池配置小网客 oracle
tomcat版本7.0 配置oracle连接池方式：修改tomcat的server.xml配置文件： <GlobalNamingResources> <Resource name="utermdatasource" auth="Container" type="javax.sql.DataSou
Oracle 分页算法汇总 vipbooks oracle sql 算法 .net
这是我找到的一些关于Oracle分页的算法，大家那里还有没有其他好的算法没？我们大家一起分享一下！ -- Oracle 分页算法一 select * from ( select page.*,rownum rn from (select * from help) page -- 20 = (currentPag