13260130504

Open-Falcon V0.2.1（or&grafana）+OneAlert

```一、环境准备

安装redis&mysql
redis：4.0.
mysql：5.6.
wget http://mirrors.linuxeye.com/oneinstack.tar.gz
tar zxf oneinstack.tar.gz

初始化mysql表结构
cd /tmp/ && git clone https://github.com/open-falcon/falcon-plus.git
cd /tmp/falcon-plus/scripts/mysql/db_schema/
mysql -h 127.0.0.1 -u root -p < 1_uic-db-schema.sql
mysql -h 127.0.0.1 -u root -p < 2_portal-db-schema.sql
mysql -h 127.0.0.1 -u root -p < 3_dashboard-db-schema.sql
mysql -h 127.0.0.1 -u root -p < 4_graph-db-schema.sql
mysql -h 127.0.0.1 -u root -p < 5_alarms-db-schema.sql

下载编译好的https://github.com/open-falcon/falcon-plus/releases
open-falcon-v0.2.0.tar.gz二进制版本

创建工作目录
export FALCON_HOME=/home/work
export WORKSPACE=$FALCON_HOME/open-falcon
mkdir -p $WORKSPACE

解压二进制包
tar -xzvf open-falcon-v0.2.0.tar.gz -C $WORKSPACE

二、后端安装启动
注意：以下是配置文件讲解，需要改动的地方很少，直接在原来配置文件改即可，以下是常用的工具配置，并不是所有工具都需要，按需搭建即可
修改配置文件
Agent
vim agent/config/cfg.json

{
"debug": true, # 控制一些debug信息的输出，生产环境通常设置为false
"hostname": "", # agent采集了数据发给transfer，endpoint就设置为了hostname，默认通过hostname获取，如果配置中配置了hostname，就用配置中的
"ip": "", # agent与hbs心跳的时候会把自己的ip地址发给hbs，agent会自动探测本机ip，如果不想让agent自动探测，可以手工修改该配置
"plugin": {
"enabled": false, # 默认不开启插件机制
"dir": "./plugin", # 把放置插件脚本的git repo clone到这个目录
"git": "https://github.com/open-falcon/plugin.git", # 放置插件脚本的git repo地址
"logs": "./logs" # 插件执行的log，如果插件执行有问题，可以去这个目录看log
},
"heartbeat": {
"enabled": true, # 此处enabled要设置为true
"addr": "127.0.0.1:6030", # hbs的地址，端口是hbs的rpc端口
"interval": 60, # 心跳周期，单位是秒
"timeout": 1000 # 连接hbs的超时时间，单位是毫秒
},
"transfer": {
"enabled": true,
"addrs": [
"127.0.0.1:18433"
], # transfer的地址，端口是transfer的rpc端口, 可以支持写多个transfer的地址，agent会保证HA
"interval": 60, # 采集周期，单位是秒，即agent一分钟采集一次数据发给transfer
"timeout": 1000 # 连接transfer的超时时间，单位是毫秒
},
"http": {
"enabled": true, # 是否要监听http端口
"listen": ":1988",
"backdoor": false
},
"collector": {
"ifacePrefix": ["eth", "em"], # 默认配置只会采集网卡名称前缀是eth、em的网卡流量，配置为空就会采集所有的，lo的也会采集。可以从/proc/net/dev看到各个网卡的流量信息
"mountPoint": []
},
"default_tags": {
},
"ignore": { # 默认采集了200多个metric，可以通过ignore设置为不采集
"cpu.busy": true,
"df.bytes.free": true,
"df.bytes.total": true,
"df.bytes.used": true,
"df.bytes.used.percent": true,
"df.inodes.total": true,
"df.inodes.free": true,
"df.inodes.used": true,
"df.inodes.used.percent": true,
"mem.memtotal": true,
"mem.memused": true,
"mem.memused.percent": true,
"mem.memfree": true,
"mem.swaptotal": true,
"mem.swapused": true,
"mem.swapfree": true
}
}

Transfer

vim transfer/config/cfg.json
debug: true/false, 如果为true，日志中会打印debug信息

minStep: 30, 允许上报的数据最小间隔，默认为30秒

http
    - enabled: true/false, 表示是否开启该http端口，该端口为控制端口，主要用来对transfer发送控制命令、统计命令、debug命令等
    - listen: 表示监听的http端口

rpc
    - enabled: true/false, 表示是否开启该jsonrpc数据接收端口, Agent发送数据使用的就是该端口
    - listen: 表示监听的http端口

socket #即将被废弃,请避免使用
    - enabled: true/false, 表示是否开启该telnet方式的数据接收端口，这是为了方便用户一行行的发送数据给transfer
    - listen: 表示监听的http端口

judge
    - enabled: true/false, 表示是否开启向judge发送数据
    - batch: 数据转发的批量大小，可以加快发送速度，建议保持默认值
    - connTimeout: 单位是毫秒，与后端建立连接的超时时间，可以根据网络质量微调，建议保持默认
    - callTimeout: 单位是毫秒，发送数据给后端的超时时间，可以根据网络质量微调，建议保持默认
    - pingMethod: 后端提供的ping接口，用来探测连接是否可用，必须保持默认
    - maxConns: 连接池相关配置，最大连接数，建议保持默认
    - maxIdle: 连接池相关配置，最大空闲连接数，建议保持默认
    - replicas: 这是一致性hash算法需要的节点副本数量，建议不要变更，保持默认即可
    - cluster: key-value形式的字典，表示后端的judge列表，其中key代表后端judge名字，value代表的是具体的ip:port

graph
    - enabled: true/false, 表示是否开启向graph发送数据
    - batch: 数据转发的批量大小，可以加快发送速度，建议保持默认值
    - connTimeout: 单位是毫秒，与后端建立连接的超时时间，可以根据网络质量微调，建议保持默认
    - callTimeout: 单位是毫秒，发送数据给后端的超时时间，可以根据网络质量微调，建议保持默认
    - pingMethod: 后端提供的ping接口，用来探测连接是否可用，必须保持默认
    - maxConns: 连接池相关配置，最大连接数，建议保持默认
    - maxIdle: 连接池相关配置，最大空闲连接数，建议保持默认
    - replicas: 这是一致性hash算法需要的节点副本数量，建议不要变更，保持默认即可
    - cluster: key-value形式的字典，表示后端的graph列表，其中key代表后端graph名字，value代表的是具体的ip:port(多个地址用逗号隔开, transfer会将同一份数据发送至各个地址，利用这个特性可以实现数据的多重备份)

tsdb
    - enabled: true/false, 表示是否开启向open tsdb发送数据
    - batch: 数据转发的批量大小，可以加快发送速度
    - connTimeout: 单位是毫秒，与后端建立连接的超时时间，可以根据网络质量微调，建议保持默认
    - callTimeout: 单位是毫秒，发送数据给后端的超时时间，可以根据网络质量微调，建议保持默认
    - maxConns: 连接池相关配置，最大连接数，建议保持默认
    - maxIdle: 连接池相关配置，最大空闲连接数，建议保持默认
    - retry: 连接后端的重试次数和发送数据的重试次数
    - address: tsdb地址或者tsdb集群vip地址, 通过tcp连接tsdb

Graph
{
"debug": false, //true or false, 是否开启debug日志
"http": {
"enabled": true, //true or false, 表示是否开启该http端口，该端口为控制端口，主要用来对graph发送控制命令、统计命令、debug命令
"listen": "0.0.0.0:6071" //表示监听的http端口
},
"rpc": {
"enabled": true, //true or false, 表示是否开启该rpc端口，该端口为数据接收端口
"listen": "0.0.0.0:6070" //表示监听的rpc端口
},
"rrd": {
"storage": "./data/6070" // 历史数据的文件存储路径（如有必要，请修改为合适的路）
},
"db": {
"dsn": "root:@tcp(127.0.0.1:3306)/graph?loc=Local&parseTime=true", //MySQL的连接信息，默认用户名是root，密码为空，host为127.0.0.1，database为graph（如有必要，请修改)
"maxIdle": 4 //MySQL连接池配置，连接池允许的最大连接数，保持默认即可
},
"callTimeout": 5000, //RPC调用超时时间，单位ms
"migrate": { //扩容graph时历史数据自动迁移
"enabled": false, //true or false, 表示graph是否处于数据迁移状态
"concurrency": 2, //数据迁移时的并发连接数，建议保持默认
"replicas": 500, //这是一致性hash算法需要的节点副本数量，建议不要变更，保持默认即可（必须和transfer的配置中保持一致）
"cluster": { //未扩容前老的graph实例列表
"graph-00" : "127.0.0.1:6070"
}
}
}
API
{
"log_level": "debug",
"db": { //数据库相关的连接配置信息
"faclon_portal": "root:@tcp(127.0.0.1:3306)/falcon_portal?charset=utf8&parseTime=True&loc=Local",
"graph": "root:@tcp(127.0.0.1:3306)/graph?charset=utf8&parseTime=True&loc=Local",
"uic": "root:@tcp(127.0.0.1:3306)/uic?charset=utf8&parseTime=True&loc=Local",
"dashboard": "root:@tcp(127.0.0.1:3306)/dashboard?charset=utf8&parseTime=True&loc=Local",
"alarms": "root:@tcp(127.0.0.1:3306)/alarms?charset=utf8&parseTime=True&loc=Local",
"db_bug": true
},
"graphs": { // graph模块的部署列表信息
"cluster": {
"graph-00": "127.0.0.1:6070"
},
"max_conns": 100,
"max_idle": 100,
"conn_timeout": 1000,
"call_timeout": 5000,
"numberOfReplicas": 500
},
"metric_list_file": "./api/data/metric",
"web_port": ":8080", // http监听端口
"access_control": true, // 如果设置为false，那么任何用户都可以具备管理员权限
"salt": "pleaseinputwhichyouareusingnow", //数据库加密密码的时候的salt
"skip_auth": false, //如果设置为true，那么访问api就不需要经过认证
"default_token": "default-token-used-in-server-side", //用于服务端各模块间的访问授权
"gen_doc": false,
"gen_doc_path": "doc/module.html"
}
HBS(Heartbeat Server)
{
"debug": true,
"database": "root:password@tcp(127.0.0.1:3306)/falcon_portal?loc=Local&parseTime=true", # Portal的数据库地址
"hosts": "", # portal数据库中有个host表，如果表中数据是从其他系统同步过来的，此处配置为sync，否则就维持默认，留空即可
"maxIdle": 100,
"listen": ":6030", # hbs监听的rpc地址
"trustable": [""],
"http": {
"enabled": true,
"listen": "0.0.0.0:6031" # hbs监听的http地址
}
}
Judge
{
"debug": true,
"debugHost": "nil",
"remain": 11,
"http": {
"enabled": true,
"listen": "0.0.0.0:6081"
},
"rpc": {
"enabled": true,
"listen": "0.0.0.0:6080"
},
"hbs": {
"servers": ["127.0.0.1:6030"], # hbs最好放到lvs vip后面，所以此处最好配置为vip:port
"timeout": 300,
"interval": 60
},
"alarm": {
"enabled": true,
"minInterval": 300, # 连续两个报警之间至少相隔的秒数，维持默认即可
"queuePattern": "event:p%v",
"redis": {
"dsn": "127.0.0.1:6379", # 与alarm、sender使用一个redis
"maxIdle": 5,
"connTimeout": 5000,
"readTimeout": 5000,
"writeTimeout": 5000
}
}
}
Alarm
{
"log_level": "debug",
"http": {
"enabled": true,
"listen": "0.0.0.0:9912"
},
"redis": {
"addr": "127.0.0.1:6379",
"maxIdle": 5,
"highQueues": [
"event:p0",
"event:p1",
"event:p2"
],
"lowQueues": [
"event:p3",
"event:p4",
"event:p5",
"event:p6"
],
"userIMQueue": "/queue/user/im",
"userSmsQueue": "/queue/user/sms",
"userMailQueue": "/queue/user/mail"
},
"api": {
"im": "http://127.0.0.1:10086/wechat", //微信发送网关地址
"sms": "http://127.0.0.1:10086/sms", //短信发送网关地址
"mail": "http://127.0.0.1:10086/mail", //邮件发送网关地址
"dashboard": "http://127.0.0.1:8081", //dashboard模块的运行地址
"plus_api":"http://127.0.0.1:8080", //falcon-plus api模块的运行地址
"plus_api_token": "default-token-used-in-server-side" //用于和falcon-plus api模块服务端之间的通信认证token
},
"falcon_portal": {
"addr": "root:@tcp(127.0.0.1:3306)/alarms?charset=utf8&loc=Asia%2FChongqing",
"idle": 10,
"max": 100
},
"worker": {
"im": 10,
"sms": 10,
"mail": 50
},
"housekeeper": {
"event_retention_days": 7, //报警历史信息的保留天数
"event_delete_batch": 100
}
}
Task
debug: true/false, 如果为true，日志中会打印debug信息

http

enable: true/false, 表示是否开启该http端口，该端口为控制端口，主要用来对task发送控制命令、统计命令、debug命令等
listen: 表示http-server监听的端口

index

enable: true/false, 表示是否开启索引更新任务
dsn: 索引服务的MySQL的连接信息，默认用户名是root，密码为空，host为127.0.0.1，database为graph（如有必要，请修改）
maxIdle: MySQL连接池配置，连接池允许的最大空闲连接数，保持默认即可
cluster: 后端graph索引更新的定时任务描述。一条记录的形如: "graph地址:执行周期描述"，通过设置不同的执行周期，来实现负载在时间上的均衡。
eg. 后端部署了两个graph实例，cluster可以配置为
"cluster":{
"test.hostname01:6071" : "0 0 0 ? 0-5", //周0-5,每天的00:00:00,开始执行索引全量更新;"0 0 0 ? 0-5"为quartz表达式
"test.hostname02:6071" : "0 30 0 ? * 0-5", //周0-5,每天的00:30:00,开始执行索引全量更新
}
autoDelete: true|false, 是否自动删除垃圾索引。默认为false

collector

enable: true/false, 表示是否开启falcon的自身状态采集任务
destUrl: 监控数据的push地址,默认为本机的1988接口
srcUrlFmt: 监控数据采集的url格式, %s将由机器名或域名替换
cluster: falcon后端服务列表，用具体的"module,hostname:port"表示，module取值可以为graph、transfer、task等

Nodata
{
"debug": true,
"http": {
"enabled": true,
"listen": "0.0.0.0:6090"
},
"plus_api":{
"connectTimeout": 500,
"requestTimeout": 2000,
"addr": "http://127.0.0.1:8080", #falcon-plus api模块的运行地址
"token": "default-token-used-in-server-side" #用于和falcon-plus api模块的交互认证token
},
"config": {
"enabled": true,
"dsn": "root:@tcp(127.0.0.1:3306)/falcon_portal?loc=Local&parseTime=true&wait_timeout=604800",
"maxIdle": 4
},
"collector":{
"enabled": true,
"batch": 200,
"concurrent": 10
},
"sender":{
"enabled": true,
"connectTimeout": 500,
"requestTimeout": 2000,
"transferAddr": "127.0.0.1:6060", #transfer的http监听地址,一般形如"domain.transfer.service:6060"
"batch": 500
}
}
Aggregator
{
"debug": true,
"http": {
"enabled": true,
"listen": "0.0.0.0:6055"
},
"database": {
"addr": "root:@tcp(127.0.0.1:3306)/falcon_portal?loc=Local&parseTime=true",
"idle": 10,
"ids": [1, -1],
"interval": 55
},
"api": {
"connect_timeout": 500,
"request_timeout": 2000,
"plus_api": "http://127.0.0.1:8080", #falcon-plus api模块的运行地址
"plus_api_token": "default-token-used-in-server-side", #和falcon-plus api 模块交互的认证token
"push_api": "http://127.0.0.1:1988/v1/push" #push数据的http接口，这是agent提供的接口
}
}

Agent-updater
每台机器都要部署falcon-agent，如果公司机器量比较少，用pssh、ansible、fabric之类的工具手工安装问题也不大。但是公司机器量多了之后，手工安装、升级、回滚falcon-agent将成为噩梦。
个人开发了agent-updater这个工具，用于管理falcon-agent，agent-updater也有一个agent：ops-updater，可以看做是一个超级agent，用于管理其他agent的agent，呵呵，ops-updater推荐在装机的时候一起安装上。ops-updater通常是不会升级的。
具体参看：https://github.com/open-falcon/ops-updater

三、前端安装启动

克隆前端组件代码
cd $WORKSPACE
git clone https://github.com/open-falcon/dashboard.git

安装依赖包
yum install -y python-virtualenv
yum install -y python-devel
yum install -y openldap-devel
yum install -y mysql-devel
yum groupinstall "Development tools"
cd $WORKSPACE/dashboard/
virtualenv ./env
./env/bin/pip install -r pip_requirements.txt

修改配置文件
vim dashboard/rrd/config.py
启动
./control start

四、验证
浏览器输入192.168.100.227:8081（ip+端口）

点击sign up注册，第一个帐号名称为root的用户会被自动设置为超级管理员

五、grafana配置
注：这个只是好玩，安装不安装都行
下载安装包
wget https://s3-us-west-2.amazonaws.com/grafana-releases/release/grafana-4.2.0-1.x86_64.rpm
rpm -ivh grafana-4.2.0-1.x86_64.rpm
安装插件
grafana-cli plugins install fastweb-openfalcon-datasource
编辑grafana.ini配置文件
vim /etc/grafana.ini
添加
[plugin.openfalcon]
;path = /var/lib/grafana/plugins/fastweb-openfalcon-datasource
启动grafana
service grafana-server restart

验证
浏览器访问192.168.100.227：3000（ip+3000端口）
默认登录名admin 密码admin

这个只是随便玩，想玩高大上多搞

六、OneAlert
注：这个就比较实用了,主要是邮件+短信+电话报警，而且是免费的，可以集成zabbix，nagios，falcon等等等等主流监控，可以在手机端app及PC端处理报警，配置及管理一切，灰常实用。
打开onealert

1.添加应用
创建falcon应用,并获取appkey
2.添加falcon回调地址
登录open-falcon,选择template模块,点击你想要绑定OneAlert告警平台的template name.
注意：你可以一个template绑定一个appkey,也可以多个.这取决于你们的管理方式.
在回调地址中填写类似如下URL:
http://api.110monitor.com/alert/api/event/falcon/your_appkey
3.查看告警

4.，在「配置」->「应用」
模块添加新应用.选择「添加应用」后，您可以选择匹配的监控平台，系统会以向导的方式指引你完成配置
5选择「配置」->「分派策略」
您可以将不同的应用、不同级别、不同内容的告警分派给不同的人员。你也可以将团队成员根据角色划分不同级别，比如一线运维人员实时接收告警，二线测试开发人员接收升级（长时间未处理解决）后的告警。
6.选择「配置」->「通知策略」
您可以设置自己或团队成员用何种渠道接收告警，在何种时间、接收什么级别的告警。详细了解通知策略
7.您可以在点击右上角「用户名」->「邀请成员」
选择添加团队成员
8.可以用微信与app管理，并且可以排班，分组。

运维架构服务监控 Open-Falcon介绍、安装、监控MySQL、Redis、MongoDB、Rabbitmq、Nginx系列实战教程-史上最全纵然间 Linux Python SQL 运维架构
一、介绍监控系统是整个运维环节，乃至整个产品生命周期中最重要的一环，事前及时预警发现故障，事后提供翔实的数据用于追查定位问题。监控系统作为一个成熟的运维产品，业界有很多开源的实现可供选择。当公司刚刚起步，业务规模较小，运维团队也刚刚建立的初期，选择一款开源的监控系统，是一个省时省力，效率最高的方案。之后，随着业务规模的持续快速增长，监控的对象也越来越多，越来越复杂，监控系统的使用对象也从最初少数的
小白解说之Prometheus监控入门小白说互联网
大家好，我是小白。今天给大家讲解一下云原生界的监控扛把子普罗米修斯Prometheus。一、开源监控方案开源监控系统种类繁多，随着这么多年技术的革新，云计算大数据等技术的发展,目前还比较流行的是Prometheus、Nightingale、Open-falcon、Zabbix.大家感兴趣可以自行Google了解一下这些监控系统，我理解各有利弊吧，根据实际场合选择最合适的吧,总而言之，Prometh
【ZABBIX】zabbix实践中的总结（一）日近长安远 zabbix 数据库服务器 https 运维
文章目录一、学习zabbix二、对zabbix、open-falcon、prometheus的认识三、官方文档更新的一条命令的理解四、php-fpm五、面试题：请你详细介绍一下zabbix，说明它的架构和原理六、什么是时序数据库？七、进程和进程的通信方式有哪些？八、Socket九、zabbix采集的数据放在mysql的哪个表？十、采集数据的时间间隔越短越好还是越长越好？十一、可以支持多少个监控同时
详解 OneAlert 排班可以帮你做什么 OneAPM_Official
排班的存在，实质是通过有序安排，降低企业/团队人力成本，提升工作效率。阅读导航（预计2min）1.详解排班功能轮班机制工作时间双视图展示灵活调整2.利用排班如何助力运维团队排班策略让告警更精准分派到人PDCA戴明环优化排班策略3.总结1.详解排班功能轮班机制OneAlert分派功能已经解决了将某类告警分派给相关负责人的问题，但是并非所有企业/团队，单类告警的处理人只有1个，大部分企业是多人协作处理
开源监控服务一瞥：Prometheus、Grafana、Zabbix、Nagios、Icinga和Open-Falcon CodeArtisanX 开源监控
前言随着信息技术的发展，监控服务在维护系统稳定性和性能方面变得越来越重要。本文将比较一些流行的开源监控服务，以帮助你选择适合你需求的解决方案。监控服务对比监控服务特点优势不足性能扩展性安全性Prometheus-多维度数据模型-监控容器化环境的强大工具-需要单独设置存储后端-查询性能较高，适用于大规模环境-可通过分布式部署进行横向扩展-支持基于HTTPS的数据传输，提供基本认证-支持服务发现自动发
JVM——8.调优工具1(jstat) 你想要怎样的未来 jvm jvm实战 java java jvm jvm.gc java虚拟机
文章目录1.使用背景2.jstat的介绍及使用2.1jstat-gcPID介绍2.2其他的jstat命令2.3jstat-gcPID使用3.关注指标及计算分析3.1关注指标3.2计算分析1.使用背景一般来说，中大型公司都会有自己的应用监控系统，比如开源的Zabbix、Open-Falcon、Prometheus等，也可能一些公司自己实现了监控或者告警系统；这些系统可以监控所有在线上的各种应用的运行
滴滴夜莺：从监控告警系统向运维平台演化木讷大叔爱运维系统监控百宝箱夜莺监控运维平台
简述滴滴夜莺（Nightingale）是一款经过大规模生产环境验证的、分布式高性能的运维监控系统。基于Open-Falcon，结合滴滴内部的最佳实践，在性能、可维护性、易用性方面做了大量的改进，支撑了滴滴内部数十亿监控指标，覆盖了从系统、容器、到应用等各层面的监控需求。夜莺于2020年3月底开源至今，GitHubStar已突破2000，并且于9月底发布了最新的3.0版本。本次更新夜莺被拆成了四个子
滴滴(夜莺)Nightingale监控部署奈斯啊奈斯 linux 服务器监控类 falcon
Nightingale是一套衍生自Open-Falcon的互联网监控解决方案，融入了滴滴的最佳实践，由于改动太大，优化太多，产品上已经无法与Open-Falcon平滑兼容，故而单开一个项目。本文主要讲述滴滴Nightingale通过源码编译安装，喜欢的小伙伴可以访问https://n9e.didiyun.com/docs/了解更多关于Nightingale的介绍。1.关闭防火墙[root@loca
【夜莺(Flashcat)V6监控】4.采集器Categraf介绍虎眼豆丁夜莺（Flashcat）监控 github java 运维
简介Categraf是一个监控采集Agent，类似Telegraf、Grafana-Agent、Datadog-Agent，希望对所有常见监控对象提供监控数据采集能力，采用All-in-one的设计，不但支持指标采集，也希望支持日志和调用链路的数据采集。来自快猫研发团队，和Open-Falcon、Nightingale的研发是一拨人。categraf的代码托管在github：https://git
第28关 k8s监控实战之Prometheus(一) 博哥爱运维 kubernetes prometheus 容器 linux 云原生运维开发
------>课程视频同步分享在今日头条和B站大家好，我是博哥爱运维。对于运维开发人员来说，不管是哪个平台服务，监控都是非常关键重要的。在传统服务里面，我们通常会到zabbix、open-falcon、netdata来做服务的监控，但对于目前主流的K8s平台来说，由于服务pod会被调度到任何机器上运行，且pod挂掉后会被自动重启，并且我们也需要有更好的自动服务发现功能来实现服务报警的自动接入，实现
分布式下有哪些好用的监控组件？小小哭包分布式解决方案分布式监控组件
在之前的内容中，分析了分布式系统下的线上服务监控的常用指标，那么在实际开发中，如何收集各个监控指标呢？线上出现告警之后，又如何快速处理呢？本文我们就来看下这两个问题。常用监控组件目前分布式系统常用的监控组件主要有OpenFalcon、Nagios、Zabbix、CAT等，下面一起来看看这几款组件的应用及相关特性。好钢要用在刀刃上，由于各类监控组件的应用和配置更偏向基础运维，所以本课时的目的是希望你
open-falcon单机版--环境准备（银河麒麟V10） ahstudy 国产操作系统银河麒麟运维监控
1、安装redissudoaptinstallredis-server2、安装mysqlsudoapt-getinstallmysql-server3、安装gitsudoaptinstallgit4、下载数据库脚本并初始化数据库sudocd/tmp/&&gitclonehttps://github.com/open-falcon/falcon-plus.gitsudocd/tmp/falcon-p
监控系统看这一篇就够了！Zabbix、Prometheus等常见监控教程开源Linux zabbix prometheus 运维大数据
监控俗称「第三只眼」，几乎是我们每天都会打交道的系统，俗话说：无监控、不运维，监控的地位不言而喻，尤其是在运维自动化时代，传统运维、DevOps，亦或是SRE，监控都是一项必备的技能。我们先来认识一下主流的开源监控系统，Zabbix、Open-Falcon、Prometheus等，今天就简单介绍一下【Zabbix】【Prometheus】【Cacti】【Nagios】【Garafana】等5种主流
Open-falcon技术系列文章——安装部署open-falcon RobertTeacher 开源监控预警平台 open-falcon open-falcon 开源监控平台 docker mysql redis
Open-falcon技术系列文章——安装部署open-falcon安装部署open-falcon文章目录Open-falcon技术系列文章——安装部署open-falcon前言一、通过yum方式部署open-falcon1.环境准备1.1.安装redis1.2.安装mysql1.3.初始化mysql表结构1.4.下载编译好的二进制版本2.启动后端2.1.创建工作目录2.2.解压二进制包2.3.启
OpenFalcon源码分析(aggregator组件) Xiao_Yang
aggregator版本VERSION="0.0.4"aggregator组件功能集群聚合模块。聚合某集群下的所有机器的某个指标的值，提供一种集群视角的监控体验。aggregator组件逻辑图aggregator逻辑图aggregator配置操作配置指南aggregator配置1aggregator配置2aggregator配置3main入口函数分析funcmain(){cfg:=flag.Str
zabbix部署onealert云警告平台 Simonier
onealert告警功能告警AllInOne，支持微信、邮箱、短信、APP、电话告警支持接入Zabbix、Nagios、阿里云、腾讯云、监控宝等等告警信息灵活的分配策略，可灵活的分配告警信息发送给相关人员微信、邮箱、app等告警方式全部免费实验环境：首先保证虚拟机server1可以上网：server1:172.25.1.1企业7zabbix-server服务test1:172.25.1.11企业6
zabbix集成onealert报警、利用proxy分担server端压力 a939029674 个人作业
前言告警将重要信息发送给运维「或者其他相关人」，及时发现并且处理问题。在所有开源监控软件里面，Zabbix的告警方式无疑是最棒的。告警的方式各式各样，从Email告警到飞信、139/189邮箱、最后到微信甚至电话告警，接入存在各种问题以及困难，有没有什么软件能够将他们AllInone呢？OneAlert2.Zabbix传统告警方法Email：调用sendmail、sendEmail等脚本通过SMT
Linux监控平台，zabbix监控 chuangu7098 操作系统 php 开发工具
常见开源监控软件cacti、nagios、zabbix、smokeping、open-falcon等等cacti、smokeping偏向于基础监控，成图非常漂亮cacti、nagios、zabbix服务端监控中心，需要php环境支持，其中zabbix和cacti都需要mysql作为数据存储，nagios不用存储历史数据，注重服务或者监控项的状态，zabbix会获取服务或者监控项目的数据，会把数据记
Linux监控平台介绍、zabbix监控介绍、安装zabbix、忘记Admin密码如何做、主动模式和被动模式，添加监控主机、添加自定义模板、处理图形中的乱码、自动发现、添加自定义监控项目、配置邮件告警 xou6363
1、Linux监控平台介绍监控存在的原因：站点出了问题，没有人知道，等用户发现了，才提醒供应商；对公司影响很大常见的开源监控软件有：cacti、nagios、zabbix、smokeping、open-falcon等cacti、smokeping偏向于基础监控，成图非常漂亮，适合监控网络设备cacti、nagios、zabbix服务端监控中心，需要php环境支持（用Apache的php，用ngin
开源一款监控数据采集器，啥都能监控龙渊秦五
简介Categraf是一个监控采集Agent，类似Telegraf、Grafana-Agent、Datadog-Agent，希望对所有常见监控对象提供监控数据采集能力，采用All-in-one的设计，不但支持指标采集，也希望支持日志和调用链路的数据采集。来自快猫研发团队，和Open-Falcon、Nightingale的研发是一拨人。categraf的代码托管在两个地方：github：https:
Promethus(普罗米修斯）的Grafana+onealert实现报警功能南宫乘风 Prometheus监控 Grafana Promethus onealert 告警监控
1、Centos7安装Promethus(普罗米修斯）监控系统完整版2、Promethus(普罗米修斯）监控Mysql数据库3、Promethus(普罗米修斯）安装Grafana可视化图形工具4、Promethus的Grafana图形显示MySQL监控数据5、Promethus(普罗米修斯）的Grafana+onealert实现报警功能目录1、Centos7安装Promethus(普罗米修斯）监控
Promethus(普罗米修斯）监控Mysql数据库南宫乘风 Prometheus监控 mysql Promethus 监控
相关博文：1、Centos7安装Promethus(普罗米修斯）监控系统完整版2、Promethus(普罗米修斯）监控Mysql数据库3、Promethus(普罗米修斯）安装Grafana可视化图形工具4、Promethus的Grafana图形显示MySQL监控数据5、Promethus(普罗米修斯）的Grafana+onealert实现报警功能Promethus(普罗米修斯）监控Mysql数据库
Promethus(普罗米修斯）安装Grafana可视化图形工具南宫乘风 Prometheus监控 Grafana Promethus 监控
相关博文：1、Centos7安装Promethus(普罗米修斯）监控系统完整版2、Promethus(普罗米修斯）监控Mysql数据库3、Promethus(普罗米修斯）安装Grafana可视化图形工具4、Promethus的Grafana图形显示MySQL监控数据5、Promethus(普罗米修斯）的Grafana+onealert实现报警功能教程使用的软件：链接:https://pan.bai
Promethus的Grafana图形显示MySQL监控数据南宫乘风 Prometheus监控 Grafana Promethus mysql 监控
相关博文：1、Centos7安装Promethus(普罗米修斯）监控系统完整版2、Promethus(普罗米修斯）监控Mysql数据库3、Promethus(普罗米修斯）安装Grafana可视化图形工具4、Promethus的Grafana图形显示MySQL监控数据5、Promethus(普罗米修斯）的Grafana+onealert实现报警功能目录Grafana图形显示MySQL监控数据①在gr
n9e告警可高用的实现机制分析
n9e=nightingalen9e监控告警框架，提供了监控绘图、监控告警以及通知等一体的监控运维体系，在云原生时代，可以认为是Open-falcon的升级版。一.告警的数据流指标存储：使用push模式categraf采集后push给n9e-server；n9e-server将指标值push给时序库prometheus；指标告警：使用pull模式由n9e-server使用PromQL向promet
openfalcon 通过python查询mysql数据上报凯撒公猿
openfalcon通过python查询mysql数据上报思路主要是用python获取mysql数据，进行统计上报imagepython脚本python包需要自行通过pip安装#!-*-coding:utf8-*-##author:liuwenqi##date:2018-06-18importrequestsimporttimeimportjsonimportpymysqlfromdecimali
open-falcon架构介绍互联网中的一个咸鱼
open-falcon整体架构下图是open-falcon的整体架构，模块比较多，可以看完整篇文章介绍再回头看这个架构图。image简化版架构图简化的falcon基本工作流程可描述如下图所示：image下面就根据这个简化版流程图，介绍下open-falcon到底是怎么工作的。agent功能：数据采集上报，部署在每台物理机上。数据到底是什么样的？{'endpoint':hostname-of-mac
Prometheus+Grafana+Onealert Saka_2859
Prometheus(由go语言(golang)开发)是一套开源的监控&报警&时间序列数据库的组合。适合监控docker容器。基于时间序列的数值数据的容器监控解决方案。按照时间顺序记录系统、设备状态变化的数据被称为时序数据优势易于管理轻易获取服务内部状态高效灵活的查询语句支持本地和远程存储采用http协议，默认pull模式拉取数据，也可以通过中间网关push数据支持自动发现可扩展易集成grafan
open-falcon架构图例海水味儿
整理原理以及工作流程：1、app执行agent2、agent获取各种系统的监控项数值传给Transfer模块3、Transfer模块将整理过的监控项数值传给Judge模块进行告警判断4、Transfer模块将整理过的监控项数值传给Graph模块进行RRD数据文件存储5、Judge根据具体报警策略或阈值进行告警判断，如需告警，将告警event事件存储进redis队列。6、Alarm根据event事件
滴滴开源夜莺，新一代企业级监控解决方案！Open-Falcon 之后最新力作码农小光
来自公众号：GoCN，作者：滴滴技术导读：滴滴开源又双叒发布新开源项目啦——夜莺（Nightingale）是滴滴基础平台联合滴滴云研发和开源的企业级监控解决方案。旨在满足云原生时代企业级的监控需求。一起来了解项目详情吧。夜莺（Nightingale）是滴滴基础平台联合滴滴云研发和开源的企业级监控解决方案。旨在满足云原生时代企业级的监控需求。Nightingale在产品完成度、系统高可用、以及用户体
强大的销售团队背后竟然是大数据分析的身影蓝儿唯美数据分析
Mark Roberge是HubSpot的首席财务官，在招聘销售职位时使用了大量数据分析。但是科技并没有挤走直觉。大家都知道数理学家实际上已经渗透到了各行各业。这些热衷数据的人们通过处理数据理解商业流程的各个方面，以重组弱点，增强优势。 Mark Roberge是美国HubSpot公司的首席财务官，HubSpot公司在构架集客营销现象方面出过一份力——因此他也是一位数理学家。他使用数据分析
Haproxy+Keepalived高可用双机单活 bylijinnan 负载均衡 keepalived haproxy 高可用
我们的应用MyApp不支持集群，但要求双机单活（两台机器：master和slave）： 1.正常情况下，只有master启动MyApp并提供服务 2.当master发生故障时，slave自动启动本机的MyApp，同时虚拟IP漂移至slave，保持对外提供服务的IP和端口不变 F5据说也能满足上面的需求，但F5的通常用法都是双机双活，单活的话还没研究过服务器资源 10.7
eclipse编辑器中文乱码问题解决 0624chenhong eclipse乱码
使用Eclipse编辑文件经常出现中文乱码或者文件中有中文不能保存的问题，Eclipse提供了灵活的设置文件编码格式的选项，我们可以通过设置编码格式解决乱码问题。在Eclipse可以从几个层面设置编码格式：Workspace、Project、Content Type、File 本文以Eclipse 3.3（英文）为例加以说明： 1. 设置Workspace的编码格式： Windows-&g
基础篇--resources资源不懂事的小屁孩 android
最近一直在做java开发，偶尔敲点android代码，突然发现有些基础给忘记了，今天用半天时间温顾一下resources的资源。 String.xml 字符串资源涉及国际化问题 http://www.2cto.com/kf/201302/190394.html string-array
接上篇补上window平台自动上传证书文件的批处理问卷酷的飞上天空 window
@echo off : host=服务器证书域名或ip，需要和部署时服务器的域名或ip一致 ou=公司名称, o=公司名称 set host=localhost set ou=localhost set o=localhost set password=123456 set validity=3650 set salias=s
企业物联网大潮涌动：如何做好准备？蓝儿唯美企业
物联网的可能性也许是无限的。要找出架构师可以做好准备的领域然后利用日益连接的世界。尽管物联网（IoT）还很新，企业架构师现在也应该为一个连接更加紧密的未来做好计划，而不是跟上闸门被打开后的集成挑战。“问题不在于物联网正在进入哪些领域，而是哪些地方物联网没有在企业推进，” Gartner研究总监Mike Walker说。 Gartner预测到2020年物联网设备安装量将达260亿，这些设备在全
spring学习——数据库（mybatis持久化框架配置） a-john mybatis
Spring提供了一组数据访问框架，集成了多种数据访问技术。无论是JDBC，iBATIS(mybatis)还是Hibernate，Spring都能够帮助消除持久化代码中单调枯燥的数据访问逻辑。可以依赖Spring来处理底层的数据访问。 mybatis是一种Spring持久化框架，要使用mybatis，就要做好相应的配置： 1，配置数据源。有很多数据源可以选择，如：DBCP，JDBC，aliba
Java静态代理、动态代理实例 aijuans Java静态代理
采用Java代理模式，代理类通过调用委托类对象的方法，来提供特定的服务。委托类需要实现一个业务接口，代理类返回委托类的实例接口对象。按照代理类的创建时期，可以分为：静态代理和动态代理。所谓静态代理：　指程序员创建好代理类，编译时直接生成代理类的字节码文件。所谓动态代理：　在程序运行时，通过反射机制动态生成代理类。一、静态代理类实例： 1、Serivce.ja
Struts1与Struts2的12点区别 asia007 Struts1与Struts2
1) 在Action实现类方面的对比：Struts 1要求Action类继承一个抽象基类；Struts 1的一个具体问题是使用抽象类编程而不是接口。Struts 2 Action类可以实现一个Action接口，也可以实现其他接口，使可选和定制的服务成为可能。Struts 2提供一个ActionSupport基类去实现常用的接口。即使Action接口不是必须实现的，只有一个包含execute方法的P
初学者要多看看帮助文档不要用js来写Jquery的代码百合不是茶 jquery js
解析json数据的时候需要将解析的数据写到文本框中, 出现了用js来写Jquery代码的问题; 1, JQuery的赋值有问题代码如下: data.username 表示的是: 网易 $("#use
经理怎么和员工搞好关系和信任 bijian1013 团队项目管理管理
产品经理应该有坚实的专业基础，这里的基础包括产品方向和产品策略的把握，包括设计，也包括对技术的理解和见识，对运营和市场的敏感，以及良好的沟通和协作能力。换言之，既然是产品经理，整个产品的方方面面都应该能摸得出门道。这也不懂那也不懂，如何让人信服？如何让自己懂？就是不断学习，不仅仅从书本中，更从平时和各种角色的沟通
如何为rich:tree不同类型节点设置右键菜单 sunjing contextMenu tree Richfaces
组合使用target和targetSelector就可以啦，如下： <rich:tree id="ruleTree" value="#{treeAction.ruleTree}" var="node" nodeType="#{node.type}" selectionChangeListener=&qu
【Redis二】Redis2.8.17搭建主从复制环境 bit1129 redis
开始使用Redis2.8.17 Redis第一篇在Redis2.4.5上搭建主从复制环境，对它的主从复制的工作机制，真正的惊呆了。不知道Redis2.8.17的主从复制机制是怎样的，Redis到了2.4.5这个版本，主从复制还做成那样，Impossible is nothing! 本篇把主从复制环境再搭一遍看看效果，这次在Unbuntu上用官方支持的版本。 Ubuntu上安装Red
JSONObject转换JSON--将Date转换为指定格式白糖_ JSONObject
项目中，经常会用JSONObject插件将JavaBean或List<JavaBean>转换为JSON格式的字符串，而JavaBean的属性有时候会有java.util.Date这个类型的时间对象，这时JSONObject默认会将Date属性转换成这样的格式： {"nanos":0,"time":-27076233600000,
JavaScript语言精粹读书笔记 braveCS JavaScript
【经典用法】： //①定义新方法 Function .prototype.method=function(name, func){ this.prototype[name]=func; return this; } //②给Object增加一个create方法，这个方法创建一个使用原对
编程之美-找符合条件的整数用字符串来表示大整数避免溢出 bylijinnan 编程之美
import java.util.LinkedList; public class FindInteger { /** * 编程之美找符合条件的整数用字符串来表示大整数避免溢出 * 题目：任意给定一个正整数N，求一个最小的正整数M(M>1)，使得N*M的十进制表示形式里只含有1和0 * * 假设当前正在搜索由0，1组成的K位十进制数
读书笔记 chengxuyuancsdn 读书笔记
1、Struts访问资源 2、把静态参数传递给一个动作 3、<result>type属性 4、s:iterator、s:if c:forEach 5、StringBuilder和StringBuffer 6、spring配置拦截器 1、访问资源 (1)通过ServletActionContext对象和实现ServletContextAware,ServletReque
[通讯与电力]光网城市建设的一些问题 comsci 问题
信号防护的问题,前面已经说过了,这里要说光网交换机与市电保障的关系我们过去用的ADSL线路,因为是电话线,在小区和街道电力中断的情况下,只要在家里用笔记本电脑+蓄电池,连接ADSL,同样可以上网........
oracle 空间RESUMABLE daizj oracle 空间不足 RESUMABLE 错误挂起
空间RESUMABLE操作转 Oracle从9i开始引入这个功能，当出现空间不足等相关的错误时，Oracle可以不是马上返回错误信息，并回滚当前的操作，而是将操作挂起，直到挂起时间超过RESUMABLE TIMEOUT，或者空间不足的错误被解决。这一篇简单介绍空间RESUMABLE的例子。第一次碰到这个特性是在一次安装9i数据库的过程中，在利用D
重构第一次写的线程池 dieslrae 线程池 python
最近没有什么学习欲望,修改之前的线程池的计划一直搁置,这几天比较闲,还是做了一次重构,由之前的2个类拆分为现在的4个类. 1、首先是工作线程类:TaskThread,此类为一个工作线程,用于完成一个工作任务,提供等待(wait),继续(proceed),绑定任务(bindTask)等方法 #!/usr/bin/env python # -*- coding:utf8 -*-
C语言学习六指针 dcj3sjt126com c
初识指针，简单示例程序： /* 指针就是地址，地址就是指针地址就是内存单元的编号指针变量是存放地址的变量指针和指针变量是两个不同的概念但是要注意：通常我们叙述时会把指针变量简称为指针，实际它们含义并不一样 */ # include <stdio.h> int main(void) { int * p; // p是变量的名字， int *
yii2 beforeSave afterSave beforeDelete dcj3sjt126com delete
public function afterSave($insert, $changedAttributes) { parent::afterSave($insert, $changedAttributes); if($insert) { //这里是新增数据 } else { //这里是更新数据 } }
timertask shuizhaosi888 timertask
java.util.Timer timer = new java.util.Timer(true); // true 说明这个timer以daemon方式运行（优先级低， // 程序结束timer也自动结束），注意，javax.swing // 包中也有一个Timer类，如果import中用到swing包， // 要注意名字的冲突。 TimerTask task = new
Spring Security（13）——session管理 234390216 session Spring Security 攻击保护超时
session管理目录 1.1 检测session超时 1.2 concurrency-control 1.3 session 固定攻击保护
公司项目NODEJS实践0.3[ mongo / session ...] 逐行分析JS源代码 mongodb session nodejs
http://www.upopen.cn 一、前言书接上回，我们搭建了WEB服务端路由、模板等功能，完成了register 通过ajax与后端的通信，今天主要完成数据与mongodb的存取，实现注册 / 登录 /
pojo.vo.po.domain区别 LiaoJuncai java VO POJO javabean domain
　　POJO = "Plain Old Java Object"，是MartinFowler等发明的一个术语，用来表示普通的Java对象，不是JavaBean, EntityBean 或者 SessionBean。POJO不但当任何特殊的角色，也不实现任何特殊的Java框架的接口如，EJB， JDBC等等。　　　　即POJO是一个简单的普通的Java对象，它包含业务逻辑
Windows Error Code OhMyCC windows
0 操作成功完成. 1 功能错误. 2 系统找不到指定的文件. 3 系统找不到指定的路径. 4 系统无法打开文件. 5 拒绝访问. 6 句柄无效. 7 存储控制块被损坏. 8 存储空间不足, 无法处理此命令. 9 存储控制块地址无效. 10 环境错误. 11 试图加载格式错误的程序. 12 访问码无效. 13 数据无效. 14 存储器不足, 无法完成此操作. 15 系
在storm集群环境下发布Topology roadrunners 集群 storm topology spout bolt
storm的topology设计和开发就略过了。本章主要来说说如何在storm的集群环境中，通过storm的管理命令来发布和管理集群中的topology。 1、打包打包插件是使用maven提供的maven-shade-plugin，详细见maven-shade-plugin。 <plugin> <groupId>org.apache.maven.
为什么不允许代码里出现“魔数” tomcat_oracle java
　　在一个新项目中，我最先做的事情之一，就是建立使用诸如Checkstyle和Findbugs之类工具的准则。目的是制定一些代码规范，以及避免通过静态代码分析就能够检测到的bug。　　迟早会有人给出案例说这样太离谱了。其中的一个案例是Checkstyle的魔数检查。它会对任何没有定义常量就使用的数字字面量给出警告，除了-1、0、1和2。　　很多开发者在这个检查方面都有问题，这可以从结果
zoj 3511 Cake Robbery(线段树) 阿尔萨斯线段树
题目链接：zoj 3511 Cake Robbery 题目大意：就是有一个N边形的蛋糕，切M刀，从中挑选一块边数最多的，保证没有两条边重叠。解题思路：有多少个顶点即为有多少条边，所以直接按照切刀切掉点的个数排序，然后用线段树维护剩下的还有哪些点。 #include <cstdio> #include <cstring> #include <vector&

Open-Falcon V0.2.1（or&grafana）+OneAlert

你可能感兴趣的:(openfalcon,open-falcon,onealert)