阿里云安装企业监控 Grafana及linux 命令监控

image.png

要说监控工具 有多种,甚至linux 下的各种命令也足够 大家使用的
1、比如 查看 整体的资源占用 使用它 :top 命令

可以查看 系统中各个进程 所占用的 mem cpu pid 等 信息 ,此法 一般可以用来 查看 重点 占用cpu mem 的进程 ,有时候 查看 一些 病毒 木马 劫持资源 ,
比如现在 比特币盛行,需要大量的计算资源 ,所以 很多黑客 通过扫描 众多服务器 ,重点扫描一些 计算资源 庞大的服务器,一般 运作 hadoop spark docker 的服务器 都有 丰富的计算资源,
甚至 有大量的用户 直接使用 hadoop spark 作为 系统登录用户 ,这些高频的登录用户 会被黑客重点扫描,假如 密码 很简单 ,则被轻易攻破,然后 植入 wget 矿机挖矿 程序 ,这些 挖矿程序 是相当消耗资源 ,甚至 打满 cpu ,造成 系统服务无法正常运作,甚至宕机。因为经历过所以 会重点 排查 这些,需要注意的是 n 核cpu 的总使用 率 是 n*100%

2.查看 内存 消耗 使用 : free -m
这个会查看到当前 系统的 内存 信息 ,包括 总内存 使用内存 剩余内存 ,buffer 和cache 等信息 ,用来 排查 现在 系统的健康状态

3.查看 硬盘的使用信息 使用 df -h
这个会查看到 硬盘分区 中,每个分区的硬盘存储 总量 和使用及剩余和 挂载盘符
4.查看 文件夹的 存储 占用大小 du -h dirPath
这个需要制定 文件目录 ,可以指定 查看深度,可以通过 man du
还有 fdisk -l 查看 磁盘的挂载信息

5.查看 进程信息 ps -ef |grep 进程名
通过 此命令 可以查看具体的进程名对应的 进程号 和进程 目录
一般 查看 同一个进程 开启实例大概有几个,另外就是 杀掉进程 kill -9 或者重新 配置进程 kill-1,
另外 对于 一些 java 的服务 比如 hadoop spark hive Zeppelin 通过
jps 命令 查看 进程是否运行和对应的进程号 ,尤其注意 pid,如果 出现 pocess unvailable,这个表示 之前 已经死掉的进程 没有被清理掉。

6.通过网络 工具 查看 通信 连接和 网络端口 使用
使用 ping ip 或 hostname 【需要在本机 配置该 访问 hostname /etc/hosts,或 ipaddress
使用 nc -l portid ,查看 由其他主机 连接本主机 该端口的使用情况
http://blog.csdn.net/diabatic/article/details/46867447
重点是 查看 此端口是否被本机 某些进程占用或者 其他主机 连接该端口 的发送信息 是什么,其他主机是否可以通过该端口 连接此主机
这个在 其他册数主机 使用 telnet ip/hostname port ,开启连接尝试

还有就是 使用 netstat 这个可以查看 本机的内网ip ,和与外围 通信的ip 及端口 及使用协议
具体参数的使用 查看 man netstat
使用 ifconfig 查看 一些 本机 内网ip 和公网信息
另外 通过 history 命令 ,查看 往期命令执行列表,通过 排查 重点 陌生操作 确定是否有异常行为 ,判断是否被劫持。

另外 更全的 linux 监控 命令 查看 此
参考 http://os.51cto.com/art/201412/460698_all.htm,常用这些命令 必须会让你成为 linux 运维的 扛把子

以上这些 都是 linux 系统自带的 监控 工具 ,从 cpu mem disk net thread 等重点关注,可以让 服务器的运维 更 健康 更稳定 ,不过 人是懒惰的,总是在期待着一劳永逸的工具出现 ,下面介绍的就是

一些开源的 监控 工具
在 我们 调研的过程中 见到了 zabbix zinpkin nagios graphite InfluxDB Telegraf kibana Grafana
众多工具中 要说形象气质最好的就是 Grafana,各种丰富的插件 让其 可以 满足各种需求,恰恰也说明了 ,好的 工具 还要 有足够的可扩展性 ,并且是 允许 草根 扩展

安装 参考 http://www.jianshu.com/p/5eddf0f0ed64
http://www.jianshu.com/p/a21bf4462051
grafana https://grafana.com/grafana/download?platform=mac
官网的tutorial http://docs.grafana.org/installation/rpm/

另外 nagios 的官网 https://www.nagios.org/

使用 idea 提交 到 gitlab http://m.blog.csdn.net/zsq520520/article/details/51004721
http://blog.csdn.net/csdnxingyuntian/article/details/68491366

七牛的 日志监控 tutorial https://qiniu.github.io/pandora-docs/#/quickstart/grafana

安装 zabbix http://blog.csdn.net/u014057054/article/details/66476990
zabbix 官网 https://www.zabbix.com/download

你可能感兴趣的:(阿里云安装企业监控 Grafana及linux 命令监控)