背景是这样的,有一次我的服务器突然挂掉了,是由于cpu占用过高,但是我又不知道是哪个进程造成的。于是便想找一个监控工具来监控我的机器,我希望这个工具足够简单,没有复杂的配置,开箱即用,能够监控到当cpu负载过高时,发生的时间以及当时是什么进程造成这样的问题。很可惜,我并没有找到这样的工具(若有这样方便的工具请告知我),但我实在不想因此而给服务器上一套很重的监控系统。于是乎,我决定自己写一个工具。思路如下:

  1. 每隔一段时间就查看cpu占用率,当超过了设置的百分比,就触发记录;
  2. 调用top命令,按照cpu占用率从高到低排列,将输出记录到文件中,文件以时间命令;
  3. 程序能后台运行。

针对第一点,我用了一个库:github.com/shirou/gopsutil,里面有关于cpu使用率以及内存使用率的相关方法,比较简单。

代码如下:

func visor() {
    for {
        per, _ := cpu.Percent(time.Duration(config.GetConfig().Interval)*time.Second, false)
        if per[0] > config.GetConfig().AlterLimit {
            record(per[0])
        }
    }
}

func record(per float64) {
    now := time.Now().Format("2006-01-02-15-04-05")
    logFile := config.GetConfig().SnapPath + now + ".log"
    f, _ := os.Create(logFile)
    defer f.Close()

    f.Write([]byte{'\n'})
    f.Write([]byte("此时cpu占用率:" + strconv.FormatFloat(per, 'f', 10, 64)))
    f.Write([]byte{'\n'})
    topCmd := exec.Command("top", "-H", "-n", "1", "-b")
    topOutput, _ := topCmd.Output()
    f.Write(topOutput)
}

使用方法示例如下:

# 后台启动
visor -start -config=./config/config.yaml -d
# 结束进程
visor -stop

完整代码请见:https://github.com/TomatoMr/visor。


欢迎关注我的公众号:onepunchgo,给我留言。

image