从零开始运维之旅:如何监控你的 Windows?

小弟乃刚刚踏入运维圈的资深小白一枚,正所谓完事开头难,公司里怕我把生产系统搞坏就让我先在测试环境上先练练手。巧的是测试环境又是我熟悉的 Windows 环境,心中窃喜啊。但问题随之而来,运维从何下手呢。

同事正巧解囊相助,告诉我可以先从监控开始多了解下系统的性能参数等数据。这时有一种拨开云雾见光明的感觉啊,哈哈。

不过选择什么来监控呢。向大神们用的 Zabbix 和 Nagios 这等开源神器我这入门小弟暂时也不会用啊。思来想去先上网上找找看有没有什么别的工具可以快速简单入门的 。

探索之旅就这样从百度开始了,功夫不负有心人,我搜到这么一篇文章 “可能是监控 Windows 最简单的产品-Cloud Insight”。从文章中看,这个工具可能会对我这种小白用户入门有些帮助。不管怎样先试用下吧反正先用一台机子试试也不花钱。点开他们的官网先注册个账号。

首先来说安装还是比较简单的只需要下载一个安装包安装下就OK了。

整个安装过程也就是下一步就搞定了,在安装这快我就不炫技了,截一个安装完后的图片。根据他们的介绍监控服务器是需要在本地主机上装一个探针的,所以会有一个 Agent Manager 。

一起搞定后,就上界面上开始点点吧。怎么说呢整体风格还好吧,对 Windows 的一些基本指标还是能抓取出来的,对初级用户还是比较有帮助的吧。

探索之旅到这里也就先告一段落吧,总结下,运维的第一步总算是迈出去了,对这个工具的感觉是,可圈可点,它的功能还是挺多的,还有啥玩法需要更深入的研究,看到他们的文档里说,提供 API 和 SDK 功能,可以接入各种数据进行展示,比如监控北京空气质量什么的,这些功能我还没有尝试,不过他们做的文档还是真心点个赞。

特别好的一点是,可以对机器用 tag 进行分组管理,如果是后期对大规模集群进行监控,应该很有用,在一篇文章里看到他们的拓扑图,对机器、平台分组进行展示,蛮有意思的哈。

对我来说特别有用的功能应该是——报警,平时工作内容比较杂,通过自定义报警可以免去很多不必要的劳动,比如之前需要不定时去看看数据什么的。

好了就先总结到这吧,以后有什么运维上的心得体会再跟大家分享,互相学习!

本文授权转载自于哲博客。

本文转自 OneAPM 官方博客

你可能感兴趣的:(告警,运维,监控工具)