接触监控步入监控工程师行业

     刚步入监控行业,对监控只有些初步的了解在此献丑了,目前主要做的工作利用工具对主机的CPU温度、磁盘容量、负载、交换路由的流量及其端口状态进行检测;及主机的相关服务如apache相对应的网站之类的服务,目前这套系统只能做到监控一些比较简单的服务状态对于java抛出的异常的相关监控暂时没有,目前正在更改公司自己的一套监控系统,据说可达到监控要求;监控手段分为两种一种是主动监控,一被动监控,监控完了之后还有一个重要的步骤画图用一画图工具把监控所获取的数据以图的形式直观的表现出来呈现给人观察;
   下面把三款工具nagios nasa rrdtool介绍下:来自百度百科的介绍

编辑词条NAGIOS

  Nagios® is a system and network monitoring application. It watches hosts and services that you specify, alerting you when things go bad and when they get better.
  Nagios® 是一个在linux及unix环境下运行的监控系统和网络的应用程序,它监控您所指定的主机和服务,并在情况变得更糟或更好时提醒您注意。
  Nagios was originally designed to run under Linux, although it should work under most other unices as well.
  Nagios 最初被设计成运行在 Linux 上的,虽然它也能在大多数其它系统中也能同样工作。
  Some of the many features of Nagios® include:
  Nagios 包括以下一些功能:
  Monitoring of network services (SMTP, POP3, HTTP, NNTP, PING, etc.)
  监控网络服务 (SMTP、POP3、HTTP、NNTP、PING 等)
  Monitoring of host resources (processor load, disk usage, etc.)
  监控主机资源(处理器负载、磁盘使用情况等)
  Simple plugin design that allows users to easily develop their own service checks
  简单的插件设计允许用户可以很简易地开发它们自己的服务检查
  Parallelized service checks
  并行服务检查
  Ability to define network host hierarchy using "parent" hosts, allowing detection of and distinction between hosts that are down and those that are unreachable
  可以通过 "parent" 来定义网络主机的继承,可以检测和区分主机的当机状态和不可达状态
  Contact notifications when service or host problems occur and get resolved (via email, pager, or user-defined method)
  在服务或主机产生问题和修复时获得通知(通过邮件、页面或用户定制的方式)
  Ability to define event handlers to be run during service or host events for proactive problem resolution
  可以在服务和主机事件运行期间定义事件处理器,以便主动解决问题。
  Automatic log file rotation
  日志文件自动循环
  Support for implementing redundant monitoring hosts
  支持冗馀监控主机的实现
  Optional web interface for viewing current network status, notification and problem history, log file, etc.
  可选的 Web 界面,该界面用于查看当前网络状态、通知和问题列表、日志文件等
 
 
 
 
  NASA
  

  National Aeronautics and Space Administration
   美国国家航空航天局的缩写,在中国大陆又被译作“ 美国宇航局”,标新立异的人又译作“美国航宇局”“美国国家航宇局”……港澳台同胞又常译作“美国太空总署”或“美国航太总署”。

编辑本段NASA介绍

  NASA全称美国国家航空航天局,台湾译作美国国家航空暨太空总署,港澳译作美国太空总署。是美国联邦政府的一个政府机构,负责美国的太空计划。1958年7月29日,艾森豪威尔总统签署了《美国公共法案85-568》(United States Public Law 85-568,即《美国国家航空暨太空法案》),创立了NASA。NASA是 世界上最大的民用航天机构。 1958年10月1日NASA正式成立。总部位于 华盛顿哥伦比亚特区。美国国家航空航天局的视野是 “改善这里的生命,把生命延伸到那里,在更远处找到别的生命”。美国国家航空航天局的目标是“理解并保护我们赖以生存的行星;探索宇宙,找到地球外的生命;启示我们的下一代去探索宇宙”。在太空计划之外,美国国家航空航天局还进行长期的民用以及军用航空宇宙研究。美国国家航空航天局被广泛认为是世界范围内太空机构的领头羊。当时所有国防部之下非军事火箭及太空计划在总统行政命令下一起归入NASA,包括正在进行的先锋计划和探险者计划,以及美国全部科学卫星计划。原国家航空咨询委员会(NACA)的3个实验室:兰利研究实验室、刘易斯研究实验室、艾姆斯研究实验室编入NASA,更名为兰利研究中心、刘易斯研究中心、艾姆斯研究中心。爱德华空军基地的飞行试验室改名为飞行研究中心,海军研究实验室有关先锋计划的部分划归NASA,在马里兰州组建了戈达德航天飞行研究中心。1960年6月接管冯・布劳恩领导的陆军弹道导弹局,在亨茨维尔组建马歇尔航天飞行中心负责大型运载火箭的研究计划。尔后NASA还相继调整、组建了 肯尼迪航天中心、 约翰逊航天中心、太空飞行器中心。今天,NASA已成为世界上所有航天和人类太空探险的 先锋。在太空计划之外,美国国家航空航天局还进行长期的民用以及军用航空太空研究。美国国家航空航天局被广泛认为是世界范围内太空机构的领头羊。

编辑本段研究课题

  1957年苏联第一颗人造地球 卫星上天后,美国组建了国家航空航天局,对发展美国的航空航天事业起了重大作用。美国国家航空航天局的研究课题内容广泛,以航天为主。在航空方面的研究课题主要有超声速技术 、飞机节能技术等 ;在航天方面主要配合几个大型工程,如 阿波罗工程、 天空实验室、 航天飞机等开展研究。它通过科研课题、合同、计划等形式与国防部、高等院校、工业企业的研究机构保持密切的关系。它下辖的研究中心和实验室有十几个,如 戈达德航天中心、肯尼迪航天中心、 喷气推进实验室等。但科研工作80%以上委托局外各单位进行处理。研究成果以NASA出版物形式发表。出版物有《技术报告》、《技术札记》、《合同户报告》、《技术备忘录》、《技术译文》、《特殊出版物》等。
  目前美国太空总署的年度预算为160亿 美元,总部位于华盛顿哥伦比亚特区。在太空计划之外,美国太空总署还进行长期的民用以及军用航空宇宙研究。美国国家航空航天局被广泛认为是世界范围内太空机构的领头羊。

编辑本段NASA从事的研究领域

  NASA从事的研究领域:航空学研究及探索,包括空间科学(太阳系探索、火星探索、月球探索、宇宙结构和环境),地球学研究(地球系统学、地球学的应用),生物物理研究,航空学(航空技术),并承担一定的培训计划。

编辑本段NASA的机构设置

  NASA的机构设置:NASA华盛顿指挥部为最高管理机构。下设埃姆斯研究中心(NASA-ARC)、 德莱顿飞行研究中心(NASA-DFRC)、格伦研究中心(NASA-GRC)、戈达德空间研究所(NASA-GISS)、戈达德航天飞行中心(NASA-GSFC)、独立认证与鉴定研究所(NASA-IVVF)、喷气推进实验室(NASA-JPL)、肯尼迪航天中心(NASA-KSC)、兰利研究中心(NASA-LRC)、马歇尔航空飞行中心(NASA-MSFC)、斯坦尼斯航天中心(NASA-SSC)、沃罗普飞行研究所(NASA-WFF)和白沙试验研究所(NASA-WST F)。

编辑本段NASA航天计划

  花样繁多的卫星计划
   水星计划
  双子座计划
   阿波罗计划
  天空 实验室
  航天飞机
   国际空间站 (与 俄罗斯、 加拿大、 欧洲、Rosaviakosmos以及 日本宇宙开发局合作)
   星座计划
 
 
 
 

编辑词条rrdtool

  一、简介
  RRDtool是由Tobias Oetiker 编写并由全球各地的许多人贡献的工具。本篇文档的作者是Alex van den Bogaerdt 主要是帮助你理解RRDtool是什么,它能够帮助你作些什么。 RRDtool的文档对于有些人来说过于技术化。本教程帮助你理解RRDtool的基本概念。它为你自学RRDtool的文档做好准备。本文档还重点介绍了网络统计方面的知识。
  1、RRDtool是什么东西?
  RRDtool是指Round Robin Database 工具(环状数据库)。Round robin是一种处理定量数据、以及当前元素指针的技术。想象一个周边标有点的圆环--这些点就是时间存储的位置。从圆心画一条到圆周的某个点的箭头--这就是指针。就像我们在一个圆环上一样,没有起点和终点,你可以一直往下走下去。过来一段时间,所有可用的位置都会被用过,该循环过程会自动重用原来的位置。这样,数据集不会增大,并且不需要维护。RRDtool处理RRD数据库。它用向RRD数据库存储数据、从RRD数据库中提取数据。
  2、RRD中可以存放什么样的数据?
  可以适合时间序列的数据。就是说你必须能够在时间的几个点上度量某些值,并提供这些信息给RRDtool。如果你能够做到这一点,RRDtool就能够存储它们。这些数值必须是数字,但是不一定要是整数,在与MRTG合用时。(下一节会给出更详细的介绍)。
  下面的例子是关于SNMP的,SNMP是简单网络过来协议的缩写。简单是指协议简单--并不表示管理或监视网络简单。读完本篇文档后,你应当能够对人们谈论的SNMP的东西有更多的理解。现在,只要知道SNMP可以用来查询设备中保持的计数器的值就可以了。我们要存放到RRD数据库中的正是这些计数器中的数值。
  3、RRDtool可以用来干什么?
  RRDtool源自MRTG(多路由器流量绘图器)。MRTG是有一个大学连接到互联网链路的使用率的小脚本开始的。MRTG后来被当作绘制其他数据源的工具使用,包括温度、速度、电压、输出量等等。
  很可能你会从使用RRDtool来存储和处理通过SNMP收集到的数据开始。这些数据很可能是某个网络或计算机接收或发送的字节数(比特数)。它也可以用来显示潮水的波浪、阳光射线、电力消耗、展会的参观人员、机场附近的噪音等级、你喜欢的度假区的温度、电冰箱的温度、以及任何你可以想象的东西。
  你最需要一个度量数据,以及能够提供这些数据给RRDtool的感应器就可以了。RRDtool会让你创建数据库、存储数据、提取数据、创建用于在Web浏览器中显示的PNG格式的图像。这些PNG图像以来于你收集的数据,它可以是网络平均使用率、峰值。
  4、问题探讨
  首先:再读一遍!你可能漏了某些地方。如果你无法编译源代码,而且你的操作系统相当普遍,很可能不是RRDtool的错误。互联网上有已经编译好的版本。如果来自可信赖的网站,就下载一个。
  另一种情况是程序能够工作,但是没有得到预期的结果,可能是配置方面的问题。检查你的配置,与后面例子的配置比较一下。
  RRDtool有一个邮件列表及其归档。读一下几周的列表并搜索归档。没有搜索过归档就提问是很粗鲁的做法:你遇到的问题可能已经由其他人解决了!尽管不是全部,大多数问题都会这样,邮件列表不是经济为了某个参与者服务的。看看RRDtool的文档了解邮件列表的位置和使用方法。
  我建议你马上就花点时间订阅邮件列表,只要发送一封主题为 subscribe 的邮件到 [email protected] 就可以了。如果要退定该邮件列表,只需要发送主题为 unsubscribe 到同样的地址即可。
  二、学习实例
  1、第一个RRD数据库
  在我看来,学习某个东西的最好办法就是实践。为什么现在不开始呢?我们会创建一个数据库,放一些数值到它里面,然后提取这些数据。你的输出应当与本文档中的输出是一样的。
  我们会从一些简单的入手,然后把汽车与路由器比较,或者将公里和比特、字节数比较。他们都是一样的:都是某些时段的某些数值。
  假设我们有一个向互联网发送数据和接收数据的设备。该设备保留一个计数器,该计数器在开启设备时设置为0,并在每传送一个字节就加1。该计数器可能会有一个最大值。如果该值达到最大时,在加一个字节的计数,该计数器就会再次从0开始。这与世界上的许多计数器都是一样的,比如车辆上的里程计数器。
  关于网络的讨论通常用每秒比特数来衡量,因此我们要习惯这种用法。把一个字节看成是8个比特,并且开始用比特而不是字节来思考问题。不过,计数器仍然用字节数为单位来计量!在SNMP世界里,大部分的计数器都是32比特的。这就意味着他们计数范围是0-4294967。我们在例子里会用到这些数值。该设备在被查询时,会返回计数器的当前值。我们知道从上次查询设备开始到现在的时间,因此我们现在就知道每秒 平均传输了多少字节数。这不难计算。首先用文字来描述,然后计算:
  用当前查询到的计数器值,减去上一次查询的计数器值
  把当前查询时间和上次查询时间作上述同样操作(秒)
  将(1)的结果除以(2)的结果,得到的结果就是每秒的字节数。乘以8就得到每秒的比特数(bps)
  实例一
  你现在正在开车。12:05时你看了一下仪表盘上的里程计数器,它显示这俩车已经行驶了12345公里。12:10分时,你有看了一下里程计数器,它显示 12357公里。这表示你在5分钟内行驶了12公里。科技人员会把它转换成米/秒,这样可以更好的进行比较(每5分钟的字节数)和(每秒比特数)。
  我们行驶了12公里,也就是12000米。我们在5分钟内,或者说是300秒内完成。我们的速度是1200米/300秒,或者说是40米/秒。
  我们可以用公里/小时来计算速度:12乘以5分钟就是一个小时,因此我们必须把12公里乘以12得到144公里/小时。对于和我一样说英语的朋友来说,就是90英里/小时,因此不要在家里或我生活的地方尝试这个速度 :)
  记住:这些数值都仅仅是平均值。如果无法从数字中得到你是否以固定的速度在行驶。本教程后面有一个例子说明这个问题。我希望你理解在计算米/秒或者比特/秒。唯一的差别在于收集数据的方式。即使是K这个单位也是一样的,因为在网络术语中,K同样表示1000。#p#分页标题#e#
  我们现在要创建一个数据库,在此数据库中我们能够保存所有这些有趣的数字。启动这个程序的方法可能在各个操作系统上各不相同,但是我假设你可以搞清楚它是否与你的操作系统不同,键入下面的行作为一个长长的行(为了可读性,我得把他分成几行)并且用 \ 来分割。
  rrdtool create test.rrd \
  --start 920804400 \
  DS:speed:COUNTER:600:U:U \
  RRA:AVERAGE:0.5:1:24 \
  RRA:AVERAGE:0.5:6:10
  2、创建了什么东西?
  我们创建的rrd数据库名为test (test.rrd),它的起始时间是我写这篇文档的当天下午,也就是1999年3月7日(该日期转换成920804400秒)。我们的数据库存放一个名为 ’speed’ 的数据源(DS),它表示一个计数器。该计数器每5分钟(缺省)读取一次。在同一个数据库中,保存有2个环状归档(RRA),一个是每次读取时的平均数据(例如:没有东西进行平均)并保留24个样本(24乘以5分钟是2小时)。另一个RRA有6个平均值(半小时)并包含10个这样的平均值(例如5个小时)。
  RRDtool使用来源于UNIX世界的特殊时间戳。该时间戳是自1979年1月1日UTC时间开始到当前逝去的秒数。该时间戳的值被转换成本地时间,它在不同的时区会不一样。
  可能你不是和我在地球的同一个地方。这就是说时区不同。在所有的例子中,我所说的时间当中,小时可能对你来说是错误的。这对这些例子中的结果有一点影响,在阅读时,只需要修正时间中的小时即可。例如:我看到 12:05 的话,在英国的家伙看到的时间就是 11:05 。
  现在我们得向数据库中填入一些数字。我们希望读到以下数据:
  12:05 12345 KM
  12:10 12357 KM
  12:15 12363 KM
  12:20 12363 KM
  12:25 12363 KM
  12:30 12373 KM
  12:35 12383 KM
  12:40 12393 KM
  12:45 12399 KM
  12:50 12405 KM
  12:55 12411 KM
  13:00 12415 KM
  13:05 12420 KM
  13:10 12422 KM
  13:15 12423 KM
  我们用下面的命令把上述数据填入数据库:
  rrdtool update test.rrd 920804700:12345 920805000:12357 920805300:12363
  rrdtool update test.rrd 920805600:12363 920805900:12363 920806200:12373
  rrdtool update test.rrd 920806500:12383 920806800:12393 920807100:12399
  rrdtool update test.rrd 920807400:12405 920807700:12411 920808000:12415
  rrdtool update test.rrd 920808300:12420 920808600:12422 920808900:12423
  正如你说看到的那样,可以在一个命令里向数据库中填入多个值。为了可读性,我得只用三个数据,实际一行里运行的最大数据与操作系统相关。
  我们可以使用 rrdtool fetch 命令从数据库中提取数据。
  rrdtool fetch test.rrd AVERAGE --start 920804400 --end 920809200
  该命令会返回如下输出结果:
  speed
  920804700: nan
  920805000: 4.0000000000e-02
  920805300: 2.0000000000e-02
  920805600: 0.0000000000e+00
  920805900: 0.0000000000e+00
  920806200: 3.3333333333e-02
  920806500: 3.3333333333e-02
  920806800: 3.3333333333e-02
  920807100: 2.0000000000e-02
  920807400: 2.0000000000e-02
  920807700: 2.0000000000e-02
  920808000: 1.3333333333e-02
  920808300: 1.6666666667e-02
  920808600: 6.6666666667e-03
  920808900: 3.3333333333e-03
  920809200: nan
  如果不是像上面的输出结果,可能哪里有错误。也许你的操作系统会打印出不同的格式 NaN 。 NaN 表示 非数字 。 如果你的操作系统输出 U 或 UNKN 或者其他类似东西都是正常的。如果其他地方错误,可能是因为你的过程中的那些步骤出错了(当然假设我的教程是完全正确的 :-))。这样的话,删除数据库文件然后再重新尝试。 有时事情就会变化。本例哟难道的数据像 0.04 而不是 4.0000e-02 。这些实际上是一样的数字,只是写法不同而已。如果rrdtool今后的版本显示略有不同是输出也不要大惊小怪。本文档中的例子对于RRDtool 1.2.0版本都是正确的。
  3、绘第一张图
  建几个图示的时候到了,试试下面的命令:
  rrdtool graph speed.png \
  --start 920804400 --end 920808000 \
  DEF:myspeed=test.rrd:speed:AVERAGE \
  LINE2:myspeed#FF0000
  #p#分页标题#e#
  如图一
  该命令会创建名为speed.png的图像文件,该图像从12:00开始,到13:00。有一个名为myspeed的变量定义,它使用来自 test.rrd数据库的 speed RRA中的数据。绘制的线条是2像素高,表示myspeed变量。颜色是红色的.
  你会注意到图像的起始不是12:00而是12:05。这是因为在此时间之前的数据不够计算出平均值。这只会在缺少某些样本的情况下发生,不会经常发生。
  颜色是由红、绿、蓝构成的。对每种颜色成分,你可以用16进制来表示使用多少,其中00表示不包含,FF表示完全包含。白色是由红、绿、蓝组成的:FFFFFF。黑色是全部不包含:000000。
  4、用几种数学方法来绘图
  查看图像时,你会注意到横轴下标为 12:10、12:20、12:30、12:40、12:59。有时某些下标不适合(可能是12:00和13:00)会被忽略掉。
  纵轴显示我们输入的范围。下面提供的公里数,以及除以300妙的结果,我们得到非常小的数值。为了更加精确,第一个值是12(12567-12456),除以300后得到0.04,RRDtool显示时为 40m 表示 40/1000 。 其中的 m 与米、公里、或者毫米都没有任何关系!RRDtool不知道我们的数据单位,它只处理没有单位的数据。
  如果我们用米来衡量我们的距离,就会是这样:(12′357′000-12′345′000)/300 = 12′000/300 = 40.
  因为许多人都对这样的数值范围感觉更好,我们就来修正一下。我们将重新创建数据库,并存储正确的数据。但是有更好的办法:在创建png文件时进行一些计算!
  rrdtool graph speed2.png \
  --start 920804400 --end 920808000 \
  --vertical-label m/s \
  DEF:myspeed=test.rrd:speed:AVERAGE \
  CDEF:realspeed=myspeed,1000,\* \
  LINE2:realspeed#FF0000
  注意:不要忘记操作符 * 后面的 。这个反斜杆用来将*从操作系统可能解释的符号转义,而不是直接传递给rrdtool命令。
  在查看PNG文件后,你会注意到 m 不见了。正确的结果就是这样。同样,在图像中加入了一个标注。出了上面提到的几点外,PNG看起来应当是一样的。
  如图二
  计算是在CDEF部分中指定的,使用逆波兰表达式( RPN )表示的。我们要求RRDtool所作的事情是:`取数据源myspeed, 以及数值1000;把他们相乘` 。在此不要被RPN表达式困扰了,后面会详细介绍。同时,你可能想读一读关于CDEF的教程。以及Steve Rader的RPN表达式的教程。不过哦首先看我这篇教程吧。
  如果我们用1000乘以这些数值,显示把同样的数据显示成公里/小时也是可以的。
  要修改米/秒为单位的值:
  计算米/小时: value * 3′600
  计算公里/小时: value / 1′000
  合起来: value * (3′600/1′000) 或者 value * 3.6
  下面我们来创建这个PNG文件,并加入更多的魔幻功能…
  rrdtool graph speed3.png \
  --start 920804400 --end 920808000 \
  --vertical-label km/h \
  DEF:myspeed=test.rrd:speed:AVERAGE \
  "CDEF:kmh=myspeed,3600,*" \
  CDEF:fast=kmh,100,GT,kmh,0,IF \
  CDEF:good=kmh,100,GT,0,kmh,IF \
  HRULE:100#0000FF:"Maximum allowed" \
  AREA:good#00FF00:"Good speed" \
  AREA:fast#FF0000:"Too fast"
  这个图像看起来更好。速度用KM/H表示,有一个附加的线条表示最大允许的速度(在我行驶的道路上的最大限速)。我还修改了速度的显示颜色,把它从线条改为区块。
  如图三
  5、一个更复杂的图例
  现在计算更加复杂一些。对于在限速内的速度衡量方法是:
  检查公里/小时是否大于100 ( kmh,100 ) GT
  如果是,返回0,否则返回公里/小时。 ((( kmh,100 ) GT ), 0, kmh) IF
  对于上述的限速值:
  检查公里/小时是否大于100 ( kmh,100 ) GT
  如果是,返回公里/小时,否则返回0。 ((( kmh,100) GT ), kmh, 0) IF
  #p#分页标题#e#
  我愿意相信RRDtool的绘图功能能够处理的数据没有任何虚拟的限制。我会解释他们是如何工作的,不过看看下面的PNG图像:
  rrdtool graph speed4.png \
  --start 920804400 --end 920808000 \
  --vertical-label km/h \
  DEF:myspeed=test.rrd:speed:AVERAGE \
  "CDEF:kmh=myspeed,3600,*" \
  CDEF:fast=kmh,100,GT,100,0,IF \
  CDEF:over=kmh,100,GT,kmh,100,-,0,IF \
  CDEF:good=kmh,100,GT,0,kmh,IF \
  HRULE:100#0000FF:"Maximum allowed" \
  AREA:good#00FF00:"Good speed" \
  AREA:fast#550000:"Too fast" \
  STACK:over#FF0000:"Over speed"
  如图四
  更多资料请查看:[url]http://yuanjiao123.cn/html/jingyan/200809/17-32145.html[/url]

你可能感兴趣的:(职场,监控,休闲)