ldbjakyo

云计算平台管理的三大利器Nagios、Ganglia和Splunk

原文链接:http://www.programmer.com.cn/11477/

文 / 杨俊华

综合利用Nagios、Ganglia和Splunk搭建起的云计算平台监控体系，具备错误报警、性能调优、问题追踪和自动生成运维报表的功能。有了这套系统，就可轻松管理Hadoop/HBase云计算平台。

云计算早已不是停留在概念阶段了，各大公司都购买了大量的机器，开始正式的部署和运营。而动辄上百台的性能强劲的服务器，为运营管理带来了巨大的挑战。

如果没有方便的监控报警平台，对于管理员而言犹如噩梦，每天都将如救火队员一样，飞快地敲击键盘，用原始的Unix命令在多台机器中疲于奔命。
如果没有好的日志管理平台，对于开发者Troubleshooting更是一件泪流满面的事情。
而如果你是运维团队的总负责人，简洁清晰的Report则非常重要。Stakeholder们动不动就可能问起系统的SLA、机器的利用率等诸多问题，毕竟，公司为此投入了巨大的资金和人力。

朋友们，当我们管理起公司寄予厚望的云计算平台时，当我们面对如此多充满挑战的实际问题时，该怎么办？

概述

我们在搭建趋势云计算平台时，遇到了很多的问题和挑战。开始搭建时，第一次来了那么多性能强劲的机器，我们在感到兴奋的同时，也不免有些顾虑。大家坐在一起讨论，问题就列了满满一白板。

出了问题怎么办，有没有预警机制？
有没有可视化的管理界面？
管理平台需要自己开发吗？开发难度有多大？
有没有开源的管理工具？
那么多日志分布在各个机器上，有没有更有效的方法管理？
能否生成好的报表？
机器宕机，管理员能否收到短信通知？
如何做性能调优？
扩容升级时，能否给出依据？

带着这些问题，我们开始了自己的云计算平台管理和运营之旅，一路走来，收获颇丰。现在基本上形成了如图1所示的一整套云计算平台监控体系。

图1 云计算平台监控架构

在这个系统中，我们综合利用了Nagios、Ganglia和Splunk，搭建起云计算平台监控体系，使其具备错误报警、性能调优、问题追踪和自动生成运维报表的功能。有了这套系统，我们终于能够轻松管理Hadoop/HBase云计算平台了。接下来将简单介绍它们的特点和功能。

Nagios：云计算平台的智能报警器

总不能天天盯着机器看吧，因此我们首先关心的是机器的监控与报警。最理想的境界是：如果机器出故障了，我能第一时间处理；如果机器没有问题（最好永远没有问题），我能去喝茶、钓鱼和睡大觉。

发现机器有没有问题，对我们而言不是什么难事。写个脚本，Ping一下IP，Telnet每台机器的Service端口，如果增加了新机器就改改配置即可。但这样也太原始了吧，可视化效果差，不好维护，没有层次，不好管理，出不来报表，总不能老是用Excel人工写报表吧。有没有更好的方法呢？

有，你可以用Nagios。

Nagios是一个可运行在Linux/Unix平台之上的开源监视系统，可以用来监视系统运行状态和网络信息。Nagios可以监视所指定的本地或远程主机以及服务，同时提供异常通知功能。

Nagios可以提供以下几种监控功能。

监控网络服务（SMTP、POP3、HTTP、NNTP、Ping等）。
监控主机资源（处理器负荷、磁盘利用率等）。
简单的插件设计使得用户可以方便地扩展自己服务的检测方法。
并行服务检查机制。
具备定义网络分层结构的能力，并使用“parent”主机定义来表达网络主机间的关系，这种关系可被用来发现和明晰主机宕机或不可达状态。
当服务或主机问题产生与解决时将告警发送给联系人（通过电子邮件、短信、用户定义方式）。
具备定义事件处理功能，可以在主机或服务的事件发生时获取更多问题定位。
自动的日志回滚。
可以支持并实现对主机的冗余监控。
可选的Web界面用于查看当前的网络状态、通知和故障历史、日志文件等。

Nagios最好用的地方就是它将这些每天管理员做的工作自动化，你只需设定好要监听的端口即可，它会默默地工作，帮忙定时地去检测服务端口的状态，一旦发现问题，会及时发出报警。报警可以是电子邮件也可以是手机，从而使得管理员第一时间就能收到系统的状况。

Nagios的报表功能也很强大。管理员可以很容易地得到每天、每周和每月的Service运行状况。

图2 SPN 后台运行的所有Service的当前状态

如图2所示，红色部分清楚地标注有问题的机器，点开链接，就可以得到有问题机器的情况。虽然在HBase中，几台Region Server宕机不会对整体服务产生大的影响，但多少会影响到系统的Performance。而且，如果某几台Region Server频繁宕机，对整个系统的稳定性也会产生不好的影响。有了Nagios，我们可以快速定位有问题的机器，及时地将一些机器移除出HBase系统，待调整好了再上线运行，以保证系统的稳定性。

现在，Nagios已经成为了很多公司必备的监控工具。只需要简单地配置，就可以实现强大的功能，将管理员从日常烦琐的工作中解放出来。

有了Nagios，哪怕就是管理上千台机器，也不会手忙脚乱，而是有一种统领千军、运筹帷幄的感觉。

Ganglia：看到云计算平台的方方面面

Nagios的确不错，但你是不是真的可以喝茶、钓鱼、睡大觉呢？显然还不行。有了Nagios，你基本上可以做个优秀的救火队员，能在事发第一时间到达现场、处理事故。但如何防患于未然，真正做到运筹帷幄、游刃有余呢？

我们需要更加精确的数据，能够看到云计算平台的方方面面，能根据这些数据，做出性能调整、升级、扩容等的决策，从而保证Service能够满足不断增长的业务需求。

这时候，你需要Ganglia。

Ganglia是UC Berkeley发起的一个开源实时监视项目，用于测量数以千计的节点，为云计算系统提供系统静态数据以及重要的性能度量数据。Ganglia系统基本包含以下三大部分。

Gmond：Gmond运行在每台计算机上，它主要监控每台机器上收集和发送度量数据（如处理器速度、内存使用量等）。

Gmetad：Gmetad运行在Cluster的一台主机上，作为Web Server，或者用于与Web Server进行沟通。

Ganglia Web前端：Web前端用于显示Ganglia的Metrics图表。

Hadoop和HBase本身对于Ganglia的支持非常好。通过简单的配置，我们可以将Hadoop和HBase的一些关键参数以图表的形式展现在Ganglia的Web Console上。这些对于我们洞悉Hadoop和HBase的内部系统状态有很大的帮助。

在Hadoop的conf文件夹下面，找到hadoop-metrics.properties，配置好Ganglia的Server即可。这里要注意，Ganglia 3.0和Ganglia 3.1的区别，它们使用了不同的class。

dfs.class=org.apache.hadoop.metrics.ganglia.GangliaContext31

dfs.period=10

dfs.servers={Ganglia_Server}:8649

有了这些图表，Hadoop和HBase就不再是一个黑盒。无论是Hadoop的Namenode、Datanode，还是HBase的MasterServer、RegionServer任何时刻的情况，都会一目了然。由于图标的跨度可以是小时、天、月甚至是年，这样，就可以非常方便地定期生成周报、月报和年报。同时，根据图中Metrics的状况，我们可以通过调整参数、增加内存和硬盘、增加机器等的方法调整单个机器或者整个Service的性能。

图3 Hadoop其中一个DataNode的Metrics

Nagios 最大的问题在于不能洞悉到Service内部的状况。像Hadoop、HBase这样的分布式系统，一个节点的故障并不等于整个Service的故障，影响的只是Service的性能。所以，在测定Service的SLA时，我们不能以某一台机器的故障作为Service故障的评判标准。比如在我们的HBase SLA的设定上，我们定义了HBase Service完全不能工作的评判标准如下。

Master Server 联系不上。
所有RegionServer 都无法联系上。
-ROOT- 表无法访问。
.META. 表无法访问。

图4 Ganglia对Hadoop/HBase使用情况的监测

那么，我们就可以根据这个规则定义SLA，通过定期调用HBaseAdmin相应API ，将测试的结果发给Ganglia。采用同样的方法，我们还可以自定义一些规则，监视HBase Master、Zookeeper等的情况。

通过这些方法，我们完全能够针对Hadoop/HBase使用的实际情况，做出Service级别而不是机器级别的监控系统并生成报表。

此外，Ganglia还可以通过Server反馈回来的Load信息，给出各个机器的Load情况，给我们做升级和扩容提供依据。

如图5所示，Ganglia分别会用不同颜色，标注出当前时刻的机器Load分布情况。如果Load过重，就应该检查机器的具体使用情况。

图5 HBase Cluster Load Metrics

Ganglia的安装配置，可以参考：http://www.spnguru.com/?p=604。

Splunk：像查Google一样查日志

有了Nagios和Ganglia，算是成功了一大半。作为一名优秀的管理员，我们需要具备一定的Troubleshooting能力，对一些常见的问题能给出解决方案。那么，对日志的分析就必不可少。

但Hadoop/HBase的日志分布在各个机器上面，而日志之间关联性强。Client端的错误有可能是Region Server引起，而Region Server的错误有可能是Zookeeper导致。有没有一个统一的日志管理平台呢？

众里寻它千百度，蓦然回首，我们找到了Splunk——日志界的Google。

很遗憾，Splunk不是开源的，但它的免费版本提供每天500MB日志索引。如果数据量较小，通过定义好Log的级别，基本上也能满足需求。但对于数据量较大的公司，就有些捉襟见肘。

Splunk支持AdHoc的日志搜索，而且可以与Nagios配合使用。比如Nagios报警某台RegionServer端口不可达，我们收到Notification后，登录Splunk，直接搜索shutdown和host名称，找到RegionServer退出的日志。点击详细信息，分析日志，就能快速定位问题。如图6所示。

图6 Splunk与Nagios配合使用进行日志搜索

对Hadoop和HBase有了进一步了解后，我们可以利用Splunk实时检测日志中的关键字，定义关键字规则，如监控“shutdown”、“quit”、“ERROR”、“Zookeeper Session Expired”等，一旦出现，利用Splunk的Notification功能，发出邮件通知管理员，管理员通过Splunk定位问题，就可以在系统真正出现问题之前，对系统进行调整，防患于未然。

具体Splunk的设置，可以参考：http://www.spnguru.com/?p=122。

总结

搭建一套云计算平台，强大的监控管理系统是必不可少的。当然，任何工具都不是万能的，在实际维护过程中，我们也发现，Nagios和Splunk经常出现误报，如果规则定义得不好，大量的警报邮件如潮水一样涌来，反而掩盖了真正的问题。可以说，在云计算平台的运维管理上，没有一劳永逸的事情，随着规模的不断增大和应用的不断多样化，需要大家不断地实践和总结。

作者杨俊华，趋势科技研发中心资深开发工程师，2009年至今一直从事Hadoop和HBase开发和运维工作，关注Hadoop开源社区的发展。

本文选自《程序员》杂志2011年09期，未经允许不得转载。如需转载请联系 [email protected]

【论文速读】| SEAS：大语言模型的自进化对抗性安全优化云起无垠论文速读/精读语言模型安全人工智能
本次分享论文：SEAS:Self-EvolvingAdversarialSafetyOptimizationforLargeLanguageModels基本信息原文作者:MuxiDiao,RumeiLi,ShiyangLiu,GuogangLiao,JingangWang,XunliangCai,WeiranXu作者单位:北京邮电大学,美团关键词:大语言模型（LLM），对抗安全，红队，模型优化，自
大数据技术之Flume 数据流监控——Ganglia 的安装与部署（11）大数据深度洞察 Flume 大数据 flume
目录Flume数据流监控Ganglia的安装与部署Ganglia组件介绍1）安装Ganglia2）在hadoop12修改配置文件/etc/httpd/conf.d/ganglia.conf3）在hadoop12修改配置文件/etc/ganglia/gmetad.conf4）在hadoop12,hadoop13,hadoop14修改配置文件/etc/ganglia/gmond.conf5）在hado
ganglia的url参数大大大大大大大熊
12/20/201814:4012/22/201817:25http://10.11.6.79/ganglia/graph.php?c=cluster&h=centos7-dase-78&r=custom&z=small&jr=&js=&st=1546429279&cs=12%2F20%2F2018%2014%3A40&ce=12%2F22%2F2018%2017%3A25&v=1.1&m=cpu
大数据开源框架技术汇总浪尖聊大数据-浪尖数据仓库 hive flume 分布式 scipy makefile crm lighttpd
主要基于对现阶段一些常用的大数据开源框架技术的整理，只是一些简单的介绍，并不是详细技术梳理。可能会有疏漏，发现再整理。参考的太多，就不一一列出来了。这只是作为一个梳理，对以后选型或者扩展的做个参考。目录系统平台（Hadoop、CDH、HDP）监控管理（CM、Hue、Ambari、Dr.Elephant、Ganglia、Zabbix、Eagle）文件系统（HDFS、GPFS、Ceph、Gluster
Springboot2关于Metrics DJ剑麻
Metrics SpringBootActuator为Micrometer提供了依赖项管理和自动配置，Micrometer是一种支持大量监视系统的应用程序指标展示，包括：AppOptics、Atlas、Datadog、Dynatrace、Elastic、Ganglia、Graphite、Humio、Influx、JMX、KairosDB、NewRelic、Prometheus、SignalFx、
【BI&AI】Lecture10 - Motor System2 头发没了还会再长人工智能 BCI 运动系统大脑皮层
MotorSystem2专业术语descendingspinaltracts下行脊髓束corticospinaltract锥体束reticulospinaltract脊髓脑干束vestibulospinaltract脊髓脑干侧脊束precentralgyrus前中央回populationcoding群体编码basalganglia基底节thalamus丘脑Posteriorparietalcort
Linux运维日常使用软件和技能寻宝记_楠哥
运维工程师使用的运维平台和工具包括：Web服务器：apache、tomcat、nginx、lighttpd监控：nagios、ganglia、cacti、zabbix自动部署：ansible、sshpt、salt配置管理：puppet、cfengine负载均衡：lvs、haproxy、nginx传输工具：scribe、flume备份工具：rsync、wget数据库：mysql、oracle、sql
Spring Boot 生产就绪中文文档-下逆水行舟x spring boot spring boot java 数据库
本文为官方文档直译版本。原文链接由于篇幅较长，遂分两篇。上半部分中文文档SpringBoot生产就绪中文文档-下度量标准入门受支持的监控系统AppOpticsAtlasDatadogDynatracev2API自动配置手动配置v1API(旧版)与版本无关的设置ElasticGangliaGraphiteHumioInfluxJMXKairosDBNewRelicOpenTelemetryProme
Linux 内存数据 Metrics 指标解读　Laurence Linux与Shell编程内存 free 指标 metric 可用内存已用内存 cache
过去从未仔细了解过使用free、top等命令时显式的内存信息，只关注了已用内存/可用内存。本文我们详解解读和标注一下各个数据项的含义，同时和Ganglia显式的数据做一个映射。开始前介绍一个小知识，很多查看内存的命令行工具都是cat/proc/meminfo里的数据，所以数据来源都是一样的，区别只在于显式格式，用户体验上。本文我们以free命令为主，最后介绍一下top和htop的一些细微差异。先看
Linux CPU 数据 Metrics 指标解读　Laurence Linux与Shell编程 linux cpu 利用率负载 load metrics 数据
过去从未仔细了解过使用top和htop等命令时显式的CPU信息，本文我们详解解读和标注一下各个数据项的含义，同时和Ganglia显式的数据做一个映射。开始前介绍一个小知识，很多查看CPU的命令行工具都是cat/proc/stat里的数据，所以数据来源都是一样的，区别只在于显式格式，用户体验上。本文我们以mpstat和uptime命令为主，最后介绍一下top和htop的一些细微差异。一般来说，CPU
《中小银行运维架构：解密与实战》李丙洋_2021 hotwater99 #运维运维
目录传统IT基础架构IT基础设施网络架构灾备架构运维日常系统监控基础设施层监控系统层监控应用层监控业务层监控用户体验层监控事件管理事件管理流程事件应急处理事件管理制度及分级事件管理优化运维标准化域名化安全基线基础运行环境标准化操作系统中间件运行规范中间件编码规范网络标准化数据库标准化立体化监控体系监控体系流行监控系统NagiosGangliaZabbixOpen-FalconPrometheusE
Zabbix 6.0 详细基础介绍 Stars.Sky Zabbix zabbix
目录一、如何选择自己的运维监控平台1.1常用的开源运维监控工具1.1.1Cacti1.1.2Nagios1.1.3Ganglia1.1.4Centreon1.1.5Grafana1.1.6Prometheus1.1.7Zabbix1.2监控工具选型经验1.2.1中小企业传统监控选择Zabbix1.2.2云原生监控选择Prometheus二、Zabbix版本发布与安装需求2.1Zabbix版本发布计
完整修复宿主机重启后 docker 自定义网络丢失并重新恢复容器闭关苦炼内功 Linux docker 网络 openEuler
catfix-network.md1.afterhwrebootnotlosedockercustomenetworkavoidafterhwrestartcustomer’sdockernetworkvim/etc/sysconfig/dockerDISABLE_CRASH_FILES_DELETE=true[root@16-0-0-85ganglia]#cat/etc/sysconfig/do
Ambari 基本架构 cpuCode Ambari ambari 架构前端 hadoop 大数据
Ambari利用了已有的优秀开源软件，并结合起来:agent端，采用了puppet管理节点在web端，采用ember.js作为前端MVC框架和NodeJS相关工具，用handlebars.js作为页面渲染引擎，在CSS/HTML方面还用了Bootstrap框架在Server端，采用了Jetty、Spring、JAX-RS等同时利用了Ganglia、Nagios的分布式监控能力Ambari框架采用的
企业级 Zabbix 监控大不牛 linux 云计算
一、监控介绍1.你用过哪些监控软件？2.zabbix和nagios的区别3.zabbix和nagios、cacti、ganglia有什么区别4.zabbix的好处5.zabbix的监控流程6.常见监控项使用SNMP协议获取主机CPU、内存、磁盘、网卡流量等数据. 用脚本将获取到的SNMP数据存入数据库中,然后再使用一种名为MRTG的软件根据获取的数据绘制图表来分析数据的变化。MRTG(
二百零五、Flume——数据流监控工具Ganglia单机版安装以及使用Ganglia监控Flume任务的数据流（附流程截图）天地风雷水火山泽 Flume flume 大数据
一、目的Flume采集Kafka的数据流需要实时监控，这时就需要用到监控工具Ganglia二、Ganglia简介Ganglia由gmond、gmetad和gweb三部分组成。（一）第一部分：gmondgmond（GangliaMonitoringDaemon）是一种轻量级服务，安装在每台需要收集指标数据的节点主机上。使用gmond可以很容易收集很多系统指标数据，如CPU、内存、磁盘、网络和活跃进程
Flume学习笔记（4）—— Flume数据流监控 THE WHY Flume 大数据 flume 学习笔记大数据
前置知识：Flume学习笔记（1）——Flume入门-CSDN博客Flume学习笔记（2）——Flume进阶-CSDN博客Flume数据流监控Ganglia的安装与部署Ganglia由gmond、gmetad和gweb三部分组成。gmond（GangliaMonitoringDaemon）是一种轻量级服务，安装在每台需要收集指标数据的节点主机上。使用gmond，你可以很容易收集很多系统指标数据，如
ganglia man page : gmond gmetad gmetad.py gmetric gstat gmond.conf weixin_33696106 运维 python memcached
gmondGMOND(1)UserCommandsGMOND(1)NAMEgmond-manualpageforGangliaMonitorDaemonSYNOPSISgmond[OPTIONS]...DESCRIPTIONTheGangliaMonitoringDaemon(gmond)listenstotheclustermessagechannel,storesthedatain-memor
Flume 数据流监控——Ganglia的安装与部署南洲. Flmue flume udp
1、Ganglia的安装（1）安装dhttpd服务与php[yasin@hadoop102flume]$sudoyum-yinstallhttpdphp（2）安装其他依赖[atguigu@hadoop102flume]$sudoyum-yinstallrrdtoolperl-rrdtoolrrdtool-devel[atguigu@hadoop102flume]$sudoyum-yinstalla
Flume 的应用10（Flume 数据流监控Ganglia） TANCHISE Flume 大数据 kafka flume
文章目录8、Flume数据流监控8.1Ganglia的安装与部署8.2操作Flume测试监控8、Flume数据流监控8.1Ganglia的安装与部署1）三台机器安装epel源[[email protected]]$sudoyuminstall-yepel-release2)在105安装web,meta和monitor[[email protected]]$s
9. Flume数据流监控-Ganglia 喵先生呢 #Flume 大数据 flume
文章目录Flume数据流监控-Ganglia1.Ganglia的安装与部署2.Ganglia配置3.操作Flume测试监控☆Flume数据流监控-Ganglia1.Ganglia的安装与部署#安装httpd服务与phpsudoyum-yinstallhttpdphp#安装其他依赖sudoyum-yinstallrrdtoolperl-rrdtoolrrdtool-develsudoyum-yins
Flume数据流监控--Ganglia 不爱吃鱼的馋猫 flume 大数据
前言：Ganglia监控Flume比较鸡肋，花里花哨，页面也不好看，确实监控不到什么内容，因为根据Flume的架构原理，Flume是不可能丢失数据的，其内部有完善的事务机制，Source到Channel是事务性的，Channel到Sink是事务性的，因此这两个环节不会出现数据的丢失，唯一可能丢失数据的情况是Channel采用memoryChannel，agent宕机导致数据丢失，或者Channel
Flume数据流监控之Ganglia的安装与部署大数据面壁者 flume 大数据 flume
Flume数据流监控之Ganglia的安装与部署一、Ganglia的安装与部署1）三台机器安装epel源[hadoop@hadoop102flume]$sudoyuminstall-yepel-release2)在102安装web,meta和monitor[hadoop@hadoop102flume]$sudoyum-yinstallganglia-gmetadganglia-webganglia
一百九十三、Flume——Ganglia启动报错：Job for httpd.service failed because the control process exited with error 天地风雷水火山泽 Flume Linux flume linux
一、目的启动Ganglia时报错，报错详情是Jobforhttpd.servicefailedbecausethecontrolprocessexitedwitherrorcode.See"systemctlstatushttpd.service"and"journalctl-xe"fordetails.二、报错原因10月2014:10:20hurys22httpd[2437]:AH00526:S
一百九十四、Flume——Ganglia启动报错：You don‘t have permission to access /ganglia on this server. 天地风雷水火山泽 Flume flume 大数据
一、目的在Ganglia启动后，登录页面http://hurys22/ganglia查看，发现报错Youdon'thavepermissiontoaccess/gangliaonthisserver.二、解决方法（一）修改配置文件/etc/httpd/conf.d/ganglia.conf#vi/etc/httpd/conf.d/ganglia.conf在文件里添加Requireallgrante
flume数据流监控一个人的牛牛 flume flume centos linux
目录flume数据流监控Ganglia的安装与部署操作flume测试监控flume数据流监控Ganglia的安装与部署Ganglia由gmond、gmetad和gweb三部分组成。gmond（GangliaMonitoringDaemon）：是一种轻量级服务，安装在每台需要收集指标数据的节点主机上。使用gmond可以很容易收集很多系统指标数据，如CPU、内存、磁盘、网络和活跃进程的数据等。gmet
大数据学习hadoop3.1.3——Flume相关数据流监控Ganglia的安装与部署--测试 Carson_xcb Hadoop
1、Ganglia的安装与部署1、集群里都需要安装gangliasudoyuminstall-yepel-release2、在101安装web,meta和monitorsudoyum-yinstallganglia-gmetadganglia-webganglia-gmond3、在102、103安装monitorsudoyum-yinstallganglia-gmondGanglia由gmond、
Flume数据流监控（第三方框架Ganglia） _Ordinary丶 flume
Gangliaganglia由gmond、gmetad和gweb三部分组成。gmond（GangliaMonitoringDaemon）是一种轻量级服务，安装在每台需要收集指标数据的节点主机上。使用gmond，你可以很容易收集很多系统指标数据，如CPU、内存、磁盘、网络和活跃进程的数据等。gmetad（GangliaMetaDaemon）整合所有信息，并将其以RRD格式存储至磁盘的服务。gweb（
Flume 数据流监控 Ganglia 的安装与部署 @DANGE flume 大数据 flume
Ganglia的安装与部署1.安装httpd服务与phpsudoyum-yinstallhttpdphp2.安装其它依赖sudoyum-yinstallrrdtoolperl-rrdtoolrrdtool-develsudoyum-yinstallapr-devel3.安装gangliasudorpm-Uvhhttps://dl.fedoraproject.org/pub/epel/epel-re
186.Flume（三）：自定义拦截器Interceptor，自定义source，自定义sink，数据流监控工具Ganglia 鹏哥哥啊Aaaa 从头开始学编程 flume 大数据
目录一、自定义拦截器Interceptor1.需求2.需求分析3.具体实现二、自定义source1.基础介绍
数据采集高并发的架构应用 3golden .net
问题的出发点：最近公司为了发展需要，要扩大对用户的信息采集，每个用户的采集量估计约2W。如果用户量增加的话，将会大量照成采集量成3W倍的增长，但是又要满足日常业务需要，特别是指令要及时得到响应的频率次数远大于预期。 &n
不停止 MySQL 服务增加从库的两种方式 brotherlamp linux linux视频 linux资料 linux教程 linux自学
现在生产环境MySQL数据库是一主一从，由于业务量访问不断增大，故再增加一台从库。前提是不能影响线上业务使用，也就是说不能重启MySQL服务，为了避免出现其他情况，选择在网站访问量低峰期时间段操作。一般在线增加从库有两种方式，一种是通过mysqldump备份主库，恢复到从库，mysqldump是逻辑备份，数据量大时，备份速度会很慢，锁表的时间也会很长。另一种是通过xtrabacku
Quartz——SimpleTrigger触发器 eksliang SimpleTrigger TriggerUtils quartz
转载请出自出处：http://eksliang.iteye.com/blog/2208166 一.概述 SimpleTrigger触发器，当且仅需触发一次或者以固定时间间隔周期触发执行；二.SimpleTrigger的构造函数 SimpleTrigger(String name, String group)：通过该构造函数指定Trigger所属组和名称； Simpl
Informatica应用（1） 18289753290 sql workflow lookup 组件 Informatica
1.如果要在workflow中调用shell脚本有一个command组件，在里面设置shell的路径；调度wf可以右键出现schedule，现在用的是HP的tidal调度wf的执行。 2.designer里面的router类似于SSIS中的broadcast（多播组件）;Reset_Workflow_Var：参数重置（比如说我这个参数初始是1在workflow跑得过程中变成了3我要在结束时还要
python 获取图片验证码中文字酷的飞上天空 python
根据现成的开源项目 http://code.google.com/p/pytesser/改写在window上用easy_install安装不上看了下源码发现代码很少于是就想自己改写一下添加支持网络图片的直接解析 #coding:utf-8 #import sys #reload(sys) #sys.s
AJAX 永夜-极光 Ajax
1.AJAX功能:动态更新页面,减少流量消耗,减轻服务器负担 2.代码结构: <html> <head> <script type="text/javascript"> function loadXMLDoc() { .... AJAX script goes here ...
创业OR读研随便小屋创业
现在研一，有种想创业的想法，不知道该不该去实施。因为对于的我情况这两者是矛盾的，可能就是鱼与熊掌不能兼得。研一的生活刚刚过去两个月，我们学校主要的是
需求做得好与坏直接关系着程序员生活质量 aijuans IT 生活
这个故事还得从去年换工作的事情说起，由于自己不太喜欢第一家公司的环境我选择了换一份工作。去年九月份我入职现在的这家公司，专门从事金融业内软件的开发。十一月份我们整个项目组前往北京做现场开发，从此苦逼的日子开始了。系统背景：五月份就有同事前往甲方了解需求一直到6月份，后续几个月也完
如何定义和区分高级软件开发工程师 aoyouzi
在软件开发领域，高级开发工程师通常是指那些编写代码超过 3 年的人。这些人可能会被放到领导的位置，但经常会产生非常糟糕的结果。Matt Briggs 是一名高级开发工程师兼 Scrum 管理员。他认为，单纯使用年限来划分开发人员存在问题，两个同样具有 10 年开发经验的开发人员可能大不相同。近日，他发表了一篇博文，根据开发者所能发挥的作用划分软件开发工程师的成长阶段。　　初
Servlet的请求与响应百合不是茶 servlet get提交 java处理post提交
Servlet是tomcat中的一个重要组成,也是负责客户端和服务端的中介 1,Http的请求方式(get ,post); 客户端的请求一般都会都是Servlet来接受的,在接收之前怎么来确定是那种方式提交的,以及如何反馈,Servlet中有相应的方法, http的get方式 servlet就是都doGet(
web.xml配置详解之listener bijian1013 java web.xml listener
一.定义 <listener> <listen-class>com.myapp.MyListener</listen-class> </listener> 二.作用该元素用来注册一个监听器类。可以收到事件什么时候发生以及用什么作为响
Web页面性能优化（yahoo技术） Bill_chen JavaScript Ajax Web css Yahoo
1.尽可能的减少HTTP请求数 content 2.使用CDN server 3.添加Expires头(或者 Cache-control) server 4.Gzip 组件 server 5.把CSS样式放在页面的上方。 css 6.将脚本放在底部(包括内联的) javascript 7.避免在CSS中使用Expressions css 8.将javascript和css独立成外部文
【MongoDB学习笔记八】MongoDB游标、分页查询、查询结果排序 bit1129 mongodb
游标游标，简单的说就是一个查询结果的指针。游标作为数据库的一个对象，使用它是包括声明打开循环抓去一定数目的文档直到结果集中的所有文档已经抓取完关闭游标游标的基本用法，类似于JDBC的ResultSet(hasNext判断是否抓去完,next移动游标到下一条文档)，在获取一个文档集时，可以提供一个类似JDBC的FetchSize
ORA-12514 TNS 监听程序当前无法识别连接描述符中请求服务的解决方法白糖_ ORA-12514
今天通过Oracle SQL*Plus连接远端服务器的时候提示“监听程序当前无法识别连接描述符中请求服务”，遂在网上找到了解决方案： ①打开Oracle服务器安装目录\NETWORK\ADMIN\listener.ora文件，你会看到如下信息： # listener.ora Network Configuration File: D:\database\Oracle\net
Eclipse 问题 A resource exists with a different case bozch eclipse
在使用Eclipse进行开发的时候，出现了如下的问题： Description Resource Path Location TypeThe project was not built due to "A resource exists with a different case: '/SeenTaoImp_zhV2/bin/seentao'.&
编程之美-小飞的电梯调度算法 bylijinnan 编程之美
public class AptElevator { /** * 编程之美小飞电梯调度算法 * 在繁忙的时间，每次电梯从一层往上走时，我们只允许电梯停在其中的某一层。 * 所有乘客都从一楼上电梯，到达某层楼后，电梯听下来，所有乘客再从这里爬楼梯到自己的目的层。 * 在一楼时，每个乘客选择自己的目的层，电梯则自动计算出应停的楼层。 * 问：电梯停在哪
SQL注入相关概念 chenbowen00 sql Web 安全
SQL Injection：就是通过把SQL命令插入到Web表单递交或输入域名或页面请求的查询字符串，最终达到欺骗服务器执行恶意的SQL命令。具体来说，它是利用现有应用程序，将（恶意）的SQL命令注入到后台数据库引擎执行的能力，它可以通过在Web表单中输入（恶意）SQL语句得到一个存在安全漏洞的网站上的数据库，而不是按照设计者意图去执行SQL语句。首先让我们了解什么时候可能发生SQ
[光与电]光子信号战防御原理 comsci 原理
无论是在战场上,还是在后方,敌人都有可能用光子信号对人体进行控制和攻击,那么采取什么样的防御方法,最简单,最有效呢? 我们这里有几个山寨的办法,可能有些作用,大家如果有兴趣可以去实验一下根据光
oracle 11g新特性:Pending Statistics daizj oracle dbms_stats
oracle 11g新特性:Pending Statistics 转从11g开始，表与索引的统计信息收集完毕后，可以选择收集的统信息立即发布，也可以选择使新收集的统计信息处于pending状态，待确定处于pending状态的统计信息是安全的，再使处于pending状态的统计信息发布，这样就会避免一些因为收集统计信息立即发布而导致SQL执行计划走错的灾难。在 11g 之前的版本中，D
快速理解RequireJs dengkane jquery requirejs
RequireJs已经流行很久了，我们在项目中也打算使用它。它提供了以下功能：声明不同js文件之间的依赖可以按需、并行、延时载入js库可以让我们的代码以模块化的方式组织初看起来并不复杂。在html中引入requirejs 在HTML中，添加这样的 <script> 标签： <script src="/path/to
C语言学习四流程控制if条件选择、for循环和强制类型转换 dcj3sjt126com c
# include <stdio.h> int main(void) { int i, j; scanf("%d %d", &i, &j); if (i > j) printf("i大于j\n"); else printf("i小于j\n"); retu
dictionary的使用要注意 dcj3sjt126com IO
NSDictionary *dict = [NSDictionary dictionaryWithObjectsAndKeys: user.user_id , @"id", user.username , @"username",
Android 中的资源访问(Resource) finally_m xml android String drawable color
简单的说，Android中的资源是指非代码部分。例如，在我们的Android程序中要使用一些图片来设置界面，要使用一些音频文件来设置铃声，要使用一些动画来显示特效，要使用一些字符串来显示提示信息。那么，这些图片、音频、动画和字符串等叫做Android中的资源文件。在Eclipse创建的工程中，我们可以看到res和assets两个文件夹，是用来保存资源文件的，在assets中保存的一般是原生
Spring使用Cache、整合Ehcache 234390216 spring cache ehcache @Cacheable
Spring使用Cache 从3.1开始，Spring引入了对Cache的支持。其使用方法和原理都类似于Spring对事务管理的支持。Spring Cache是作用在方法上的，其核心思想是这样的：当我们在调用一个缓存方法时会把该方法参数和返回结果作为一个键值对存放在缓存中，等到下次利用同样的
当druid遇上oracle blob(clob) jackyrong oracle
http://blog.csdn.net/renfufei/article/details/44887371 众所周知，Oracle有很多坑, 所以才有了去IOE。在使用Druid做数据库连接池后，其实偶尔也会碰到小坑，这就是使用开源项目所必须去填平的。【如果使用不开源的产品，那就不是坑，而是陷阱了，你都不知道怎么去填坑】用Druid连接池，通过JDBC往Oracle数据库的
easyui datagrid pagination获得分页页码、总页数等信息 ldzyz007
var grid = $('#datagrid'); var options = grid.datagrid('getPager').data("pagination").options; var curr = options.pageNumber; var total = options.total; var max =
浅析awk里的数组 nigelzeng 二维数组 array 数组 awk
awk绝对是文本处理中的神器，它本身也是一门编程语言，还有许多功能本人没有使用到。这篇文章就单单针对awk里的数组来进行讨论，如何利用数组来帮助完成文本分析。有这么一组数据： abcd,91#31#2012-12-31 11:24:00 case_a,136#19#2012-12-31 11:24:00 case_a,136#23#2012-12-31 1
搭建 CentOS 6 服务器(6) - TigerVNC rensanning centos
安装GNOME桌面环境 # yum groupinstall "X Window System" "Desktop" 安装TigerVNC # yum -y install tigervnc-server tigervnc 启动VNC服务 # /etc/init.d/vncserver restart # vncser
Spring 数据库连接整理 tomcat_oracle spring bean jdbc
1、数据库连接jdbc.properties配置详解　　jdbc.url=jdbc:hsqldb:hsql://localhost/xdb 　　jdbc.username=sa 　　jdbc.password= 　　jdbc.driver=不同的数据库厂商驱动，此处不一一列举　　接下来，详细配置代码如下：　　 Spring连接池
Dom4J解析使用xpath java.lang.NoClassDefFoundError: org/jaxen/JaxenException异常 xp9802
用Dom4J解析xml,以前没注意,今天使用dom4j包解析xml时在xpath使用处报错异常栈：java.lang.NoClassDefFoundError: org/jaxen/JaxenException异常导入包 jaxen-1.1-beta-6.jar 解决; &nb

云计算平台管理的三大利器Nagios、Ganglia和Splunk

你可能感兴趣的:(ganglia)