云计算平台管理的三大利器Nagios、Ganglia和Splunk

综合利用Nagios、Ganglia和Splunk搭建起的云计算平台监控体系，具备错误报警、性能调优、问题追踪和自动生成运维报表的功能。有了这套系统，就可轻松管理Hadoop/HBase云计算平台。

云计算早已不是停留在概念阶段了，各大公司都购买了大量的机器，开始正式的部署和运营。而动辄上百台的性能强劲的服务器，为运营管理带来了巨大的挑战。

如果没有方便的监控报警平台，对于管理员而言犹如噩梦，每天都将如救火队员一样，飞快地敲击键盘，用原始的Unix命令在多台机器中疲于奔命。
如果没有好的日志管理平台，对于开发者Troubleshooting更是一件泪流满面的事情。
而如果你是运维团队的总负责人，简洁清晰的Report则非常重要。Stakeholder们动不动就可能问起系统的SLA、机器的利用率等诸多问题，毕竟，公司为此投入了巨大的资金和人力。

朋友们，当我们管理起公司寄予厚望的云计算平台时，当我们面对如此多充满挑战的实际问题时，该怎么办？

概述

我们在搭建趋势云计算平台时，遇到了很多的问题和挑战。开始搭建时，第一次来了那么多性能强劲的机器，我们在感到兴奋的同时，也不免有些顾虑。大家坐在一起讨论，问题就列了满满一白板。

出了问题怎么办，有没有预警机制？
有没有可视化的管理界面？
管理平台需要自己开发吗？开发难度有多大？
有没有开源的管理工具？
那么多日志分布在各个机器上，有没有更有效的方法管理？
能否生成好的报表？
机器宕机，管理员能否收到短信通知？
如何做性能调优？
扩容升级时，能否给出依据？

带着这些问题，我们开始了自己的云计算平台管理和运营之旅，一路走来，收获颇丰。现在基本上形成了如图1所示的一整套云计算平台监控体系。

图1 云计算平台监控架构

在这个系统中，我们综合利用了Nagios、Ganglia和Splunk，搭建起云计算平台监控体系，使其具备错误报警、性能调优、问题追踪和自动生成运维报表的功能。有了这套系统，我们终于能够轻松管理Hadoop/HBase云计算平台了。接下来将简单介绍它们的特点和功能。

Nagios：云计算平台的智能报警器

总不能天天盯着机器看吧，因此我们首先关心的是机器的监控与报警。最理想的境界是：如果机器出故障了，我能第一时间处理；如果机器没有问题（最好永远没有问题），我能去喝茶、钓鱼和睡大觉。

发现机器有没有问题，对我们而言不是什么难事。写个脚本，Ping一下IP，Telnet每台机器的Service端口，如果增加了新机器就改改配置即可。但这样也太原始了吧，可视化效果差，不好维护，没有层次，不好管理，出不来报表，总不能老是用Excel人工写报表吧。有没有更好的方法呢？

有，你可以用Nagios。

Nagios是一个可运行在Linux/Unix平台之上的开源监视系统，可以用来监视系统运行状态和网络信息。Nagios可以监视所指定的本地或远程主机以及服务，同时提供异常通知功能。

Nagios可以提供以下几种监控功能。

监控网络服务（SMTP、POP3、HTTP、NNTP、Ping等）。
监控主机资源（处理器负荷、磁盘利用率等）。
简单的插件设计使得用户可以方便地扩展自己服务的检测方法。
并行服务检查机制。
具备定义网络分层结构的能力，并使用“parent”主机定义来表达网络主机间的关系，这种关系可被用来发现和明晰主机宕机或不可达状态。
当服务或主机问题产生与解决时将告警发送给联系人（通过电子邮件、短信、用户定义方式）。
具备定义事件处理功能，可以在主机或服务的事件发生时获取更多问题定位。
自动的日志回滚。
可以支持并实现对主机的冗余监控。
可选的Web界面用于查看当前的网络状态、通知和故障历史、日志文件等。

Nagios最好用的地方就是它将这些每天管理员做的工作自动化，你只需设定好要监听的端口即可，它会默默地工作，帮忙定时地去检测服务端口的状态，一旦发现问题，会及时发出报警。报警可以是电子邮件也可以是手机，从而使得管理员第一时间就能收到系统的状况。

Nagios的报表功能也很强大。管理员可以很容易地得到每天、每周和每月的Service运行状况。

图2 SPN 后台运行的所有Service的当前状态

如图2所示，红色部分清楚地标注有问题的机器，点开链接，就可以得到有问题机器的情况。虽然在HBase中，几台Region Server宕机不会对整体服务产生大的影响，但多少会影响到系统的Performance。而且，如果某几台Region Server频繁宕机，对整个系统的稳定性也会产生不好的影响。有了Nagios，我们可以快速定位有问题的机器，及时地将一些机器移除出HBase系统，待调整好了再上线运行，以保证系统的稳定性。

现在，Nagios已经成为了很多公司必备的监控工具。只需要简单地配置，就可以实现强大的功能，将管理员从日常烦琐的工作中解放出来。

有了Nagios，哪怕就是管理上千台机器，也不会手忙脚乱，而是有一种统领千军、运筹帷幄的感觉。

Ganglia：看到云计算平台的方方面面

Nagios的确不错，但你是不是真的可以喝茶、钓鱼、睡大觉呢？显然还不行。有了Nagios，你基本上可以做个优秀的救火队员，能在事发第一时间到达现场、处理事故。但如何防患于未然，真正做到运筹帷幄、游刃有余呢？

我们需要更加精确的数据，能够看到云计算平台的方方面面，能根据这些数据，做出性能调整、升级、扩容等的决策，从而保证Service能够满足不断增长的业务需求。

这时候，你需要Ganglia。

Ganglia是UC Berkeley发起的一个开源实时监视项目，用于测量数以千计的节点，为云计算系统提供系统静态数据以及重要的性能度量数据。Ganglia系统基本包含以下三大部分。

Gmond：Gmond运行在每台计算机上，它主要监控每台机器上收集和发送度量数据（如处理器速度、内存使用量等）。

Gmetad：Gmetad运行在Cluster的一台主机上，作为Web Server，或者用于与Web Server进行沟通。

Ganglia Web前端：Web前端用于显示Ganglia的Metrics图表。

Hadoop和HBase本身对于Ganglia的支持非常好。通过简单的配置，我们可以将Hadoop和HBase的一些关键参数以图表的形式展现在Ganglia的Web Console上。这些对于我们洞悉Hadoop和HBase的内部系统状态有很大的帮助。

在Hadoop的conf文件夹下面，找到hadoop-metrics.properties，配置好Ganglia的Server即可。这里要注意，Ganglia 3.0和Ganglia 3.1的区别，它们使用了不同的class。

dfs.class=org.apache.hadoop.metrics.ganglia.GangliaContext31

dfs.period=10

dfs.servers={Ganglia_Server}:8649

有了这些图表，Hadoop和HBase就不再是一个黑盒。无论是Hadoop的Namenode、Datanode，还是HBase的MasterServer、RegionServer任何时刻的情况，都会一目了然。由于图标的跨度可以是小时、天、月甚至是年，这样，就可以非常方便地定期生成周报、月报和年报。同时，根据图中Metrics的状况，我们可以通过调整参数、增加内存和硬盘、增加机器等的方法调整单个机器或者整个Service的性能。

图3 Hadoop其中一个DataNode的Metrics

Nagios 最大的问题在于不能洞悉到Service内部的状况。像Hadoop、HBase这样的分布式系统，一个节点的故障并不等于整个Service的故障，影响的只是Service的性能。所以，在测定Service的SLA时，我们不能以某一台机器的故障作为Service故障的评判标准。比如在我们的HBase SLA的设定上，我们定义了HBase Service完全不能工作的评判标准如下。

Master Server 联系不上。
所有RegionServer 都无法联系上。
-ROOT- 表无法访问。
.META. 表无法访问。

图4 Ganglia对Hadoop/HBase使用情况的监测

那么，我们就可以根据这个规则定义SLA，通过定期调用HBaseAdmin相应API ，将测试的结果发给Ganglia。采用同样的方法，我们还可以自定义一些规则，监视HBase Master、Zookeeper等的情况。

通过这些方法，我们完全能够针对Hadoop/HBase使用的实际情况，做出Service级别而不是机器级别的监控系统并生成报表。

此外，Ganglia还可以通过Server反馈回来的Load信息，给出各个机器的Load情况，给我们做升级和扩容提供依据。

如图5所示，Ganglia分别会用不同颜色，标注出当前时刻的机器Load分布情况。如果Load过重，就应该检查机器的具体使用情况。

图5 HBase Cluster Load Metrics

Ganglia的安装配置，可以参考：http://www.spnguru.com/?p=604。

Splunk：像查Google一样查日志

有了Nagios和Ganglia，算是成功了一大半。作为一名优秀的管理员，我们需要具备一定的Troubleshooting能力，对一些常见的问题能给出解决方案。那么，对日志的分析就必不可少。

但Hadoop/HBase的日志分布在各个机器上面，而日志之间关联性强。Client端的错误有可能是Region Server引起，而Region Server的错误有可能是Zookeeper导致。有没有一个统一的日志管理平台呢？

众里寻它千百度，蓦然回首，我们找到了Splunk——日志界的Google。

很遗憾，Splunk不是开源的，但它的免费版本提供每天500MB日志索引。如果数据量较小，通过定义好Log的级别，基本上也能满足需求。但对于数据量较大的公司，就有些捉襟见肘。

Splunk支持AdHoc的日志搜索，而且可以与Nagios配合使用。比如Nagios报警某台RegionServer端口不可达，我们收到Notification后，登录Splunk，直接搜索shutdown和host名称，找到RegionServer退出的日志。点击详细信息，分析日志，就能快速定位问题。如图6所示。

图6 Splunk与Nagios配合使用进行日志搜索

对Hadoop和HBase有了进一步了解后，我们可以利用Splunk实时检测日志中的关键字，定义关键字规则，如监控“shutdown”、“quit”、“ERROR”、“Zookeeper Session Expired”等，一旦出现，利用Splunk的Notification功能，发出邮件通知管理员，管理员通过Splunk定位问题，就可以在系统真正出现问题之前，对系统进行调整，防患于未然。

具体Splunk的设置，可以参考：http://www.spnguru.com/?p=122。

总结

搭建一套云计算平台，强大的监控管理系统是必不可少的。当然，任何工具都不是万能的，在实际维护过程中，我们也发现，Nagios和Splunk经常出现误报，如果规则定义得不好，大量的警报邮件如潮水一样涌来，反而掩盖了真正的问题。可以说，在云计算平台的运维管理上，没有一劳永逸的事情，随着规模的不断增大和应用的不断多样化，需要大家不断地实践和总结。

【论文速读】| SEAS：大语言模型的自进化对抗性安全优化云起无垠论文速读/精读语言模型安全人工智能
本次分享论文：SEAS:Self-EvolvingAdversarialSafetyOptimizationforLargeLanguageModels基本信息原文作者:MuxiDiao,RumeiLi,ShiyangLiu,GuogangLiao,JingangWang,XunliangCai,WeiranXu作者单位:北京邮电大学,美团关键词:大语言模型（LLM），对抗安全，红队，模型优化，自
大数据技术之Flume 数据流监控——Ganglia 的安装与部署（11）大数据深度洞察 Flume 大数据 flume
目录Flume数据流监控Ganglia的安装与部署Ganglia组件介绍1）安装Ganglia2）在hadoop12修改配置文件/etc/httpd/conf.d/ganglia.conf3）在hadoop12修改配置文件/etc/ganglia/gmetad.conf4）在hadoop12,hadoop13,hadoop14修改配置文件/etc/ganglia/gmond.conf5）在hado
ganglia的url参数大大大大大大大熊
12/20/201814:4012/22/201817:25http://10.11.6.79/ganglia/graph.php?c=cluster&h=centos7-dase-78&r=custom&z=small&jr=&js=&st=1546429279&cs=12%2F20%2F2018%2014%3A40&ce=12%2F22%2F2018%2017%3A25&v=1.1&m=cpu
大数据开源框架技术汇总浪尖聊大数据-浪尖数据仓库 hive flume 分布式 scipy makefile crm lighttpd
主要基于对现阶段一些常用的大数据开源框架技术的整理，只是一些简单的介绍，并不是详细技术梳理。可能会有疏漏，发现再整理。参考的太多，就不一一列出来了。这只是作为一个梳理，对以后选型或者扩展的做个参考。目录系统平台（Hadoop、CDH、HDP）监控管理（CM、Hue、Ambari、Dr.Elephant、Ganglia、Zabbix、Eagle）文件系统（HDFS、GPFS、Ceph、Gluster
Springboot2关于Metrics DJ剑麻
Metrics SpringBootActuator为Micrometer提供了依赖项管理和自动配置，Micrometer是一种支持大量监视系统的应用程序指标展示，包括：AppOptics、Atlas、Datadog、Dynatrace、Elastic、Ganglia、Graphite、Humio、Influx、JMX、KairosDB、NewRelic、Prometheus、SignalFx、
【BI&AI】Lecture10 - Motor System2 头发没了还会再长人工智能 BCI 运动系统大脑皮层
MotorSystem2专业术语descendingspinaltracts下行脊髓束corticospinaltract锥体束reticulospinaltract脊髓脑干束vestibulospinaltract脊髓脑干侧脊束precentralgyrus前中央回populationcoding群体编码basalganglia基底节thalamus丘脑Posteriorparietalcort
Linux运维日常使用软件和技能寻宝记_楠哥
运维工程师使用的运维平台和工具包括：Web服务器：apache、tomcat、nginx、lighttpd监控：nagios、ganglia、cacti、zabbix自动部署：ansible、sshpt、salt配置管理：puppet、cfengine负载均衡：lvs、haproxy、nginx传输工具：scribe、flume备份工具：rsync、wget数据库：mysql、oracle、sql
Spring Boot 生产就绪中文文档-下逆水行舟x spring boot spring boot java 数据库
本文为官方文档直译版本。原文链接由于篇幅较长，遂分两篇。上半部分中文文档SpringBoot生产就绪中文文档-下度量标准入门受支持的监控系统AppOpticsAtlasDatadogDynatracev2API自动配置手动配置v1API(旧版)与版本无关的设置ElasticGangliaGraphiteHumioInfluxJMXKairosDBNewRelicOpenTelemetryProme
Linux 内存数据 Metrics 指标解读　Laurence Linux与Shell编程内存 free 指标 metric 可用内存已用内存 cache
过去从未仔细了解过使用free、top等命令时显式的内存信息，只关注了已用内存/可用内存。本文我们详解解读和标注一下各个数据项的含义，同时和Ganglia显式的数据做一个映射。开始前介绍一个小知识，很多查看内存的命令行工具都是cat/proc/meminfo里的数据，所以数据来源都是一样的，区别只在于显式格式，用户体验上。本文我们以free命令为主，最后介绍一下top和htop的一些细微差异。先看
Linux CPU 数据 Metrics 指标解读　Laurence Linux与Shell编程 linux cpu 利用率负载 load metrics 数据
过去从未仔细了解过使用top和htop等命令时显式的CPU信息，本文我们详解解读和标注一下各个数据项的含义，同时和Ganglia显式的数据做一个映射。开始前介绍一个小知识，很多查看CPU的命令行工具都是cat/proc/stat里的数据，所以数据来源都是一样的，区别只在于显式格式，用户体验上。本文我们以mpstat和uptime命令为主，最后介绍一下top和htop的一些细微差异。一般来说，CPU
《中小银行运维架构：解密与实战》李丙洋_2021 hotwater99 #运维运维
目录传统IT基础架构IT基础设施网络架构灾备架构运维日常系统监控基础设施层监控系统层监控应用层监控业务层监控用户体验层监控事件管理事件管理流程事件应急处理事件管理制度及分级事件管理优化运维标准化域名化安全基线基础运行环境标准化操作系统中间件运行规范中间件编码规范网络标准化数据库标准化立体化监控体系监控体系流行监控系统NagiosGangliaZabbixOpen-FalconPrometheusE
Zabbix 6.0 详细基础介绍 Stars.Sky Zabbix zabbix
目录一、如何选择自己的运维监控平台1.1常用的开源运维监控工具1.1.1Cacti1.1.2Nagios1.1.3Ganglia1.1.4Centreon1.1.5Grafana1.1.6Prometheus1.1.7Zabbix1.2监控工具选型经验1.2.1中小企业传统监控选择Zabbix1.2.2云原生监控选择Prometheus二、Zabbix版本发布与安装需求2.1Zabbix版本发布计
完整修复宿主机重启后 docker 自定义网络丢失并重新恢复容器闭关苦炼内功 Linux docker 网络 openEuler
catfix-network.md1.afterhwrebootnotlosedockercustomenetworkavoidafterhwrestartcustomer’sdockernetworkvim/etc/sysconfig/dockerDISABLE_CRASH_FILES_DELETE=true[root@16-0-0-85ganglia]#cat/etc/sysconfig/do
Ambari 基本架构 cpuCode Ambari ambari 架构前端 hadoop 大数据
Ambari利用了已有的优秀开源软件，并结合起来:agent端，采用了puppet管理节点在web端，采用ember.js作为前端MVC框架和NodeJS相关工具，用handlebars.js作为页面渲染引擎，在CSS/HTML方面还用了Bootstrap框架在Server端，采用了Jetty、Spring、JAX-RS等同时利用了Ganglia、Nagios的分布式监控能力Ambari框架采用的
企业级 Zabbix 监控大不牛 linux 云计算
一、监控介绍1.你用过哪些监控软件？2.zabbix和nagios的区别3.zabbix和nagios、cacti、ganglia有什么区别4.zabbix的好处5.zabbix的监控流程6.常见监控项使用SNMP协议获取主机CPU、内存、磁盘、网卡流量等数据. 用脚本将获取到的SNMP数据存入数据库中,然后再使用一种名为MRTG的软件根据获取的数据绘制图表来分析数据的变化。MRTG(
二百零五、Flume——数据流监控工具Ganglia单机版安装以及使用Ganglia监控Flume任务的数据流（附流程截图）天地风雷水火山泽 Flume flume 大数据
一、目的Flume采集Kafka的数据流需要实时监控，这时就需要用到监控工具Ganglia二、Ganglia简介Ganglia由gmond、gmetad和gweb三部分组成。（一）第一部分：gmondgmond（GangliaMonitoringDaemon）是一种轻量级服务，安装在每台需要收集指标数据的节点主机上。使用gmond可以很容易收集很多系统指标数据，如CPU、内存、磁盘、网络和活跃进程
Flume学习笔记（4）—— Flume数据流监控 THE WHY Flume 大数据 flume 学习笔记大数据
前置知识：Flume学习笔记（1）——Flume入门-CSDN博客Flume学习笔记（2）——Flume进阶-CSDN博客Flume数据流监控Ganglia的安装与部署Ganglia由gmond、gmetad和gweb三部分组成。gmond（GangliaMonitoringDaemon）是一种轻量级服务，安装在每台需要收集指标数据的节点主机上。使用gmond，你可以很容易收集很多系统指标数据，如
ganglia man page : gmond gmetad gmetad.py gmetric gstat gmond.conf weixin_33696106 运维 python memcached
gmondGMOND(1)UserCommandsGMOND(1)NAMEgmond-manualpageforGangliaMonitorDaemonSYNOPSISgmond[OPTIONS]...DESCRIPTIONTheGangliaMonitoringDaemon(gmond)listenstotheclustermessagechannel,storesthedatain-memor
Flume 数据流监控——Ganglia的安装与部署南洲. Flmue flume udp
1、Ganglia的安装（1）安装dhttpd服务与php[yasin@hadoop102flume]$sudoyum-yinstallhttpdphp（2）安装其他依赖[atguigu@hadoop102flume]$sudoyum-yinstallrrdtoolperl-rrdtoolrrdtool-devel[atguigu@hadoop102flume]$sudoyum-yinstalla
Flume 的应用10（Flume 数据流监控Ganglia） TANCHISE Flume 大数据 kafka flume
文章目录8、Flume数据流监控8.1Ganglia的安装与部署8.2操作Flume测试监控8、Flume数据流监控8.1Ganglia的安装与部署1）三台机器安装epel源[[email protected]]$sudoyuminstall-yepel-release2)在105安装web,meta和monitor[[email protected]]$s
9. Flume数据流监控-Ganglia 喵先生呢 #Flume 大数据 flume
文章目录Flume数据流监控-Ganglia1.Ganglia的安装与部署2.Ganglia配置3.操作Flume测试监控☆Flume数据流监控-Ganglia1.Ganglia的安装与部署#安装httpd服务与phpsudoyum-yinstallhttpdphp#安装其他依赖sudoyum-yinstallrrdtoolperl-rrdtoolrrdtool-develsudoyum-yins
Flume数据流监控--Ganglia 不爱吃鱼的馋猫 flume 大数据
前言：Ganglia监控Flume比较鸡肋，花里花哨，页面也不好看，确实监控不到什么内容，因为根据Flume的架构原理，Flume是不可能丢失数据的，其内部有完善的事务机制，Source到Channel是事务性的，Channel到Sink是事务性的，因此这两个环节不会出现数据的丢失，唯一可能丢失数据的情况是Channel采用memoryChannel，agent宕机导致数据丢失，或者Channel
Flume数据流监控之Ganglia的安装与部署大数据面壁者 flume 大数据 flume
Flume数据流监控之Ganglia的安装与部署一、Ganglia的安装与部署1）三台机器安装epel源[hadoop@hadoop102flume]$sudoyuminstall-yepel-release2)在102安装web,meta和monitor[hadoop@hadoop102flume]$sudoyum-yinstallganglia-gmetadganglia-webganglia
一百九十三、Flume——Ganglia启动报错：Job for httpd.service failed because the control process exited with error 天地风雷水火山泽 Flume Linux flume linux
一、目的启动Ganglia时报错，报错详情是Jobforhttpd.servicefailedbecausethecontrolprocessexitedwitherrorcode.See"systemctlstatushttpd.service"and"journalctl-xe"fordetails.二、报错原因10月2014:10:20hurys22httpd[2437]:AH00526:S
一百九十四、Flume——Ganglia启动报错：You don‘t have permission to access /ganglia on this server. 天地风雷水火山泽 Flume flume 大数据
一、目的在Ganglia启动后，登录页面http://hurys22/ganglia查看，发现报错Youdon'thavepermissiontoaccess/gangliaonthisserver.二、解决方法（一）修改配置文件/etc/httpd/conf.d/ganglia.conf#vi/etc/httpd/conf.d/ganglia.conf在文件里添加Requireallgrante
flume数据流监控一个人的牛牛 flume flume centos linux
目录flume数据流监控Ganglia的安装与部署操作flume测试监控flume数据流监控Ganglia的安装与部署Ganglia由gmond、gmetad和gweb三部分组成。gmond（GangliaMonitoringDaemon）：是一种轻量级服务，安装在每台需要收集指标数据的节点主机上。使用gmond可以很容易收集很多系统指标数据，如CPU、内存、磁盘、网络和活跃进程的数据等。gmet
大数据学习hadoop3.1.3——Flume相关数据流监控Ganglia的安装与部署--测试 Carson_xcb Hadoop
1、Ganglia的安装与部署1、集群里都需要安装gangliasudoyuminstall-yepel-release2、在101安装web,meta和monitorsudoyum-yinstallganglia-gmetadganglia-webganglia-gmond3、在102、103安装monitorsudoyum-yinstallganglia-gmondGanglia由gmond、
Flume数据流监控（第三方框架Ganglia） _Ordinary丶 flume
Gangliaganglia由gmond、gmetad和gweb三部分组成。gmond（GangliaMonitoringDaemon）是一种轻量级服务，安装在每台需要收集指标数据的节点主机上。使用gmond，你可以很容易收集很多系统指标数据，如CPU、内存、磁盘、网络和活跃进程的数据等。gmetad（GangliaMetaDaemon）整合所有信息，并将其以RRD格式存储至磁盘的服务。gweb（
Flume 数据流监控 Ganglia 的安装与部署 @DANGE flume 大数据 flume
Ganglia的安装与部署1.安装httpd服务与phpsudoyum-yinstallhttpdphp2.安装其它依赖sudoyum-yinstallrrdtoolperl-rrdtoolrrdtool-develsudoyum-yinstallapr-devel3.安装gangliasudorpm-Uvhhttps://dl.fedoraproject.org/pub/epel/epel-re
186.Flume（三）：自定义拦截器Interceptor，自定义source，自定义sink，数据流监控工具Ganglia 鹏哥哥啊Aaaa 从头开始学编程 flume 大数据
目录一、自定义拦截器Interceptor1.需求2.需求分析3.具体实现二、自定义source1.基础介绍
Java常用排序算法/程序员必须掌握的8大排序算法 cugfy java
分类： 1）插入排序（直接插入排序、希尔排序） 2）交换排序（冒泡排序、快速排序） 3）选择排序（直接选择排序、堆排序） 4）归并排序 5）分配排序（基数排序）所需辅助空间最多：归并排序所需辅助空间最少：堆排序平均速度最快：快速排序不稳定：快速排序，希尔排序，堆排序。先来看看8种排序之间的关系： 1.直接插入排序（1
【Spark102】Spark存储模块BlockManager剖析 bit1129 manager
Spark围绕着BlockManager构建了存储模块，包括RDD，Shuffle，Broadcast的存储都使用了BlockManager。而BlockManager在实现上是一个针对每个应用的Master/Executor结构，即Driver上BlockManager充当了Master角色，而各个Slave上(具体到应用范围，就是Executor)的BlockManager充当了Slave角色
linux 查看端口被占用情况详解 daizj linux 端口占用 netstat lsof
经常在启动一个程序会碰到端口被占用，这里讲一下怎么查看端口是否被占用，及哪个程序占用，怎么Kill掉已占用端口的程序 1、lsof -i:port port为端口号 [root@slave /data/spark-1.4.0-bin-cdh4]# lsof -i:8080 COMMAND PID USER FD TY
Hosts文件使用周凡杨 hosts locahost
一切都要从localhost说起，经常在tomcat容器起动后，访问页面时输入http://localhost:8088/index.jsp，大家都知道localhost代表本机地址，如果本机IP是10.10.134.21，那就相当于http://10.10.134.21:8088/index.jsp，有时候也会看到http: 127.0.0.1:
java excel工具 g21121 Java excel
直接上代码，一看就懂，利用的是jxl： import java.io.File; import java.io.IOException; import jxl.Cell; import jxl.Sheet; import jxl.Workbook; import jxl.read.biff.BiffException; import jxl.write.Label; import
web报表工具finereport常用函数的用法总结（数组函数）老A不折腾 finereport web报表函数总结
ADD2ARRAY ADDARRAY(array,insertArray, start):在数组第start个位置插入insertArray中的所有元素，再返回该数组。示例： ADDARRAY([3,4, 1, 5, 7], [23, 43, 22], 3)返回[3, 4, 23, 43, 22, 1, 5, 7]. ADDARRAY([3,4, 1, 5, 7], "测试&q
游戏服务器网络带宽负载计算墙头上一根草服务器
家庭所安装的4M，8M宽带。其中M是指，Mbits/S 其中要提前说明的是： 8bits = 1Byte 即8位等于1字节。我们硬盘大小50G。意思是50*1024M字节，约为 50000多字节。但是网宽是以“位”为单位的，所以，8Mbits就是1M字节。是容积体积的单位。 8Mbits/s后面的S是秒。8Mbits/s意思是每秒8M位，即每秒1M字节。我是在计算我们网络流量时想到的
我的spring学习笔记2-IoC（反向控制依赖注入） aijuans Spring 3 系列
IoC（反向控制依赖注入）这是Spring提出来了，这也是Spring一大特色。这里我不用多说，我们看Spring教程就可以了解。当然我们不用Spring也可以用IoC，下面我将介绍不用Spring的IoC。 IoC不是框架，她是java的技术，如今大多数轻量级的容器都会用到IoC技术。这里我就用一个例子来说明：如：程序中有 Mysql.calss 、Oracle.class 、SqlSe
高性能mysql 之选择存储引擎(一) annan211 mysql InnoDB MySQL引擎存储引擎
1 没有特殊情况，应尽可能使用InnoDB存储引擎。原因：InnoDB 和 MYIsAM 是mysql 最常用、使用最普遍的存储引擎。其中InnoDB是最重要、最广泛的存储引擎。她被设计用来处理大量的短期事务。短期事务大部分情况下是正常提交的，很少有回滚的情况。InnoDB的性能和自动崩溃恢复特性使得她在非事务型存储的需求中也非常流行，除非有非常
UDP网络编程百合不是茶 UDP编程局域网组播
UDP是基于无连接的,不可靠的传输与TCP/IP相反 UDP实现私聊,发送方式客户端,接受方式服务器 package netUDP_sc; import java.net.DatagramPacket; import java.net.DatagramSocket; import java.net.Ine
JQuery对象的val()方法执行结果分析 bijian1013 JavaScript js jquery
JavaScript中，如果id对应的标签不存在（同理JAVA中，如果对象不存在），则调用它的方法会报错或抛异常。在实际开发中，发现JQuery在id对应的标签不存在时，调其val()方法不会报错，结果是undefined。
http请求测试实例（采用json-lib解析） bijian1013 json http
由于fastjson只支持JDK1.5版本，因些对于JDK1.4的项目，可以采用json-lib来解析JSON数据。如下是http请求的另外一种写法，仅供参考。 package com; import java.util.HashMap; import java.util.Map; import
【RPC框架Hessian四】Hessian与Spring集成 bit1129 hessian
在【RPC框架Hessian二】Hessian 对象序列化和反序列化一文中介绍了基于Hessian的RPC服务的实现步骤，在那里使用Hessian提供的API完成基于Hessian的RPC服务开发和客户端调用，本文使用Spring对Hessian的集成来实现Hessian的RPC调用。定义模型、接口和服务器端代码 |---Model &nb
【Mahout三】基于Mahout CBayes算法的20newsgroup流程分析 bit1129 Mahout
1.Mahout环境搭建 1.下载Mahout http://mirror.bit.edu.cn/apache/mahout/0.10.0/mahout-distribution-0.10.0.tar.gz 2.解压Mahout 3. 配置环境变量 vim /etc/profile export HADOOP_HOME=/home
nginx负载tomcat遇非80时的转发问题 ronin47
　　nginx负载后端容器是tomcat（其它容器如WAS,JBOSS暂没发现这个问题）非８０端口，遇到跳转异常问题。解决的思路是：$host:port 详细如下：　　该问题是最先发现的，由于之前对nginx不是特别的熟悉所以该问题是个入门级别的： ? 1 2 3 4 5
java-17-在一个字符串中找到第一个只出现一次的字符 bylijinnan java
public class FirstShowOnlyOnceElement { /**Q17.在一个字符串中找到第一个只出现一次的字符。如输入abaccdeff，则输出b * 1.int[] count:count[i]表示i对应字符出现的次数 * 2.将26个英文字母映射：a-z <--> 0-25 * 3.假设全部字母都是小写 */ pu
mongoDB 复制集开窍的石头 mongodb
mongo的复制集就像mysql的主从数据库，当你往其中的主复制集(primary)写数据的时候，副复制集(secondary)会自动同步主复制集(Primary)的数据,当主复制集挂掉以后其中的一个副复制集会自动成为主复制集。提供服务器的可用性。和防止当机问题 mo
[宇宙与天文]宇宙时代的经济学 comsci 经济
宇宙尺度的交通工具一般都体型巨大，造价高昂。。。。。在宇宙中进行航行，近程采用反作用力类型的发动机，需要消耗少量矿石燃料，中远程航行要采用量子或者聚变反应堆发动机，进行超空间跳跃，要消耗大量高纯度水晶体能源以目前地球上国家的经济发展水平来讲，
Git忽略文件 Cwind git
有很多文件不必使用git管理。例如Eclipse或其他IDE生成的项目文件，编译生成的各种目标或临时文件等。使用git status时，会在Untracked files里面看到这些文件列表，在一次需要添加的文件比较多时（使用git add . / git add -u），会把这些所有的未跟踪文件添加进索引。 ==== ==== ==== 一些牢骚
MySQL连接数据库的必须配置 dashuaifu mysql 连接数据库配置
MySQL连接数据库的必须配置 1.driverClass：com.mysql.jdbc.Driver 2.jdbcUrl：jdbc:mysql://localhost:3306/dbname 3.user：username 4.password：password 其中1是驱动名；2是url，这里的‘dbna
一生要养成的60个习惯 dcj3sjt126com 习惯
一生要养成的60个习惯第1篇让你更受大家欢迎的习惯 1 守时，不准时赴约,让别人等,会失去很多机会。如何做到： ①该起床时就起床， ②养成任何事情都提前15分钟的习惯。 ③带本可以随时阅读的书，如果早了就拿出来读读。 ④有条理，生活没条理最容易耽误时间。 ⑤提前计划：将重要和不重要的事情岔开。 ⑥今天就准备好明天要穿的衣服。 ⑦按时睡觉，这会让按时起床更容易。 2 注重
[介绍]Yii 是什么 dcj3sjt126com PHP yii2
Yii 是一个高性能，基于组件的 PHP 框架，用于快速开发现代 Web 应用程序。名字 Yii （读作易）在中文里有“极致简单与不断演变”两重含义，也可看作 Yes It Is! 的缩写。 Yii 最适合做什么？ Yii 是一个通用的 Web 编程框架，即可以用于开发各种用 PHP 构建的 Web 应用。因为基于组件的框架结构和设计精巧的缓存支持，它特别适合开发大型应
Linux SSH常用总结 eksliang linux ssh SSHD
转载请出自出处：http://eksliang.iteye.com/blog/2186931 一、连接到远程主机格式： ssh name@remoteserver 例如： ssh [email protected] 二、连接到远程主机指定的端口格式： ssh name@remoteserver -p 22 例如： ssh i
快速上传头像到服务端工具类FaceUtil gundumw100 android
快速迭代用 import java.io.DataOutputStream; import java.io.File; import java.io.FileInputStream; import java.io.FileNotFoundException; import java.io.FileOutputStream; import java.io.IOExceptio
jQuery入门之怎么使用 ini JavaScript html jquery Web css
jQuery的强大我何问起（个人主页：hovertree.com）就不用多说了，那么怎么使用jQuery呢？首先，下载jquery。下载地址：http://hovertree.com/hvtart/bjae/b8627323101a4994.htm，一个是压缩版本，一个是未压缩版本，如果在开发测试阶段，可以使用未压缩版本，实际应用一般使用压缩版本(min)。然后就在页面上引用。
带filter的hbase查询优化 kane_xie 查询优化 hbase RandomRowFilter
问题描述 hbase scan数据缓慢，server端出现LeaseException。hbase写入缓慢。问题原因直接原因是： hbase client端每次和regionserver交互的时候，都会在服务器端生成一个Lease,Lease的有效期由参数hbase.regionserver.lease.period确定。如果hbase scan需
java设计模式-单例模式 men4661273 java 单例枚举反射 IOC
单例模式1，饿汉模式 //饿汉式单例类.在类初始化时，已经自行实例化 public class Singleton1 { //私有的默认构造函数 private Singleton1() {} //已经自行实例化 private static final Singleton1 singl
mongodb 查询某一天所有信息的3种方法，根据日期查询 qiaolevip 每天进步一点点学习永无止境 mongodb 纵观千象
// mongodb的查询真让人难以琢磨，就查询单天信息，都需要花费一番功夫才行。 // 第一种方式： coll.aggregate([ {$project:{sendDate: {$substr: ['$sendTime', 0, 10]}, sendTime: 1, content:1}}, {$match:{sendDate: '2015-
二维数组转换成JSON tangqi609567707 java 二维数组 json
原文出处：http://blog.csdn.net/springsen/article/details/7833596 public class Demo { public static void main(String[] args) { String[][] blogL
erlang supervisor wudixiaotie erlang
定义supervisor时，如果是监控celuesimple_one_for_one则删除children的时候就用supervisor:terminate_child (SupModuleName, ChildPid)，如果shutdown策略选择的是brutal_kill，那么supervisor会调用exit(ChildPid, kill)，这样的话如果Child的behavior是gen_

云计算平台管理的三大利器Nagios、Ganglia和Splunk

你可能感兴趣的:(ganglia)