moonpure

Flume环境部署和配置详解及案例大全

flume是一个分布式、可靠、和高可用的海量日志采集、聚合和传输的系统。支持在日志系统中定制各类数据发送方，用于收集数据;同时，Flume提供对数据进行简单处理，并写到各种数据接受方(比如文本、HDFS、Hbase等)的能力。

　　一、什么是Flume?
　　flume 作为 cloudera 开发的实时日志收集系统，受到了业界的认可与广泛应用。Flume 初始的发行版本目前被统称为 Flume OG（original generation），属于 cloudera。但随着 FLume 功能的扩展，Flume OG 代码工程臃肿、核心组件设计不合理、核心配置不标准等缺点暴露出来，尤其是在 Flume OG 的最后一个发行版本 0.94.0 中，日志传输不稳定的现象尤为严重，为了解决这些问题，2011 年 10 月 22 号，cloudera 完成了 Flume-728，对 Flume 进行了里程碑式的改动：重构核心组件、核心配置以及代码架构，重构后的版本统称为 Flume NG（next generation）；改动的另一原因是将 Flume 纳入 apache 旗下，cloudera Flume 改名为 Apache Flume。

flume的特点：
　　flume是一个分布式、可靠、和高可用的海量日志采集、聚合和传输的系统。支持在日志系统中定制各类数据发送方，用于收集数据;同时，Flume提供对数据进行简单处理，并写到各种数据接受方(比如文本、HDFS、Hbase等)的能力。
　　flume的数据流由事件(Event)贯穿始终。事件是Flume的基本数据单位，它携带日志数据(字节数组形式)并且携带有头信息，这些Event由Agent外部的Source生成，当Source捕获事件后会进行特定的格式化，然后Source会把事件推入(单个或多个)Channel中。你可以把Channel看作是一个缓冲区，它将保存事件直到Sink处理完该事件。Sink负责持久化日志或者把事件推向另一个Source。

flume的可靠性
　　当节点出现故障时，日志能够被传送到其他节点上而不会丢失。Flume提供了三种级别的可靠性保障，从强到弱依次分别为：end-to-end（收到数据agent首先将event写到磁盘上，当数据传送成功后，再删除；如果数据发送失败，可以重新发送。），Store on failure（这也是scribe采用的策略，当数据接收方crash时，将数据写到本地，待恢复后，继续发送），Besteffort（数据发送到接收方后，不会进行确认）。

flume的可恢复性：
　　还是靠Channel。推荐使用FileChannel，事件持久化在本地文件系统里(性能较差)。

　　flume的一些核心概念：
Agent使用JVM 运行Flume。每台机器运行一个agent，但是可以在一个agent中包含多个sources和sinks。
Client生产数据，运行在一个独立的线程。
Source从Client收集数据，传递给Channel。
Sink从Channel收集数据，运行在一个独立线程。
Channel连接 sources 和 sinks ，这个有点像一个队列。
Events可以是日志记录、 avro 对象等。

　　Flume以agent为最小的独立运行单位。一个agent就是一个JVM。单agent由Source、Sink和Channel三大组件构成，如下图：

　　值得注意的是，Flume提供了大量内置的Source、Channel和Sink类型。不同类型的Source,Channel和Sink可以自由组合。组合方式基于用户设置的配置文件，非常灵活。比如：Channel可以把事件暂存在内存里，也可以持久化到本地硬盘上。Sink可以把日志写入HDFS, HBase，甚至是另外一个Source等等。Flume支持用户建立多级流，也就是说，多个agent可以协同工作，并且支持Fan-in、Fan-out、Contextual Routing、Backup Routes，这也正是NB之处。如下图所示:

　　二、flume的官方网站在哪里？
　　http://flume.apache.org/

　　三、在哪里下载？

　　http://www.apache.org/dyn/closer.cgi/flume/1.5.0/apache-flume-1.5.0-bin.tar.gz

　　四、如何安装？
　　　　1)将下载的flume包，解压到/home/hadoop目录中，你就已经完成了50%：）简单吧

　　　　2)修改 flume-env.sh 配置文件,主要是JAVA_HOME变量设置

 
      ? 
     
           root@m1: 
           /home/hadoop/flume-1 
           .5.0-bin 
           # cp conf/flume-env.sh.template conf/flume-env.sh 
          
           root@m1: 
           /home/hadoop/flume-1 
           .5.0-bin 
           # vi conf/flume-env.sh 
          
           # Licensed to the Apache Software Foundation (ASF) under one 
          
           # or more contributor license agreements. See the NOTICE file 
          
           # distributed with this work for additional information 
          
           # regarding copyright ownership. The ASF licenses this file 
          
           # to you under the Apache License, Version 2.0 (the 
          
           # "License"); you may not use this file except in compliance 
          
           # with the License. You may obtain a copy of the License at 
          
           # 
          
           #   http://www.apache.org/licenses/LICENSE-2.0 
          
           # 
          
           # Unless required by applicable law or agreed to in writing, software 
          
           # distributed under the License is distributed on an "AS IS" BASIS, 
          
           # WITHOUT WARRANTIES OR CONDITIONS OF ANY KIND, either express or implied. 
          
           # See the License for the specific language governing permissions and 
          
           # limitations under the License. 
          
           # If this file is placed at FLUME_CONF_DIR/flume-env.sh, it will be sourced 
          
           # during Flume startup. 
          
           # Enviroment variables can be set here. 
          
           JAVA_HOME= 
           /usr/lib/jvm/java-7-oracle 
          
           # Give Flume more memory and pre-allocate, enable remote monitoring via JMX 
          
           #JAVA_OPTS="-Xms100m -Xmx200m -Dcom.sun.management.jmxremote" 
          
           # Note that the Flume conf directory is always included in the classpath. 
          
           #FLUME_CLASSPATH=""

　　　　3)验证是否安装成功

 
      ? 
     
           root@m1: 
           /home/hadoop 
           # /home/hadoop/flume-1.5.0-bin/bin/flume-ng version 
          
           Flume 1.5.0 
          
           Source code repository: https: 
           //git-wip-us 
           .apache.org 
           /repos/asf/flume 
           .git 
          
           Revision: 8633220df808c4cd0c13d1cf0320454a94f1ea97 
          
           Compiled by hshreedharan on Wed May 7 14:49:18 PDT 2014 
          
           From  
           source 
           with checksum a01fe726e4380ba0c9f7a7d222db961f 
          
           root@m1: 
           /home/hadoop 
           #

　　　　出现上面的信息，表示安装成功了

　　五、flume的案例
　　　　1)案例1：Avro
　　　　Avro可以发送一个给定的文件给Flume，Avro 源使用AVRO RPC机制。
　　　　　　a)创建agent配置文件

 
      ? 
     
           root@m1: 
           /home/hadoop 
           #vi /home/hadoop/flume-1.5.0-bin/conf/avro.conf 
          
           a1.sources = r1 
          
           a1.sinks = k1 
          
           a1.channels = c1 
          
           # Describe/configure the source 
          
           a1.sources.r1. 
           type 
           = avro 
          
           a1.sources.r1.channels = c1 
          
           a1.sources.r1.bind = 0.0.0.0 
          
           a1.sources.r1.port = 4141 
          
           # Describe the sink 
          
           a1.sinks.k1. 
           type 
           = logger 
          
           # Use a channel which buffers events in memory 
          
           a1.channels.c1. 
           type 
           = memory 
          
           a1.channels.c1.capacity = 1000 
          
           a1.channels.c1.transactionCapacity = 100 
          
           # Bind the source and sink to the channel 
          
           a1.sources.r1.channels = c1 
          
           a1.sinks.k1.channel = c1

　　　　　　b)启动flume agent a1

 
      ? 
     
           root@m1: 
           /home/hadoop 
           # /home/hadoop/flume-1.5.0-bin/bin/flume-ng agent -c . -f /home/hadoop/flume-1.5.0-bin/conf/avro.conf -n a1 -Dflume.root.logger=INFO,console

　　　　　　c)创建指定文件

 
      ? 
     
           root@m1: 
           /home/hadoop 
           # echo "hello world" > /home/hadoop/flume-1.5.0-bin/log.00

　　　　　　d)使用avro-client发送文件

 
      ? 
     
           root@m1: 
           /home/hadoop 
           # /home/hadoop/flume-1.5.0-bin/bin/flume-ng avro-client -c . -H m1 -p 4141 -F /home/hadoop/flume-1.5.0-bin/log.00

　　　　　　f)在m1的控制台，可以看到以下信息，注意最后一行：

 
      ? 
     
 
       
         
         
           root@m1: 
           /home/hadoop/flume-1 
           .5.0-bin 
           /conf 
           # /home/hadoop/flume-1.5.0-bin/bin/flume-ng agent -c . -f /home/hadoop/flume-1.5.0-bin/conf/avro.conf -n a1 -Dflume.root.logger=INFO,console 
          
 
           Info: Sourcing environment configuration script  
           /home/hadoop/flume-1 
           .5.0-bin 
           /conf/flume-env 
           .sh 
          
 
           Info: Including Hadoop libraries found via ( 
           /home/hadoop/hadoop-2 
           .2.0 
           /bin/hadoop 
           )  
           for 
           HDFS access 
          
 
           Info: Excluding  
           /home/hadoop/hadoop-2 
           .2.0 
           /share/hadoop/common/lib/slf4j-api-1 
           .7.5.jar from classpath 
          
 
           Info: Excluding  
           /home/hadoop/hadoop-2 
           .2.0 
           /share/hadoop/common/lib/slf4j-log4j12-1 
           .7.5.jar from classpath 
          
 
           ... 
          
 
           -08-10 10:43:25,112 (New I 
           /O 
           worker  
           #1) [INFO - org.apache.avro.ipc.NettyServer$NettyServerAvroHandler.handleUpstream(NettyServer.java:171)] [id: 0x92464c4f, /192.168.1.50:59850 :> /192.168.1.50:4141] UNBOUND 
          
 
           -08-10 10:43:25,112 (New I 
           /O 
           worker  
           #1) [INFO - org.apache.avro.ipc.NettyServer$NettyServerAvroHandler.handleUpstream(NettyServer.java:171)] [id: 0x92464c4f, /192.168.1.50:59850 :> /192.168.1.50:4141] CLOSED 
          
 
           -08-10 10:43:25,112 (New I 
           /O 
           worker  
           #1) [INFO - org.apache.avro.ipc.NettyServer$NettyServerAvroHandler.channelClosed(NettyServer.java:209)] Connection to /192.168.1.50:59850 disconnected. 
          
 
           -08-10 10:43:26,718 (SinkRunner-PollingRunner-DefaultSinkProcessor) [INFO - org.apache.flume.sink.LoggerSink.process(LoggerSink.java:70)] Event: { headers:{} body: 68 65 6C 6C 6F 20 77 6F 72 6C 64        hello world } 
          
 
       
 
     

　　　　2)案例2：Spool
　　　　Spool监测配置的目录下新增的文件，并将文件中的数据读取出来。需要注意两点：
　　　　1) 拷贝到spool目录下的文件不可以再打开编辑。
　　　　2) spool目录下不可包含相应的子目录
　　　　　　a)创建agent配置文件

 
      ? 
     
           root@m1: 
           /home/hadoop 
           # vi /home/hadoop/flume-1.5.0-bin/conf/spool.conf 
          
           a1.sources = r1 
          
           a1.sinks = k1 
          
           a1.channels = c1 
          
           # Describe/configure the source 
          
           a1.sources.r1. 
           type 
           = spooldir 
          
           a1.sources.r1.channels = c1 
          
           a1.sources.r1.spoolDir =  
           /home/hadoop/flume-1 
           .5.0-bin 
           /logs 
          
           a1.sources.r1.fileHeader =  
           true 
          
           # Describe the sink 
          
           a1.sinks.k1. 
           type 
           = logger 
          
           # Use a channel which buffers events in memory 
          
           a1.channels.c1. 
           type 
           = memory 
          
           a1.channels.c1.capacity = 1000 
          
           a1.channels.c1.transactionCapacity = 100 
          
           # Bind the source and sink to the channel 
          
           a1.sources.r1.channels = c1 
          
           a1.sinks.k1.channel = c1

　　　　　　b)启动flume agent a1

 
      ? 
     
           root@m1: 
           /home/hadoop 
           # /home/hadoop/flume-1.5.0-bin/bin/flume-ng agent -c . -f /home/hadoop/flume-1.5.0-bin/conf/spool.conf -n a1 -Dflume.root.logger=INFO,console

　　　　　　c)追加文件到/home/hadoop/flume-1.5.0-bin/logs目录

 
      ? 
     
           root@m1: 
           /home/hadoop 
           # echo "spool test1" > /home/hadoop/flume-1.5.0-bin/logs/spool_text.log

　　　　　　d)在m1的控制台，可以看到以下相关信息：

 
      ? 
     
           /08/10 11:37:13 INFO source.SpoolDirectorySource: Spooling Directory Source runner has shutdown. 
          
           /08/10 11:37:13 INFO source.SpoolDirectorySource: Spooling Directory Source runner has shutdown. 
          
           /08/10 11:37:14 INFO avro.ReliableSpoolingFileEventReader: Preparing to move file /home/hadoop/flume-1.5.0-bin/logs/spool_text.log to /home/hadoop/flume-1.5.0-bin/logs/spool_text.log.COMPLETED 
          
           /08/10 11:37:14 INFO source.SpoolDirectorySource: Spooling Directory Source runner has shutdown. 
          
           /08/10 11:37:14 INFO source.SpoolDirectorySource: Spooling Directory Source runner has shutdown. 
          
           /08/10 11:37:14 INFO sink.LoggerSink: Event: { headers:{file=/home/hadoop/flume-1.5.0-bin/logs/spool_text.log} body: 73 70 6F 6F 6C 20 74 65 73 74 31        spool test1 } 
          
           /08/10 11:37:15 INFO source.SpoolDirectorySource: Spooling Directory Source runner has shutdown. 
          
           /08/10 11:37:15 INFO source.SpoolDirectorySource: Spooling Directory Source runner has shutdown. 
          
           /08/10 11:37:16 INFO source.SpoolDirectorySource: Spooling Directory Source runner has shutdown. 
          
           /08/10 11:37:16 INFO source.SpoolDirectorySource: Spooling Directory Source runner has shutdown. 
          
           /08/10 11:37:17 INFO source.SpoolDirectorySource: Spooling Directory Source runner has shutdown.

　　　　3)案例3：Exec
　　　　EXEC执行一个给定的命令获得输出的源,如果要使用tail命令，必选使得file足够大才能看到输出内容
　　　　　　a)创建agent配置文件

 
      ? 
     
           root@m1: 
           /home/hadoop 
           # vi /home/hadoop/flume-1.5.0-bin/conf/exec_tail.conf 
          
           a1.sources = r1 
          
           a1.sinks = k1 
          
           a1.channels = c1 
          
           # Describe/configure the source 
          
           a1.sources.r1. 
           type 
           =  
           exec 
          
           a1.sources.r1.channels = c1 
          
           a1.sources.r1. 
           command 
           =  
           tail 
            -F  
           /home/hadoop/flume-1 
           .5.0-bin 
           /log_exec_tail 
          
           # Describe the sink 
          
           a1.sinks.k1. 
           type 
           = logger 
          
           # Use a channel which buffers events in memory 
          
           a1.channels.c1. 
           type 
           = memory 
          
           a1.channels.c1.capacity = 1000 
          
           a1.channels.c1.transactionCapacity = 100 
          
           # Bind the source and sink to the channel 
          
           a1.sources.r1.channels = c1 
          
           a1.sinks.k1.channel = c1

　　　　　　b)启动flume agent a1

 
      ? 
     
           root@m1: 
           /home/hadoop 
           # /home/hadoop/flume-1.5.0-bin/bin/flume-ng agent -c . -f /home/hadoop/flume-1.5.0-bin/conf/exec_tail.conf -n a1 -Dflume.root.logger=INFO,console

　　　　　　c)生成足够多的内容在文件里

 
      ? 
     
           root@m1: 
           /home/hadoop 
           # for i in {1..100};do echo "exec tail$i" >> /home/hadoop/flume-1.5.0-bin/log_exec_tail;echo $i;sleep 0.1;done

　　　　　　e)在m1的控制台，可以看到以下信息：

 
      ? 
     
           -08-10 10:59:25,513 (SinkRunner-PollingRunner-DefaultSinkProcessor) [INFO - org.apache.flume.sink.LoggerSink.process(LoggerSink.java:70)] Event: { headers:{} body: 65 78 65 63 20 74 61 69 6C 20 74 65 73 74    exec tail test } 
          
           -08-10 10:59:34,535 (SinkRunner-PollingRunner-DefaultSinkProcessor) [INFO - org.apache.flume.sink.LoggerSink.process(LoggerSink.java:70)] Event: { headers:{} body: 65 78 65 63 20 74 61 69 6C 20 74 65 73 74    exec tail test } 
          
           -08-10 11:01:40,557 (SinkRunner-PollingRunner-DefaultSinkProcessor) [INFO - org.apache.flume.sink.LoggerSink.process(LoggerSink.java:70)] Event: { headers:{} body: 65 78 65 63 20 74 61 69 6C 31          exec tail1 } 
          
           -08-10 11:01:41,180 (SinkRunner-PollingRunner-DefaultSinkProcessor) [INFO - org.apache.flume.sink.LoggerSink.process(LoggerSink.java:70)] Event: { headers:{} body: 65 78 65 63 20 74 61 69 6C 32          exec tail2 } 
          
           -08-10 11:01:41,180 (SinkRunner-PollingRunner-DefaultSinkProcessor) [INFO - org.apache.flume.sink.LoggerSink.process(LoggerSink.java:70)] Event: { headers:{} body: 65 78 65 63 20 74 61 69 6C 33          exec tail3 } 
          
           -08-10 11:01:41,181 (SinkRunner-PollingRunner-DefaultSinkProcessor) [INFO - org.apache.flume.sink.LoggerSink.process(LoggerSink.java:70)] Event: { headers:{} body: 65 78 65 63 20 74 61 69 6C 34          exec tail4 } 
          
           -08-10 11:01:41,181 (SinkRunner-PollingRunner-DefaultSinkProcessor) [INFO - org.apache.flume.sink.LoggerSink.process(LoggerSink.java:70)] Event: { headers:{} body: 65 78 65 63 20 74 61 69 6C 35          exec tail5 } 
          
           -08-10 11:01:41,181 (SinkRunner-PollingRunner-DefaultSinkProcessor) [INFO - org.apache.flume.sink.LoggerSink.process(LoggerSink.java:70)] Event: { headers:{} body: 65 78 65 63 20 74 61 69 6C 36          exec tail6 } 
          
           .... 
          
           .... 
          
           .... 
          
           -08-10 11:01:51,550 (SinkRunner-PollingRunner-DefaultSinkProcessor) [INFO - org.apache.flume.sink.LoggerSink.process(LoggerSink.java:70)] Event: { headers:{} body: 65 78 65 63 20 74 61 69 6C 39 36        exec tail96 } 
          
           -08-10 11:01:51,550 (SinkRunner-PollingRunner-DefaultSinkProcessor) [INFO - org.apache.flume.sink.LoggerSink.process(LoggerSink.java:70)] Event: { headers:{} body: 65 78 65 63 20 74 61 69 6C 39 37        exec tail97 } 
          
           -08-10 11:01:51,551 (SinkRunner-PollingRunner-DefaultSinkProcessor) [INFO - org.apache.flume.sink.LoggerSink.process(LoggerSink.java:70)] Event: { headers:{} body: 65 78 65 63 20 74 61 69 6C 39 38        exec tail98 } 
          
           -08-10 11:01:51,551 (SinkRunner-PollingRunner-DefaultSinkProcessor) [INFO - org.apache.flume.sink.LoggerSink.process(LoggerSink.java:70)] Event: { headers:{} body: 65 78 65 63 20 74 61 69 6C 39 39        exec tail99 } 
          
           -08-10 11:01:51,551 (SinkRunner-PollingRunner-DefaultSinkProcessor) [INFO - org.apache.flume.sink.LoggerSink.process(LoggerSink.java:70)] Event: { headers:{} body: 65 78 65 63 20 74 61 69 6C 31 30 30       exec tail100 }

　　　　4)案例4：Syslogtcp
　　　　Syslogtcp监听TCP的端口做为数据源
　　　　　　a)创建agent配置文件

 
      ? 
     
           root@m1: 
           /home/hadoop 
           # vi /home/hadoop/flume-1.5.0-bin/conf/syslog_tcp.conf 
          
           a1.sources = r1 
          
           a1.sinks = k1 
          
           a1.channels = c1 
          
           # Describe/configure the source 
          
           a1.sources.r1. 
           type 
           = syslogtcp 
          
           a1.sources.r1.port = 5140 
          
           a1.sources.r1.host = localhost 
          
           a1.sources.r1.channels = c1 
          
           # Describe the sink 
          
           a1.sinks.k1. 
           type 
           = logger 
          
           # Use a channel which buffers events in memory 
          
           a1.channels.c1. 
           type 
           = memory 
          
           a1.channels.c1.capacity = 1000 
          
           a1.channels.c1.transactionCapacity = 100 
          
           # Bind the source and sink to the channel 
          
           a1.sources.r1.channels = c1 
          
           a1.sinks.k1.channel = c1

　　　　　　b)启动flume agent a1

 
      ? 
     
           root@m1: 
           /home/hadoop 
           # /home/hadoop/flume-1.5.0-bin/bin/flume-ng agent -c . -f /home/hadoop/flume-1.5.0-bin/conf/syslog_tcp.conf -n a1 -Dflume.root.logger=INFO,console

　　　　　　c)测试产生syslog

 
      ? 
     
           root@m1: 
           /home/hadoop 
           # echo "hello idoall.org syslog" | nc localhost 5140

　　　　　　d)在m1的控制台，可以看到以下信息：

 
      ? 
     
           /08/10 11:41:45 INFO node.PollingPropertiesFileConfigurationProvider: Reloading configuration file:/home/hadoop/flume-1.5.0-bin/conf/syslog_tcp.conf 
          
           /08/10 11:41:45 INFO conf.FlumeConfiguration: Added sinks: k1 Agent: a1 
          
           /08/10 11:41:45 INFO conf.FlumeConfiguration: Processing:k1 
          
           /08/10 11:41:45 INFO conf.FlumeConfiguration: Processing:k1 
          
           /08/10 11:41:45 INFO conf.FlumeConfiguration: Post-validation flume configuration contains configuration for agents: [a1] 
          
           /08/10 11:41:45 INFO node.AbstractConfigurationProvider: Creating channels 
          
           /08/10 11:41:45 INFO channel.DefaultChannelFactory: Creating instance of channel c1 type memory 
          
           /08/10 11:41:45 INFO node.AbstractConfigurationProvider: Created channel c1 
          
           /08/10 11:41:45 INFO source.DefaultSourceFactory: Creating instance of source r1, type syslogtcp 
          
           /08/10 11:41:45 INFO sink.DefaultSinkFactory: Creating instance of sink: k1, type: logger 
          
           /08/10 11:41:45 INFO node.AbstractConfigurationProvider: Channel c1 connected to [r1, k1] 
          
           /08/10 11:41:45 INFO node.Application: Starting new configuration:{ sourceRunners:{r1=EventDrivenSourceRunner: { source:org.apache.flume.source.SyslogTcpSource{name:r1,state:IDLE} }} sinkRunners:{k1=SinkRunner: { policy:org.apache.flume.sink.DefaultSinkProcessor@6538b14 counterGroup:{ name:null counters:{} } }} channels:{c1=org.apache.flume.channel.MemoryChannel{name: c1}} } 
          
           /08/10 11:41:45 INFO node.Application: Starting Channel c1 
          
           /08/10 11:41:45 INFO instrumentation.MonitoredCounterGroup: Monitored counter group for type: CHANNEL, name: c1: Successfully registered new MBean. 
          
           /08/10 11:41:45 INFO instrumentation.MonitoredCounterGroup: Component type: CHANNEL, name: c1 started 
          
           /08/10 11:41:45 INFO node.Application: Starting Sink k1 
          
           /08/10 11:41:45 INFO node.Application: Starting Source r1 
          
           /08/10 11:41:45 INFO source.SyslogTcpSource: Syslog TCP Source starting... 
          
           /08/10 11:42:15 WARN source.SyslogUtils: Event created from Invalid Syslog data. 
          
           /08/10 11:42:15 INFO sink.LoggerSink: Event: { headers:{Severity=0, flume.syslog.status=Invalid, Facility=0} body: 68 65 6C 6C 6F 20 69 64 6F 61 6C 6C 2E 6F 72 67 hello idoall.org }

　　　　5)案例5：JSONHandler
　　　　　　a)创建agent配置文件

 
      ? 
     
           root@m1: 
           /home/hadoop 
           # vi /home/hadoop/flume-1.5.0-bin/conf/post_json.conf 
          
           a1.sources = r1 
          
           a1.sinks = k1 
          
           a1.channels = c1 
          
           # Describe/configure the source 
          
           a1.sources.r1. 
           type 
           = org.apache.flume. 
           source 
           .http.HTTPSource 
          
           a1.sources.r1.port = 8888 
          
           a1.sources.r1.channels = c1 
          
           # Describe the sink 
          
           a1.sinks.k1. 
           type 
           = logger 
          
           # Use a channel which buffers events in memory 
          
           a1.channels.c1. 
           type 
           = memory 
          
           a1.channels.c1.capacity = 1000 
          
           a1.channels.c1.transactionCapacity = 100 
          
           # Bind the source and sink to the channel 
          
           a1.sources.r1.channels = c1 
          
           a1.sinks.k1.channel = c1

　　　　　　b)启动flume agent a1

 
      ? 
     
           root@m1: 
           /home/hadoop 
           # /home/hadoop/flume-1.5.0-bin/bin/flume-ng agent -c . -f /home/hadoop/flume-1.5.0-bin/conf/post_json.conf -n a1 -Dflume.root.logger=INFO,console

　　　　　　c)生成JSON 格式的POST request

 
      ? 
     
           root@m1: 
           /home/hadoop 
           # curl -X POST -d '[{ "headers" :{"a" : "a1","b" : "b1"},"body" : "idoall.org_body"}]' http://localhost:8888

　　　　　　d)在m1的控制台，可以看到以下信息：
/

 
           08/10 11:49:59 INFO node.Application: Starting Channel c1 
          
           /08/10 11:49:59 INFO instrumentation.MonitoredCounterGroup: Monitored counter group for type: CHANNEL, name: c1: Successfully registered new MBean. 
          
           /08/10 11:49:59 INFO instrumentation.MonitoredCounterGroup: Component type: CHANNEL, name: c1 started 
          
           /08/10 11:49:59 INFO node.Application: Starting Sink k1 
          
           /08/10 11:49:59 INFO node.Application: Starting Source r1 
          
           /08/10 11:49:59 INFO mortbay.log: Logging to org.slf4j.impl.Log4jLoggerAdapter(org.mortbay.log) via org.mortbay.log.Slf4jLog 
          
           /08/10 11:49:59 INFO mortbay.log: jetty-6.1.26 
          
           /08/10 11:50:00 INFO mortbay.log: Started [email protected]:8888 
          
           /08/10 11:50:00 INFO instrumentation.MonitoredCounterGroup: Monitored counter group for type: SOURCE, name: r1: Successfully registered new MBean. 
          
           /08/10 11:50:00 INFO instrumentation.MonitoredCounterGroup: Component type: SOURCE, name: r1 started 
          
           /08/10 12:14:32 INFO sink.LoggerSink: Event: { headers:{b=b1, a=a1} body: 69 64 6F 61 6C 6C 2E 6F 72 67 5F 62 6F 64 79  idoall.org_body }

　　　　6)案例6：Hadoop sink
　　　　其中关于hadoop2.2.0部分的安装部署，请参考文章《ubuntu12.04+hadoop2.2.0+zookeeper3.4.5+hbase0.96.2+hive0.13.1分布式环境部署》
　　　　　　a)创建agent配置文件

 
      ? 
     
           root@m1: 
           /home/hadoop 
           # vi /home/hadoop/flume-1.5.0-bin/conf/hdfs_sink.conf 
          
           a1.sources = r1 
          
           a1.sinks = k1 
          
           a1.channels = c1 
          
           # Describe/configure the source 
          
           a1.sources.r1. 
           type 
           = syslogtcp 
          
           a1.sources.r1.port = 5140 
          
           a1.sources.r1.host = localhost 
          
           a1.sources.r1.channels = c1 
          
           # Describe the sink 
          
           a1.sinks.k1. 
           type 
           = hdfs 
          
           a1.sinks.k1.channel = c1 
          
           a1.sinks.k1.hdfs.path = hdfs: 
           //m1 
           :9000 
           /user/flume/syslogtcp 
          
           a1.sinks.k1.hdfs.filePrefix = Syslog 
          
           a1.sinks.k1.hdfs.round =  
           true 
          
           a1.sinks.k1.hdfs.roundValue = 10 
          
           a1.sinks.k1.hdfs.roundUnit = minute 
          
           # Use a channel which buffers events in memory 
          
           a1.channels.c1. 
           type 
           = memory 
          
           a1.channels.c1.capacity = 1000 
          
           a1.channels.c1.transactionCapacity = 100 
          
           # Bind the source and sink to the channel 
          
           a1.sources.r1.channels = c1 
          
           a1.sinks.k1.channel = c1

　　　　　　b)启动flume agent a1

 
      ? 
     
           root@m1: 
           /home/hadoop 
           # /home/hadoop/flume-1.5.0-bin/bin/flume-ng agent -c . -f /home/hadoop/flume-1.5.0-bin/conf/hdfs_sink.conf -n a1 -Dflume.root.logger=INFO,console

　　　　　　c)测试产生syslog

 
      ? 
     
           root@m1: 
           /home/hadoop 
           # echo "hello idoall flume -> hadoop testing one" | nc localhost 5140

　　　　　　d)在m1的控制台，可以看到以下信息：

 
      ? 
     
           /08/10 12:20:39 INFO instrumentation.MonitoredCounterGroup: Monitored counter group for type: CHANNEL, name: c1: Successfully registered new MBean. 
          
           /08/10 12:20:39 INFO instrumentation.MonitoredCounterGroup: Component type: CHANNEL, name: c1 started 
          
           /08/10 12:20:39 INFO node.Application: Starting Sink k1 
          
           /08/10 12:20:39 INFO node.Application: Starting Source r1 
          
           /08/10 12:20:39 INFO instrumentation.MonitoredCounterGroup: Monitored counter group for type: SINK, name: k1: Successfully registered new MBean. 
          
           /08/10 12:20:39 INFO instrumentation.MonitoredCounterGroup: Component type: SINK, name: k1 started 
          
           /08/10 12:20:39 INFO source.SyslogTcpSource: Syslog TCP Source starting... 
          
           /08/10 12:21:46 WARN source.SyslogUtils: Event created from Invalid Syslog data. 
          
           /08/10 12:21:49 INFO hdfs.HDFSSequenceFile: writeFormat = Writable, UseRawLocalFileSystem = false 
          
           /08/10 12:21:49 INFO hdfs.BucketWriter: Creating hdfs://m1:9000/user/flume/syslogtcp//Syslog.1407644509504.tmp 
          
           /08/10 12:22:20 INFO hdfs.BucketWriter: Closing hdfs://m1:9000/user/flume/syslogtcp//Syslog.1407644509504.tmp 
          
           /08/10 12:22:20 INFO hdfs.BucketWriter: Close tries incremented 
          
           /08/10 12:22:20 INFO hdfs.BucketWriter: Renaming hdfs://m1:9000/user/flume/syslogtcp/Syslog.1407644509504.tmp to hdfs://m1:9000/user/flume/syslogtcp/Syslog.1407644509504 
          
           /08/10 12:22:20 INFO hdfs.HDFSEventSink: Writer callback called.

　　　　　　e)在m1上再打开一个窗口，去hadoop上检查文件是否生成

 
      ? 
     
           root@m1: 
           /home/hadoop 
           # /home/hadoop/hadoop-2.2.0/bin/hadoop fs -ls /user/flume/syslogtcp 
          
           Found 1 items 
          
           -rw-r--r--  3 root supergroup    155 2014-08-10 12:22  
           /user/flume/syslogtcp/Syslog 
           .1407644509504 
          
           root@m1: 
           /home/hadoop 
           # /home/hadoop/hadoop-2.2.0/bin/hadoop fs -cat /user/flume/syslogtcp/Syslog.1407644509504 
          
           SEQ!org.apache.hadoop.io.LongWritable"org.apache.hadoop.io.BytesWritable^;>Gv$hello idoall flume -> hadoop testing one

　　　　7)案例7：File Roll Sink
　　　　　　a)创建agent配置文件

 
      ? 
     
           root@m1: 
           /home/hadoop 
           # vi /home/hadoop/flume-1.5.0-bin/conf/file_roll.conf 
          
           a1.sources = r1 
          
           a1.sinks = k1 
          
           a1.channels = c1 
          
           # Describe/configure the source 
          
           a1.sources.r1. 
           type 
           = syslogtcp 
          
           a1.sources.r1.port = 5555 
          
           a1.sources.r1.host = localhost 
          
           a1.sources.r1.channels = c1 
          
           # Describe the sink 
          
           a1.sinks.k1. 
           type 
           = file_roll 
          
           a1.sinks.k1.sink.directory =  
           /home/hadoop/flume-1 
           .5.0-bin 
           /logs 
          
           # Use a channel which buffers events in memory 
          
           a1.channels.c1. 
           type 
           = memory 
          
           a1.channels.c1.capacity = 1000 
          
           a1.channels.c1.transactionCapacity = 100 
          
           # Bind the source and sink to the channel 
          
           a1.sources.r1.channels = c1 
          
           a1.sinks.k1.channel = c1

　　　　　　b)启动flume agent a1

 
      ? 
     
           root@m1: 
           /home/hadoop 
           # /home/hadoop/flume-1.5.0-bin/bin/flume-ng agent -c . -f /home/hadoop/flume-1.5.0-bin/conf/file_roll.conf -n a1 -Dflume.root.logger=INFO,console

　　　　　　c)测试产生log

 
      ? 
     
           root@m1: 
           /home/hadoop 
           # echo "hello idoall.org syslog" | nc localhost 5555 
          
           root@m1: 
           /home/hadoop 
           # echo "hello idoall.org syslog 2" | nc localhost 5555

　　　　　　d)查看/home/hadoop/flume-1.5.0-bin/logs下是否生成文件,默认每30秒生成一个新文件

 
      ? 
     
           root@m1:/home/hadoop# ll /home/hadoop/flume-1.5.0-bin/logs 
          
           总用量 272 
          
           drwxr-xr-x 3 root root  4096 Aug 10 12:50 ./ 
          
           drwxr-xr-x 9 root root  4096 Aug 10 10:59 ../ 
          
           -rw-r--r-- 1 root root   50 Aug 10 12:49 1407646164782-1 
          
           -rw-r--r-- 1 root root   0 Aug 10 12:49 1407646164782-2 
          
           -rw-r--r-- 1 root root   0 Aug 10 12:50 1407646164782-3 
          
           root@m1:/home/hadoop# cat /home/hadoop/flume-1.5.0-bin/logs/1407646164782-1 /home/hadoop/flume-1.5.0-bin/logs/1407646164782-2 
          
           hello idoall.org syslog 
          
           hello idoall.org syslog 2

　　　　8)案例8：Replicating Channel Selector
　　　　Flume支持Fan out流从一个源到多个通道。有两种模式的Fan out，分别是复制和复用。在复制的情况下，流的事件被发送到所有的配置通道。在复用的情况下，事件被发送到可用的渠道中的一个子集。Fan out流需要指定源和Fan out通道的规则。
　　　　这次我们需要用到m1,m2两台机器
　　　　　　a)在m1创建replicating_Channel_Selector配置文件

 
      ? 
     
           root@m1: 
           /home/hadoop 
           # vi /home/hadoop/flume-1.5.0-bin/conf/replicating_Channel_Selector.conf 
          
           a1.sources = r1 
          
           a1.sinks = k1 k2 
          
           a1.channels = c1 c2 
          
           # Describe/configure the source 
          
           a1.sources.r1. 
           type 
           = syslogtcp 
          
           a1.sources.r1.port = 5140 
          
           a1.sources.r1.host = localhost 
          
           a1.sources.r1.channels = c1 c2 
          
           a1.sources.r1.selector. 
           type 
           = replicating 
          
           # Describe the sink 
          
           a1.sinks.k1. 
           type 
           = avro 
          
           a1.sinks.k1.channel = c1 
          
           a1.sinks.k1. 
           hostname 
           = m1 
          
           a1.sinks.k1.port = 5555 
          
           a1.sinks.k2. 
           type 
           = avro 
          
           a1.sinks.k2.channel = c2 
          
           a1.sinks.k2. 
           hostname 
           = m2 
          
           a1.sinks.k2.port = 5555 
          
           # Use a channel which buffers events in memory 
          
           a1.channels.c1. 
           type 
           = memory 
          
           a1.channels.c1.capacity = 1000 
          
           a1.channels.c1.transactionCapacity = 100 
          
           a1.channels.c2. 
           type 
           = memory 
          
           a1.channels.c2.capacity = 1000 
          
           a1.channels.c2.transactionCapacity = 100

　　　　　　b)在m1创建replicating_Channel_Selector_avro配置文件

 
      ? 
     
           root@m1: 
           /home/hadoop 
           # vi /home/hadoop/flume-1.5.0-bin/conf/replicating_Channel_Selector_avro.conf 
          
           a1.sources = r1 
          
           a1.sinks = k1 
          
           a1.channels = c1 
          
           # Describe/configure the source 
          
           a1.sources.r1. 
           type 
           = avro 
          
           a1.sources.r1.channels = c1 
          
           a1.sources.r1.bind = 0.0.0.0 
          
           a1.sources.r1.port = 5555 
          
           # Describe the sink 
          
           a1.sinks.k1. 
           type 
           = logger 
          
           # Use a channel which buffers events in memory 
          
           a1.channels.c1. 
           type 
           = memory 
          
           a1.channels.c1.capacity = 1000 
          
           a1.channels.c1.transactionCapacity = 100 
          
           # Bind the source and sink to the channel 
          
           a1.sources.r1.channels = c1 
          
           a1.sinks.k1.channel = c1

　　　　　　c)在m1上将2个配置文件复制到m2上一份

 
      ? 
     
           root@m1: 
           /home/hadoop/flume-1 
           .5.0-bin 
           # scp -r /home/hadoop/flume-1.5.0-bin/conf/replicating_Channel_Selector.conf root@m2:/home/hadoop/flume-1.5.0-bin/conf/replicating_Channel_Selector.conf 
          
           root@m1: 
           /home/hadoop/flume-1 
           .5.0-bin 
           # scp -r /home/hadoop/flume-1.5.0-bin/conf/replicating_Channel_Selector_avro.conf root@m2:/home/hadoop/flume-1.5.0-bin/conf/replicating_Channel_Selector_avro.conf

　　　　　　d)打开4个窗口，在m1和m2上同时启动两个flume agent

 
      ? 
     
           root@m1: 
           /home/hadoop 
           # /home/hadoop/flume-1.5.0-bin/bin/flume-ng agent -c . -f /home/hadoop/flume-1.5.0-bin/conf/replicating_Channel_Selector_avro.conf -n a1 -Dflume.root.logger=INFO,console 
          
           root@m1: 
           /home/hadoop 
           # /home/hadoop/flume-1.5.0-bin/bin/flume-ng agent -c . -f /home/hadoop/flume-1.5.0-bin/conf/replicating_Channel_Selector.conf -n a1 -Dflume.root.logger=INFO,console

　　　　　　e)然后在m1或m2的任意一台机器上，测试产生syslog

 
      ? 
     
           root@m1: 
           /home/hadoop 
           # echo "hello idoall.org syslog" | nc localhost 5140

　　　　　　f)在m1和m2的sink窗口，分别可以看到以下信息,这说明信息得到了同步：

 
      ? 
     
           /08/10 14:08:18 INFO ipc.NettyServer: Connection to /192.168.1.51:46844 disconnected. 
          
           /08/10 14:08:52 INFO ipc.NettyServer: [id: 0x90f8fe1f, /192.168.1.50:35873 => /192.168.1.50:5555] OPEN 
          
           /08/10 14:08:52 INFO ipc.NettyServer: [id: 0x90f8fe1f, /192.168.1.50:35873 => /192.168.1.50:5555] BOUND: /192.168.1.50:5555 
          
           /08/10 14:08:52 INFO ipc.NettyServer: [id: 0x90f8fe1f, /192.168.1.50:35873 => /192.168.1.50:5555] CONNECTED: /192.168.1.50:35873 
          
           /08/10 14:08:59 INFO ipc.NettyServer: [id: 0xd6318635, /192.168.1.51:46858 => /192.168.1.50:5555] OPEN 
          
           /08/10 14:08:59 INFO ipc.NettyServer: [id: 0xd6318635, /192.168.1.51:46858 => /192.168.1.50:5555] BOUND: /192.168.1.50:5555 
          
           /08/10 14:08:59 INFO ipc.NettyServer: [id: 0xd6318635, /192.168.1.51:46858 => /192.168.1.50:5555] CONNECTED: /192.168.1.51:46858 
          
           /08/10 14:09:20 INFO sink.LoggerSink: Event: { headers:{Severity=0, flume.syslog.status=Invalid, Facility=0} body: 68 65 6C 6C 6F 20 69 64 6F 61 6C 6C 2E 6F 72 67 hello idoall.org }

　　　　
9)案例9：Multiplexing Channel Selector
　　　　　　a)在m1创建Multiplexing_Channel_Selector配置文件

 
      ? 
     
           root@m1: 
           /home/hadoop 
           # vi /home/hadoop/flume-1.5.0-bin/conf/Multiplexing_Channel_Selector.conf 
          
           a1.sources = r1 
          
           a1.sinks = k1 k2 
          
           a1.channels = c1 c2 
          
           # Describe/configure the source 
          
           a1.sources.r1. 
           type 
           = org.apache.flume. 
           source 
           .http.HTTPSource 
          
           a1.sources.r1.port = 5140 
          
           a1.sources.r1.channels = c1 c2 
          
           a1.sources.r1.selector. 
           type 
           = multiplexing 
          
           a1.sources.r1.selector.header =  
           type 
          
           #映射允许每个值通道可以重叠。默认值可以包含任意数量的通道。 
          
           a1.sources.r1.selector.mapping.baidu = c1 
          
           a1.sources.r1.selector.mapping.ali = c2 
          
           a1.sources.r1.selector.default = c1 
          
           # Describe the sink 
          
           a1.sinks.k1. 
           type 
           = avro 
          
           a1.sinks.k1.channel = c1 
          
           a1.sinks.k1. 
           hostname 
           = m1 
          
           a1.sinks.k1.port = 5555 
          
           a1.sinks.k2. 
           type 
           = avro 
          
           a1.sinks.k2.channel = c2 
          
           a1.sinks.k2. 
           hostname 
           = m2 
          
           a1.sinks.k2.port = 5555 
          
           # Use a channel which buffers events in memory 
          
           a1.channels.c1. 
           type 
           = memory 
          
           a1.channels.c1.capacity = 1000 
          
           a1.channels.c1.transactionCapacity = 100 
          
           a1.channels.c2. 
           type 
           = memory 
          
           a1.channels.c2.capacity = 1000 
          
           a1.channels.c2.transactionCapacity = 100

　　　　　　b)在m1创建Multiplexing_Channel_Selector_avro配置文件

 
      ? 
     
           root@m1: 
           /home/hadoop 
           # vi /home/hadoop/flume-1.5.0-bin/conf/Multiplexing_Channel_Selector_avro.conf 
          
           a1.sources = r1 
          
           a1.sinks = k1 
          
           a1.channels = c1 
          
           # Describe/configure the source 
          
           a1.sources.r1. 
           type 
           = avro 
          
           a1.sources.r1.channels = c1 
          
           a1.sources.r1.bind = 0.0.0.0 
          
           a1.sources.r1.port = 5555 
          
           # Describe the sink 
          
           a1.sinks.k1. 
           type 
           = logger 
          
           # Use a channel which buffers events in memory 
          
           a1.channels.c1. 
           type 
           = memory 
          
           a1.channels.c1.capacity = 1000 
          
           a1.channels.c1.transactionCapacity = 100 
          
           # Bind the source and sink to the channel 
          
           a1.sources.r1.channels = c1 
          
           a1.sinks.k1.channel = c1

　　　　　　c)将2个配置文件复制到m2上一份

 
      ? 
     
           root@m1: 
           /home/hadoop/flume-1 
           .5.0-bin 
           # scp -r /home/hadoop/flume-1.5.0-bin/conf/Multiplexing_Channel_Selector.conf root@m2:/home/hadoop/flume-1.5.0-bin/conf/Multiplexing_Channel_Selector.conf 
          
           root@m1: 
           /home/hadoop/flume-1 
           .5.0-bin 
           # scp -r /home/hadoop/flume-1.5.0-bin/conf/Multiplexing_Channel_Selector_avro.conf root@m2:/home/hadoop/flume-1.5.0-bin/conf/Multiplexing_Channel_Selector_avro.conf

　　　　　　d)打开4个窗口，在m1和m2上同时启动两个flume agent

 
      ? 
     
           root@m1: 
           /home/hadoop 
           # /home/hadoop/flume-1.5.0-bin/bin/flume-ng agent -c . -f /home/hadoop/flume-1.5.0-bin/conf/Multiplexing_Channel_Selector_avro.conf -n a1 -Dflume.root.logger=INFO,console 
          
           root@m1: 
           /home/hadoop 
           # /home/hadoop/flume-1.5.0-bin/bin/flume-ng agent -c . -f /home/hadoop/flume-1.5.0-bin/conf/Multiplexing_Channel_Selector.conf -n a1 -Dflume.root.logger=INFO,console

　　　　　　e)然后在m1或m2的任意一台机器上，测试产生syslog

 
      ? 
     
           root@m1: 
           /home/hadoop 
           # curl -X POST -d '[{ "headers" :{"type" : "baidu"},"body" : "idoall_TEST1"}]' http://localhost:5140 && curl -X POST -d '[{ "headers" :{"type" : "ali"},"body" : "idoall_TEST2"}]' http://localhost:5140 && curl -X POST -d '[{ "headers" :{"type" : "qq"},"body" : "idoall_TEST3"}]' http://localhost:5140

　　　　　　f)在m1的sink窗口，可以看到以下信息：

 
      ? 
     
           14/08/10 14:32:21 INFO node.Application: Starting Sink k1 
          
           14/08/10 14:32:21 INFO node.Application: Starting Source r1 
          
           14/08/10 14:32:21 INFO source.AvroSource: Starting Avro source r1: { bindAddress: 0.0.0.0, port: 5555 }... 
          
           14/08/10 14:32:21 INFO instrumentation.MonitoredCounterGroup: Monitored counter group for type: SOURCE, name: r1: Successfully registered new MBean. 
          
           14/08/10 14:32:21 INFO instrumentation.MonitoredCounterGroup: Component type: SOURCE, name: r1 started 
          
           14/08/10 14:32:21 INFO source.AvroSource: Avro source r1 started. 
          
           14/08/10 14:32:36 INFO ipc.NettyServer: [id: 0xcf00eea6, /192.168.1.50:35916 => /192.168.1.50:5555] OPEN 
          
           14/08/10 14:32:36 INFO ipc.NettyServer: [id: 0xcf00eea6, /192.168.1.50:35916 => /192.168.1.50:5555] BOUND: /192.168.1.50:5555 
          
           14/08/10 14:32:36 INFO ipc.NettyServer: [id: 0xcf00eea6, /192.168.1.50:35916 => /192.168.1.50:5555] CONNECTED: /192.168.1.50:35916 
          
           14/08/10 14:32:44 INFO ipc.NettyServer: [id: 0x432f5468, /192.168.1.51:46945 => /192.168.1.50:5555] OPEN 
          
           14/08/10 14:32:44 INFO ipc.NettyServer: [id: 0x432f5468, /192.168.1.51:46945 => /192.168.1.50:5555] BOUND: /192.168.1.50:5555 
          
           14/08/10 14:32:44 INFO ipc.NettyServer: [id: 0x432f5468, /192.168.1.51:46945 => /192.168.1.50:5555] CONNECTED: /192.168.1.51:46945 
          
           14/08/10 14:34:11 INFO sink.LoggerSink: Event: { headers:{type=baidu} body: 69 64 6F 61 6C 6C 5F 54 45 53 54 31       idoall_TEST1 } 
          
           14/08/10 14:34:57 INFO sink.LoggerSink: Event: { headers:{type=qq} body: 69 64 6F 61 6C 6C 5F 54 45 53 54 33       idoall_TEST3 }

　　　　　　g)在m2的sink窗口，可以看到以下信息：

 
      ? 
     
           14/08/10 14:32:27 INFO node.Application: Starting Sink k1 
          
           14/08/10 14:32:27 INFO node.Application: Starting Source r1 
          
           14/08/10 14:32:27 INFO source.AvroSource: Starting Avro source r1: { bindAddress: 0.0.0.0, port: 5555 }... 
          
           14/08/10 14:32:27 INFO instrumentation.MonitoredCounterGroup: Monitored counter group for type: SOURCE, name: r1: Successfully registered new MBean. 
          
           14/08/10 14:32:27 INFO instrumentation.MonitoredCounterGroup: Component type: SOURCE, name: r1 started 
          
           14/08/10 14:32:27 INFO source.AvroSource: Avro source r1 started. 
          
           14/08/10 14:32:36 INFO ipc.NettyServer: [id: 0x7c2f0aec, /192.168.1.50:38104 => /192.168.1.51:5555] OPEN 
          
           14/08/10 14:32:36 INFO ipc.NettyServer: [id: 0x7c2f0aec, /192.168.1.50:38104 => /192.168.1.51:5555] BOUND: /192.168.1.51:5555 
          
           14/08/10 14:32:36 INFO ipc.NettyServer: [id: 0x7c2f0aec, /192.168.1.50:38104 => /192.168.1.51:5555] CONNECTED: /192.168.1.50:38104 
          
           14/08/10 14:32:44 INFO ipc.NettyServer: [id: 0x3d36f553, /192.168.1.51:48599 => /192.168.1.51:5555] OPEN 
          
           14/08/10 14:32:44 INFO ipc.NettyServer: [id: 0x3d36f553, /192.168.1.51:48599 => /192.168.1.51:5555] BOUND: /192.168.1.51:5555 
          
           14/08/10 14:32:44 INFO ipc.NettyServer: [id: 0x3d36f553, /192.168.1.51:48599 => /192.168.1.51:5555] CONNECTED: /192.168.1.51:48599 
          
           14/08/10 14:34:33 INFO sink.LoggerSink: Event: { headers:{type=ali} body: 69 64 6F 61 6C 6C 5F 54 45 53 54 32       idoall_TEST2 }

　　　　可以看到，根据header中不同的条件分布到不同的channel上

　　　　10)案例10：Flume Sink Processors
　　　　failover的机器是一直发送给其中一个sink，当这个sink不可用的时候，自动发送到下一个sink。

　　　　　　a)在m1创建Flume_Sink_Processors配置文件

 
      ? 
     
           root@m1: 
           /home/hadoop 
           # vi /home/hadoop/flume-1.5.0-bin/conf/Flume_Sink_Processors.conf 
          
           a1.sources = r1 
          
           a1.sinks = k1 k2 
          
           a1.channels = c1 c2 
          
           #这个是配置failover的关键，需要有一个sink group 
          
           a1.sinkgroups = g1 
          
           a1.sinkgroups.g1.sinks = k1 k2 
          
           #处理的类型是failover 
          
           a1.sinkgroups.g1.processor. 
           type 
           = failover 
          
           #优先级，数字越大优先级越高，每个sink的优先级必须不相同 
          
           a1.sinkgroups.g1.processor.priority.k1 = 5 
          
           a1.sinkgroups.g1.processor.priority.k2 = 10 
          
           #设置为10秒，当然可以根据你的实际状况更改成更快或者很慢 
          
           a1.sinkgroups.g1.processor.maxpenalty = 10000 
          
           # Describe/configure the source 
          
           a1.sources.r1. 
           type 
           = syslogtcp 
          
           a1.sources.r1.port = 5140 
          
           a1.sources.r1.channels = c1 c2 
          
           a1.sources.r1.selector. 
           type 
           = replicating 
          
           # Describe the sink 
          
           a1.sinks.k1. 
           type 
           = avro 
          
           a1.sinks.k1.channel = c1 
          
           a1.sinks.k1. 
           hostname 
           = m1 
          
           a1.sinks.k1.port = 5555 
          
           a1.sinks.k2. 
           type 
           = avro 
          
           a1.sinks.k2.channel = c2 
          
           a1.sinks.k2. 
           hostname 
           = m2 
          
           a1.sinks.k2.port = 5555 
          
           # Use a channel which buffers events in memory 
          
           a1.channels.c1. 
           type 
           = memory 
          
           a1.channels.c1.capacity = 1000 
          
           a1.channels.c1.transactionCapacity = 100 
          
           a1.channels.c2. 
           type 
           = memory 
          
           a1.channels.c2.capacity = 1000 
          
           a1.channels.c2.transactionCapacity = 100

　　　　　　b)在m1创建Flume_Sink_Processors_avro配置文件

 
      ? 
     
           root@m1: 
           /home/hadoop 
           # vi /home/hadoop/flume-1.5.0-bin/conf/Flume_Sink_Processors_avro.conf 
          
           a1.sources = r1 
          
           a1.sinks = k1 
          
           a1.channels = c1 
          
           # Describe/configure the source 
          
           a1.sources.r1. 
           type 
           = avro 
          
           a1.sources.r1.channels = c1 
          
           a1.sources.r1.bind = 0.0.0.0 
          
           a1.sources.r1.port = 5555 
          
           # Describe the sink 
          
           a1.sinks.k1. 
           type 
           = logger 
          
           # Use a channel which buffers events in memory 
          
           a1.channels.c1. 
           type 
           = memory 
          
           a1.channels.c1.capacity = 1000 
          
           a1.channels.c1.transactionCapacity = 100 
          
           # Bind the source and sink to the channel 
          
           a1.sources.r1.channels = c1 
          
           a1.sinks.k1.channel = c1

　　　　　　c)将2个配置文件复制到m2上一份

 
      ? 
     
           root@m1: 
           /home/hadoop/flume-1 
           .5.0-bin 
           # scp -r /home/hadoop/flume-1.5.0-bin/conf/Flume_Sink_Processors.conf root@m2:/home/hadoop/flume-1.5.0-bin/conf/Flume_Sink_Processors.conf 
          
           root@m1: 
           /home/hadoop/flume-1 
           .5.0-bin 
           # scp -r /home/hadoop/flume-1.5.0-bin/conf/Flume_Sink_Processors_avro.conf root@m2:/home/hadoop/flume-1.5.0-bin/conf/Flume_Sink_Processors_avro.conf

　　　　　　d)打开4个窗口，在m1和m2上同时启动两个flume agent

 
      ? 
     
           root@m1: 
           /home/hadoop 
           # /home/hadoop/flume-1.5.0-bin/bin/flume-ng agent -c . -f /home/hadoop/flume-1.5.0-bin/conf/Flume_Sink_Processors_avro.conf -n a1 -Dflume.root.logger=INFO,console 
          
           root@m1: 
           /home/hadoop 
           # /home/hadoop/flume-1.5.0-bin/bin/flume-ng agent -c . -f /home/hadoop/flume-1.5.0-bin/conf/Flume_Sink_Processors.conf -n a1 -Dflume.root.logger=INFO,console

　　　　　　e)然后在m1或m2的任意一台机器上，测试产生log

 
      ? 
     
           root@m1: 
           /home/hadoop 
           # echo "idoall.org test1 failover" | nc localhost 5140

　　　　　　f)因为m2的优先级高，所以在m2的sink窗口，可以看到以下信息，而m1没有：

 
      ? 
     
           14/08/10 15:02:46 INFO ipc.NettyServer: Connection to /192.168.1.51:48692 disconnected. 
          
           14/08/10 15:03:12 INFO ipc.NettyServer: [id: 0x09a14036, /192.168.1.51:48704 => /192.168.1.51:5555] OPEN 
          
           14/08/10 15:03:12 INFO ipc.NettyServer: [id: 0x09a14036, /192.168.1.51:48704 => /192.168.1.51:5555] BOUND: /192.168.1.51:5555 
          
           14/08/10 15:03:12 INFO ipc.NettyServer: [id: 0x09a14036, /192.168.1.51:48704 => /192.168.1.51:5555] CONNECTED: /192.168.1.51:48704 
          
           14/08/10 15:03:26 INFO sink.LoggerSink: Event: { headers:{Severity=0, flume.syslog.status=Invalid, Facility=0} body: 69 64 6F 61 6C 6C 2E 6F 72 67 20 74 65 73 74 31 idoall.org test1 }

　　　　　　g)这时我们停止掉m2机器上的sink(ctrl+c)，再次输出测试数据：

 
      ? 
     
           root@m1: 
           /home/hadoop 
           # echo "idoall.org test2 failover" | nc localhost 5140

　　　　　　h)可以在m1的sink窗口，看到读取到了刚才发送的两条测试数据：

 
      ? 
     
           14/08/10 15:02:46 INFO ipc.NettyServer: Connection to /192.168.1.51:47036 disconnected. 
          
           14/08/10 15:03:12 INFO ipc.NettyServer: [id: 0xbcf79851, /192.168.1.51:47048 => /192.168.1.50:5555] OPEN 
          
           14/08/10 15:03:12 INFO ipc.NettyServer: [id: 0xbcf79851, /192.168.1.51:47048 => /192.168.1.50:5555] BOUND: /192.168.1.50:5555 
          
           14/08/10 15:03:12 INFO ipc.NettyServer: [id: 0xbcf79851, /192.168.1.51:47048 => /192.168.1.50:5555] CONNECTED: /192.168.1.51:47048 
          
           14/08/10 15:07:56 INFO sink.LoggerSink: Event: { headers:{Severity=0, flume.syslog.status=Invalid, Facility=0} body: 69 64 6F 61 6C 6C 2E 6F 72 67 20 74 65 73 74 31 idoall.org test1 } 
          
           14/08/10 15:07:56 INFO sink.LoggerSink: Event: { headers:{Severity=0, flume.syslog.status=Invalid, Facility=0} body: 69 64 6F 61 6C 6C 2E 6F 72 67 20 74 65 73 74 32 idoall.org test2 }

　　　　　　i)我们再在m2的sink窗口中，启动sink：

 
      ? 
     
           root@m1: 
           /home/hadoop 
           # /home/hadoop/flume-1.5.0-bin/bin/flume-ng agent -c . -f /home/hadoop/flume-1.5.0-bin/conf/Flume_Sink_Processors_avro.conf -n a1 -Dflume.root.logger=INFO,console

　　　　　　j)输入两批测试数据：

 
      ? 
     
           root@m1: 
           /home/hadoop 
           # echo "idoall.org test3 failover" | nc localhost 5140 && echo "idoall.org test4 failover" | nc localhost 5140

　　　　　k)在m2的sink窗口，我们可以看到以下信息，因为优先级的关系，log消息会再次落到m2上：

 
      ? 
     
           14/08/10 15:09:47 INFO node.Application: Starting Sink k1 
          
           14/08/10 15:09:47 INFO node.Application: Starting Source r1 
          
           14/08/10 15:09:47 INFO source.AvroSource: Starting Avro source r1: { bindAddress: 0.0.0.0, port: 5555 }... 
          
           14/08/10 15:09:47 INFO instrumentation.MonitoredCounterGroup: Monitored counter group for type: SOURCE, name: r1: Successfully registered new MBean. 
          
           14/08/10 15:09:47 INFO instrumentation.MonitoredCounterGroup: Component type: SOURCE, name: r1 started 
          
           14/08/10 15:09:47 INFO source.AvroSource: Avro source r1 started. 
          
           14/08/10 15:09:54 INFO ipc.NettyServer: [id: 0x96615732, /192.168.1.51:48741 => /192.168.1.51:5555] OPEN 
          
           14/08/10 15:09:54 INFO ipc.NettyServer: [id: 0x96615732, /192.168.1.51:48741 => /192.168.1.51:5555] BOUND: /192.168.1.51:5555 
          
           14/08/10 15:09:54 INFO ipc.NettyServer: [id: 0x96615732, /192.168.1.51:48741 => /192.168.1.51:5555] CONNECTED: /192.168.1.51:48741 
          
           14/08/10 15:09:57 INFO sink.LoggerSink: Event: { headers:{Severity=0, flume.syslog.status=Invalid, Facility=0} body: 69 64 6F 61 6C 6C 2E 6F 72 67 20 74 65 73 74 32 idoall.org test2 } 
          
           14/08/10 15:10:43 INFO ipc.NettyServer: [id: 0x12621f9a, /192.168.1.50:38166 => /192.168.1.51:5555] OPEN 
          
           14/08/10 15:10:43 INFO ipc.NettyServer: [id: 0x12621f9a, /192.168.1.50:38166 => /192.168.1.51:5555] BOUND: /192.168.1.51:5555 
          
           14/08/10 15:10:43 INFO ipc.NettyServer: [id: 0x12621f9a, /192.168.1.50:38166 => /192.168.1.51:5555] CONNECTED: /192.168.1.50:38166 
          
           14/08/10 15:10:43 INFO sink.LoggerSink: Event: { headers:{Severity=0, flume.syslog.status=Invalid, Facility=0} body: 69 64 6F 61 6C 6C 2E 6F 72 67 20 74 65 73 74 33 idoall.org test3 } 
          
           14/08/10 15:10:43 INFO sink.LoggerSink: Event: { headers:{Severity=0, flume.syslog.status=Invalid, Facility=0} body: 69 64 6F 61 6C 6C 2E 6F 72 67 20 74 65 73 74 34 idoall.org test4 }

　　　　11)案例11：Load balancing Sink Processor
　　　　load balance type和failover不同的地方是，load balance有两个配置，一个是轮询，一个是随机。两种情况下如果被选择的sink不可用，就会自动尝试发送到下一个可用的sink上面。

　　　　　　a)在m1创建Load_balancing_Sink_Processors配置文件

 
      ? 
     
           root@m1: 
           /home/hadoop 
           # vi /home/hadoop/flume-1.5.0-bin/conf/Load_balancing_Sink_Processors.conf 
          
           a1.sources = r1 
          
           a1.sinks = k1 k2 
          
           a1.channels = c1 
          
           #这个是配置Load balancing的关键，需要有一个sink group 
          
           a1.sinkgroups = g1 
          
           a1.sinkgroups.g1.sinks = k1 k2 
          
           a1.sinkgroups.g1.processor. 
           type 
           = load_balance 
          
           a1.sinkgroups.g1.processor.backoff =  
           true 
          
           a1.sinkgroups.g1.processor.selector = round_robin 
          
           # Describe/configure the source 
          
           a1.sources.r1. 
           type 
           = syslogtcp 
          
           a1.sources.r1.port = 5140 
          
           a1.sources.r1.channels = c1 
          
           # Describe the sink 
          
           a1.sinks.k1. 
           type 
           = avro 
          
           a1.sinks.k1.channel = c1 
          
           a1.sinks.k1. 
           hostname 
           = m1 
          
           a1.sinks.k1.port = 5555 
          
           a1.sinks.k2. 
           type 
           = avro 
          
           a1.sinks.k2.channel = c1 
          
           a1.sinks.k2. 
           hostname 
           = m2 
          
           a1.sinks.k2.port = 5555 
          
           # Use a channel which buffers events in memory 
          
           a1.channels.c1. 
           type 
           = memory 
          
           a1.channels.c1.capacity = 1000 
          
           a1.channels.c1.transactionCapacity = 100

　　　　　　b)在m1创建Load_balancing_Sink_Processors_avro配置文件

 
      ? 
     
           root@m1: 
           /home/hadoop 
           # vi /home/hadoop/flume-1.5.0-bin/conf/Load_balancing_Sink_Processors_avro.conf 
          
           a1.sources = r1 
          
           a1.sinks = k1 
          
           a1.channels = c1 
          
           # Describe/configure the source 
          
           a1.sources.r1. 
           type 
           = avro 
          
           a1.sources.r1.channels = c1 
          
           a1.sources.r1.bind = 0.0.0.0 
          
           a1.sources.r1.port = 5555 
          
           # Describe the sink 
          
           a1.sinks.k1. 
           type 
           = logger 
          
           # Use a channel which buffers events in memory 
          
           a1.channels.c1. 
           type 
           = memory 
          
           a1.channels.c1.capacity = 1000 
          
           a1.channels.c1.transactionCapacity = 100 
          
           # Bind the source and sink to the channel 
          
           a1.sources.r1.channels = c1 
          
           a1.sinks.k1.channel = c1

　　　　　　c)将2个配置文件复制到m2上一份

 
      ? 
     
           root@m1: 
           /home/hadoop/flume-1 
           .5.0-bin 
           # scp -r /home/hadoop/flume-1.5.0-bin/conf/Load_balancing_Sink_Processors.conf root@m2:/home/hadoop/flume-1.5.0-bin/conf/Load_balancing_Sink_Processors.conf 
          
           root@m1: 
           /home/hadoop/flume-1 
           .5.0-bin 
           # scp -r /home/hadoop/flume-1.5.0-bin/conf/Load_balancing_Sink_Processors_avro.conf root@m2:/home/hadoop/flume-1.5.0-bin/conf/Load_balancing_Sink_Processors_avro.conf

　　　　　　d)打开4个窗口，在m1和m2上同时启动两个flume agent

 
      ? 
     
           root@m1: 
           /home/hadoop 
           # /home/hadoop/flume-1.5.0-bin/bin/flume-ng agent -c . -f /home/hadoop/flume-1.5.0-bin/conf/Load_balancing_Sink_Processors_avro.conf -n a1 -Dflume.root.logger=INFO,console 
          
           root@m1: 
           /home/hadoop 
           # /home/hadoop/flume-1.5.0-bin/bin/flume-ng agent -c . -f /home/hadoop/flume-1.5.0-bin/conf/Load_balancing_Sink_Processors.conf -n a1 -Dflume.root.logger=INFO,console

　　　　　　e)然后在m1或m2的任意一台机器上，测试产生log，一行一行输入，输入太快，容易落到一台机器上

 
      ? 
     
           root@m1: 
           /home/hadoop 
           # echo "idoall.org test1" | nc localhost 5140 
          
           root@m1: 
           /home/hadoop 
           # echo "idoall.org test2" | nc localhost 5140 
          
           root@m1: 
           /home/hadoop 
           # echo "idoall.org test3" | nc localhost 5140 
          
           root@m1: 
           /home/hadoop 
           # echo "idoall.org test4" | nc localhost 5140

　　　　　　f)在m1的sink窗口，可以看到以下信息：

 
      ? 
     
           14/08/10 15:35:29 INFO sink.LoggerSink: Event: { headers:{Severity=0, flume.syslog.status=Invalid, Facility=0} body: 69 64 6F 61 6C 6C 2E 6F 72 67 20 74 65 73 74 32 idoall.org test2 } 
          
           14/08/10 15:35:33 INFO sink.LoggerSink: Event: { headers:{Severity=0, flume.syslog.status=Invalid, Facility=0} body: 69 64 6F 61 6C 6C 2E 6F 72 67 20 74 65 73 74 34 idoall.org test4 }

　　　　　　g)在m2的sink窗口，可以看到以下信息：

 
      ? 
     
           14/08/10 15:35:27 INFO sink.LoggerSink: Event: { headers:{Severity=0, flume.syslog.status=Invalid, Facility=0} body: 69 64 6F 61 6C 6C 2E 6F 72 67 20 74 65 73 74 31 idoall.org test1 } 
          
           14/08/10 15:35:29 INFO sink.LoggerSink: Event: { headers:{Severity=0, flume.syslog.status=Invalid, Facility=0} body: 69 64 6F 61 6C 6C 2E 6F 72 67 20 74 65 73 74 33 idoall.org test3 }

　　　　说明轮询模式起到了作用。

　　　　12)案例12：Hbase sink

　　　　　　a)在测试之前，请先参考《ubuntu12.04+hadoop2.2.0+zookeeper3.4.5+hbase0.96.2+hive0.13.1分布式环境部署》将hbase启动

　　　　　　b)然后将以下文件复制到flume中：

 
      ? 
     
 
       
         
         
           cp 
            /home/hadoop/hbase-0 
           .96.2-hadoop2 
           /lib/protobuf-java-2 
           .5.0.jar  
           /home/hadoop/flume-1 
           .5.0-bin 
           /lib 
          
 
           cp 
            /home/hadoop/hbase-0 
           .96.2-hadoop2 
           /lib/hbase-client-0 
           .96.2-hadoop2.jar  
           /home/hadoop/flume-1 
           .5.0-bin 
           /lib 
          
 
           cp 
            /home/hadoop/hbase-0 
           .96.2-hadoop2 
           /lib/hbase-common-0 
           .96.2-hadoop2.jar  
           /home/hadoop/flume-1 
           .5.0-bin 
           /lib 
          
 
           cp 
            /home/hadoop/hbase-0 
           .96.2-hadoop2 
           /lib/hbase-protocol-0 
           .96.2-hadoop2.jar  
           /home/hadoop/flume-1 
           .5.0-bin 
           /lib 
          
 
           cp 
            /home/hadoop/hbase-0 
           .96.2-hadoop2 
           /lib/hbase-server-0 
           .96.2-hadoop2.jar  
           /home/hadoop/flume-1 
           .5.0-bin 
           /lib 
          
 
           cp 
            /home/hadoop/hbase-0 
           .96.2-hadoop2 
           /lib/hbase-hadoop2-compat-0 
           .96.2-hadoop2.jar  
           /home/hadoop/flume-1 
           .5.0-bin 
           /lib 
          
 
           cp 
            /home/hadoop/hbase-0 
           .96.2-hadoop2 
           /lib/hbase-hadoop-compat-0 
           .96.2-hadoop2.jar  
           /home/hadoop/flume-1 
           .5.0-bin 
           /lib 
           @@@ 
          
 
           cp 
            /home/hadoop/hbase-0 
           .96.2-hadoop2 
           /lib/htrace-core-2 
           .04.jar  
           /home/hadoop/flume-1 
           .5.0-bin 
           /lib 
          
 
       
 
     

　　　　　　c)确保test_idoall_org表在hbase中已经存在，test_idoall_org表的格式以及字段请参考《ubuntu12.04+hadoop2.2.0+zookeeper3.4.5+hbase0.96.2+hive0.13.1分布式环境部署》中关于hbase部分的建表代码。

　　　　　　d)在m1创建hbase_simple配置文件

 
      ? 
     
           root@m1: 
           /home/hadoop 
           # vi /home/hadoop/flume-1.5.0-bin/conf/hbase_simple.conf 
          
           a1.sources = r1 
          
           a1.sinks = k1 
          
           a1.channels = c1 
          
           # Describe/configure the source 
          
           a1.sources.r1. 
           type 
           = syslogtcp 
          
           a1.sources.r1.port = 5140 
          
           a1.sources.r1.host = localhost 
          
           a1.sources.r1.channels = c1 
          
           # Describe the sink 
          
           a1.sinks.k1. 
           type 
           = logger 
          
           a1.sinks.k1. 
           type 
           = hbase 
          
           a1.sinks.k1.table = test_idoall_org 
          
           a1.sinks.k1.columnFamily = name 
          
           a1.sinks.k1.column = idoall 
          
           a1.sinks.k1.serializer = org.apache.flume.sink.hbase.RegexHbaseEventSerializer 
          
           a1.sinks.k1.channel = memoryChannel 
          
           # Use a channel which buffers events in memory 
          
           a1.channels.c1. 
           type 
           = memory 
          
           a1.channels.c1.capacity = 1000 
          
           a1.channels.c1.transactionCapacity = 100 
          
           # Bind the source and sink to the channel 
          
           a1.sources.r1.channels = c1 
          
           a1.sinks.k1.channel = c1

　　　　　　e)启动flume agent

 
      ? 
     
           /home/hadoop/flume-1 
           .5.0-bin 
           /bin/flume-ng 
           agent -c . -f  
           /home/hadoop/flume-1 
           .5.0-bin 
           /conf/hbase_simple 
           .conf -n a1 -Dflume.root.logger=INFO,console

　　　　　　f)测试产生syslog

 
      ? 
     
           root@m1: 
           /home/hadoop 
           # echo "hello idoall.org from flume" | nc localhost 5140

　　　　　　g)这时登录到hbase中，可以发现新数据已经插入

 
      ? 
     
           root@m1: 
           /home/hadoop 
           # /home/hadoop/hbase-0.96.2-hadoop2/bin/hbase shell 
          
           2014-08-10 16:09:48,984 INFO [main] Configuration.deprecation: hadoop.native.lib is deprecated. Instead, use io.native.lib.available 
          
           HBase Shell; enter  
           'help' 
            for 
           list of supported commands. 
          
           Type  
           "exit" 
           to leave the HBase Shell 
          
           Version 0.96.2-hadoop2, r1581096, Mon Mar 24 16:03:18 PDT 2014 
          
           hbase(main):001:0> list 
          
           TABLE                                                                                                          
          
           SLF4J: Class path contains multiple SLF4J bindings. 
          
           SLF4J: Found binding  
           in 
           [jar: 
           file 
           : 
           /home/hadoop/hbase-0 
           .96.2-hadoop2 
           /lib/slf4j-log4j12-1 
           .6.4.jar! 
           /org/slf4j/impl/StaticLoggerBinder 
           .class] 
          
           SLF4J: Found binding  
           in 
           [jar: 
           file 
           : 
           /home/hadoop/hadoop-2 
           .2.0 
           /share/hadoop/common/lib/slf4j-log4j12-1 
           .7.5.jar! 
           /org/slf4j/impl/StaticLoggerBinder 
           .class] 
          
           SLF4J: See http: 
           //www 
           .slf4j.org 
           /codes 
           .html 
           #multiple_bindings for an explanation. 
          
           hbase2hive_idoall                                                                                                    
          
           hive2hbase_idoall                                                                                                    
          
           test_idoall_org                                                                                                     
          
           3 row(s)  
           in 
           2.6880 seconds 
          
           => [ 
           "hbase2hive_idoall" 
           ,  
           "hive2hbase_idoall" 
           ,  
           "test_idoall_org" 
           ] 
          
           hbase(main):002:0> scan  
           "test_idoall_org" 
          
           ROW                          COLUMN+CELL                                                                            
          
           10086                         column=name:idoall, timestamp=1406424831473, value=idoallvalue                                                  
          
           1 row(s)  
           in 
           0.0550 seconds 
          
           hbase(main):003:0> scan  
           "test_idoall_org" 
          
           ROW                          COLUMN+CELL                                                                            
          
           10086                         column=name:idoall, timestamp=1406424831473, value=idoallvalue                                                  
          
           1407658495588-XbQCOZrKK8-0              column=name:payload, timestamp=1407658498203, value=hello idoall.org from flume                                          
          
           2 row(s)  
           in 
           0.0200 seconds 
          
           hbase(main):004:0> quit

　　　　经过这么多flume的例子测试，如果你全部做完后，会发现flume的功能真的很强大，可以进行各种搭配来完成你想要的工作，俗话说师傅领进门，修行在个人，如何能够结合你的产品业务，将flume更好的应用起来，快去动手实践吧。

　　　　这篇文章做为一个笔记，希望能够对刚入门的同学起到帮助作用。

情绪觉察日记第37天露露_e800
今天是家庭关系规划师的第二阶最后一天，慧萍老师帮我做了个案，帮我处理了埋在心底好多年的一份恐惧，并给了我深深的力量！这几天出来学习，爸妈过来婆家帮我带小孩，妈妈出于爱帮我收拾东西，并跟我先生和婆婆产生矛盾，妈妈觉得他们没有照顾好我…。今晚回家见到妈妈，我很欣赏她并赞扬她，妈妈说今晚要跟我睡我说好，当我们俩躺在床上准备睡觉的时候，我握着妈妈的手对她说:妈妈这几天辛苦你了，你看你多利害把我们的家收拾得
芦花鞋一四许叶晗
又是在一个寒冷的夏日里，青铜和葵花决定今天一起去卖芦花鞋，奶奶亲手给他们做了一碗热乎乎的粥对他们说:“就靠你们两挣生活费了这碗粥赶紧趁热喝了吧！”于是青铜和葵花喝完了奶奶给她们做的粥，就准备去镇上卖卢花鞋，这回青铜和葵花穿着新的芦花鞋来到了镇上。青铜这回看到了很多人都在卖，用手势表达对葵花说:“这回有好多人在抢我们生意呢！我们必须得吆喝起来。”葵花点了点头。可是谁知他们也大声的叫，卖芦花喽！卖芦花
关于沟通这件事，项目经理不需要每次都面对面进行流程大师兄
很多项目经理都会遇到这样的问题，项目中由于事情太多，根本没有足够的时间去召开会议，那在这种情况下如何去有效地管理项目中的利益相关者？当然，不建议电子邮件也不需要开会的话，建议可以采取下面几种方式来形成有效的沟通，这几种方式可以帮助你努力的通过各种办法来保持和各方面的联系。项目经理首先要问自己几个问题，项目中哪些利益相关者是必须要进行沟通的？可以列出项目中所有的利益相关者清单，同时也整理出项目中哪些
机器学习与深度学习间关系与区别 ℒℴѵℯ心·动ꦿ໊ོ꫞ 人工智能学习深度学习 python
一、机器学习概述定义机器学习（MachineLearning,ML）是一种通过数据驱动的方法，利用统计学和计算算法来训练模型，使计算机能够从数据中学习并自动进行预测或决策。机器学习通过分析大量数据样本，识别其中的模式和规律，从而对新的数据进行判断。其核心在于通过训练过程，让模型不断优化和提升其预测准确性。主要类型1.监督学习（SupervisedLearning）监督学习是指在训练数据集中包含输入
【iOS】MVC设计模式 Magnetic_h ios mvc 设计模式 objective-c 学习 ui
MVC前言如何设计一个程序的结构，这是一门专门的学问，叫做"架构模式"（architecturalpattern），属于编程的方法论。MVC模式就是架构模式的一种。它是Apple官方推荐的App开发架构，也是一般开发者最先遇到、最经典的架构。MVC各层controller层Controller/ViewController/VC（控制器）负责协调Model和View，处理大部分逻辑它将数据从Mod
一百九十四章. 自相矛盾巨木擎天
唉！就这么一夜，林子感觉就像过了很多天似的，先是回了阳间家里，遇到了那么多不可思议的事情儿。特别是小伙伴们，第二次与自己见面时，僵硬的表情和恐怖的气氛，让自己如坐针毡，打从心眼里难受！还有东子，他现在还好吗？有没有被人欺负？护城河里的小鱼小虾们，还都在吗？水不会真的干枯了吧？那对相亲相爱漂亮的太平鸟儿，还好吧！春天了，到了做窝、下蛋、喂养小鸟宝宝的时候了，希望它们都能够平安啊！虽然没有看见家人，也
UI学习——cell的复用和自定义cell Magnetic_h ui 学习
目录cell的复用手动（非注册）自动（注册）自定义cellcell的复用在iOS开发中，单元格复用是一种提高表格（UITableView）和集合视图（UICollectionView）滚动性能的技术。当一个UITableViewCell或UICollectionViewCell首次需要显示时，如果没有可复用的单元格，则视图会创建一个新的单元格。一旦这个单元格滚动出屏幕，它就不会被销毁。相反，它被添
element实现动态路由+面包屑软件技术NINI vue案例 vue.js 前端
el-breadcrumb是ElementUI组件库中的一个面包屑导航组件，它用于显示当前页面的路径，帮助用户快速理解和导航到应用的各个部分。在Vue.js项目中，如果你已经安装了ElementUI，就可以很方便地使用el-breadcrumb组件。以下是一个基本的使用示例：安装ElementUI（如果你还没有安装的话）:你可以通过npm或yarn来安装ElementUI。bash复制代码npmi
地推话术，如何应对地推过程中家长的拒绝校师学
相信校长们在做地推的时候经常遇到这种情况：市场专员反馈家长不接单，咨询师反馈难以邀约这些家长上门，校区地推疲软，招生难。为什么？仅从地推层面分析，一方面因为家长受到的信息轰炸越来越多，对信息越来越“免疫”；而另一方面地推人员的专业能力和营销话术没有提高，无法应对家长的拒绝，对有意向的家长也不知如何跟进，眼睁睁看着家长走远；对于家长的疑问，更不知道如何有技巧地回答，机会白白流失。由于回答没技巧和专业
谢谢你们，爱你们！鹿游儿
昨天家人去泡温泉，二个孩子也带着去，出发前一晚，匆匆下班，赶回家和孩子一起收拾。饭后，我拿出笔和本子（上次去澳门时做手帐的本子）写下了1\2\3\4\5\6\7\8\9,让后让小壹去思考，带什么出发去旅游呢？她在对应的数字旁边画上了，泳衣、泳圈、肖恩、内衣内裤、tapuy、拖鞋……画完后，就让她自己对着这个本子，将要带的，一一带上，没想到这次带的书还是这本《便便工厂》(晚上姑婆发照片过来，妹妹累得
C语言如何定义宏函数？小九格物 c语言
在C语言中，宏函数是通过预处理器定义的，它在编译之前替换代码中的宏调用。宏函数可以模拟函数的行为，但它们不是真正的函数，因为它们在编译时不会进行类型检查，也不会分配存储空间。宏函数的定义通常使用#define指令，后面跟着宏的名称和参数列表，以及宏展开后的代码。宏函数的定义方式：1.基本宏函数：这是最简单的宏函数形式，它直接定义一个表达式。#defineSQUARE(x)((x)*(x))2.带参
微服务下功能权限与数据权限的设计与实现 nbsaas-boot 微服务 java 架构
在微服务架构下，系统的功能权限和数据权限控制显得尤为重要。随着系统规模的扩大和微服务数量的增加，如何保证不同用户和服务之间的访问权限准确、细粒度地控制，成为设计安全策略的关键。本文将讨论如何在微服务体系中设计和实现功能权限与数据权限控制。1.功能权限与数据权限的定义功能权限：指用户或系统角色对特定功能的访问权限。通常是某个用户角色能否执行某个操作，比如查看订单、创建订单、修改用户资料等。数据权限：
理解Gunicorn：Python WSGI服务器的基石范范0825 ipython linux 运维
理解Gunicorn：PythonWSGI服务器的基石介绍Gunicorn，全称GreenUnicorn，是一个为PythonWSGI（WebServerGatewayInterface）应用设计的高效、轻量级HTTP服务器。作为PythonWeb应用部署的常用工具，Gunicorn以其高性能和易用性著称。本文将介绍Gunicorn的基本概念、安装和配置，帮助初学者快速上手。1.什么是Gunico
学点心理知识，呵护孩子健康静候花开_7090
昨天听了华中师范大学教育管理学系副教授张玲老师的《哪里才是学生心理健康的最后庇护所，超越教育与技术的思考》的讲座。今天又重新学习了一遍，收获匪浅。张玲博士也注意到了当今社会上的孩子由于心理问题导致的自残、自杀及伤害他人等恶性事件。她向我们普及了一个重要的命题，她说心理健康的一些基本命题，我们与我们通常的一些教育命题是不同的，她还举了几个例子，让我们明白我们原来以为的健康并非心理学上的健康。比如如果
2021年12月19日，春蕾教育集团团建活动感受——黄晓丹黄错错加油
感受:1.从陌生到熟悉的过程。游戏环节让我们在轻松的氛围中得到了锻炼，也增长了不少知识。2.游戏过程中，我们贡献的是个人力量，展现的是团队的力量。它磨合的往往不止是工作的熟悉，更是观念上契合度的贴近。3.这和工作是一样的道理。在各自的岗位上，每个人摆正自己的位置、各司其职充分发挥才能，并团结一致劲往一处使，才能实现最大的成功。新知:1.团队精神需要不断地创新。过去，人们把创新看作是冒风险，现在人们
Cell Insight | 单细胞测序技术又一新发现，可用于HIV-1和Mtb共感染个体诊断尐尐呅
结核病是艾滋病合并其他疾病中导致患者死亡的主要原因。其中结核病由结核分枝杆菌（Mycobacteriumtuberculosis,Mtb）感染引起，获得性免疫缺陷综合症（艾滋病）由人免疫缺陷病毒（Humanimmunodeficiencyvirustype1,HIV-1）感染引起。国家感染性疾病临床医学研究中心/深圳市第三人民医院张国良团队携手深圳华大生命科学研究院吴靓团队，共同研究得出单细胞测序
c++ 的iostream 和 c++的stdio的区别和联系黄卷青灯77 c++算法开发语言 iostream stdio
在C++中，iostream和C语言的stdio.h都是用于处理输入输出的库，但它们在设计、用法和功能上有许多不同。以下是两者的区别和联系：区别1.编程风格iostream（C++风格）：C++标准库中的输入输出流类库，支持面向对象的输入输出操作。典型用法是cin（输入）和cout（输出），使用>操作符来处理数据。更加类型安全，支持用户自定义类型的输入输出。#includeintmain(){in
《投行人生》读书笔记小蘑菇的树洞
《投行人生》----作者詹姆斯-A-朗德摩根斯坦利副主席40年的职业洞见-很短小精悍的篇幅，比较适合初入职场的新人。第一部分成功的职业生涯需要规划1.情商归为适应能力分享与协作同理心适应能力，更多的是自我意识，你有能力识别自己的情并分辨这些情绪如何影响你的思想和行为。2.对于初入职场的人的建议，细节，截止日期和数据很重要截止日期，一种有效的方法是请老板为你所有的任务进行优先级排序。和老板喝咖啡的好
Linux下QT开发的动态库界面弹出操作（SDL2） 13jjyao QT类 qt 开发语言 sdl2 linux
需求：操作系统为linux，开发框架为qt，做成需带界面的qt动态库，调用方为java等非qt程序难点：调用方为java等非qt程序，也就是说调用方肯定不带QApplication::exec()，缺少了这个，QTimer等事件和QT创建的窗口将不能弹出(包括opencv也是不能弹出)；这与qt调用本身qt库是有本质的区别的思路：1.调用方缺QApplication::exec()，那么我们在接口
绘本讲师训练营【24期】8/21阅读原创《独生小孩》 1784e22615e0
24016-孟娟《独生小孩》图片发自App今天我想分享一个蛮特别的绘本，讲的是一个特殊的群体，我也是属于这个群体，80后的独生小孩。这是一本中国绘本，作者郭婧，也是一个80厚。全书一百多页，均为铅笔绘制，虽然为黑白色调，但并不显得沉闷。全书没有文字，犹如“默片”，但并不影响读者对该作品的理解，反而显得神秘，梦幻，給读者留下想象的空间。作者在前蝴蝶页这样写到：“我更希望父母和孩子一起分享这本书，使他
店群合一模式下的社区团购新发展——结合链动 2+1 模式、AI 智能名片与 S2B2C 商城小程序源码说私域人工智能小程序
摘要：本文探讨了店群合一的社区团购平台在当今商业环境中的重要性和优势。通过分析店群合一模式如何将互联网社群与线下终端紧密结合，阐述了链动2+1模式、AI智能名片和S2B2C商城小程序源码在这一模式中的应用价值。这些创新元素的结合为社区团购带来了新的机遇，提升了用户信任感、拓展了营销渠道，并实现了线上线下的完美融合。一、引言随着互联网技术的不断发展，社区团购作为一种新兴的商业模式，在满足消费者日常需
我校举行新老教师师徒结对仪式暨名师专业工作室工作交流活动李蕾1229
为促进我校教师专业发展，发挥骨干教师的引领带头作用，11月6日下午，我校举行新老教师师徒结对仪式暨名师专业工作室工作交流活动。图片发自App会议由教师发展处李蕾主任主持，首先，由范校长宣读新老教师结对名单及双方承担职责。随后，两位新调入教师陈玉萍、莫正杰分别和他们的师傅鲍元美、刘召彬老师签订了师徒结对协议书。图片发自App图片发自App师徒拥抱、握手。有了师傅就有了目标有了方向，相信两位新教师在师
向内而求陈陈_19b4
10月27日，阴。阅读书目:《次第花开》。作者:希阿荣博堪布，是当今藏传佛家宁玛派最伟大的上师法王，如意宝晋美彭措仁波切颇具影响力的弟子之一。多年以来，赴海内外各地弘扬佛法，以正式授课、现场开示、发表文章等多种方法指导佛学弟子修行佛法。代表作《寂静之道》、《生命这出戏》、《透过佛法看世界》自出版以来一直是佛教类书籍中的畅销书。图片发自App金句:1.佛陀说，一切痛苦的根源在于我们长期以来对自身及外
消息中间件有哪些常见类型 xmh-sxh-1314 java
消息中间件根据其设计理念和用途，可以大致分为以下几种常见类型：点对点消息队列（Point-to-PointMessagingQueues）：在这种模型中，消息被发送到特定的队列中，消费者从队列中取出并处理消息。队列中的消息只能被一个消费者消费，消费后即被删除。常见的实现包括IBM的MQSeries、RabbitMQ的部分使用场景等。适用于任务分发、负载均衡等场景。发布/订阅消息模型（Pub/Sub
ArcGIS栅格计算器常见公式（赋值、0和空值的转换、补充栅格空值）研学随笔 arcgis 经验分享
我们在使用ArcGIS时通常经常用到栅格计算器，今天主要给大家介绍我日常中经常用到的几个公式，供大家参考学习。将特定值（-9999）赋值为0，例如-9999.Con("raster"==-9999,0,"raster")2.给空值赋予特定的值（如0）Con(IsNull("raster"),0,"raster")3.将特定的栅格值(如1)赋值为空值，其他保留原值SetNull("raster"==
水平垂直居中的几种方法（总结） LJ小番茄 CSS_玄学语言 html javascript 前端 css css3
1.使用flexbox的justify-content和align-items.parent{display:flex;justify-content:center;/*水平居中*/align-items:center;/*垂直居中*/height:100vh;/*需要指定高度*/}2.使用grid的place-items:center.parent{display:grid;place-item
本周第二次约练 2cfbdfe28a51
中原焦点团队中24初26刘霞2021.12.3约练161次，分享第368天当事人虽然是带着问题来的，但是咨询过程中发现，她是经过自己不断地调整和努力才走到现在的，看到当事人的不容易，找到例外，发现资源，力量感也就随之而来。增强画面感，或者说重温，会给当事人带来更深刻的感受。
放下是一段成长的修行小莳玥
人来到这个世界上，只有两件事：生和死。一件事已经做完了，另一件你还急什么呢?是人，都有七情六欲。是心，都有喜怒哀乐，这些再正常不过了。别总抱怨自己活得累，过得辛苦。永远记住：舒坦是留给死人的。苦，才是生活；累，才是工作；变，才是命运；忍，才是历练；容，才是智慧；静，才是修养；舍，才会得到；做，才会拥有。人生，活得太清楚，才是最大的不明白。有些事，看得很清，却说不清；有些人，了解很深，却猜不透；有些
回溯 Leetcode 332 重新安排行程 mmaerd Leetcode刷题学习记录 leetcode 算法职场和发展
重新安排行程Leetcode332学习记录自代码随想录给你一份航线列表tickets，其中tickets[i]=[fromi,toi]表示飞机出发和降落的机场地点。请你对该行程进行重新规划排序。所有这些机票都属于一个从JFK（肯尼迪国际机场）出发的先生，所以该行程必须从JFK开始。如果存在多种有效的行程，请你按字典排序返回最小的行程组合。例如，行程[“JFK”,“LGA”]与[“JFK”,“LGB
Python数据分析与可视化实战指南 William数据分析 python python 数据
在数据驱动的时代，Python因其简洁的语法、强大的库生态系统以及活跃的社区，成为了数据分析与可视化的首选语言。本文将通过一个详细的案例，带领大家学习如何使用Python进行数据分析，并通过可视化来直观呈现分析结果。一、环境准备1.1安装必要库在开始数据分析和可视化之前，我们需要安装一些常用的库。主要包括pandas、numpy、matplotlib和seaborn等。这些库分别用于数据处理、数学
mysql主从数据同步林鹤霄 mysql主从数据同步
配置mysql5.5主从服务器(转) 教程开始：一、安装MySQL 说明：在两台MySQL服务器192.168.21.169和192.168.21.168上分别进行如下操作，安装MySQL 5.5.22 二、配置MySQL主服务器（192.168.21.169）mysql -uroot -p &nb
oracle学习笔记 caoyong oracle
1、ORACLE的安装 a>、ORACLE的版本 8i,9i : i是internet 10g,11g : grid (网格) 12c : cloud (云计算) b>、10g不支持win7 &
数据库，SQL零基础入门天子之骄 sql 数据库入门基本术语
数据库，SQL零基础入门做网站肯定离不开数据库，本人之前没怎么具体接触SQL，这几天起早贪黑得各种入门，恶补脑洞。一些具体的知识点，可以让小白不再迷茫的术语，拿来与大家分享。数据库，永久数据的一个或多个大型结构化集合，通常与更新和查询数据的软件相关
pom.xml 一炮送你回车库 pom.xml
1、一级元素dependencies是可以被子项目继承的 2、一级元素dependencyManagement是定义该项目群里jar包版本号的，通常和一级元素properties一起使用，既然有继承，也肯定有一级元素modules来定义子元素 3、父项目里的一级元素<modules> <module>lcas-admin-war</module> <
sql查地区省市县 3213213333332132 sql mysql
-- db_yhm_city SELECT * FROM db_yhm_city WHERE class_parent_id = 1 -- 海南 class_id = 9 港、奥、台 class_id = 33、34、35 SELECT * FROM db_yhm_city WHERE class_parent_id =169 SELECT d1.cla
关于监听器那些让人头疼的事宝剑锋梅花香画图板监听器鼠标监听器
本人初学JAVA，对于界面开发我只能说有点蛋疼，用JAVA来做界面的话确实需要一定的耐心（不使用插件，就算使用插件的话也没好多少）既然Java提供了界面开发，老师又要求做，只能硬着头皮上啦。但是监听器还真是个难懂的地方，我是上了几次课才略微搞懂了些。
JAVA的遍历MAP darkranger map
Java Map遍历方式的选择 1. 阐述　　对于Java中Map的遍历方式，很多文章都推荐使用entrySet，认为其比keySet的效率高很多。理由是：entrySet方法一次拿到所有key和value的集合；而keySet拿到的只是key的集合，针对每个key，都要去Map中额外查找一次value，从而降低了总体效率。那么实际情况如何呢？　　为了解遍历性能的真实差距，包括在遍历ke
POJ 2312 Battle City 优先多列+bfs aijuans 搜索
来源：http://poj.org/problem?id=2312 题意：题目背景就是小时候玩的坦克大战，求从起点到终点最少需要多少步。已知S和R是不能走得，E是空的，可以走，B是砖，只有打掉后才可以通过。思路：很容易看出来这是一道广搜的题目，但是因为走E和走B所需要的时间不一样，因此不能用普通的队列存点。因为对于走B来说，要先打掉砖才能通过，所以我们可以理解为走B需要两步，而走E是指需要1
Hibernate与Jpa的关系，终于弄懂 avords java Hibernate 数据库 jpa
我知道Jpa是一种规范，而Hibernate是它的一种实现。除了Hibernate，还有EclipseLink(曾经的toplink)，OpenJPA等可供选择，所以使用Jpa的一个好处是，可以更换实现而不必改动太多代码。在play中定义Model时，使用的是jpa的annotations，比如javax.persistence.Entity, Table, Column, OneToMany
酸爽的console.log bee1314 console
在前端的开发中，console.log那是开发必备啊，简直直观。通过写小函数，组合大功能。更容易测试。但是在打版本时，就要删除console.log，打完版本进入开发状态又要添加，真不够爽。重复劳动太多。所以可以做些简单地封装，方便开发和上线。 /** * log.js hufeng * The safe wrapper for `console.xxx` functions *
哈佛教授：穷人和过于忙碌的人有一个共同思维特质 bijian1013 时间管理励志人生穷人过于忙碌
一个跨学科团队今年完成了一项对资源稀缺状况下人的思维方式的研究，结论是：穷人和过于忙碌的人有一个共同思维特质，即注意力被稀缺资源过分占据，引起认知和判断力的全面下降。这项研究是心理学、行为经济学和政策研究学者协作的典范。　　这个研究源于穆来纳森对自己拖延症的憎恨。他7岁从印度移民美国，很快就如鱼得水，哈佛毕业
other operate 征客丶 OS osx
一、Mac Finder 设置排序方式，预览栏在显示－》查看显示选项中二、有时预览显示时，卡死在那，有可能是一些临时文件夹被删除了，如：/private/tmp[有待验证] -------------------------------------------------------------------- 若有其他凝问或文中有错误，请及时向我指出，我好及时改正，同时也让我们一
【Scala五】分析Spark源代码总结的Scala语法三 bit1129 scala
1. If语句作为表达式 val properties = if (jobIdToActiveJob.contains(jobId)) { jobIdToActiveJob(stage.jobId).properties } else { // this stage will be assigned to "default" po
ZooKeeper 入门 BlueSkator 中间件 zk
ZooKeeper是一个高可用的分布式数据管理与系统协调框架。基于对Paxos算法的实现，使该框架保证了分布式环境中数据的强一致性，也正是基于这样的特性，使得ZooKeeper解决很多分布式问题。网上对ZK的应用场景也有不少介绍，本文将结合作者身边的项目例子，系统地对ZK的应用场景进行一个分门归类的介绍。值得注意的是，ZK并非天生就是为这些应用场景设计的，都是后来众多开发者根据其框架的特性，利
MySQL取得当前时间的函数是什么格式化日期的函数是什么 BreakingBad mysql Date
取得当前时间用 now() 就行。在数据库中格式化时间用DATE_FORMA T(date, format) . 根据格式串format 格式化日期或日期和时间值date，返回结果串。可用DATE_FORMAT( ) 来格式化DATE 或DATETIME 值，以便得到所希望的格式。根据format字符串格式化date值: %S, %s 两位数字形式的秒（ 00,01,
读《研磨设计模式》-代码笔记-组合模式 bylijinnan java 设计模式
声明：本文只为方便我个人查阅和理解，详细的分析以及源代码请移步原作者的博客http://chjavach.iteye.com/ import java.util.ArrayList; import java.util.List; abstract class Component { public abstract void printStruct(Str
4_JAVA+Oracle面试题(有答案) chenke oracle
基础测试题卷面上不能出现任何的涂写文字，所有的答案要求写在答题纸上，考卷不得带走。选择题 1、 What will happen when you attempt to compile and run the following code? （3） public class Static { static { int x = 5; // 在static内有效 } st
新一代工作流系统设计目标 comsci 工作算法脚本
用户只需要给工作流系统制定若干个需求，流程系统根据需求，并结合事先输入的组织机构和权限结构，调用若干算法，在流程展示版面上面显示出系统自动生成的流程图，然后由用户根据实际情况对该流程图进行微调，直到满意为止，流程在运行过程中，系统和用户可以根据情况对流程进行实时的调整，包括拓扑结构的调整，权限的调整，内置脚本的调整。。。。。在这个设计中，最难的地方是系统根据什么来生成流
oracle 行链接与行迁移 daizj oracle 行迁移
表里的一行对于一个数据块太大的情况有二种(一行在一个数据块里放不下) 第一种情况: INSERT的时候，INSERT时候行的大小就超一个块的大小。Oracle把这行的数据存储在一连串的数据块里(Oracle Stores the data for the row in a chain of data blocks)，这种情况称为行链接(Row Chain)，一般不可避免(除非使用更大的数据
[JShop]开源电子商务系统jshop的系统缓存实现 dinguangx jshop 电子商务
前言 jeeshop中通过SystemManager管理了大量的缓存数据，来提升系统的性能，但这些缓存数据全部都是存放于内存中的，无法满足特定场景的数据更新（如集群环境）。JShop对jeeshop的缓存机制进行了扩展，提供CacheProvider来辅助SystemManager管理这些缓存数据，通过CacheProvider,可以把缓存存放在内存,ehcache,redis，memcache
初三全学年难记忆单词 dcj3sjt126com english word
several 儿子；若干 shelf 架子 knowledge 知识；学问 librarian 图书管理员 abroad 到国外，在国外 surf 冲浪 wave 浪；波浪 twice 两次；两倍 describe 描写；叙述 especially 特别；尤其 attract 吸引 prize 奖品；奖赏 competition 比赛；竞争 event 大事；事件 O
sphinx实践 dcj3sjt126com sphinx
安装参考地址:http://briansnelson.com/How_to_install_Sphinx_on_Centos_Server yum install sphinx 如果失败的话使用下面的方式安装 wget http://sphinxsearch.com/files/sphinx-2.2.9-1.rhel6.x86_64.rpm yum loca
JPA之JPQL（三） frank1234 orm jpa JPQL
1 什么是JPQL JPQL是Java Persistence Query Language的简称，可以看成是JPA中的HQL， JPQL支持各种复杂查询。 2 检索单个对象 @Test public void querySingleObject1() { Query query = em.createQuery("sele
Remove Duplicates from Sorted Array II hcx2013 remove
Follow up for "Remove Duplicates":What if duplicates are allowed at most twice? For example,Given sorted array nums = [1,1,1,2,2,3], Your function should return length
Spring4新特性——Groovy Bean定义DSL jinnianshilongnian spring 4
Spring4新特性——泛型限定式依赖注入 Spring4新特性——核心容器的其他改进 Spring4新特性——Web开发的增强 Spring4新特性——集成Bean Validation 1.1(JSR-349)到SpringMVC Spring4新特性——Groovy Bean定义DSL Spring4新特性——更好的Java泛型操作API Spring4新
CentOS安装Mysql5.5 liuxingguome centos
CentOS下以RPM方式安装MySQL5.5 首先卸载系统自带Mysql： yum remove mysql mysql-server mysql-libs compat-mysql51 rm -rf /var/lib/mysql rm /etc/my.cnf 查看是否还有mysql软件： rpm -qa|grep mysql 去http://dev.mysql.c
第14章工具函数（下） onestopweb 函数
index.html <!DOCTYPE html PUBLIC "-//W3C//DTD XHTML 1.0 Transitional//EN" "http://www.w3.org/TR/xhtml1/DTD/xhtml1-transitional.dtd"> <html xmlns="http://www.w3.org/
POJ 1050 SaraWon 二维数组子矩阵最大和
POJ ACM第1050题的详细描述，请参照 http://acm.pku.edu.cn/JudgeOnline/problem?id=1050 题目意思：给定包含有正负整型的二维数组，找出所有子矩阵的和的最大值。如二维数组 0 -2 -7 0 9 2 -6 2 -4 1 -4 1 -1 8 0 -2 中和最大的子矩阵是 9 2 -4 1 -1 8 且最大和是15
Java8全新打造，英语学习supertool yangshangchuan java superword 闭包 java8 函数式编程
superword是一个Java实现的英文单词分析软件，主要研究英语单词音近形似转化规律、前缀后缀规律、词之间的相似性规律等等。Clean code、Fluent style、Java8 feature: Lambdas, Streams and Functional-style Programming。升学考试、工作求职、充电提高，都少不了英语的身影，英语对我们来说实在太重要

Flume环境部署和配置详解及案例大全

你可能感兴趣的:(Flume环境部署和配置详解及案例大全)