大数据:数据采集平台之Fluentd

大数据:数据采集平台之Fluentd


  1. Apache Flume
    详情请看文章:《大数据:数据采集平台之Apache Flume》

  2. Fluentd
    详情请看文章:《大数据:数据采集平台之Fluentd》

  3. Logstash
    详情请看文章:《大数据:数据采集平台之Logstash》

  4. Apache Chukwa
    详情请看文章:《大数据:数据采集平台之Apache Chukwa 》

  5. Scribe
    详情请看文章:《大数据:数据采集平台之Scribe 》

  6. Splunk Forwarder
    详情请看文章:《大数据:数据采集平台之Splunk Forwarder》


官网: http://docs.fluentd.org/articles/quickstart

Fluentd是一个开源的数据收集框架。Fluentd使用C/Ruby开发,使用JSON文件来统一日志数据。它的可插拔架构,支持各种不同种类和格式的数据源和数据输出。最后它也同时提供了高可靠和很好的扩展性。Treasure Data, Inc 对该产品提供支持和维护。

Fluentd的部署与架构设计和Flume非常相似:
大数据:数据采集平台之Fluentd_第1张图片
Fluentd的Input/Buffer/Output非常类似于Flume的Source/Channel/Sink。

  1. Input:Input负责接收数据或者主动抓取数据。支持syslog,http,file tail等。

  2. Buffer:Buffer负责数据获取的性能和可靠性,也有文件或内存等不同类型的Buffer可以配置。

  3. Output:Output负责输出数据到目的地例如文件,AWS S3或者其它的Fluentd。

Fluentd的配置非常方便,如下图:
大数据:数据采集平台之Fluentd_第2张图片
Fluentd的技术栈如下图:
大数据:数据采集平台之Fluentd_第3张图片
FLuentd和其插件都是由Ruby开发,MessgaePack提供了JSON的序列化和异步的并行通信RPC机制。
大数据:数据采集平台之Fluentd_第4张图片
Cool.io是基于libev的事件驱动框架。

FLuentd的扩展性非常好,客户可以自己定制(Ruby)Input/Buffer/Output。

Fluentd从各方面看都很像Flume,区别是使用Ruby开发,Footprint会小一些,但是也带来了跨平台的问题,并不能支持Windows平台。另外采用JSON统一数据/日志格式是它的另一个特点。相对去Flumed,配置也相对简单一些。

参考:https://mp.weixin.qq.com/s/emQ_94T0_Hw3ywQc0-4Dtg

你可能感兴趣的:(云计算与大数据)