Flume环境搭建及配置

Flume是Cloudera提供的一个高可用的,高可靠的,分布式的海量日志采集、聚合和传输的系统。Flume基于流式架构,灵活简单。
1.flume-env.sh 配置JAVA_HOME
	export JAVA_HOME=/opt/module/jdk1.8.0_144

2.Exec source适用于监控一个实时追加的文件,但不能保证数据不丢失;Spooldir Source能够保证数据不丢失,且能够实现断点续传,但延迟较高,不能实时监控;而Taildir Source既能够实现断点续传,又可以保证数据不丢失,还能够进行实时监控。

3.Taildir Source维护了一个json格式的position File,其会定期的往position File中更新每个文件读取到的最新的位置,因此能够实现断点续传。

你可能感兴趣的:(大数据,flume)