flume写入hdfs参数详解以及很多小文件问题

     Flume中的HDFS Sink应该是非常常用的,其中的配置参数也比较多,在这里记录备忘一下。

一、参数配置详解

  • type

            hdfs

  • path

            写入hdfs的路径,需要包含文件系统标识,比如:hdfs://namenode/flume/webdata/

            可以使用flume提供的日期及%{host}表达式。

  • filePrefix

            默认值:FlumeData

            写入hdfs的文件名前缀,可以使用flume提供的日期及%{host}表达式。

  • fileSuffix

            写入hdfs的文件名后缀,比如:.lzo .log等。

  • inUsePrefix

            临时文件的文件名前缀,hdfs sink会先往目标目录中写临时文件,再根据相关规则重命名成最终目标文件;

  • inUseSuffix

            默认值:.tmp

            临时文件的文件名后缀。

  • rollInterval

            默认值:30

            hdfs sink间隔多长将临时文件滚动成最终目标文件,单位:秒;

            如果设置成0,则表示不根据时间来滚动文件;

            注:滚动(roll)

你可能感兴趣的:(flume)