Flume采集数据到HDFS时,文件中有乱码

参数

hdfs.fileType    

默认值

SequenceFile    

参数描述

File format: currently SequenceFile, DataStream or CompressedStream

(1)DataStream will not compress output file and please don’t set codeC

(2)CompressedStream requires set hdfs.codeC with an available codeC


翻看Flume文档,发现,HdfsEventSink中,hdfs.fileType默认为SequenceFile,将其改为DataStream就可以按照采集的文件原样输入到hdfs,加一行

a1.sinks.k1.hdfs.fileType=DataStream

你可能感兴趣的:(Apache,Hadoop)