org.apache.hadoop.mapreduce.lib.input包分析

先上类图:



FileInputFormat中比较重要的方法:

listStatus:List input directories.

getSplits:Generate the list of files and make them into FileSplits.

===========================================================

下面几个参数可以用于配置FileInputFormat:

mapred.input.pathFilter.class:输入文件过滤器,通过过滤器的文件才会加入InputFormat;

mapred.min.split.size:最小的划分大小;

mapred.max.split.size:最大的划分大小;

mapred.input.dir:输入路径,用逗号做分割。

===========================================================









你可能感兴趣的:(org.apache.hadoop.mapreduce.lib.input包分析)