Hadoop怎样避免文件被切分?

  • 第一种方法就是增加最小分片大小,将它设置成大于要处理的最大文件大小。把它设置为最大值long.MAX_VALUE即可。
  • 第二种方法就是使用FileInputFormat具体子类,并且重写isSplitable()方法把返回值设置为false。

你可能感兴趣的:(Hadoop)