InputFormat

InputFormat 的作用:

数据输入->splits->键值对。

将数据转化成为键值对,供Map使用。

所以InputFormat后面跟随的泛型,就是map所处理的类型。

InputFormat之中的 getSplits() 获取split。

内部的RecordReader 将split 转化成为键值对。

自定义InputFormat 的关键 在于 自定义实现 RecordReader

这个类用来解析split,来确定,返回的键值对是什么。

自定义的RecordReader






自定义InputFormat 


你可能感兴趣的:(InputFormat)