更改Map过程中用于区分不同key/value对的分隔符

如果指定输入文件的格式是TextInputFormat

那么默认的区分不同key/value对的分隔符是\n


我们可以通过"textinputformat.record.delimiter"参数来指定自己想要的分隔符

比如说

Configuration conf =new Configuration();

conf.set("textinputformat.record.delimiter","[DEBUG]");

那么现在不同key/value对之间的分隔符是"[DEBUG]"字符串


参考文献:

[1]https://hadoopi.wordpress.com/2013/05/31/custom-recordreader-processing-string-pattern-delimited-records/

你可能感兴趣的:(更改Map过程中用于区分不同key/value对的分隔符)