1 hadoop streaming
2hadoop straming工作方式
3Job提交设置file选项
4streaming选项和用法
4.1只有mapper的job
4.2定义jobs的其他选项
4.3 hadoop streaming中的大文件和文件档案
4.4为jobs定义其他的配置变量
4.5其他支持的选项
Streaming支持hadoop常用命令行选项。支持的参数主要有下面这些:
bin/hadoop command [genericOptions] [commandOptions]
5更多的用法实例
5.1自定义将行数据划分为key-value键值对
5.2有用的Partitioner类
5.3Comparator类
5.4Hadoop Aggregate包(-reduce aggregate选项)
5.5字段选择
5.6 mapred尝试任务失败次数控制及map任务失败率控制