一、Hadoop Streaming:

Hadoop Streaming是Hadoop发行包的一个功能。Hadoop Streaming的作用是,可以使用任何可运行程序或脚本作为Mapper和/或Reducer来创建和执行MapReduce作业。例如:

$HADOOP_HOME/bin/hadoop jar $HADOOP_HOME/contrib/streaming/hadoop-streaming-1.2.1.jar -input /user/nma/input/ -output /user/nma/output_streaming/ -mapper cat -reducer wc

二、Hadoop Streaming工作原理:


三、命令行选项


四、指定java类作为Mapper/Reducer: