在windows下开发mapreduce

    上一节说道编译hadoop-eclipse插件,现在说说在windows下编写mapreduce吧

    1、首先在map/reduce locations 中右键new一个hadoop location,如下图是创建好了的,如果是第一次,不会有myhadoop。
在windows下开发mapreduce_第1张图片

    2、配置

    在windows下开发mapreduce_第2张图片
    这里面的location name 是随便起的名字,host 是hadoop配置文件core-site.xml中的fs.defaultFS的url的主机ip,右边的port,是fs.defaultFS的url的端口号,user name 是linux系统使用hadoop的用户名

    3、如果成功,则可以展开左边的目录,能够看到hdfs上的文件,如果看不到目录,第一时间看看你的hadoop集群启动了么,别犯这种低级的错误哦
    在windows下开发mapreduce_第3张图片

    4、试一试能不能删除里面文件,如果不能,可能会涉及到权限的问题,修改集群配置文件hdfs-site.xml

<property>
 <name>dfs.permissions</name>
 <value>false</value>
</property>



    5、新建一个mapreduce工程,会自动把需要的jar包都引进来,然后写个wordcount小程序吧,这里就不写了,右键这个类,选择run as configration 
     在windows下开发mapreduce_第4张图片

    配置好mainclass 点选项卡Arguments 
    在windows下开发mapreduce_第5张图片

    填写好运行的参数,第一个为输入目录,第二个为输出目录,配置好后run as hadoop 就可以在左侧目录树下看到ouput文件夹

    6、运行程序如果出错,这里有解决办法,但是由于时间关系,先放在这,后续补充

你可能感兴趣的:(在windows下开发mapreduce)