hadoop注意事项

1、 /etc/hosts  里面的各主机ip配置 要和所关联机器系统ifconfig ip地址对应     

2、系统 最好用静态ip地址

3、部署启动/访问集群的时候要注意防火墙是否关闭

4、/opt/hive/bin/hive --service hiveserver -p 1043 --hiveconf javax.jdo.option.ConnectionURL=jdbc:mysql://hd194:3306/dp_meta 
 (hive --service hiveserver为启动hive服务  hive为启动命令行)  修改hive属性的值

5、一台服务器可以开启多个hive 只要 -p 端口号不同

6、用eclipse编写mapreduce程序时,可以先在本地测试,input文件、out文件夹可以用本地的路径作为参数。如果在windows下的eclipse编写需要计算机名为hadoop不然会报权限不足的错误。

7、在经验不足的情况下编写mapreduce可以先用一个可以跑通的mapreduce程序(例如wordcount.java)再在其上面进行拓展。

8、可以把hbase的数据直接动态插入到hive只需在创建hive表时指向hive的数据来源

9、hadoop运行jar 打包为Runnable JAR file :hadoop jar /usr/hadoop20140111/mywordcount1.jar hdfs://hadoop2/test/hadoop/wordcount hdfs://hadoop2/test/hadoop/0003

/usr/hadoop20140111/mywordcount1.jar为本地路径。

10、hadoop运行jar 打包为JAR file:hadoop jar /usr/hadoop20140111/fix.jar WordCount hdfs://hadoop2/test/hadoop/wordcount hdfs://hadoop2/test/hadoop/00048


你可能感兴趣的:(总结)