6月11日第二十八次早课(sqoop)

1.sqoop是什么?

主要用于在Hadoop与RDBMS间进行数据的传递

2.sqoop分为哪两个分支,各最新版本是什么?

sqoop1:1.4.7

sqoop2:1.99.7

3.在工作中我们用的最多的是sqoop1,那么导入和导出,谁给谁的

导入是RDBMS到Hadoop

导出是Hadoop到RDBMS

4.假如输入一个命令找不到not found,你们觉得该怎么办?(老生常谈)

先看打错了没有,再看PATH有没有,或者yum安装

5.sqoop命令参数-m是什么意思

指定MapReduce的数量

6.sqoop 想要把MySQL数据导到hive里,那么是不是要加mysql jdbc jar包?

需要

7.sqoop导入,我能不能直接写SQL的导?

可以 --query指定

8.sqoop会有reduce job吗

不会

9.假如让你们项目作业的sqoop 每天导数据到hive分区表里,用shell脚本和crontab,有没有信心完成?

还要练习

你可能感兴趣的:(6月11日第二十八次早课(sqoop))