个人总结-Sqoop


一、从rdbms导入到hdfs中

1、一 import(从rdbms导入到hdfs中)

可选参数

默认使用as-textfile文件格式,行与行之间使用逗号分割

--as-parquetfile  使用partition文件格式保存

--columns id,name 导入指定的列

--compress 启用压缩

--compression-codec org.apache.hadoop.io.compress.SnappyCodec 压缩格式

压缩后的文件如果直接加载到hive,可以正常运行(生产环境中用hive来分析mysql的数据

--delete-target-dir 删除已经存在的目标目录

--fields-terminated-by '\t' 设置分割符

--direct mysql优化,快速导入,

2、查看mysql中-的database:

sqoop list-databases \

--connect jdbc:mysql://localhost:3306 \

--username root \

--password ***** \

3、将mysql中表的数据导入到hdfs

sqoop import \

--connect jdbc:mysql://localhost:3306/test \

--username root \

--password ***** \

--table users \

--target-dir /user/sqoop/mysql/users \

--num-mappers 1

4、使用sql语句将数据导入hdfs

sqoop import \

--connect jdbc:mysql://localhost:3306/test \

--username root \

--password ***** \

--query 'select id,name from users where $CONDITIONS'\

--target-dir /user/sqoop/mysql/users_query \

--num-mappers 1

5、使用sql语句将数据导入hdfs——增量导入

有一个唯一的标识符,类似于插入时间createtime,使用where来进行区分

sqoop import \

--connect jdbc:mysql://localhost:3306/test \

--username root \

--password ***** \

--query 'select id,name from users where $CONDITIONS'\

--target-dir /user/sqoop/mysql/users_query \

--num-mappers 1 \

--incremental append \增量倒入

--check-column id \ 标识符列

--last-value 4 \上一次的最后一个 插入位置

二、export导出(文件或者hive到mysql中)

1、将hdfs文件导入mysql

sqoop export \

--connect jdbc:mysql://localhost:3306/test \

--username root \

--password ***** \

--table users \

--export-dir /user/sqoop/hdfs/users_mysql.txt \

--num-mappers 1 \

2、从mysql直接导数据到hive中

sqoop import \

--connect jdbc:mysql://localhost:3306/test \

--username root \

--password ***** \

--table users \

--delete-target-dir \

--fields-terminated-by ',' \

--num-mappers 1 \

--hive-import \

--hive-database default \

--hive-table users2

原理与之前一样,中间还是会先将数据写道hdfs上边

3、从hive中导出数据到mysql中

sqoop export \

--connect jdbc:mysql://localhost:3306/test \

--username root \

--password ***** \

--table users2 \

--export-dir /user/sqoop/hdfs/mysql \

--num-mappers 1 \

--input-fields-terminated-by ','

4、option-file使用:相当于执行脚本

执行语句:sqoop --options-file /文件位置

脚本内容:(空格变换行)

sqoop export   

#这里写注释

--connect jdbc:mysql://localhost:3306/test

--username root

--password *****

--table users2

--export-dir /user/sqoop/hdfs/mysql

--num-mappers 1

--input-fields-terminated-by ','

你可能感兴趣的:(个人总结-Sqoop)