hadoop集群安装与配置--sqoop安装

1.      Sqoop安装在hadoop.client上

2.      复制一份sqoop-env-template.sh,命名为sqoop-env.sh

3.      修改sqoop-env.sh的内容:

export HADOOP_COMMON_HOME=/home/hadoopuser/hadoop

export HADOOP_MAPRED_HOME=/home/hadoopuser/hadoop/lib

export HIVE_HOME=/home/hadoopuser/hive

4.      复制一份sqoop-site-template.xml,命名为sqoop-site.xml

5.      如果没有使用HBASE数据库,则需要修改bin/configure-sqoop文件,将其中有关hbase的内容全部使用#号注销掉

6.      需要连接sqlserver数据库,则需要下载sqljdbc.jar和sqljdbc4.jar,并将这两个文件拷贝到sqoop/lib文件夹下

下载地址: http://www.microsoft.com/en-us/download/details.aspx?displaylang=en&id=21599

下载tar.gz的安装包

7.      常用命令:

(1)    导入

a.      依据导入表创建hive表

Bin/sqoop create-hive-table --connect ‘jdbc:sqlserver://ip;username=用户名;password=密码;database=数据库名’  --table 表名  --hive-table   hive的表名

b.      导入数据并关联至hive表

Bin/sqoop import --connect ‘jdbc:sqlserver://ip;username=用户名;password=密码;database=数据库名’  --table 表名  --hive-import  --hive-table   hive的表名

(2)    导出

Bin/sqoop export --connect ‘jdbc:sqlserver://ip;username=用户名;password=密码;database=数据库名’  --table 表名 --export-dir /user/hive/warehouse/表名 --input-fields-terminated-by '\001'

你可能感兴趣的:(实践手册,大数据笔记,hadoop集群,sqlserver,sqoop,数据导入导出)