Sqoop2安装步骤详情及安装包下载

下载

https://306t.com/file/24704272-456283295

下载后得到:sqoop-1.99.7-bin-hadoop200.tar.gz文件

其中sqoop1和sqoop2区别可以参考以下链接 
重拾初心——Sqoop1和Sqoop2的刨析对比 
http://blog.csdn.net/gamer_gyt/article/details/55225700

安装

安装步骤参考官方文档 
http://sqoop.apache.org/docs/1.99.7/admin/Installation.html

解压tar包

将sqoop-1.99.7-bin-hadoop200.tar.gz上传至服务器中,这里安装到/usr/local/hadoop/sqoop-1.99.7目录中

# 拷贝tar包到/usr/local/hadoop/中
cp sqoop-1.99.7-bin-hadoop200.tar.gz /usr/local/hadoop/
# 解压tar包
tar -xvf sqoop-1.99.7-bin-hadoop200.tar.gz
# 为文件夹重命名
mv sqoop-1.99.7-bin-hadoop200 sqoop-1.99.7

配置sqoop2

  1. 确保sqoop2所依赖的环境变量 
    sqoop2需要hadoop的依赖(HADOOP_COMMON, HADOOP_HDFS, HADOOP_MAPRED, HADOOP_YARN),所以你的环境变量中需要存在如下的环境变量
export HADOOP_HOME=/..

或者

export HADOOP_COMMON_HOME=/...
export HADOOP_HDFS_HOME=/...
export HADOOP_MAPRED_HOME=/...
export HADOOP_YARN_HOME=/...

如果配置了HADOOP_HOME,则sqoop会自动寻找$HADOOP_HOME/share/common相应的目录。

  1. 配置sqoop2的环境变量 
    在/etc/profire文件中增加如下配置,注意SQOOP2_HOME的位置
#Sqoop配置
export SQOOP2_HOME=/usr/local/hadoop/sqoop-1.99.7
export CATALINA_BASE=$SQOOP2_HOME/server
#Sqoop外部jar包存放路径,以后mysql-**.jar,odbc*.jar文件都放到extra-lib中即可
export SQOOP_SERVER_EXTRA_LIB=$SQOOP2_HOME/server/lib/extra-lib
export PATH=$PATH:$SQOOP2_HOME/bin
  1. sqoop访问hdfs的配置 

       因为sqoop访问Hadoop的MapReduce使用的是代理的方式,必须在Hadoop的core-site.xml中配置所接受的proxy用户和组,在hadoop的core-site.xml中增加如下配置,其中sqoop2是代理的用户和组的意思。表示运行hadoop的系统用户名


hadoop.proxyuser.root.hosts
*


hadoop.proxyuser.root.groups
*

配置sqoop访问的hadoop配置文件的位置 
在/usr/local/hadoop/sqoop-1.99.7/conf/sqoop.properties文件中,修改如下变量的值为你hadoop配置文件目录

org.apache.sqoop.submission.engine.mapreduce.configuration.directory=/usr/local/hadoop/hadoop-2.7.4/etc/hadoop

 

初始化sqoop仓库

因为sqoop2中存储着元数据信息,所以首次安装时需要初始化仓库

sqoop2-tool upgrade

初始化完成后,可以做一次验证

sqoop2-tool verify

当出现Verification was successful.字样时,表示初始化成功。

启动sqoop

执行sqoop2-server start启动sqoop,同理。执行sqoop2-server stop会停止sqoop

sqoop2-server start

执行完以上命令后,启动信息如下。 

然后执行jps命令查看启动了哪些进程,可以看到sqoop server只启动了SqoopJettyServer进程。 

启动sqoop客户端

由于我现在是伪分布式,所以sqoop server和sqoop client都在一台机器上,直接执行sqoop2-shell命令即可启动sqoop客户端 
 
可以查看sqoop2的版本,执行show version --all命令

sqoop:000> show version --all
client version:
Sqoop1.99.7 source revision 435d5e61b922a32d7bce567fe5fb1a9c0d9b1bbb
Compiledby abefine on TueJul1916:08:27 PDT 2016
0[main] WARN org.apache.hadoop.util.NativeCodeLoader-Unable to load native-hadoop library for your platform...using builtin-java classes where applicable
server version:
Sqoop1.99.7 source revision 435d5e61b922a32d7bce567fe5fb1a9c0d9b1bbb
Compiledby abefine on TueJul1916:08:27 PDT 2016
API versions:
[v1]
sqoop:000>

 

你可能感兴趣的:(大数据)