Spark整合Hive

安装hive
解压hive到指定的目录中,一般解压在/usr/local/hive

tar -zxvf hive-xxx.tar.gz

配置系统环境
Spark整合Hive_第1张图片

配置hive-env.sh的环境
配置hadoop的家目录,配置hive的家目录,已及配置hive配置文件的目录

Spark整合Hive_第2张图片

配置hive-site.xml

<property>
    <name>hive.metastore.localname>
    <value>truevalue>
    <description/>
  property>

  
  <property>
    <name>javax.jdo.option.ConnectionURLname>
    <value>jdbc:mysql://192.168.1.3:3306/hivevalue>
    <description/>
  property>

  <property>
    <name>javax.jdo.option.ConnectionDriverNamename>
    <value>com.mysql.jdbc.Drivervalue>
    <description/>
  property>

  <property>
    <name>javax.jdo.option.ConnectionUserNamename>
    <value>rootvalue>
    <description/>
  property>

   <property>
    <name>javax.jdo.option.ConnectionPasswordname>
    <value>mysqlvalue>
    <description/>
  property>

注意,我用的是windows下的mysql,还有,将mysql的驱动jar包放在hive的lib下

启动hive,启动之前必须初始化数据库:我初始化的是mysql数据库

./schemaTool   --initSchema  --dbType mysql

启动hive

./hive

Spark整合Hive_第3张图片

HDFS上面也有建好的数据表

Spark整合Hive_第4张图片

启动spark,启动之前将mysql的驱动包,加入到spark的lib下

这里写图片描述

启动spark-shell

这里写图片描述

建表:

这里写图片描述

HDFS上面也有spark建好的数据表

Spark整合Hive_第5张图片

注意:
1.需要把配置好的hive-site.xml文件copy到spark的安装目录的conf下。
2.在spark的conf下的spark-env.sh中添加hive配置:

这里写图片描述

Spark整合hive完毕

你可能感兴趣的:(spark)