三十二、《大数据项目实战之用户行为分析》Spark SQL操作Hive的几种方式

Spark SQL与Hive整合成功后,可以使用以下几种方式对Hive数据仓库进行操作。

1. Spark SQL终端操作

Spark SQL终端启动后,可以直接使用HiveQL语句对Hive数据仓库进行操作。

例如,列出当前所有数据库,代码如下:

spark-sql> show databases;

default

Time taken: 3.66 seconds, Fetched 1 row(s)

可以看到,默认有一个名为default的数据库。

创建表student,其中字段id为整型,字段name为字符串,代码如下:

spark-sql> CREATE TABLE student(id INT,name STRING);

Time taken: 1.351 seconds

向表student中插入一条数据,代码如下:

spark-sql> INSERT INTO student VALUES(1000,'xiaoming');

Time taken: 10.338 seconds

你可能感兴趣的:(#,hive,大数据,spark,Spark,SQL操作Hive,SparkSQL)