Kettle与Hadoop(六)执行HiveQL语句

1. 建立hive表,导入原始数据,过程参考

https://blog.csdn.net/wzy0623/article/details/106471124#2.%20%E5%90%91Hive%E5%AF%BC%E5%85%A5%E6%95%B0%E6%8D%AE。

2.  建立一个作业,查询hive表,并将聚合数据写入一个hive表。
(1)打开PDI,新建一个作业,如图1所示。

图1

(2)编辑'SQL'作业项,如图2所示。

Kettle与Hadoop(六)执行HiveQL语句_第1张图片 图2

        说明:hive_cdh631是已经建好的hive数据库连接,参见https://wxy0327.blog.csdn.net/article/details/106406702#%E4%B8%89%E3%80%81%E8%BF%9E%E6%8E%A5Hive。

3. 保存并执行作业,日志如图3所示。

Kettle与Hadoop(六)执行HiveQL语句_第2张图片 图3

        从图3可以看到,作业已经成功执行。

4. 检查hive表,结果如图4所示。

Kettle与Hadoop(六)执行HiveQL语句_第3张图片 图4

        从图4可以看到,新建了weblogs_agg表,并装载了聚合数据。

你可能感兴趣的:(Kettle与Hadoop(六)执行HiveQL语句)