Hive用直接传入的数据生成表

需求

想通过fixed的数据直接生成一个hive 表,不是select from其他表的那种。
类似pandas 生成dataframe

data = pd.DataFrame([[1,2,3], [4,5,6]], columns=['a','b','c'])

在Hive中可以通过stack来实现,

stack API

https://cwiki.apache.org/confluence/display/Hive/LanguageManual+UDF#LanguageManualUDF-stack(values)
在这里插入图片描述
其中:

  • r表示有r行数据
  • stack()的后面n-1个参数分别为具体的值(把行数据展开),n-1 = r * c (行*列数)

实现

SELECT
    stack(2, 1,2,3,4,5,6) as (a,b,c)

结果

a	b	c
1	2	3
4	5	6

你可能感兴趣的:(Hive)