今天是跟公司的数据分析师小姐姐学习的一天,学习了两个行转列的用法,先简单记录一下开心
1.spark SQL的数组行转列
LATERAL VIEW explode(entities) a as entities_new
2.SQL的数组行转列
-- 2.1 cross join unnest(数组字段名称) as "新的字段名称"
例如,如下将array类型的数组vtags进行展开,得到新的字段vtag:
select vtag,count(doc,id)
from dw.dim_doc_info
cross join unnest(vtags) AS t(vtag)
where p_day = '2021-01-04'
group by 1;