Databricks 第11篇:Spark SQL 查询(行转列、列转行、Lateral View、排序)
本文分享在AzureDatabricks中如何实现行转列和列转行,并介绍对查询的结果进行排序的各种方式。一,行转列在分组中,把每个分组中的某一列的数据连接在一起:collect_list:把一个分组中的列合成为数组,数据不去重,格式是['a','a','b']collect_set:把一个分组中的列合成为集合,数据去重,格式是['a','b']用于连接文本数组的函数,通过sep把数组中的item分