Hive aggregate functions (UDAF)用法(持续更新)

Hive 中聚集函数的用法

collect_set(col)和collect_list(col)用法
return type prototype description
array collect_set(col) Returns a set of objects with duplicate elements eliminated.
array collect_list(col) Returns a list of objects with duplicates. (As of Hive 0.13.0.)

collect_set用于将某列的值收集在一起,返回一个去重的数组;
collect_list功能相似,只是数组中的元素值未做去重。

你可能感兴趣的:(大数据处理)