percentile_approx函数

percentile(col, p):percentile要求输入的字段必须是int类型的

percentile_approx(col, p):percentile_approx则是数值类似型的都可以 ;

percentile_approx(abs(col), array(0.1, 0.2, 0.3, 0.4, 0.5, 0.6, 0.7, 0.8, 0.9)) 输出多位分位数。

特别注意:如果p值过小(根据你的数据的count(distinct)的量,与p值的比较判断),则会导致有得分位数全是相同的值,这时候把p值调大一些即可。

你可能感兴趣的:(技术,hive)