Hive查询之自定义函数

Hive查询之自定义函数

1 自定义函数流程

1)Hive 自带了一些函数,比如:max/min等,但是数量有限,自己可以通过自定义UDF来方便

的扩展

2)当Hive提供的内置函数无法满足你的业务处理需要时,此时就可以考虑使用用户自定义函数

(UDF:user-defined function)

3)根据用户自定义函数类别分为以下三种

(1)UDF(User-Defined-Function)

​ 一进一出

(2)UDAF(User-Defined Aggregation Function)

​ 用户自定义聚合函数,多进一出

​ 类似于:count/max/min

(3)UDTF(User-Defined Table-Generating Functions)

​ 用户自定义表生成函数,一进多出

​ 如lateral view explode()

4)官方文档地址

https://cwiki.apache.org/confluence/display/Hive/HivePlugins

5)编程步骤

(1)继承Hive提供的类

​ org.apache.hadoop.hive.ql.udf.generic.GenericUDF

​ org.apache.hadoop.hive.ql.udf.generic.GenericUDTF;

(2)实现类中的抽象方法

(3)在hive的命令行窗口创建函数

添加jar

add jar linux_jar_path

创建function

create [temporary] function [dbname.]function_name AS class_name;

(4)在hive的命令行窗口删除函数

drop 

你可能感兴趣的:(Hadoop,hive,hive)