hive udf函数编写完整demo

一.简单的udf

只需要继承org.apache.hadoop.hive.ql.exec.UDF,并定义
public Object evaluate(Object args) {} 方法即可。

如下例子是一个传入string参数,调另一个接口,返回新的string的udf:

public class QEncrypt extends UDF{
        public String evaluate(String sphone) {
            String res=get_qphone(sphone);
            return res;
        }
}

将上面代码打包,hive-udf.jar

发布:

1.hdfs dfs -put -f hive-udf.jar /user/udfs/hive-udf.jar   ---放到hdfs

2.create function xxx as 'xxx' using jar 'hdfs://user/udfs/hive-udf.jar';----创建函数

3.show functions  查看

 

 

 

二.复杂的udf

继承org.apache.hadoop.hive.ql.udf.generic.GenericUDF之后,需要重写几个重要的方法:
public void configure(MapredContext context) {}
//可选,该方法中可以通过context.getJobConf()获取job执行时候的Configuration;
//可以通过Configuration传递参数值
public ObjectInspector initialize(ObjectInspector[] arguments)
//必选,该方法用于函数初始化操作,并定义函数的返回值类型;
//比如,在该方法中可以初始化对象实例,初始化数据库链接,初始化读取文件等;
public Object evaluate(DeferredObject[] args){}
//必选,函数处理的核心方法,用途和UDF中的evaluate一样;
public String getDisplayString(String[] children)
//必选,显示函数的帮助信息
public void close(){}
//可选,map完成后,执行关闭操作

你可能感兴趣的:(hive)