hive自定义函数分类+UDF实例

hive自定义函数分为三类:

  • UDF(User-Defined-Function)普通函数, 一进一出

  • UDAF(User-Defined Aggregation Function)聚合函数,多进一出

  • UDTF(User-Defined Table-Generating Functions)表生成函数, 一进多出

UDF实例

  • 新建子模块hive_demo

  • 配置pom.xml文件



    4.0.0

    cn.hive
    hive-udf
    1.0
    
        
            org.apache.hive
            hive-exec
            1.2.1
        
        
            org.apache.hadoop
            hadoop-common
            2.7.4
        
    
    
        
            
                org.apache.maven.plugins
                maven-shade-plugin
                2.2
                
                    
                        package
                        
                            shade
                        
                        
                                
                                    
                                        *:*
                                        
                                            META-INF/*.SF
                                            META-INF/*.DSA
                                            META-INF/*.RSA
                                        
                                    
                                
                        
                    
                
            
        
    

编写一个java类,继承UDF,并重载evaluate方法。



import org.apache.hadoop.hive.ql.exec.UDF;
import org.apache.hadoop.io.Text;

public class Lower extends UDF{
    public Text   evaluate(Text s){
        if(s==null){
            return null;
        }
        return new Text(s.toString().toLowerCase());
    }
}   
  • 打成jar包上传到服务器

  • 将jar包添加到hive的classpath

hive>add JAR /home/hadoop/udf.jar;

  • 创建临时函数与开发好的java class关联

create temporary function tolowercase as 'cn.itcast.cloud.hive.demo.udf.CustomUDF';

  • 即可在hql中使用自定义的函数tolowercase ip

Select tolowercase(name),age from t_test;

 

 

你可能感兴趣的:(hive自定义函数分类+UDF实例)