hive自定义UDF函数遇到的坑

遇到的问题:

1、add jar后找不到类: FAILED: Class com.udf.udf.TestUdf not found

2、建函数没有权限,报延签的错误:  java.lang.SecurityException: Invalid signature file digest for Manifest main attributes

chmod 755 you.jar

搭建流程:

1、新建一个java项目,新建lib项目

2、将hive集群下面的lib文件夹下面的所有jar(除开php,py)拷贝到lib下面

3、将jar添加到依赖管理

4、新建udf类:

package com.udf.test;

import org.apache.hadoop.hive.ql.exec.UDF;

public class UdfTest extends UDF {

    public int evaluate(int a,int b){
        return a+b;
    }
}

5、将项目打成jar

6、注意一般工具打包都会给jar延签,使用者有权限验证,所以需要删除权限认证,在linux上面执行:

        zip -d your.jar 'META-INF/.SF' 'META-INF/.RSA' 'META-INF/*SF'   注意是每次打了新包都需要这个删除操作

6、进入hive控制台:add jar /home/hive/jar/udf.jar;  -- 你自己的路径

7、创建临时函数:

create temporary function udftests AS 'com.udf.test.UdfTest';  -- com.udf.test.UdfTest是类的路径

8、使用函数:select udftests(20,40);

hive自定义UDF函数遇到的坑_第1张图片

9、至此就是一个完整的建立udf的流程,如果要建立永久函数,

   那么需要将jar放到hdfs或者配置:create function udf_number AS 'com.udf.test.UdfTest' using jar 'hdfs:///hive_jar/udf.jar';

    注意这里不要加ip和端口,如果远程创建才需要,本地集群只需要hdfs:///就可以了

    或者hive-env.sh配置文件中添加HIVE_AUX_JARS_PATH

   

 

 

你可能感兴趣的:(大数据)