hive中创建udf函数及遇到的坑

创建udf的方法:

udf开发 自定义标准函数:
自定义函数步骤:
第一步:集成UDF类,重写evaluate方法(转换为小写字母)

import org.apache.hadoop.hive.ql.exec.UDF;
	import org.apache.hadoop.io.Text;

	public class Str2Lower extends UDF {
		public Text evaluate(final Text s) {
			if (s == null) {
				return null;
			}
			return new Text(s.toString().toLowerCase());
		}
	}

第二步:打jar包,上传到集群
IDEA中如何正确快速打jar包
第三步:在Hive中添加jar包

add jar /root/jars/hadoopLearn-1.0-SNAPSHOT.jar;

第四步:创建函数

create [temporary] function str2lower2 as 'cn.kgc.hiveudf.Str2Lower';
临时函数:临时创建,退出终端后函数消失,在函数的有效期内,所有的数据库中都可以使用
永久函数:永久性使用,需要将jar包放到hdfs上,切换到其他的数据库不可用
过程如下:
// 把打好的jar包上传到hdfs上

hdfs dfs -mkdir /hiveudf
hdfs dfs -put hadoopLearn-1.0-SNAPSHOT.jar /hiveudf

// 添加jar包
add jar hdfs://hadoop1:9000/hiveudf/hadoopLearn-1.0-SNAPSHOT.jar;
// 创建永久函数
create function str2lower2 as 'cn.kgc.hiveudf.Str2Lower';

第五步:测试(调用)函数
遇到的坑:找不到打jar包的类
hive中创建udf函数及遇到的坑_第1张图片
解决方法:
1.安装zip
yum install -y zip
2.删除签名文件
zip -d jar包地址 ‘META-INF/.SF’ ‘META-INF/.RSA’ ‘META-INF/*SF’
以上两步是在linux中做的
下面是在hive中操作
3.删除hive中的jar包
delete jar 自己放的jar包地址;
4.重新添加jar到hive中
add jar 自己放的jar包地址;
5.创建方法
create function str2lower2 as ‘cn.kgc.hiveudf.Str2Lower’;
这个创建的方法名只能使用,不可以查看

你可能感兴趣的:(hive中创建udf函数及遇到的坑)