HIVE自定义函数类型

编写代码

package UDF.UDFS_CLASS;

import org.apache.commons.lang.StringUtils;
import org.apache.hadoop.hive.ql.exec.UDF;
import org.apache.hadoop.io.Text;

public class UDFS extends UDF {
public Text evaluate(Text str) {
//input parameter(对日志文件分析,若为空则返回空,避免报错)
if (str == null) {
return null;
}
//     invilated(对数据分析,若为空则返回空,避免报错)
if(StringUtils.isBlank(toString())){
return null;
}
//Text result =new Text(str.toString().toLowerCase());
String lineValue = str.toString();//转换大写为小写的函数
        String[] strs = lineValue.toString().split("\t");
Text result = new Text(strs.toString().replaceAll("\"", ""));将字符串中的所有双引号删除
return result;

}
}

添加函数到hive

讲jar包放到hive文件夹中然后添加函数到hive的函数表

add jar /opt/cdh5.3.6/hive-0.13.1-cdh5.3.6/UFS_replace.jar ;

这里写图片描述

create temporary function UFS_replace as ' UDF.UDFS_CLASS.UDFS' ;

添加之后可以通过代码
show functions;来查看hive中所有函数
这里写图片描述

使用函数查询

select url,ufs_replace(url) ufs_url from db_udf_log;

HIVE自定义函数类型_第1张图片

你可能感兴趣的:(Hive)