Hive内置杂项函数

函数名(参数) 返回值类型 说明
version() string Hive2.1.0起,返回Hive版本。返回值包含两部分:构建号和构建hash值。
surrogate_key([write_id_bits, task_id_bits]) bigint 为插入到表中的每一行生成唯一的Id。只能用作acid或仅插入表的默认值。
sha2(string/binary, int) string Hive1.3.0起,计算SHA-2系列哈希函数(SHA-224, SHA-256, SHA-384, and SHA-512)。第二个参数为结果的位数,只能是224、256(0)、384或512.java8+支持224。如果参数为null或位数不合法则返回null。

sha1(string/binary)

sha(string/binary)

string Hive1.3.0起,计算字符串或二进制的SHA-1摘要,并以十六进制字符串的形式返回。
md5(string/binary) string Hive1.3.0起,计算字符串或二进制的MD5 128位校验和,以32个十六进制字符串的形式返回。如果参数为null,则返回null。
reflect(class, method[, arg1[, arg2..]]) varies Hive0.7.0起,使用反射通过匹配参数签名来调用Java方法。
logged_in_user() string Hive2.2.0起,从会话状态返回连接到Hive时提供的用户名。
java_method(class, method[, arg1[, arg2..]]) varies Hive0.9.0起,与reflect相同。
hash(a1[, a2...]) int Hive0.4.0起,返回参数的哈希值。
current_user() string Hive1.2.0起,从配置的身份验证器管理器返回当前用户名。可以与连接时提供的用户名相同,但是对于某些身份验证管理器可能不同。
current_database() string Hive0.13.0起,返回当前数据库名。
crc32(string/binary) bigint Hive1.3.0起,计算字符串或二进制的循环冗余校验值,并返回长整型数字。
aes_encrypt(input string/binary, key string/binary) binary Hive0.13.0起,使用AES加密input。key的长度可以为128、192或256位。如果安装了JCE(Java Cryptography Extension)无限权限策略文件,则可以使用192和256位密钥。如果input为null或者key长度非法则返回null。
aes_decrypt(input binary, key string/binary) binary Hive0.13.0起,使用AES解密input。key的长度可以为128、192或256位。如果安装了JCE(Java Cryptography Extension)无限权限策略文件,则可以使用192和256位密钥。如果input为null或者key长度非法则返回null。
get_json_object(json_str,expression) varies

解析json字符串,提取指定的字段的值。支持的操作符有:

$:根对象

.:子操作符。

[]:数组下标操作符。

*:[]通配符。

xpath_*(xml_string, xpath_expression_string) varies

Hive0.6.0起,使用xPath表达式解析XML数据。xpath系列函数包装JDK提供的Java XPath库javax.xml.xpath。该库基于XPath 1.0规范。xpath_expression_string会被编译并缓存,下一个输入行的表达式与前一个匹配则会重用,否则重新编译。因此,xml字符串总是针对每个输入行进行解析,但是xpath表达式是预编译的,并在绝大多数用例中重用。不正确的xml字符串将导致抛出运行时异常。

xpath:返回一个Hive字符串数组。

xpath_string:返回字符串。

xpath_boolean:返回布尔值。

xpath_short:返回短整型。

xpath_int:返回整型。

xpath_long:返回长整型。

xpath_float:返回浮点数。

xpath_double:返回双精度浮点数。

xpath_number:返回双精度浮点数。

你可能感兴趣的:(Hive)