[转]Hive的parse_url函数

refer to http://blog.csdn.net/xiaolang85/article/details/8823025 

 

parse_url(url, partToExtract[, key]) - extracts a part from a URL

解析URL字符串,partToExtract的选项包含[HOST,PATH,QUERY,REF,PROTOCOL,FILE,AUTHORITY,USERINFO]

 

举例:

* parse_url('http://facebook.com/path/p1.php?query=1', 'HOST')返回'facebook.com' 

* parse_url('http://facebook.com/path/p1.php?query=1', 'PATH')返回'/path/p1.php' 

* parse_url('http://facebook.com/path/p1.php?query=1', 'QUERY')返回'query=1'

可以指定key来返回特定参数,例如

* parse_url('http://facebook.com/path/p1.php?query=1', 'QUERY','query')返回'1'

 

* parse_url('http://facebook.com/path/p1.php?query=1#Ref', 'REF')返回'Ref' 

* parse_url('http://facebook.com/path/p1.php?query=1#Ref', 'PROTOCOL')返回'http'

 

比直接使用正则表达式要方便一些~~

你可能感兴趣的:(hive)