浮云6363

hive2.0中常用的内置函数大全

abs(x)：返回绝对值
greatest(T v1, T v2, ...):求最大值
least(T v1, T v2, ...)：求最小值
round(DOUBLE a)：四舍五入
round(DOUBLE a, INT d)：指定精度的四舍五入
bround(DOUBLE a)：银行家舍入法
bround(DOUBLE a, INT d)：银行家指定精度的舍入法,保留d位小数
floor(DOUBLE a)：向下取整
ceil(DOUBLE a), ceiling(DOUBLE a)：向上取整
rand(), rand(INT seed)：取随机数
exp(DOUBLE a), exp(DECIMAL a)：自然指数
ln(DOUBLE a), ln(DECIMAL a)：自然数为底的对数
log10(DOUBLE a), log10(DECIMAL a)：以10为底对数
log(DOUBLE base, DOUBLE a),log(DECIMAL base, DECIMAL a)：对数函数
log2(DOUBLE a), log2(DECIMAL a)：以2为底对数函数
pow(DOUBLE a, DOUBLE p), power(DOUBLE a, DOUBLE p):幂运算函数
sqrt(DOUBLE a), sqrt(DECIMAL a):开平方函数
bin(BIGINT a):二进制函数
hex(BIGINT a) hex(STRING a) hex(BINARY a):十六进制函数
unhex(STRING a):反转十六进制函数
conv(BIGINT num, INT from_base, INT to_base), conv(STRING num, INT from_base, INT to_base)：进制转换函数
pmod(INT a, INT b), pmod(DOUBLE a, DOUBLE b):取余函数
sin(DOUBLE a), sin(DECIMAL a):正弦函数
asin(DOUBLE a), asin(DECIMAL a):反正弦函数
cos(DOUBLE a), cos(DECIMAL a):余弦函数
acos(DOUBLE a), acos(DECIMAL a):反余弦函数
tan(DOUBLE a), tan(DECIMAL a):正切函数
atan(DOUBLE a), atan(DECIMAL a):反正切函数
degrees(DOUBLE a), degrees(DECIMAL a):弧度值转换角度值
radians(DOUBLE a), radians(DOUBLE a):角度值转换成弧度值
positive(INT a), positive(DOUBLE a):返回a
negative(INT a), negative(DOUBLE a):返回a的相反数
sign(DOUBLE a), sign(DECIMAL a):判断数值是正数，0或负数
e():数学常数e
pi():数学常数pi
factorial(INT a):求a的阶乘
cbrt(DOUBLE a):求a的立方根
shiftleft(TINYINT|SMALLINT|INT a, INT b),shiftleft(BIGINT a, INT b):按位左移
shiftright(TINYINT|SMALLINT|INT a, INTb),shiftright(BIGINT a, INT b):按拉右移
shiftrightunsigned(TINYINT|SMALLINT|INTa, INT b),shiftrightunsigned(BIGINT a, INT b):无符号按位右移（<<<）

关系运算

等值比较: =
不等值比较: <>
小于比较: <
小于等于比较: <=
大于比较: >
大于等于比较: >=
空值判断: IS NULL
非空判断: IS NOT NULL
LIKE比较: LIKE
JAVA的LIKE操作: RLIKE
REGEXP操作: REGEXP

数学运算：

加法操作: +
减法操作: -
乘法操作:
除法操作: /
取余操作: %
位与操作: &
位或操作: |
位异或操作: ^
位取反操作: ~

逻辑运算：

逻辑与操作: AND
逻辑或操作: OR
逻辑非操作: NOT

类型转换函数

binary(string|binary):将输入的值转换成二进制
cast(expr as ):将expr转换成type类型

日期函数

UNIX时间戳转日期函数: from_unixtime
获取当前UNIX时间戳函数: unix_timestamp
日期转UNIX时间戳函数: unix_timestamp
指定格式日期转UNIX时间戳函数: unix_timestamp
日期时间转日期函数: to_date
日期转年函数: year
日期转月函数: month
日期转天函数: day
日期转小时函数: hour
日期转分钟函数: minute
日期转秒函数: second
日期转周函数: weekofyear
日期比较函数: datediff
日期增加函数: date_add
日期减少函数: date_sub
last_day() 函数：返回月份中的最后一天
next_day() 函数：返回指定日期下周的指定周几
trunc()函数：返回指定日期月份的第一天/年中的第一天日期
add_months()函数：按指定格式返回指定日期增加几个月后的日期
months_between()函数：返回日期1到日期2之间的月数
date_format()函数：返回指定日期格式

条件函数

If函数: if
非空查找函数: COALESCE
条件判断函数：CASE
条件判断函数：CASE

字符函数

字符串长度函数：length
字符串反转函数：reverse
字符串连接函数：concat
带分隔符字符串连接函数：concat_ws
字符串截取函数：substr,substring
字符串截取函数：substr,substring
字符串转大写函数：upper,ucase
去空格函数：trim
左边去空格函数：ltrim
右边去空格函数：rtrim
正则表达式替换函数：regexp_replace
正则表达式解析函数：regexp_extract
URL解析函数：parse_url
json解析函数：get_json_object
json解析函数：json_tuple
空格字符串函数：space
重复字符串函数：repeat
首字符ascii函数：ascii
左补足函数：lpad
右补足函数：rpad
分割字符串函数: split
集合查找函数: find_in_set
字符串查找函数:instr
格式化数字函数:format_number
字符串在post位置后第一次出现的位置函数:locate

聚合函数

个数统计函数: count
总和统计函数: sum
平均值统计函数: avg
最小值统计函数: min
最大值统计函数: max
非空集合总体变量函数: var_pop
非空集合样本变量函数: var_samp
总体标准偏离函数: stddev_pop
样本标准偏离函数: stddev_samp
中位数函数: percentile
中位数函数: percentile
近似中位数函数: percentile_approx
近似中位数函数: percentile_approx
直方图: histogram_numeric

复合类型构建操作

Map类型构建: map
Struct类型构建: struct
array类型构建: array

复杂类型访问操作

array类型访问: A[n]
map类型访问: M[key]
struct类型访问: S.x

复杂类型长度统计函数

Map类型长度函数: size(Map\)
array类型长度函数: size(Array\)

复杂类型操作函数

数组转成多行函数：explode(Array\/Map\)

替换空值:nvl(null, T)

数学函数

abs(x)：返回绝对值

返回值类型：DOUBLE
说明：返回x的绝对值

> select abs(-12);
+------+--+
| _c0  |
+------+--+
| 12   |
+------+--+
> select abs(12);
+------+--+
| _c0  |
+------+--+
| 12   |
+------+--+

greatest(T v1, T v2, …):求最大值

返回值：泛型
说明：求函数中所有参数的最大值

> select greatest(12, 32, 64, 2);
+------+--+
| _c0  |
+------+--+
| 64   |
+------+--+
> select greatest('sql', 'spark', 'hive', 'hbase');
+------+--+
| _c0  |
+------+--+
| sql  |
+------+--+

least(T v1, T v2, …)：求最小值

返回值：泛型
说明：求函数中所有参数的最小值

> select least(12, 32, 64, 2);
+------+--+
| _c0  |
+------+--+
| 2    |
+------+--+
> select least('sql', 'spark', 'hive', 'hbase');
+--------+--+
|  _c0   |
+--------+--+
| hbase  |
+--------+--+

round(DOUBLE a)：四舍五入

返回值：BIGINT
说明：返回对a四舍五入的BIGINT值

> select round(4.6);
+------+--+
| _c0  |
+------+--+
| 5.0  |
+------+--+
> select round(4.3);
+------+--+
| _c0  |
+------+--+
| 4.0  |
+------+--+

round(DOUBLE a, INT d)：指定精度的四舍五入

返回值：DOUBLE
说明：返回DOUBLE型d的保留n位小数的DOUBLE型的近似值

> select round(4.62345, 2);
+-------+--+
|  _c0  |
+-------+--+
| 4.62  |
+-------+--+
> select round(4.623456, 5);
+----------+--+
|   _c0    |
+----------+--+
| 4.62346  |
+----------+--+

bround(DOUBLE a)：银行家舍入法

返回值：BIGINT
说明：银行家舍入法（1~4：舍，6~9：进，5->前位数是偶：舍，5->前位数是奇：进）

> select bround(8.25, 1);
+----------+--+
|   _c0    |
+----------+--+
|   8.2    |
+----------+--+
> select bround(5.25);
+----------+--+
|   _c0    |
+----------+--+
|    5     |
+----------+--+
> select bround(4.5);
+----------+--+
|   _c0    |
+----------+--+
|    4     |
+----------+--+

bround(DOUBLE a, INT d)：银行家指定精度的舍入法,保留d位小数

返回值：DOUBLE
说明：银行家指定精度的舍入法,保留d位小数

> select bround(2.35, 1);
+----------+--+
|   _c0    |
+----------+--+
|   2.4    |
+----------+--+
> select bround(2.25, 1);
+----------+--+
|   _c0    |
+----------+--+
|   2.2    |
+----------+--+

floor(DOUBLE a)：向下取整

返回值: BIGINT
说明: 返回等于或者小于该double变量的最大的整数

> select floor(8.21);
+------+--+
| _c0  |
+------+--+
| 8    |
+------+--+
> select floor(-6.5);
+------+--+
| _c0  |
+------+--+
| -7   |
+------+--+

ceil(DOUBLE a), ceiling(DOUBLE a)：向上取整

返回值: BIGINT
说明: 返回等于或者大于该double变量的最小的整数

> select ceil(2.3);
+------+--+
| _c0  |
+------+--+
| 3    |
+------+--+
> select ceil(2.9);
+------+--+
| _c0  |
+------+--+
| 3    |
+------+--+

rand(), rand(INT seed)：取随机数

返回值: double
说明: 返回一个0到1范围内的随机数。如果指定种子seed，则会等到一个稳定的随机数序列

> select rand();
+--------------------+--+
|        _c0         |
+--------------------+--+
| 0.638574497022045  |
+--------------------+--+
> select rand(6);
+---------------------+--+
|         _c0         |
+---------------------+--+
| 0.7307886238322471  |
+---------------------+--+

exp(DOUBLE a), exp(DECIMAL a)：自然指数

返回值: double
说明: 返回自然对数e的a次方

> select exp(3.4);
+--------------------+--+
|        _c0         |
+--------------------+--+
| 29.96410004739701  |
+--------------------+--+

ln(DOUBLE a), ln(DECIMAL a)：自然数为底的对数

返回值：DOUBLE
说明：以自然数为底的对数，a可为小数

> select ln(3.5);
+--------------------+--+
|        _c0         |
+--------------------+--+
| 1.252762968495368  |
+--------------------+--+

log10(DOUBLE a), log10(DECIMAL a)：以10为底对数

返回值: double
说明: 返回以10为底的a的对数

> select log10(2.5);
+---------------------+--+
|         _c0         |
+---------------------+--+
| 0.3979400086720376  |
+---------------------+--+

log(DOUBLE base, DOUBLE a),log(DECIMAL base, DECIMAL a)：对数函数

返回值: double
说明: 返回以base为底的a的对数

> select log(3, 9);
+------+--+
| _c0  |
+------+--+
| 2.0  |
+------+--+

log2(DOUBLE a), log2(DECIMAL a)：以2为底对数函数

返回值: double
说明: 返回以2为底的a的对数

> select log2(4);
+------+--+
| _c0  |
+------+--+
| 2.0  |
+------+--+

pow(DOUBLE a, DOUBLE p), power(DOUBLE a, DOUBLE p):幂运算函数

返回值: double
说明: 返回a的p次幂

> select pow(2, 3);
+------+--+
| _c0  |
+------+--+
| 8.0  |
+------+--+
> select power(3.0, 2.0);
+------+--+
| _c0  |
+------+--+
| 9.0  |
+------+--+

sqrt(DOUBLE a), sqrt(DECIMAL a):开平方函数

返回值: double
说明: 返回a的平方根

> select sqrt(16.0);
+------+--+
| _c0  |
+------+--+
| 4.0  |
+------+--+

bin(BIGINT a):二进制函数

返回值: string
说明: 返回a的二进制代码表示

> select bin(3245);
+---------------+--+
|      _c0      |
+---------------+--+
| 110010101101  |
+---------------+--+

hex(BIGINT a) hex(STRING a) hex(BINARY a):十六进制函数

返回值: string
说明: 如果变量是int类型，那么返回a的十六进制表示；如果变量是string类型，则返回该字符串的十六进制表示

> select hex(36);
+------+--+
| _c0  |
+------+--+
| 24   |
+------+--+
> select hex('a');
+------+--+
| _c0  |
+------+--+
| 61   |
+------+--+

unhex(STRING a):反转十六进制函数

返回值: string
说明: 返回该十六进制字符串所代码的字符串

> select unhex(61);
+------+--+
| _c0  |
+------+--+
| a    |
+------+--+

conv(BIGINT num, INT from_base, INT to_base), conv(STRING num, INT from_base, INT to_base)：进制转换函数

返回值: string
说明: 将数值num从from_base进制转化到to_base进制

> select conv(20, 10, 2);
+--------+--+
|  _c0   |
+--------+--+
| 10100  |
+--------+--+
> select conv(10100, 2, 10);
+------+--+
| _c0  |
+------+--+
| 20   |
+------+--+

pmod(INT a, INT b), pmod(DOUBLE a, DOUBLE b):取余函数

返回值: int double
说明: 返回正的a除以b的余数

> select pmod(9, 6);
+------+--+
| _c0  |
+------+--+
| 3    |
+------+--+

sin(DOUBLE a), sin(DECIMAL a):正弦函数

返回值: double
说明: 返回a的正弦值

> select sin(0.5);
+--------------------+--+
|        _c0         |
+--------------------+--+
| 0.479425538604203  |
+--------------------+--+

asin(DOUBLE a), asin(DECIMAL a):反正弦函数

返回值: double
说明: 返回a的反正弦值

> select asin(0.479425538604203);
+------+--+
| _c0  |
+------+--+
| 0.5  |
+------+--+

cos(DOUBLE a), cos(DECIMAL a):余弦函数

返回值: double
说明: 返回a的余弦值

> select cos(0.5);
+---------------------+--+
|         _c0         |
+---------------------+--+
| 0.8775825618903728  |
+---------------------+--+

acos(DOUBLE a), acos(DECIMAL a):反余弦函数

返回值: double
说明: 返回a的反余弦值

> select acos(0.8775825618903728)
+---------------------+--+
|         _c0         |
+---------------------+--+
| 0.4999999999999999  |
+---------------------+--+

tan(DOUBLE a), tan(DECIMAL a):正切函数

返回值: double
说明: 返回a的正切值

> select tan(0.5);
+---------------------+--+
|         _c0         |
+---------------------+--+
| 0.5463024898437905  |
+---------------------+--+

atan(DOUBLE a), atan(DECIMAL a):反正切函数

返回值: double
说明: 返回a的反正切值

> select atan(0.5463024898437905);
+------+--+
| _c0  |
+------+--+
| 0.5  |
+------+--+

degrees(DOUBLE a), degrees(DECIMAL a):弧度值转换角度值

返回值: double
说明: 返回弧度a的角度值

> select degrees(0.6);
+--------------------+--+
|        _c0         |
+--------------------+--+
| 34.37746770784939  |
+--------------------+--+

radians(DOUBLE a), radians(DOUBLE a):角度值转换成弧度值

返回值: double
说明: 返回角度a的弧度值

> select radians(34.37746770784939);
+------+--+
| _c0  |
+------+--+
| 0.6  |
+------+--+

positive(INT a), positive(DOUBLE a):返回a

返回值: int double
说明: 返回a

> select positive(3.5);
+------+--+
| _c0  |
+------+--+
| 3.5  |
+------+--+

negative(INT a), negative(DOUBLE a):返回a的相反数

返回值: int double
说明: 返回-a

> select negative(3.6);
+-------+--+
|  _c0  |
+-------+--+
| -3.6  |
+-------+--+
> select negative(-3.6);
+------+--+
| _c0  |
+------+--+
| 3.6  |
+------+--+

sign(DOUBLE a), sign(DECIMAL a):判断数值是正数，0或负数

返回值: double
说明: 如果a是正数则返回1.0，是负数则返回-1.0，否则返回0.0

> select sign(6);
+------+--+
| _c0  |
+------+--+
| 1.0  |
+------+--+
> select sign(-60);
+-------+--+
|  _c0  |
+-------+--+
| -1.0  |
+-------+--+
> select sign(0);
+------+--+
| _c0  |
+------+--+
| 0.0  |
+------+--+

e():数学常数e

返回值: double
说明: 返回数学常数e

> select e();
+--------------------+--+
|        _c0         |
+--------------------+--+
| 2.718281828459045  |
+--------------------+--+

pi():数学常数pi

返回值: double
说明: 返回数学常数pi

> select pi();
+--------------------+--+
|        _c0         |
+--------------------+--+
| 3.141592653589793  |
+--------------------+--+

factorial(INT a):求a的阶乘

返回值: int
说明: 返回a的阶乘

> select factorial(4);
+------+--+
| _c0  |
+------+--+
|  24  |
+------+--+

cbrt(DOUBLE a):求a的立方根

返回值: double
说明: 返回a的立方根

> select cbrt(27.0);
+------+--+
| _c0  |
+------+--+
| 3.0  |
+------+--+

shiftleft(TINYINT|SMALLINT|INT a, INT b),shiftleft(BIGINT a, INT b):按位左移

返回值: int bigint
说明: 返回a按位左移b位

> select shiftleft(2, 2);
+------+--+
| _c0  |
+------+--+
|  8   |
+------+--+

shiftright(TINYINT|SMALLINT|INT a, INTb),shiftright(BIGINT a, INT b):按拉右移

返回值: int bigint
说明: 返回a按位右移b位

> select shiftright(22, 2);
+------+--+
| _c0  |
+------+--+
|  5   |
+------+--+

shiftrightunsigned(TINYINT|SMALLINT|INTa, INT b),shiftrightunsigned(BIGINT a, INT b):无符号按位右移（<<<）

返回值: int bigint
说明: 返回a按位右移b位

> select shiftrightunsigned(32, 2);
+------+--+
| _c0  |
+------+--+
|  8   |
+------+--+
> select shiftrightunsigned(-32, 2);
+--------------------+--+
|         _c0        |
+--------------------+--+
|     1073741823     |
+--------------------+--+

关系运算

等值比较: =

语法：A=B
操作类型：所有基本类型
描述: 如果表达式A与表达式B相等，则为TRUE；否则为FALSE

> select 1=1;
+-------+--+
|  _c0  |
+-------+--+
| true  |
+-------+--+

不等值比较: <>

语法: A <> B
操作类型: 所有基本类型
描述: 如果表达式A为NULL，或者表达式B为NULL，返回NULL；如果表达式A与表达式B不相等，则为TRUE；否则为FALSE

> select 1<>2;
+-------+--+
|  _c0  |
+-------+--+
| true  |
+-------+--+
> select 1<>1;
+--------+--+
|  _c0   |
+--------+--+
| false  |
+--------+--+
> select NULL<>2;
+-------+--+
|  _c0  |
+-------+--+
| NULL  |
+-------+--+

小于比较: <

语法: A < B
操作类型：所有基本类型
描述: 如果表达式A为NULL，或者表达式B为NULL，返回NULL；如果表达式A小于表达式B，则为TRUE；否则为FALSE

> select NULL < 2;
+-------+--+
|  _c0  |
+-------+--+
| NULL  |
+-------+--+
> select 1 < 2;
+-------+--+
|  _c0  |
+-------+--+
| true  |
+-------+--+
> select 2 < 1;
+--------+--+
|  _c0   |
+--------+--+
| false  |
+--------+--+

小于等于比较: <=

语法: A <= B
操作类型: 所有基本类型
描述: 如果表达式A为NULL，或者表达式B为NULL，返回NULL；如果表达式A小于或者等于表达式B，则为TRUE；否则为FALSE

> select NULL <= 2;
 +-------+--+
|  _c0  |
+-------+--+
| NULL  |
+-------+--+
> select 0 <= 2;
+-------+--+
|  _c0  |
+-------+--+
| true  |
+-------+--+

大于比较: >

语法: A > B
操作类型: 所有基本类型
描述: 如果表达式A为NULL，或者表达式B为NULL，返回NULL；如果表达式A大于表达式B，则为TRUE；否则为FALSE

> select null > 2;
+-------+--+
|  _c0  |
+-------+--+
| NULL  |
+-------+--+
> select 3 > 2;
+-------+--+
|  _c0  |
+-------+--+
| true  |
+-------+--+

大于等于比较: >=

语法: A >= B
操作类型: 所有基本类型
描述: 如果表达式A为NULL，或者表达式B为NULL，返回NULL；如果表达式A大于或者等于表达式B，则为TRUE；否则为FALSE

> select null >= 2;
+-------+--+
|  _c0  |
+-------+--+
| NULL  |
+-------+--+
> select 6 >= 2;
+-------+--+
|  _c0  |
+-------+--+
| true  |
+-------+--+

注意：String的比较要注意(常用的时间比较可以先 to_date 之后再比较)

> select '20181208 00:00:00' < '20181208', '20181208 00:00:00' > '20181208', '20181208 00:00:00' = '20181208';
+--------+-------+--------+--+
|  _c0   |  _c1  |  _c2   |
+--------+-------+--------+--+
| false  | true  | false  |
+--------+-------+--------+--+

空值判断: IS NULL

语法: A IS NULL
操作类型: 所有类型
描述: 如果表达式A的值为NULL，则为TRUE；否则为FALSE

> select null is null;
+-------+--+
|  _c0  |
+-------+--+
| true  |
+-------+--+
> select '' is null;
+--------+--+
|  _c0   |
+--------+--+
| false  |
+--------+--+
> select 0 is null;
+--------+--+
|  _c0   |
+--------+--+
| false  |
+--------+--+

非空判断: IS NOT NULL

语法: A IS NOT NULL
操作类型: 所有类型
描述: 如果表达式A的值为NULL，则为FALSE；否则为TRUE

> select 0 is not null;
+-------+--+
|  _c0  |
+-------+--+
| true  |
+-------+--+
> select null is not null;
+--------+--+
|  _c0   |
+--------+--+
| false  |
+--------+--+

LIKE比较: LIKE

语法: A LIKE B
操作类型: strings
描述: 如果字符串A或者字符串B为NULL，则返回NULL；如果字符串A符合表达式B 的正则语法，则为TRUE；否则为FALSE。B中字符”_”表示任意单个字符，而字符”%”表示任意数量的字符。

> select 'hive' like 'h%';
+-------+--+
|  _c0  |
+-------+--+
| true  |
+-------+--+
> select 'hive' like '_______';
+--------+--+
|  _c0   |
+--------+--+
| false  |
+--------+--+
> select 'hive' like '____';
+-------+--+
|  _c0  |
+-------+--+
| true  |
+-------+--+
> select 'fuyun' like null;
+-------+--+
|  _c0  |
+-------+--+
| NULL  |
+-------+--+

注意：否定比较时候用NOT A LIKE B

> select not 'hive' like '____';
+--------+--+
|  _c0   |
+--------+--+
| false  |
+--------+--+

JAVA的LIKE操作: RLIKE

语法: A RLIKE B
操作类型: strings
描述: 如果字符串A或者字符串B为NULL，则返回NULL；如果字符串A符合JAVA正则表达式B的正则语法，则为TRUE；否则为FALSE。

> select 'fuyun' rlike '^f.*n$';
+-------+--+
|  _c0  |
+-------+--+
| true  |
+-------+--+

注意：判断一个字符串是否全为数字：

> select '12345' rlike '^\\d+$';
+-------+--+
|  _c0  |
+-------+--+
| true  |
+-------+--+
> select '12a34b' rlike '^\\d+$';
+--------+--+
|  _c0   |
+--------+--+
| false  |
+--------+--+

REGEXP操作: REGEXP

语法: A REGEXP B
操作类型: strings
描述: 功能与RLIKE相同

> select 'fuyun' regexp '^f.*n$';
+-------+--+
|  _c0  |
+-------+--+
| true  |
+-------+--+

数学运算：

加法操作: +

语法: A + B
操作类型：所有数值类型
说明：返回A与B相加的结果。结果的数值类型等于A的类型和B的类型的最小父类型（详见数据类型的继承关系）。比如，int + int 一般结果为int类型，而 int + double 一般结果为double类型

+------+--+
| _c0  |
+------+--+
| 10   |
+------+--+
> select 2 + 20.2;
+-------+--+
|  _c0  |
+-------+--+
| 22.2  |
+-------+--+

减法操作: -

语法: A – B
操作类型：所有数值类型
说明：返回A与B相减的结果。结果的数值类型等于A的类型和B的类型的最小父类型（详见数据类型的继承关系）。比如，int – int 一般结果为int类型，而 int – double 一般结果为double类型

> select 2 - 3;
+------+--+
| _c0  |
+------+--+
| -1   |
+------+--+
> select 6.6 - 3;
+---------------------+--+
|         _c0         |
+---------------------+--+
| 3.5999999999999996  |
+---------------------+--+

乘法操作:

语法: A * B
操作类型：所有数值类型
说明：返回A与B相乘的结果。结果的数值类型等于A的类型和B的类型的最小父类型（详见数据类型的继承关系）。注意，如果A乘以B的结果超过默认结果类型的数值范围，则需要通过cast将结果转换成范围更大的数值类型

> select 6.2 * 2;
+-------+--+
|  _c0  |
+-------+--+
| 12.4  |
+-------+--+

除法操作: /

语法: A / B
操作类型：所有数值类型
说明：返回A除以B的结果。结果的数值类型为double

> select 80 / 20;
+------+--+
| _c0  |
+------+--+
| 4.0  |
+------+--+

注意：hive中最高精度的数据类型是double,只精确到小数点后16位，在做除法运算的时候要特别注意

> select ceil(28.0/6.999999999999999999999);
+------+--+
| _c0  |
+------+--+
| 4    |
+------+--+
> select ceil(28.0/6.99999999999999);          
+------+--+
| _c0  |
+------+--+
| 5    |
+------+--+
> select 28.0/6.99999999999999;
+--------------------+--+
|        _c0         |
+--------------------+--+
| 4.000000000000005  |
+--------------------+--+
> select 28.0/6.999999999999999999999;
+------+--+
| _c0  |
+------+--+
| 4.0  |
+------+--+

取余操作: %

语法: A % B
操作类型：所有数值类型
说明：返回A除以B的余数。结果的数值类型等于A的类型和B的类型的最小父类型（详见数据类型的继承关系）。

> select 11 % 2;
+------+--+
| _c0  |
+------+--+
| 1    |
+------+--+
> select 6.8 % 2;
+---------------------+--+
|         _c0         |
+---------------------+--+
| 0.7999999999999998  |
+---------------------+--+

注意：精度在hive中是个很大的问题，类似这样的操作最好通过round指定精度

> select round(6.8 % 2, 2);
+------+--+
| _c0  |
+------+--+
| 0.8  |
+------+--+

位与操作: &

语法: A & B
操作类型：所有数值类型
说明：返回A和B按位进行与操作的结果（两个正数的二进制同位数都为1取1，有一个数为0取0）。结果的数值类型等于A的类型和B的类型的最小父类型（详见数据类型的继承关系）。

> select 3 & 2;
+------+--+
| _c0  |
+------+--+
| 2    |
+------+--+
> select 4 & 8;
+------+--+
| _c0  |
+------+--+
| 0    |
+------+--+

位或操作: |

语法: A | B
操作类型：所有数值类型
说明：返回A和B按位进行或操作的结果（两个正数的二进制同位数有一个为1取1，两个数为0取0）。结果的数值类型等于A的类型和B的类型的最小父类型（详见数据类型的继承关系）。

> select 3 | 2;
+------+--+
| _c0  |
+------+--+
| 3    |
+------+--+
> select 4 | 8;
+------+--+
| _c0  |
+------+--+
| 12   |
+------+--+

位异或操作: ^

语法: A ^ B
操作类型：所有数值类型
说明：返回A和B按位进行异或操作的结果（两个正数的二进制同位数相同取0，不同取1）。结果的数值类型等于A的类型和B的类型的最小父类型（详见数据类型的继承关系）。

> select 2 ^ 3;
+------+--+
| _c0  |
+------+--+
| 1    |
+------+--+
hive> select 6 ^ 4 from iteblog;
2

位取反操作: ~

语法: ~A
操作类型：所有数值类型
说明：返回A按位取反操作的结果。结果的数值类型等于A的类型。

> select ~3;
+------+--+
| _c0  |
+------+--+
| -4   |
+------+--+
> select ~(-4);
+------+--+
| _c0  |
+------+--+
| 3    |
+------+--+

逻辑运算：

逻辑与操作: AND

语法: A AND B
操作类型：boolean
说明：如果A和B均为TRUE，则为TRUE；否则为FALSE。如果A为NULL或B为NULL，则为NULL

> select 2 = 1 and 3 = 3;
+--------+--+
|  _c0   |
+--------+--+
| false  |
+--------+--+

逻辑或操作: OR

语法: A OR B
操作类型：boolean
说明：如果A为TRUE，或者B为TRUE，或者A和B均为TRUE，则为TRUE；否则为FALSE

> select 2 = 1 or 3 = 3;
+-------+--+
|  _c0  |
+-------+--+
| true  |
+-------+--+

逻辑非操作: NOT

语法: NOT A
操作类型：boolean
说明：如果A为FALSE，或者A为NULL，则为TRUE；否则为FALSE

> select not 2 = 3;
+-------+--+
|  _c0  |
+-------+--+
| true  |
+-------+--+

类型转换函数

binary(string|binary):将输入的值转换成二进制

语法: binary(string|binary)
返回值: binary
说明: 将输入的值转换成二进制

> select binary('fuyun');
+--------+--+
|  _c0   |
+--------+--+
| fuyun  |
+--------+--+

cast(expr as ):将expr转换成type类型

语法: cast(expr as )
返回值: Expected “=” to follow “type”
说明:返回转换后的数据类型

字符串转日期
> select cast('2018-12-08' as date);
+-------------+--+
|     _c0     |
+-------------+--+
| 2018-12-08  |
+-------------+--+
字符串转时间戳
> select cast('2018-12-08 23:30:56' as timestamp);
+------------------------+--+
|          _c0           |
+------------------------+--+
| 2018-12-08 23:30:56.0  |
+------------------------+--+
时间戳转换为日期
> select cast(timestamp('2018-12-08 23:30:56.0') as date);
+-------------+--+
|     _c0     |
+-------------+--+
| 2018-12-08  |
+-------------+--+
时间戳转换为日期
> select cast(timestamp(1544211242351) as date);
+-------------+--+
|     _c0     |
+-------------+--+
| 2018-12-08  |
+-------------+--+
日期转换为字符串
> select cast(date('2018-12-08') as string);
+-------------+--+
|     _c0     |
+-------------+--+
| 2018-12-08  |
+-------------+--+

日期函数

UNIX时间戳转日期函数: from_unixtime

语法: from_unixtime(bigint unixtime[, string format])
返回值: string
说明: 转化UNIX时间戳（从1970-01-01 00:00:00 UTC到指定时间的秒数）到当前时区的时间格式

> select from_unixtime(unix_timestamp(), 'yyyyMMdd');
+-------------+--+
|     _c0     |
+-------------+--+
|  20181208   |
+-------------+--+

获取当前UNIX时间戳函数: unix_timestamp

语法: unix_timestamp()
返回值: bigint
说明: 获得当前时区的UNIX时间戳

> select unix_timestamp();
+---------------+--+
|      _c0      |
+---------------+--+
|  1544283929   |
+---------------+--+

日期转UNIX时间戳函数: unix_timestamp

语法: unix_timestamp(string date)
返回值: bigint
说明: 转换格式为"yyyy-MM-dd HH:mm:ss"的日期到UNIX时间戳。如果转化失败，则返回0。

> select unix_timestamp('2018-12-08 23:50:00');
+-------------+--+
|     _c0     |
+-------------+--+
| 1544284200  |
+-------------+--+

指定格式日期转UNIX时间戳函数: unix_timestamp

语法: unix_timestamp(string date, string pattern)
返回值: bigint
说明: 转换pattern格式的日期到UNIX时间戳。如果转化失败，则返回0。

> select unix_timestamp('20181208 23:51:03','yyyyMMdd HH:mm:ss');
+-------------+--+
|     _c0     |
+-------------+--+
| 1544284263  |
+-------------+--+

日期时间转日期函数: to_date

语法: to_date(string timestamp)
返回值: string
说明: 返回日期时间字段中的日期部分。

> select to_date('2018-12-08 23:59:00');
+-------------+--+
|     _c0     |
+-------------+--+
| 2018-12-08  |
+-------------+--+

日期转年函数: year

语法: year(string date)
返回值: int
说明: 返回日期中的年。

> select year('2018-12-08 23:59:00');
+-------+--+
|  _c0  |
+-------+--+
| 2018  |
+-------+--+

日期转月函数: month

语法: month (string date)
返回值: int
说明: 返回日期中的月份。

> select month('2018-12-08 23:59:00');
+------+--+
| _c0  |
+------+--+
| 12   |
+------+--+

日期转天函数: day

语法: day (string date)
返回值: int
说明: 返回日期中的天。

> select day('2018-12-08 23:59:00');
+------+--+
| _c0  |
+------+--+
| 8    |
+------+--+

日期转小时函数: hour

语法: hour (string date)
返回值: int
说明: 返回日期中的小时。

> select hour('2018-12-08 23:59:00');
+------+--+
| _c0  |
+------+--+
| 23   |
+------+--+

日期转分钟函数: minute

语法: minute (string date)
返回值: int
说明: 返回日期中的分钟。

> select minute('2018-12-08 23:59:00');
+------+--+
| _c0  |
+------+--+
| 59   |
+------+--+

日期转秒函数: second

语法: second (string date)
返回值: int
说明: 返回日期中的秒。

> select second('2018-12-08 23:59:00');
+------+--+
| _c0  |
+------+--+
| 0    |
+------+--+

日期转周函数: weekofyear

语法: weekofyear (string date)
返回值: int
说明: 返回日期在当前的周数。

> select weekofyear('2018-12-08 23:59:00');
+------+--+
| _c0  |
+------+--+
| 49   |
+------+--+

日期比较函数: datediff

语法: datediff(string enddate, string startdate)
返回值: int
说明: 返回结束日期减去开始日期的天数。

> select datediff('2018-12-08', '2018-12-01');
+------+--+
| _c0  |
+------+--+
| 7    |
+------+--+

日期增加函数: date_add

语法: date_add(string startdate, int days)
返回值: string
说明: 返回开始日期startdate增加days天后的日期。

> select date_add('2018-12-08', 30);
+-------------+--+
|     _c0     |
+-------------+--+
| 2019-01-07  |
+-------------+--+

日期减少函数: date_sub

语法: date_sub (string startdate, int days)
返回值: string
说明: 返回开始日期startdate减少days天后的日期。

> select date_sub('2018-12-08', 30);
+-------------+--+
|     _c0     |
+-------------+--+
| 2018-11-08  |
+-------------+--+

last_day() 函数：返回月份中的最后一天

语法: last_day(string date)
返回值: string
说明: 返回日期date月份的最后一天。

> select last_day('2018-12-26');
+-------------+--+
|     _c0     |
+-------------+--+
| 2018-12-31  |
+-------------+--+

next_day() 函数：返回指定日期下周的指定周几

语法: next_day(string start_date, string day_of_week)
返回值: string
说明: 返回日期start_date下周的指定周几。

> select next_day('2019-02-24', 'TU');
+-------------+--+
|     _c0     |
+-------------+--+
| 2019-02-26  |
+-------------+--+

> select next_day('2019-02-24', 'MONDAY');
+-------------+--+
|     _c0     |
+-------------+--+
| 2019-02-25  |
+-------------+--+

trunc()函数：返回指定日期月份的第一天/年中的第一天日期

语法: trunc(string date, string format)
返回值: string
支持格式：MONTH/MON/MM, YEAR/YYYY/YY
说明: 返回日期date月份的第一天/年中的第一天日期。

> select trunc('2019-02-24', 'YYYY');
+-------------+--+
|     _c0     |
+-------------+--+
| 2019-01-01  |
+-------------+--+

> select trunc('2019-02-24', 'MM');
+-------------+--+
|     _c0     |
+-------------+--+
| 2019-02-01  |
+-------------+--+

add_months()函数：按指定格式返回指定日期增加几个月后的日期

语法: add_months(string start_date, int num_months, output_date_format)
返回值: string
说明: 返回日期date月份的第一天/年中的第一天日期。

> select add_months('2019-02-28', 1);
+-------------+--+
|     _c0     |
+-------------+--+
| 2019-03-31  |
+-------------+--+

> select add_months('2019-02-24 21:15:16', 2, 'YYYY-MM-dd HH:mm:ss');
+----------------------+--+
|          _c0         |
+----------------------+--+
| 2019-04-24 21:15:16  |
+----------------------+--+

months_between()函数：返回日期1到日期2之间的月数

语法: months_between(date1, date2)
返回值: double
说明: 返回日期1到日期2之间的月数，如果date1晚于date2，则结果为正数。如果date1早于date2，则结果为负。如果date1和date2是一个月的同一天或两个月的最后一天，那么结果总是一个整数。否则，UDF根据31天的月份计算结果的小数部分，并考虑时间组件date1和date2的差异。date1和date2类型可以是日期、时间戳或字符串，格式为“yyyy-MM-dd”或“yyyy-MM-dd HH:mm:ss”

> select months_between('2019-02-22 10:30:00', '2018-12-30');
+-------------+--+
|     _c0     |
+-------------+--+
| 1.75604839  |
+-------------+--+

> select months_between('2019-02-22 10:30:00', '2018-12-22');
+---------------+--+
|      _c0      |
+---------------+--+
|      2.0      |
+---------------+--+

date_format()函数：返回指定日期格式

语法: date_format(date/timestamp/string, fmt)
返回值: string
说明: 返回日期指定的格式。

> select date_format('2018-12-26', 'y');
+-------------+--+
|     _c0     |
+-------------+--+
|     2018    |
+------------ -+--+

条件函数

If函数: if

语法: if(boolean testCondition, T valueTrue, T valueFalseOrNull)
返回值: T
说明: 当条件testCondition为TRUE时，返回valueTrue；否则返回valueFalseOrNull

> select if(2 = 2, 63, 69);
+------+--+
| _c0  |
+------+--+
| 63   |
+------+--+
> select if(2 = 1, 63, 69);
+------+--+
| _c0  |
+------+--+
| 69   |
+------+--+

非空查找函数: COALESCE

语法: COALESCE(T v1, T v2, …)
返回值: T
说明: 返回参数中的第一个非空值；如果所有值都为NULL，那么返回NULL

> select coalesce(null, 63, 69);
+------+--+
| _c0  |
+------+--+
| 63   |
+------+--+

条件判断函数：CASE

语法: CASE a WHEN b THEN c [WHEN d THEN e]* [ELSE f] END
返回值: T
说明：如果a等于b，那么返回c；如果a等于d，那么返回e；否则返回f

> select case 100 when 50 then 'tom' when 100 then 'mary' else 'tim' end;
+-------+--+
|  _c0  |
+-------+--+
| mary  |
+-------+--+
> select case 200 when 50 then 'tom' when 100 then 'mary' else 'tim' end;
+------+--+
| _c0  |
+------+--+
| tim  |
+------+--+

条件判断函数：CASE

语法: CASE WHEN a THEN b [WHEN c THEN d]* [ELSE e] END
返回值: T
说明：如果a为TRUE,则返回b；如果c为TRUE，则返回d；否则返回e

> select case when 1=2 then 'tom' when 2=2 then 'mary' else 'tim' end;
+-------+--+
|  _c0  |
+-------+--+
| mary  |
+-------+--+
> select case when 1=1 then 'tom' when 2=2 then 'mary' else 'tim' end ;
+------+--+
| _c0  |
+------+--+
| tom  |
+------+--+

字符函数

字符串长度函数：length

语法: length(string A)
返回值: int
说明：返回字符串A的长度

> select length('fuyun');
+------+--+
| _c0  |
+------+--+
| 5    |
+------+--+

字符串反转函数：reverse

语法: reverse(string A)
返回值: string
说明：返回字符串A的反转结果

> select reverse('fuyun');
+--------+--+
|  _c0   |
+--------+--+
| nuyuf  |
+--------+--+

字符串连接函数：concat

语法: concat(string A, string B…)
返回值: string
说明：返回输入字符串连接后的结果，支持任意个输入字符串

> select concat('fu', 'yun');
+--------+--+
|  _c0   |
+--------+--+
| fuyun  |
+--------+--+
> select concat('my', 'name', 'is', 'fuyun');
+----------------+--+
|      _c0       |
+----------------+--+
| mynameisfuyun  |
+----------------+--+

带分隔符字符串连接函数：concat_ws

语法: concat_ws(string SEP, string A, string B…)
返回值: string
说明：返回输入字符串连接后的结果，SEP表示各个字符串间的分隔符

> select concat_ws(' ', 'my', 'name', 'is', 'fuyun');
+-------------------+--+
|        _c0        |
+-------------------+--+
| my name is fuyun  |
+-------------------+--+

字符串截取函数：substr,substring

语法: substr(string A, int start),substring(string A, int start)
返回值: string
说明：返回字符串A从start位置到结尾的字符串

> select substr('abcdefg', 5);
+------+--+
| _c0  |
+------+--+
| efg  |
+------+--+
> select substring('abcdefg', 5);
+------+--+
| _c0  |
+------+--+
| efg  |
+------+--+
> select substring('abcdefg', -1);
+------+--+
| _c0  |
+------+--+
| g    |
+------+--+

字符串截取函数：substr,substring

语法: substr(string A, int start, int len),substring(string A, int start, int len)
返回值: string
说明：返回字符串A从start位置开始，长度为len的字符串

> select substr('abcde',3,2);
+------+--+
| _c0  |
+------+--+
| cd   |
+------+--+
> select substring('abcde',3,2);
+------+--+
| _c0  |
+------+--+
| cd   |
+------+--+
> select substring('abcde',-2,2);
+------+--+
| _c0  |
+------+--+
| de   |
+------+--+

字符串转大写函数：upper,ucase

语法: upper(string A) ucase(string A)
返回值: string
说明：返回字符串A的大写格式

> select upper('abSEd');
+--------+--+
|  _c0   |
+--------+--+
| ABSED  |
+--------+--+
> select ucase('abSEd');
+--------+--+
|  _c0   |
+--------+--+
| ABSED  |
+--------+--+

8、字符串转小写函数：lower,lcase
语法: lower(string A) lcase(string A)
返回值: string
说明：返回字符串A的小写格式

> select lower('abSEd');
+--------+--+
|  _c0   |
+--------+--+
| absed  |
+--------+--+
> select lcase('abSEd');
+--------+--+
|  _c0   |
+--------+--+
| absed  |
+--------+--+

去空格函数：trim

语法: trim(string A)
返回值: string
说明：去除字符串两边的空格

> select trim(' abc ');
+------+--+
| _c0  |
+------+--+
| abc  |
+------+--+

左边去空格函数：ltrim

语法: ltrim(string A)
返回值: string
说明：去除字符串左边的空格

> select ltrim(' abc ');
+-------+--+
|  _c0  |
+-------+--+
| abc   |
+-------+--+

右边去空格函数：rtrim

语法: rtrim(string A)
返回值: string
说明：去除字符串右边的空格

> select rtrim(' abc ');
+-------+--+
|  _c0  |
+-------+--+
|  abc  |
+-------+--+

正则表达式替换函数：regexp_replace

语法: regexp_replace(string A, string B, string C)
返回值: string
说明：将字符串A中的符合java正则表达式B的部分替换为C。注意，在有些情况下要使用转义字符,类似oracle中的regexp_replace函数。

>  select regexp_replace('fuyun', 'u|n', '');
+------+--+
| _c0  |
+------+--+
| fy   |
+------+--+

正则表达式解析函数：regexp_extract

语法: regexp_extract(string subject, string pattern, int index)
返回值: string
说明：将字符串subject按照pattern正则表达式的规则拆分，返回index指定的字符。

>  select regexp_extract('foothebar', 'foo(.*?)(bar)', 1);
+------+--+
| _c0  |
+------+--+
| the  |
+------+--+
> select regexp_extract('foothebar', 'foo(.*?)(bar)', 2);
+------+--+
| _c0  |
+------+--+
| bar  |
+------+--+
> select regexp_extract('foothebar', 'foo(.*?)(bar)', 0);
+------------+--+
|    _c0     |
+------------+--+
| foothebar  |
+------------+--+

注意，在有些情况下要使用转义字符，下面的等号要用双竖线转义，这是java正则表达式的规则。

> select regexp_extract('isStartDate=2018-12-08', '.*?StartDate\\=([^&]+)',1);
+-------------+--+
|     _c0     |
+-------------+--+
| 2018-12-08  |
+-------------+--+

URL解析函数：parse_url

语法: parse_url(string urlString, string partToExtract [, string keyToExtract])
返回值: string
说明：返回URL中指定的部分。partToExtract的有效值为：HOST, PATH, QUERY, REF, PROTOCOL, AUTHORITY, FILE, and USERINFO.

> select parse_url('https://me.csdn.net/lz6363', 'HOST'); 
+--------------+--+
|     _c0      |
+--------------+--+
| me.csdn.net  |
+--------------+--+
> select parse_url('https://me.csdn.net/lz6363/?k1=v1&k2=v2#Ref1', 'QUERY', 'k1'); 
+------+--+
| _c0  |
+------+--+
| v1   |
+------+--+

json解析函数：get_json_object

语法: get_json_object(string json_string, string path)
返回值: string
说明：解析json的字符串json_string,返回path指定的内容。如果输入的json字符串无效，那么返回NULL。

hive> select  get_json_object('{"store":
 {"fruit":\[{"weight":8,"type":"apple"},{"weight":9,"type":"pear"}],
 "bicycle":{"price":19.95,"color":"red"}
 },
"email":"amy@only_for_json_udf_test.net",
 "owner":"amy"
}
','$.owner')
+------+--+
| _c0  |
+------+--+
| amy  |
+------+--+

json解析函数：json_tuple

语法:json_tuple(json_string, path1, path2, …, pathn)
返回值: tuple
说明：解析json的字符串json_string,返回path1-pathn指定的内容。如果输入的json字符串无效，那么返回NULL。

select json_tuple('{"website":"https://blog.csdn.net/lz6363/article/list/1","name":"浮云"}', 'website', 'name');
OK
c0	c1
https://blog.csdn.net/lz6363/article/list/1	浮云
Time taken: 0.788 seconds, Fetched: 1 row(s)

空格字符串函数：space

语法: space(int n)
返回值: string
说明：返回长度为n的字符串

> select space(10) ;
+-------------+--+
|     _c0     |
+-------------+--+
|             |
+-------------+--+
> select length(space(10));
+------+--+
| _c0  |
+------+--+
| 10   |
+------+--+

重复字符串函数：repeat

语法: repeat(string str, int n)
返回值: string
说明：返回重复n次后的str字符串

> select repeat('abc',5);
+------------------+--+
|       _c0        |
+------------------+--+
| abcabcabcabcabc  |
+------------------+--+

首字符ascii函数：ascii

语法: ascii(string str)
返回值: int
说明：返回字符串str第一个字符的ascii码

> select ascii('abcde');
+------+--+
| _c0  |
+------+--+
| 97   |
+------+--+

左补足函数：lpad

语法: lpad(string str, int len, string pad)
返回值: string
说明：将str进行用pad进行左补足到len位

> select lpad('abc',10,'td');
+-------------+--+
|     _c0     |
+-------------+--+
| tdtdtdtabc  |
+-------------+--+

注意：与GP，ORACLE不同，pad 不能默认

右补足函数：rpad

语法: rpad(string str, int len, string pad)
返回值: string
说明：将str进行用pad进行右补足到len位

> select rpad('abc',10,'td');
+-------------+--+
|     _c0     |
+-------------+--+
| abctdtdtdt  |
+-------------+--+

分割字符串函数: split

语法: split(string str, string pat)
返回值: array
说明: 按照pat字符串分割str，会返回分割后的字符串数组

> select split('abtcdtef','t');
+-------------------+--+
|        _c0        |
+-------------------+--+
| ["ab","cd","ef"]  |
+-------------------+--+

集合查找函数: find_in_set

语法: find_in_set(string str, string strList)
返回值: int
说明: 返回str在strlist第一次出现的位置，strlist是用逗号分割的字符串。如果没有找该str字符，则返回0

> select find_in_set('ab','ef,ab,de');
+------+--+
| _c0  |
+------+--+
| 2    |
+------+--+
> select find_in_set('at','ef,ab,de');
+------+--+
| _c0  |
+------+--+
| 0    |
+------+--+

字符串查找函数:instr

语法: instr(string str, string substr)
返回值: int
说明: 查找字符串str中子字符串substr出现的位置，如果查找失败将返回0，如果任一参数为Null将返回null，注意位置为从1开始的

> SELECT instr('fuyun', 'yun');
+------+--+
| _c0  |
+------+--+
| 3    |
+------+--+
> SELECT instr('bigdata', 'ta');
+------+--+
| _c0  |
+------+--+
| 6    |
+------+--+

格式化数字函数:format_number

语法: format_number(number x, int d)
返回值: string
说明: 将数值X转换成"#,###,###.##"格式字符串，并保留d位小数，如果d为0，将进行四舍五入且不保留小数

> SELECT format_number(12332.123456, 4);
+--------------+--+
|     _c0      |
+--------------+--+
| 12,332.1235  |
+--------------+--+

字符串在post位置后第一次出现的位置函数:locate

语法: locate(string substr, string str[, int pos])
返回值: int
说明: 查找字符串str中子字符串substr出现的位置，如果查找失败将返回0，如果任一参数为Null将返回null，注意位置为从1开始的

> SELECT locate('bar', 'foobarbar', 5)
+------+--+
| _c0  |
+------+--+
| 7    |
+------+--+

聚合函数

个数统计函数: count

语法: count(), count(expr), count(DISTINCT expr[, expr_.])
返回值: int
说明: count()统计检索出的行的个数，包括NULL值的行；count(expr)返回指定字段的非空值的个数；count(DISTINCT expr[, expr_.])返回指定字段的不同的非空值的个数

总和统计函数: sum

语法: sum(col), sum(DISTINCT col)
返回值: double
说明: sum(col)统计结果集中col的相加的结果；sum(DISTINCT col)统计结果中col不同值相加的结果

平均值统计函数: avg

语法: avg(col), avg(DISTINCT col)
返回值: double
说明: avg(col)统计结果集中col的平均值；avg(DISTINCT col)统计结果中col不同值相加的平均值

最小值统计函数: min

语法: min(col)
返回值: double
说明: 统计结果集中col字段的最小值

最大值统计函数: max

语法: maxcol)
返回值: double
说明: 统计结果集中col字段的最大值

非空集合总体变量函数: var_pop

语法: var_pop(col)
返回值: double
说明: 统计结果集中col非空集合的总体变量（忽略null）

非空集合样本变量函数: var_samp

语法: var_samp (col)
返回值: double
说明: 统计结果集中col非空集合的样本变量（忽略null）

总体标准偏离函数: stddev_pop

语法: stddev_pop(col)
返回值: double
说明: 该函数计算总体标准偏离，并返回总体变量的平方根，其返回值与VAR_POP函数的平方根相同

样本标准偏离函数: stddev_samp

语法: stddev_samp (col)
返回值: double
说明: 该函数计算样本标准偏离

中位数函数: percentile

语法: percentile(BIGINT col, p)
返回值: double
说明: 求准确的第pth个百分位数，p必须介于0和1之间，但是col字段目前只支持整数，不支持浮点数类型

中位数函数: percentile

语法: percentile(BIGINT col, array(p1 [, p2]…))
返回值: array
说明: 功能和上述类似，之后后面可以输入多个百分位数，返回类型也为array，其中为对应的百分位数。

近似中位数函数: percentile_approx

语法: percentile_approx(DOUBLE col, p [, B])
返回值: double
说明: 求近似的第pth个百分位数，p必须介于0和1之间，返回类型为double，但是col字段支持浮点类型。参数B控制内存消耗的近似精度，B越大，结果的准确度越高。默认为10,000。当col字段中的distinct值的个数小于B时，结果为准确的百分位数

近似中位数函数: percentile_approx

语法: percentile_approx(DOUBLE col, array(p1 [, p2]…) [, B])
返回值: array
说明: 功能和上述类似，之后后面可以输入多个百分位数，返回类型也为array，其中为对应的百分位数。

直方图: histogram_numeric

语法: histogram_numeric(col, b)
返回值: array
说明: 以b为基准计算col的直方图信息。

复合类型构建操作

Map类型构建: map

语法: map (key1, value1, key2, value2, …)
说明：根据输入的key和value对构建map类型

> create table test2 as select map('100','tom','200','mary') as t;
> > desc test2;
+-----------+---------------------+----------+--+
| col_name  |      data_type      | comment  |
+-----------+---------------------+----------+--+
| t         | map  |          |
+-----------+---------------------+----------+--+
> select t from test2;
+-----------------------------+--+
|              t              |
+-----------------------------+--+
| {"100":"tom","200":"mary"}  |
+-----------------------------+--+

Struct类型构建: struct

语法: struct(val1, val2, val3, …)
说明：根据输入的参数构建结构体struct类型

> create table test1 as select struct('tom','mary','tim') as t;
> desc test1;
+-----------+----------------------------------------------+----------+--+
| col_name  |                  data_type                   | comment  |
+-----------+----------------------------------------------+----------+--+
| t         | struct  |          |
+-----------+----------------------------------------------+----------+--+
> select t from test1;
+--------------------------------------------+--+
|                     t                      |
+--------------------------------------------+--+
| {"col1":"tom","col2":"mary","col3":"tim"}  |
+--------------------------------------------+--+

array类型构建: array

语法: array(val1, val2, …)
说明：根据输入的参数构建数组array类型

> create table test as select array("tom","mary","tim") as t;
> desc test;
+-----------+----------------+----------+--+
| col_name  |   data_type    | comment  |
+-----------+----------------+----------+--+
| t         | array  |          |
+-----------+----------------+----------+--+
> select t from test;
+-----------------------+--+
|           t           |
+-----------------------+--+
| ["tom","mary","tim"]  |
+-----------------------+--+

复杂类型访问操作

array类型访问: A[n]

语法: A[n]
操作类型: A为array类型，n为int类型
说明：返回数组A中的第n个变量值。数组的起始下标为0。比如，A是个值为[‘foo’, ‘bar’]的数组类型，那么A[0]将返回’foo’,而A[1]将返回’bar’

> create table test as select array("tom","mary","tim") as t;
> select t[0],t[1],t[2] from test;
+------+-------+------+--+
| _c0  |  _c1  | _c2  |
+------+-------+------+--+
| tom  | mary  | tim  |
+------+-------+------+--+

map类型访问: M[key]

语法: M[key]
操作类型: M为map类型，key为map中的key值
说明：返回map类型M中，key值为指定值的value值。比如，M是值为{‘f’ -> ‘foo’, ‘b’ -> ‘bar’, ‘all’ -> ‘foobar’}的map类型，那么M[‘all’]将会返回’foobar’

> create table `map` as select map('100','tom','200','mary') as t;
> select t['200'],t['100'] from `map`;
+-------+------+--+
|  _c0  | _c1  |
+-------+------+--+
| mary  | tom  |
+-------+------+--+

struct类型访问: S.x

语法: S.x
操作类型: S为struct类型
说明：返回结构体S中的x字段。比如，对于结构体struct foobar {int foo, int bar}，foobar.foo返回结构体中的foo字段

> create table `struct` as select struct('tom','mary','tim') as t;
> desc `struct`;
+-----------+----------------------------------------------+----------+--+
| col_name  |                  data_type                   | comment  |
+-----------+----------------------------------------------+----------+--+
| t         | struct  |          |
+-----------+----------------------------------------------+----------+--+
> select t.col1,t.col3 from `struct` ;
+-------+-------+--+
| col1  | col3  |
+-------+-------+--+
| tom   | tim   |
+-------+-------+--+

复杂类型长度统计函数

Map类型长度函数: size(Map)

语法: size(Map)
返回值: int
说明: 返回map类型的长度

> select size(map('100','tom','101','mary'));
+------+--+
| _c0  |
+------+--+
| 2    |
+------+--+

array类型长度函数: size(Array)

语法: size(Array)
返回值: int
说明: 返回array类型的长度

> select size(array('100','101','102','103'));
 +------+--+
| _c0  |
+------+--+
| 4    |
+------+--+

复杂类型操作函数

数组转成多行函数：explode(Array/Map)

语法: explode(Array/Map)
返回值:
说明: 数组转成多行

> select explode(array('hive', 'linux', 'hadoop', 'hdfs', 'spark'));
OK
hive
linux
hadoop
hdfs
spark

select explode(map('1','hive','2','spark'));
OK
1	hive
2	spark

替换空值:nvl(null, T)

语法: nvl(null,T)
返回值:泛型
说明: 将空值替换成想要的值

select nvl(null, 'fuyun');
OK
_c0
fuyun

参考资料：https://www.iteblog.com/archives/2258.html#i-8
https://www.cnblogs.com/MOBIN/p/5618747.html#2
https://cwiki.apache.org/confluence/display/Hive/LanguageManual+UDF

你可能感兴趣的:(hive)

nosql数据库技术与应用知识点皆过客，揽星河 NoSQL nosql 数据库大数据数据分析数据结构非关系型数据库
Nosql知识回顾大数据处理流程数据采集(flume、爬虫、传感器)数据存储(本门课程NoSQL所处的阶段)Hdfs、MongoDB、HBase等数据清洗(入仓)Hive等数据处理、分析(Spark、Flink等)数据可视化数据挖掘、机器学习应用(Python、SparkMLlib等)大数据时代存储的挑战(三高)高并发(同一时间很多人访问)高扩展(要求随时根据需求扩展存储)高效率(要求读写速度快)
浅谈MapReduce Android路上的人 Hadoop 分布式计算 mapreduce 分布式框架 hadoop
从今天开始，本人将会开始对另一项技术的学习，就是当下炙手可热的Hadoop分布式就算技术。目前国内外的诸多公司因为业务发展的需要，都纷纷用了此平台。国内的比如BAT啦，国外的在这方面走的更加的前面，就不一一列举了。但是Hadoop作为Apache的一个开源项目，在下面有非常多的子项目，比如HDFS，HBase,Hive，Pig,等等，要先彻底学习整个Hadoop，仅仅凭借一个的力量，是远远不够的。
Presto【基础 01】简介+架构+数据源+数据模型 2401_84254343 程序员架构
一个Catalog包含Schema和Connector。例如，配置JMX的Catalog，通过JXMConnector访问JXM信息。当执行一条SQL语句时，可以同时运行在多个Catalog。Presto处理table时，是通过表的完全限定（fully-qualified）名来找到Catalog。例如，一个表的权限定名是hive.test_data.test，则test是表名，test_data是
大数据毕业设计hadoop+spark+hive知识图谱租房数据分析可视化大屏租房推荐系统 58同城租房爬虫房源推荐系统房价预测系统计算机毕业设计机器学习深度学习人工智能 2401_84572577 程序员大数据 hadoop 人工智能
做了那么多年开发，自学了很多门编程语言，我很明白学习资源对于学一门新语言的重要性，这些年也收藏了不少的Python干货，对我来说这些东西确实已经用不到了，但对于准备自学Python的人来说，或许它就是一个宝藏，可以给你省去很多的时间和精力。别在网上瞎学了，我最近也做了一些资源的更新，只要你是我的粉丝，这期福利你都可拿走。我先来介绍一下这些东西怎么用，文末抱走。（1）Python所有方向的学习路线（
大数据之flink与hive 星辰_mya 大数据 flink hive
其实吧我不太想写flink，因为线上经验确实不多，这也是我需要补的地方，没有条件创造条件，先来一篇吧flink：高性能低延迟流批一体的分布式计算框架基于事件时间对实时数据精准处理快速响应支持批处理，高效离线分析和数据挖掘数据仓库的引擎丰富数据源/接收器，集成多种数据存储格式和源，比较常见就是咱们今天的主题hive了checkpoint恢复机制，故障恢复快速恢复计算任务分布式弹性扩展，据业务灵活增加
hive血缘关系之输入表与目标表的解析 zxfBdd hive 大数据治理大数据
接了一个新需求：需要做数据仓库的血缘关系。正所谓兵来将挡水来土掩，那咱就动手吧。血缘关系是数据治理的一块，其实有专门的第三方数据治理框架，但考虑到目前的线上环境已经趋于稳定，引入新的框架无疑是劳民伤财，伤筋动骨，所以就想以最小的代价把这个事情给做了。目前我们考虑做的血缘关系呢只是做输入表和输出表，最后会形成一张表与表之间的链路图。这个东西的好处就是有助于仓库人员梳理业务，后面可能还会做字段之间的血
初级练习[3]:Hive SQL子查询应用大数据深度洞察 Hive hive sql hadoop 数据仓库大数据数据库
目录环境准备看如下链接子查询查询所有课程成绩均小于60分的学生的学号、姓名查询没有学全所有课的学生的学号、姓名解释：没有学全所有课，也就是该学生选修的课程数<总的课程数。查询出只选修了三门课程的全部学生的学号和姓名环境准备看如下链接环境准备https://blog.csdn.net/qq_45115959/article/details/142057624?spm=1001.2014.3001.5
Linux下载压缩包：tar.gz、zip、tar.bz2格式全攻略 promise524 Linux linux 运维服务器后端 bash shell
在Linux中，下载各种格式的压缩包（如.tar.gz、.zip、.tar.bz2等）通常使用命令行工具如wget和curl。1.使用wget下载压缩包wget是Linux中最常用的文件下载工具，支持HTTP、HTTPS、FTP等协议，可以直接从命令行下载文件。基本命令：wget[URL]下载.tar.gz文件wgethttps://test.com/archive.tar.gz此命令将从指定的U
Anaconda版本和Python版本对应关系纬领网络 python anaconda3
官网下载地址：https://repo.anaconda.com/archive/下载地址：https://mirrors.tuna.tsinghua.edu.cn/anaconda/archive/anaconda3版本基础python版本Anaconda3-2024.06-1Python3.12.4Anaconda3-2024.02-1Python3.11.7Anaconda3-2023.09
R语言包AMORE安装报错问题以及RStudio与Rtools环境配置卡卡_R-Python R语言数据分析与可视化 r语言开发语言
在使用R语言进行AMORE安装时会遇到报错，这时候需要采用解决办法：'''AMORE包安装，需要离线官网下载安装包：Indexof/src/contrib/Archive/AMORE(r-project.org)https://cran.r-project.org/src/contrib/Archive/AMORE/一、出现的问题最近开始学习R语言，安装了最新版的R4.4.1和RStudio，但安
中级练习[3]：Hive SQL用户行为与商品销售数据分析大数据深度洞察 Hive hive 数据仓库大数据 sql
目录1.用户累计消费金额及VIP等级查询1.1题目需求1.2代码实现2.首次下单后第二天连续下单的用户比率查询2.1题目需求2.2代码实现3.每个商品销售首年的年份、销售数量和销售金额统计3.1题目需求3.2代码实现1.用户累计消费金额及VIP等级查询1.1题目需求从订单信息表(order_info)中统计每个用户截止其每个下单日期的累积消费金额，以及每个用户在其每个下单日期的VIP等级。VIP等
Python基础知识进阶之正则表达式_头歌python正则表达式进阶前端陈萨龙程序员 python 学习面试
最后硬核资料：关注即可领取PPT模板、简历模板、行业经典书籍PDF。技术互助：技术群大佬指点迷津，你的问题可能不是问题，求资源在群里喊一声。面试题库：由技术群里的小伙伴们共同投稿，热乎的大厂面试真题，持续更新中。知识体系：含编程语言、算法、大数据生态圈组件（Mysql、Hive、Spark、Flink）、数据仓库、Python、前端等等。网上学习资料一大堆，但如果学到的知识不成体系，遇到问题时只是
编程常用命令总结 Yellow0523 Linux BigData 大数据
编程命令大全1.软件环境变量的配置JavaScalaSparkHadoopHive2.大数据软件常用命令Spark基本命令Spark-SQL命令Hive命令HDFS命令YARN命令Zookeeper命令kafka命令Hibench命令MySQL命令3.Linux常用命令Git命令conda命令pip命令查看Linux系统的详细信息查看Linux系统架构(X86还是ARM，两种方法都可)端口号命令L
博客园怎么了？ YYH1992
新年好，给大家拜个早年！今年来到安徽过年，无聊中，不知不觉中又来到博客园了（忠实粉丝哦），却发现一件奇怪的事情，请看截图难道博客园被挂马了？抑或其它问题？如果真有问题，还请dudu抓紧时间修正，免得影响我们园子的声誉！我要下线了，出去买回家的车票了，只能年后回家了。。。转载于:https://www.cnblogs.com/HollisYao/archive/2008/02/06/1065351.
linux下文件的复制、移动与删除搬砖中年人
一、文件复制命令cp命令格式：cp[-adfilprsu]源文件(source)目标文件(destination)cp[option]source1source2source3...directory参数说明：-a:是指archive的意思，也说是指复制所有的目录-d:若源文件为连接文件(linkfile)，则复制连接文件属性而非文件本身-f:强制(force)，若有重复或其它疑问时，不会询问用户
2024年最全使用Python求解方程_python解方程(1)，字节面试官迟到 2401_84569545 程序员 python 学习面试
最后硬核资料：关注即可领取PPT模板、简历模板、行业经典书籍PDF。技术互助：技术群大佬指点迷津，你的问题可能不是问题，求资源在群里喊一声。面试题库：由技术群里的小伙伴们共同投稿，热乎的大厂面试真题，持续更新中。知识体系：含编程语言、算法、大数据生态圈组件（Mysql、Hive、Spark、Flink）、数据仓库、Python、前端等等。网上学习资料一大堆，但如果学到的知识不成体系，遇到问题时只是
兼容 Trino Connector，扩展 Apache Doris 数据源接入能力｜Lakehouse 使用手册 vvvae1234 apache
ApacheDoris内置支持包括Hive、Iceberg、Hudi、Paimon、LakeSoul、JDBC在内的多种Catalog，并为其提供原生高性能且稳定的访问能力，以满足与数据湖的集成需求。而随着ApacheDoris用户的增加，新的数据源连接需求也随之增加。因此，从3.0版本开始，ApacheDoris引入了TrinoConnector兼容框架。Trino/Presto作为业界较早应用
SAP HANA makaitai BW sap 数据库工具报表 layer 服务器
原文地址：http://LiuAlex.com/archives/1776也是刚刚开始学习HANA的一些知识，一边看书一遍做笔记，说到底无非是用自己的语言来理解标准帮组文档所讲解的意思，肯定有理解失误的地方，毕竟没有参加过标准培训，即使有培训，从老师那边来的知识也不可能是完整的传授过来，中间多少的知识遗漏是正常的，所以多看看HELP的文档，应该可以原汁原味的理解作者的意思。这张图片是从SAPHAN
Hive SQL查询汇总分析大数据深度洞察 Hive hive sql hadoop 数据仓库数据库大数据
目录SQL查询汇总分析成绩查询查询编号为“02”的课程的总成绩查询参加考试的学生个数分组查询查询各科成绩最高和最低的分查询每门课程有多少学生参加了考试（有考试成绩）查询男生、女生人数分组结果的条件查询平均成绩大于60分的学生的学号和平均成绩查询至少选修四门课程的学生学号查询同姓（假设每个学生姓名的第一个字为姓）的学生名单并统计同姓人数大于2的姓查询每门课程的平均成绩，结果按平均成绩升序排序，平均成
RMAN-08137 rman delete archivelog force jnrjian 数据库 oracle
deleteforcearchiveloguntiltime'trunc(sysdate-4)'backedup1timestodevicetypedisk;SymptomsDatabaseAClonedtoDatabaseBonCloneserver.GoldenGateisConfiguredonSourcedatbaseA.DatabaseBwhichisclonedfromSourcedo
hive表格统计信息不准确 weixin_41956627 hive hive hadoop 数据仓库
问题描述有个hive分区表，orc存储格式，有个分区，查询selectcount(1)fromtablewheredt='yyyyMMdd'结果是0，但查询select*fromtablewheredt='yyyyMMdd'又能查到数据，去hdfs对应目录下查看，也能看到有数据文件解决执行如下sqlANALYZETABLEdb.table1PARTITION(dt='20240908')COMPU
Conda创建环境失败：000和404错误柚柚柚柚柚 conda
一、首先下载Anaconda1.打开网址Indexof/anaconda/archive/|清华大学开源软件镜像站|TsinghuaOpenSourceMirror，滑到最底部，下载Anaconda3-5.3.1-Linux-x86_64.sh。2.使用winscp拖动本地的Anaconda3-5.3.1-Linux-x86_64.sh到服务器的个人工作目录下。二、安装Anaconda软件，创建虚
C#中两个问号的含义 weixin_30363981 测试
stringstrParam=Request.Params["param"]??"";取??左边的值,如果??左边的值为null则取右边的值转载于:https://www.cnblogs.com/shadowtale/archive/2012/10/19/2731152.html
如何下载各个版本的tomcat-比如tomcat9 耳边轻语999 tomcat java
1，找到tomcat官网https://tomcat.apache.org/ApacheTomcat®-Welcome!找到tomcat9，或者archives1.1，找到对应版本1.2，找到小版本1.3，找到bin2，Indexof/dist/tomcat/tomcat-9/v9.0.39/bin2.1，下载对应的解压版本或者安装版本
Percona-toolkit工具详解小一_d28d
1.pt工具安装[root@master~]#yuminstall-ypercona-toolkit-3.1.0-2.el7.x86_64.rpm2.常用工具使用介绍2.1pt-archiver归档表#重要参数--limit100每次取100行数据用pt-archive处理--txn-size100设置100行为一个事务提交一次，--where'id>/root/db/checksum.logpt
Ubuntu更换apt-get的下载源愤愤的有痣青年
将以下内容替换/etc/apt/sources.list中的内容deb-srchttp://archive.ubuntu.com/ubuntuxenialmainrestricted#Addedbysoftware-propertiesdebhttp://mirrors.aliyun.com/ubuntu/xenialmainrestricteddeb-srchttp://mirrors.aliy
apt 下载指定架构的包及离线安装的方法错误重复学习记录 linux
#设置系统架构sudodpkg--add-architectureamd64#安装apt-rdependssudoaptinstallapt-rdepends#创建单独的目录mkdir-p/home/apt/postgresql-client-common#仅下载安装包sudoapt-getinstall--download-onlysudomv/var/cache/apt/archives/*/
游戏运营环节的一些关键转化率 turtle081025 数据分析游戏网络游戏运营
转载于http://www.gamedatas.com/archives/134转化率这个指标在各行各业的数据分析中运用的非常之广泛，例如：电商中就会存在，点击到订单生成的一系列转化率，传统的销售行业也会在做广告的时候考虑该广告能够转化多少订单，而在游戏行业，转化率同样是一个不容忽视的指标。一般来说，游戏运营的过程中主要会关注到这些转化率：1.下载-安装（激活）转化率；2.安装（激活）-注册转化率
Python API操作RocketMQ 京城小筑 #Python编程 python
背景：开发背景:公司相关报表需求需要将订单业务数据同步至RocketMQ中，由于需要保证开发的一致性(多个部门协同开发)，所以采用读取Hive离线数据的方式通过PythonAPI写入RocketMQ中，便于其他开发同事调用~开发环境:本地调试系统MacPython3.7.5rocketmq0.4.4(Python模块)rocketmq-client-python2.0.0(Python模块)服务器
hive搭建 -----内嵌模式和本地模式 lzhlizihang hive hadoop
文章目录一、内嵌模式（使用较少）1、上传、解压、重命名2、配置环境变量3、配置conf下的hive-env.sh4、修改conf下的hive-site.xml5、启动hadoop集群6、给hdfs创建文件夹7、修改hive-site.xml中的非法字符8、初始化元数据9、测试是否成功10、内嵌模式的缺点二、本地模式（最常用）1、检查mysql是否正常2、上传、解压、重命名3、配置环境变量4、修改c
Nginx负载均衡 510888780 nginx 应用服务器
Nginx负载均衡一些基础知识: nginx 的 upstream目前支持 4 种方式的分配 1)、轮询（默认）每个请求按时间顺序逐一分配到不同的后端服务器，如果后端服务器down掉，能自动剔除。 2)、weight 指定轮询几率，weight和访问比率成正比
RedHat 6.4 安装 rabbitmq bylijinnan erlang rabbitmq redhat
在 linux 下安装软件就是折腾，首先是测试机不能上外网要找运维开通，开通后发现测试机的 yum 不能使用于是又要配置 yum 源，最后安装 rabbitmq 时也尝试了两种方法最后才安装成功机器版本： [root@redhat1 rabbitmq]# lsb_release LSB Version: :base-4.0-amd64:base-4.0-noarch:core
FilenameUtils工具类 eksliang FilenameUtils common-io
转载请出自出处：http://eksliang.iteye.com/blog/2217081 一、概述这是一个Java操作文件的常用库，是Apache对java的IO包的封装，这里面有两个非常核心的类FilenameUtils跟FileUtils，其中FilenameUtils是对文件名操作的封装;FileUtils是文件封装，开发中对文件的操作，几乎都可以在这个框架里面找到。非常的好用。
xml文件解析SAX 不懂事的小屁孩 xml
xml文件解析:xml文件解析有四种方式， 1.DOM生成和解析XML文档(SAX是基于事件流的解析) 2.SAX生成和解析XML文档(基于XML文档树结构的解析) 3.DOM4J生成和解析XML文档 4.JDOM生成和解析XML 本文章用第一种方法进行解析，使用android常用的DefaultHandler import org.xml.sax.Attributes;
通过定时任务执行mysql的定期删除和新建分区，此处是按日分区酷的飞上天空 mysql
使用python脚本作为命令脚本，linux的定时任务来每天定时执行 #!/usr/bin/python # -*- coding: utf8 -*- import pymysql import datetime import calendar #要分区的表 table_name = 'my_table' #连接数据库的信息 host,user,passwd,db =
如何搭建数据湖架构？听听专家的意见蓝儿唯美架构
Edo Interactive在几年前遇到一个大问题：公司使用交易数据来帮助零售商和餐馆进行个性化促销，但其数据仓库没有足够时间去处理所有的信用卡和借记卡交易数据 “我们要花费27小时来处理每日的数据量，”Edo主管基础设施和信息系统的高级副总裁Tim Garnto说道：“所以在2013年，我们放弃了现有的基于PostgreSQL的关系型数据库系统，使用了Hadoop集群作为公司的数
spring学习——控制反转与依赖注入 a-john spring
控制反转（Inversion of Control，英文缩写为IoC）是一个重要的面向对象编程的法则来削减计算机程序的耦合问题，也是轻量级的Spring框架的核心。控制反转一般分为两种类型，依赖注入（Dependency Injection，简称DI）和依赖查找（Dependency Lookup）。依赖注入应用比较广泛。
用spool+unixshell生成文本文件的方法 aijuans xshell
例如我们把scott.dept表生成文本文件的语句写成dept.sql,内容如下: 　　set pages 50000; 　　set lines 200; 　　set trims on; 　　set heading off; 　　spool /oracle_backup/log/test/dept.lst; 　　select deptno||','||dname||','||loc
1、基础--名词解析(OOA/OOD/OOP) asia007 学习基础知识
OOA:Object-Oriented Analysis（面向对象分析方法）是在一个系统的开发过程中进行了系统业务调查以后，按照面向对象的思想来分析问题。OOA与结构化分析有较大的区别。OOA所强调的是在系统调查资料的基础上，针对OO方法所需要的素材进行的归类分析和整理，而不是对管理业务现状和方法的分析。　　OOA（面向对象的分析）模型由5个层次（主题层、对象类层、结构层、属性层和服务层）
浅谈java转成json编码格式技术百合不是茶 json编码 java转成json编码
json编码;是一个轻量级的数据存储和传输的语言在java中需要引入json相关的包,引包方式在工程的lib下就可以了 JSON与JAVA数据的转换（JSON 即 JavaScript Object Natation，它是一种轻量级的数据交换格式，非常适合于服务器与 JavaScript 之间的数据的交
web.xml之Spring配置(基于Spring+Struts+Ibatis) bijian1013 java web.xml SSI spring配置
指定Spring配置文件位置 <context-param> <param-name>contextConfigLocation</param-name> <param-value> /WEB-INF/spring-dao-bean.xml,/WEB-INF/spring-resources.xml, /WEB-INF/
Installing SonarQube（Fail to download libraries from server） sunjing Install Sonar
1. Download and unzip the SonarQube distribution 2. Starting the Web Server The default port is "9000" and the context path is "/". These values can be changed in &l
【MongoDB学习笔记十一】Mongo副本集基本的增删查 bit1129 mongodb
一、创建复本集假设mongod,mongo已经配置在系统路径变量上，启动三个命令行窗口，分别执行如下命令： mongod --port 27017 --dbpath data1 --replSet rs0 mongod --port 27018 --dbpath data2 --replSet rs0 mongod --port 27019 -
Anychart图表系列二之执行Flash和HTML5渲染白糖_ Flash
今天介绍Anychart的Flash和HTML5渲染功能 HTML5 Anychart从6.0第一个版本起，已经逐渐开始支持各种图的HTML5渲染效果了，也就是说即使你没有安装Flash插件，只要浏览器支持HTML5，也能看到Anychart的图形（不过这些是需要做一些配置的）。这里要提醒下大家，Anychart6.0版本对HTML5的支持还不算很成熟，目前还处于
Laravel版本更新异常4.2.8-> 4.2.9 Declaration of ... CompilerEngine ... should be compa bozch laravel
昨天在为了把laravel升级到最新的版本，突然之间就出现了如下错误： ErrorException thrown with message "Declaration of Illuminate\View\Engines\CompilerEngine::handleViewException() should be compatible with Illuminate\View\Eng
编程之美-NIM游戏分析-石头总数为奇数时如何保证先动手者必胜 bylijinnan 编程之美
import java.util.Arrays; import java.util.Random; public class Nim { /**编程之美 NIM游戏分析问题：有N块石头和两个玩家A和B，玩家A先将石头随机分成若干堆，然后按照BABA...的顺序不断轮流取石头，能将剩下的石头一次取光的玩家获胜，每次取石头时，每个玩家只能从若干堆石头中任选一堆，
lunce创建索引及简单查询 chengxuyuancsdn 查询创建索引 lunce
import java.io.File; import java.io.IOException; import org.apache.lucene.analysis.Analyzer; import org.apache.lucene.analysis.standard.StandardAnalyzer; import org.apache.lucene.document.Docume
[IT与投资]坚持独立自主的研究核心技术 comsci it
和别人合作开发某项产品....如果互相之间的技术水平不同,那么这种合作很难进行,一般都会成为强者控制弱者的方法和手段..... 所以弱者,在遇到技术难题的时候,最好不要一开始就去寻求强者的帮助,因为在我们这颗星球上,生物都有一种控制其
flashback transaction闪回事务查询 daizj oracle sql 闪回事务
闪回事务查询有别于闪回查询的特点有以下3个：（1）其正常工作不但需要利用撤销数据，还需要事先启用最小补充日志。（2）返回的结果不是以前的“旧”数据，而是能够将当前数据修改为以前的样子的撤销SQL（Undo SQL）语句。（3）集中地在名为flashback_transaction_query表上查询，而不是在各个表上通过“as of”或“vers
Java I/O之FilenameFilter类列举出指定路径下某个扩展名的文件游其是你 FilenameFilter
这是一个FilenameFilter类用法的例子，实现的列举出“c:\\folder“路径下所有以“.jpg”扩展名的文件。 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28
C语言学习五函数，函数的前置声明以及如何在软件开发中合理的设计函数来解决实际问题 dcj3sjt126com c
# include <stdio.h> int f(void) //括号中的void表示该函数不能接受数据，int表示返回的类型为int类型 { return 10; //向主调函数返回10 } void g(void) //函数名前面的void表示该函数没有返回值 { //return 10; //error 与第8行行首的void相矛盾 } in
今天在测试环境使用yum安装，遇到一个问题： Error: Cannot retrieve metalink for repository: epel. Pl dcj3sjt126com centos
今天在测试环境使用yum安装，遇到一个问题： Error: Cannot retrieve metalink for repository: epel. Please verify its path and try again 处理很简单，修改文件“/etc/yum.repos.d/epel.repo”，将baseurl的注释取消， mirrorlist注释掉。即可。 &n
单例模式 shuizhaosi888 单例模式
单例模式懒汉式 public class RunMain { /** * 私有构造 */ private RunMain() { } /** * 内部类，用于占位，只有 */ private static class SingletonRunMain { priv
Spring Security（09）——Filter 234390216 Spring Security
Filter 目录 1.1 Filter顺序 1.2 添加Filter到FilterChain 1.3 DelegatingFilterProxy 1.4 FilterChainProxy 1.5
公司项目NODEJS实践0.1 逐行分析JS源代码 mongodb nginx ubuntu nodejs
一、前言前端如何独立用nodeJs实现一个简单的注册、登录功能，是不是只用nodejs+sql就可以了？其实是可以实现，但离实际应用还有距离，那要怎么做才是实际可用的。网上有很多nod
java.lang.Math liuhaibo_ljf java Math lang
System.out.println(Math.PI); System.out.println(Math.abs(1.2)); System.out.println(Math.abs(1.2)); System.out.println(Math.abs(1)); System.out.println(Math.abs(111111111)); System.out.println(Mat
linux下时间同步 nonobaba ntp
今天在linux下做hbase集群的时候，发现hmaster启动成功了，但是用hbase命令进入shell的时候报了一个错误 PleaseHoldException: Master is initializing，查看了日志，大致意思是说master和slave时间不同步，没办法，只好找一种手动同步一下，后来发现一共部署了10来台机器，手动同步偏差又比较大，所以还是从网上找现成的解决方
ZooKeeper3.4.6的集群部署 roadrunners zookeeper 集群部署
ZooKeeper是Apache的一个开源项目，在分布式服务中应用比较广泛。它主要用来解决分布式应用中经常遇到的一些数据管理问题，如：统一命名服务、状态同步、集群管理、配置文件管理、同步锁、队列等。这里主要讲集群中ZooKeeper的部署。 1、准备工作我们准备3台机器做ZooKeeper集群，分别在3台机器上创建ZooKeeper需要的目录。数据存储目录
Java高效读取大文件 tomcat_oracle java
　　读取文件行的标准方式是在内存中读取，Guava 和Apache Commons IO都提供了如下所示快速读取文件行的方法：　　Files.readLines(new File(path), Charsets.UTF_8); 　　FileUtils.readLines(new File(path)); 　　这种方法带来的问题是文件的所有行都被存放在内存中，当文件足够大时很快就会导致
微信支付api返回的xml转换为Map的方法 xu3508620 xml map 微信api
举例如下： <xml> <return_code><![CDATA[SUCCESS]]></return_code> <return_msg><![CDATA[OK]]></return_msg> <appid><

hive2.0中常用的内置函数大全

目录

数学函数

abs(x)：返回绝对值

greatest(T v1, T v2, …):求最大值

least(T v1, T v2, …)：求最小值

round(DOUBLE a)：四舍五入

round(DOUBLE a, INT d)：指定精度的四舍五入

bround(DOUBLE a)：银行家舍入法

bround(DOUBLE a, INT d)：银行家指定精度的舍入法,保留d位小数

floor(DOUBLE a)：向下取整

ceil(DOUBLE a), ceiling(DOUBLE a)：向上取整

rand(), rand(INT seed)：取随机数

exp(DOUBLE a), exp(DECIMAL a)：自然指数

ln(DOUBLE a), ln(DECIMAL a)：自然数为底的对数

log10(DOUBLE a), log10(DECIMAL a)：以10为底对数

log(DOUBLE base, DOUBLE a),log(DECIMAL base, DECIMAL a)：对数函数

log2(DOUBLE a), log2(DECIMAL a)：以2为底对数函数

pow(DOUBLE a, DOUBLE p), power(DOUBLE a, DOUBLE p):幂运算函数

sqrt(DOUBLE a), sqrt(DECIMAL a):开平方函数

bin(BIGINT a):二进制函数

hex(BIGINT a) hex(STRING a) hex(BINARY a):十六进制函数

unhex(STRING a):反转十六进制函数

conv(BIGINT num, INT from_base, INT to_base), conv(STRING num, INT from_base, INT to_base)：进制转换函数

pmod(INT a, INT b), pmod(DOUBLE a, DOUBLE b):取余函数

sin(DOUBLE a), sin(DECIMAL a):正弦函数

asin(DOUBLE a), asin(DECIMAL a):反正弦函数

cos(DOUBLE a), cos(DECIMAL a):余弦函数

acos(DOUBLE a), acos(DECIMAL a):反余弦函数

tan(DOUBLE a), tan(DECIMAL a):正切函数

atan(DOUBLE a), atan(DECIMAL a):反正切函数

degrees(DOUBLE a), degrees(DECIMAL a):弧度值转换角度值

radians(DOUBLE a), radians(DOUBLE a):角度值转换成弧度值

positive(INT a), positive(DOUBLE a):返回a

negative(INT a), negative(DOUBLE a):返回a的相反数

sign(DOUBLE a), sign(DECIMAL a):判断数值是正数，0或负数

e():数学常数e

pi():数学常数pi

factorial(INT a):求a的阶乘

cbrt(DOUBLE a):求a的立方根

shiftleft(TINYINT|SMALLINT|INT a, INT b),shiftleft(BIGINT a, INT b):按位左移

shiftright(TINYINT|SMALLINT|INT a, INTb),shiftright(BIGINT a, INT b):按拉右移

shiftrightunsigned(TINYINT|SMALLINT|INTa, INT b),shiftrightunsigned(BIGINT a, INT b):无符号按位右移（<<<）

关系运算

等值比较: =

不等值比较: <>

小于比较: <

小于等于比较: <=

大于比较: >

大于等于比较: >=

空值判断: IS NULL

非空判断: IS NOT NULL

LIKE比较: LIKE

JAVA的LIKE操作: RLIKE

REGEXP操作: REGEXP

数学运算：

加法操作: +

减法操作: -

乘法操作:

除法操作: /

取余操作: %

位与操作: &

位或操作: |

位异或操作: ^

位取反操作: ~

逻辑运算：

逻辑与操作: AND

逻辑或操作: OR

逻辑非操作: NOT

类型转换函数

binary(string|binary):将输入的值转换成二进制

cast(expr as ):将expr转换成type类型

日期函数

UNIX时间戳转日期函数: from_unixtime

获取当前UNIX时间戳函数: unix_timestamp

日期转UNIX时间戳函数: unix_timestamp

指定格式日期转UNIX时间戳函数: unix_timestamp

日期时间转日期函数: to_date

日期转年函数: year

日期转月函数: month