神是念着倒

[Hive] 08 - 内建操作符、函数（UDF）

环境

宿主机：Windows 10 64_bit
虚拟机：VMware pro 12
- CentOS 7.5 64_bit（3台：1个master、2个slave）
- Hadoop-2.6.5
- MariaDB-5.5.60
- Hive 1.2.2
ssh工具：SecureCRT 7.3

0、内置运算符（Built-in Operators）

----0.0 关系运算符

----0.1 算术运算符

----0.2 逻辑运算符

----0.3 字符串运算符

----0.4 针对复杂类型的操作符

1、内置函数（Built-in Functions）

----1.0 数学函数

----1.1 集合函数

----1.2 类型转换函数

----1.3 日期函数

----1.4 条件函数

----1.5 字符串函数

----1.6 数据屏蔽函数

----1.7 Misc. 函数

----|----1.7.0 xpath

----|----1.7.1 get_json_object

2、内置聚合函数（UDAF，Built-in Aggregate Functions）

3、内置表生成函数（UDTF，Built-in Table-Generating Functions）

----3.0 使用示例

----3.1 explode

----3.2 posexplode

----3.3 json_tuple

----3.4 parse_url_tuple

4、其他

----

正文

Case-insensitive，不区分大小写。所有的Hive关键字都是不区分大小写的，也包括Hive的操作符和函数的名称。

在Beeline或CLI中，使用使用下方的命令去显示最近的文档：

show functions;

describe function functionName;

describe function extended functionName;

当UDF嵌套在UDF或函数中时，对于表达式缓存会有bug：

当hive.cache.expr.evaluation=true时，（默认为true），假如一个UDF嵌套在另一个UDF或一个Hive函数中，这个UDF会给出不正确的结果。这个bug影响了0.12.0、0.13.0、0.13.1版本，不过在0.14.0修复了；
这个问题跟getDisplayString方法的UDF实现有关。

0、内置运算符

0.0 关系运算符

下方的操作符将会比较传递过来的操作数、并生成一个true或false值。

操作符	操作数类型	描述
`a=b`	所有的基本类型	假如表达式a等于表达式b，则为`true`；否则`false`
`a==b`	所有的基本类型	`=`操作符的同义词
`a<=>b`	所有的基本类型	对于非空操作数（`no-null`），返回跟`=`操作符相同的结果，但是假如两个都是`null`则返回`true`，假如它们中其中一个是`null`则返回`false`。`Hive 0.9.0`版本
`a<>b`	所有的基本类型	假如a或b是`null`，则为`null`；假如表达式a不等于表达式b，那么则是`true`，否则为`false`。
`a!=b`	所有的基本类型	`<>`操作符的同义词
`a`	所有的基本类型	若a或b是`null`，则为`null`；若表达式a小于表达式b，则为`true`；否则为`false`。
`a<=b`	所有的基本类型	若a或b是`null`，则为`null`；若表达式a小于等于表达式b，则为`true`；否则为`false`。
`a>b`	所有的基本类型	若a或b是`null`，则为`null`；若表达式a大于表达式b，则为`true`；否则为`false`。
`a>=b`	所有的基本类型	若a或b是`null`，则为`null`；若表达式a大于等于表达式b，则为`true`；否则为`false`。可以通过`not`关键字来反转。`Hive 0.9.0`版本
`a [not] between b and c`	所有的基本类型	假如`a`、`b`、或`c`是`null`，则为`null`；若`a`大于等于`b`且小于等于`c`，则为`true`；否则为`false`。`Hive 0.9.0`版本
`a is null`	所有类型	若表达式a计算结果为`null`，则为`true`；否则为`false`。
`a is not null`	所有类型	若表达式a计算结果为`null`，则为`false`；否则为`true`。
`a is [not] (true\|false)`	布尔类型	仅当满足条件时，则为`true`。`Hive 3.0.0+`版本注意：`null`是`unknown`，都会是`false`。
`a [not] like b`	字符串	假如a或b是`null`，则为`null`；假如字符串a跟SQL简单的正则表达式b匹配的话，则为`true`；否则为`false`。比较是按字符进行的。b中的`_`可以匹配a中的任何字符；而b中的`%`可以匹配a中任意个字符。例如：`foobar`跟`foo`计算结果为`false`；而`foobar`跟`foo_ _ _`计算结果为`true`；`foobar`像`foo%`。
`a rlike b`	字符串	假如a或b是`null`，则为`null`；假如a的任何子串（可能是空）匹配Java正则表达式b，则为`true`；否则为`false`。例如：`foobar` rlike `foo`将结算为`true`，而且`foobar` rlike `^f.*r$`
`a regexp b`	字符串	跟rlike一样

0.1 算术运算符

下方操作符支持对操作数的各种常见算术运算。所有都会返回数字类型；假如任何操作数都是null，那么结果也是null。

运算符	操作数类型	描述
`a+b`	所有的数字类型	得到a加上b的结果。结果的类型跟操作数的公共父级是相同的。
`a-b`	所有的数字类型	得到a减b的结果。
`a*b`	所有的数字类型	得到a乘b的结果。
`a/b`	所有的数字类型	得到a除以b的结果。
`a div b`	整数类型	取整。例如：`17 div 3`结果为`5`
`a % b`	所有的数字类型	取余
`a & b`	所有的数字类型	按位取与
`a \| b`	所有的数字类型	按位取或
`a ^ b`	所有的数字类型	按位取异或
`~a`	所有的数字类型	按位取反

0.2 逻辑运算符

下方运算符支持创建逻辑表达式。它们所有都返回true、false、或null，这取决于操作数的布尔值。null表示一个unknown标志，所以假如结果取决于unknown标志，那么结果本身就是unknown。

操作符	操作数类型	描述
`a and b`	布尔类型	假如a和b都是`true`，那么结果为`true`，否则为`false`。假如a或b是`null`，则结果是`null`。
`a or b`	布尔类型	假如a或b、或a和b都是`true`，那么结果为`true`；`false`或`null`则为`null`，否则为`false`。
`not a`	布尔类型	假如a是`false` 或`null`，则结果为`true`；否则为`false`。
`!a`	布尔类型	和`not a`一样
`a in (val1, val2, ...)`	布尔类型	假如a等于其中任一个值，则为`true`。`Hive 0.13+`
`a not in (val1, val2, ...)`	布尔类型	假如a不等于其中任一个值，则为`true`。`Hive 0.13+`
`[not] exists (subquery)`		假如子查询至少返回一行，则为`true`。`Hive 0.13+`

0.3 字符串操作符

操作符	操作数类型	描述
`a \|\| b`	字符串	连接操作数（`concat(a ,b)`的简写）`Hive 2.2.0+`

0.4 针对复杂类型的操作符

复杂类型构造函数

构造函数	操作数	描述
`map`	`(key1, value1, key2, value2, ...)`	根据给定的键值对创建一个map。
`struct`	`(val1, val2, va3, ...)`	根据给定的字段值创建一个struct。字段名将是`col1`，`col2`，…
`named_struct`	`(name1, val1, name2, val2, ...)`	根据给定的字段名称和值创建一个struct。`Hive 0.8.0+`
`array`	`(val1, val2, ...)`	根据给定的元素创建一个array。
`create_union`	`(tag, val1, val2, ...)`	根据tag参数指向的值创建一个union类型

下方操作符提供了访问复杂类型中元素的机制：

操作符	操作数类型	描述
`a[n]`	a是一个array类型，n是一个int类型	返回数组A中的第n个元素。第一个元素索引是0。
`m[key]`	m是一个`map`，key有k类型	返回map中key对的值。
`s.x`	s是一个struct类型	返回s的x字段。

1、内置函数

1.0 数学函数

Hive支持下方内置数学函数；当参数为null时，大部分会返回null。

返回类型	名称	描述
`double`	`round(double a)`	返回对a四舍五入的bigint值
`double`	`round(double a, int d)`	返回a的四舍五入、并精确到d位的值
`double`	`bround(double a)`	返回a使用了`half_even`舍入法模式的bigint值。`Hive 1.3.0+`和`2.0.0+`。也称为高斯或银行家舍入法。例如：`bround(2.5)=2`、`bround(3.5)=4`
`double`	`round(double a, int d)`	指定精度为d位的银行家舍入法`Hive 1.3.0+`和`2.0.0+`。例如：`bround(8.25, 1)=8.2`、`bround(8.35, 1)=8.4`
`bigint`	`floor(double a)`	向下取整，返回等于或小于a的最大整数
`bigint`	`ceil(double a)`、`ceiling(double a)`	向上取整，返回大于或等于a的最小整数
`double`	`rand()`、`rand(int seed)`	返回一个0到1内的随机数。如果指定种子seed，则会取得一个稳定的随机数序列
`double`	`exp(double a)`、`exp(decimal a)`	自然指数，返回自然对数e的a次方。decimal是在`Hive 0.13.0`引入
`double`	`in(double a)`、`in(decimal a)`	返回以自然数为底的对数，a可以是小数，decimal是在`Hive 0.13.0`引入
`double`	`log10(double a)`、`log10(decimal a)`	返回以10为底的a的对数，decimal是在`Hive 0.13.0`引入
`double`	`log2(double a)`、`log2(decimal a)`	返回以2为底的a的对数，decimal是在`Hive 0.13.0`引入
`double`	`log(double base, double a)`、`log(decimal base, decimal a)`	返回以base为底的a的对数，decimal是在`Hive 0.13.0`引入
`double`	`pow(double a, double p)`、`power(double a, double p)`	返回a的p次幂
`double`	`sqrt(double a)`、 `sqrt(decimal a)`	返回a的平方根，decimal是在`Hive 0.13.0`引入
`string`	`bin(bigint a)`	返回a的二进制码表示
`string`	`hex(bigint a)`、`hex(string a)`、`hex(binary a)`	十六进制函数。如果变量是int类型，那么返回a的十六进制表示；如果变量是string类型，则返回该字符串的十六进制表示，等等。binary是在`Hive 0.12.0`引入
`binary`	`unhex(string a)`	反转十六进制函数。返回该十六进制字符串所代码的字符串。binary是在`Hive 0.12.0`引入
`string`	`conv(bigint num, int from_base, int to_base)`、`conv(string num, int from_base, int to_base)`	进制转换函数，将数值num从from_base进制转化到to_base进制
`double`	`abs(double a)`	绝对值函数，返回a的绝对值
`int or double`	`pmod(int a, int b)`、`pmod(double a, double b)`	取余函数，返回正的a除以b的余数
`double`	`sin(double a)`、`sin(decimal a)`	正弦函数，返回a的正弦值，decimal是在`Hive 0.13.0`引入
`double`	`asin(double a)`、`asin(decimal a)`	反正弦函数，返回a的反正弦值，decimal是在`Hive 0.13.0`引入
`double`	`cos(double a)`、`cos(decimal a)`	余弦函数，返回a的余弦值，decimal是在`Hive 0.13.0`引入
`double`	`acos(double a)`、`acos(decimal a)`	反余弦函数，返回a的反余弦值，decimal是在`Hive 0.13.0`引入
`double`	`tan(double a)`、`tan(decimal a)`	正切函数，返回a的正切值，decimal是在`Hive 0.13.0`引入
`double`	`atan(double a)`、`atan(decimal a)`	反正切函数，返回a的反正切值，decimal是在`Hive 0.13.0`引入
`double`	`degrees(double a)`、`degrees(decimal a)`	弧度值转换角度值函数，返回弧度a的角度值，decimal是在`Hive 0.13.0`引入
`double`	`radians(double a)`、`radians(decimal a)`	角度值转换成弧度值函数，返回角度a的弧度值，decimal是在`Hive 0.13.0`引入
`int or double`	`positive(int a)`、`positive(double a)`	返回a
`int or double`	`negative(int a)`、`negative(double a)`	返回a的相反数
`int or double`	`sign(int a)`、`sign(double a)`	判断数值是正数，0或负数。如果a是正数则返回1.0，是负数则返回-1.0，否则返回0.0。decimal是在`Hive 0.13.0`引入
`double`	`e()`	返回数学常数e
`double`	`pi()`	返回数学常数pi
`bigint`	`factorial(int a)`	返回a的阶乘，a的有效值为0-20。`Hive 1.2.0+`
`double`	`cbrt(double a)`	返回a的立方根。`Hive 1.2.0+`
`int or bigint`	`shiftleft(tinyint\|smallint\|int a, int b)`、`shiftleft(bigint a, int b)`	返回a按位左移b位。`Hive 1.2.0+`
`int or bigint`	`shifright(tinyint\|smallint\|int a, int b)`、`shiftright(bigint a, int b)`	回a按位右移b位。`Hive 1.2.0+`
`int or bigint`	`shiftrightunsigned(tinyint\|smallint\|int a, int b)`、`shiftrightunsigned(bigint a, int b)`	无符号按位右移（<<<），返回a按位右移b位。`Hive 1.2.0+`
`T`	`greatest(T v1, T v2, ...)`	返回值列表的最大值。`Hive 1.1.0+`
`T`	`least(T v1, T v2, ...)`	返回值列表的最小值。`Hive 1.1.0+`
`int`	`width_bucket(numeric expr, numeric min_value, numeric max_value, INT num_buckets)`	`Hive 3.0.0+`

1.1 集合函数

返回类型	名称	描述
`int`	`size(Map)`	返回map的元素数量
`int`	`size(Array)`	返回array的元素数量
`array`	`map_keys(Map)`	返回一个包含输入map的key的无序map
`array`	`map_values(Map)`	返回一个包含输入map的value的无序map
`boolean`	`array_contains(Array, value)`	假如array包含value则返回true
`array`	`sort_array(Array)`	按照array元素的自然顺序对输入array按升序排序并返回。`Hive 0.9.0+`

实例：

hive> select 11 % 2;
OK
1
Time taken: 1.364 seconds, Fetched: 1 row(s)
hive> select ceil(28.0/6.999999999999999999999);
OK
4
Time taken: 0.136 seconds, Fetched: 1 row(s)
hive> select round(6.8 % 2, 2);
OK
0.8
Time taken: 0.17 seconds, Fetched: 1 row(s)

1.2 类型转换函数

返回类型	名称	描述
`binary`	`binary(string\|binary)`	将参数强制转换为二进制
type	`cast(expr as )`	将表达式expr的结果转换为type类型。例如：`cast('1' as BIGINT)`，将把字符串`1`转换为整数1。假如转换失败，则返回`null`。对于一个非空字符串，`cast(expr as boolean)`将返回`true`。

1.3 日期函数

返回类型	名称	描述
`string`	`from_unixtime(bigint unixtime[,string format])`	UNIX时间戳转日期函数`from_unixtime`。即转化UNIX时间戳（从`1970-01-01 00:00:00 UTC`到指定时间的秒数）到当前时区的时间格式
`bigint`	`unix_timestamp()`	获取当前UNIX时间戳函数`unix_timestamp`。即获得当前时区的UNIX时间戳
`bigint`	`unix_timestamp(string date)`	日期转UNIX时间戳函数`unix_timestamp`。转换格式为`"yyyy-MM-dd HH:mm:ss"`的日期到UNIX时间戳。如果转化失败，则返回0。
`bigint`	`unix_timestamp(string date, string pattern)`	指定格式日期转UNIX时间戳函数`unix_timestamp`。转换pattern格式的日期到UNIX时间戳。如果转化失败，则返回0。
`Hive 2.1.0`之前是：`string`；`2.1.0`之后是：`date`	`to_date(string timestamp)`	日期时间转日期函数`to_date`。返回日期时间字段中的日期部分。
`int`	`year(string date)`	日期转年函数`year`。返回日期中的年。
`int`	`quarter(date/timestamp/string)`	`Hive 1.3.0+`。返回日期、时间戳或字符串在1到4范围内的一个季度
`int`	`month(string date)`	日期转月函数`month`。返回日期中的月份。
`int`	`day(string date) dayofmonth(date)`	日期转天函数`day`。返回日期中的天
`int`	`hour(string date)`	日期转小时函数`hour`。返回日期中的小时
`int`	`minute(string date)`	日期转分钟函数`minute`。返回日期中的分钟
`int`	`second(string date)`	日期转秒函数`second`。返回日期中的秒
`int`	`weekofyear(string date)`	日期转周函数`weekofyear`。返回日期在当前的周数
`int`	`extract(field from source)`	`Hive 2.2.0+`。从源检索像天、小时等字段。源必须是一个日期、时间戳、或者可以转换为日期或时间戳的间隔或字符串。支持的字段包括：日、日、时、分、月、季度、秒、周、年。
`int`	`datediff(string enddate, string startdate)`	日期比较函数`datediff`。返回结束日期减去开始日期的天数
`Hive 2.1.0`之前是：`string`；`2.1.0`之后是：`date`	`date_add(date/timestamp/string startdate, tinyint/smallint/int days)`	日期增加函数`date_add`。返回开始日期startdate增加days天后的日期
`Hive 2.1.0`之前是：`string`；`2.1.0`之后是：`date`	`date_sub(date/timestamp/string startdate, tinyint/smallint/int days)`	日期减少函数`date_sub`。返回开始日期startdate减少days天后的日期
`timestamp`	`from_utc_timestamp({any primitive type} ts, string timezone)`	`Hive 0.8.0+`。将UTC中的时间戳转换为给定时区
`timestamp`	`to_utc_timestamp({any primitive type} ts, string timezone)`	`Hive 0.8.0+`。将给定时区中的时间戳转换为UTC
`date`	`current_date`	`Hive 1.2.0+`。返回查询计算开始时的当前日期
`timestamp`	`current_timestamp`	`Hive 1.2.0+`。返回查询计算开始时的当前时间戳
`string`	`add_months(string start_date, int num_months, output_date_format)`	按指定格式返回指定日期增加几个月后的日期
`string`	`last_day(string date)`	返回月份中的最后一天
`string`	`next_day(string start_date, string day_of_week)`	返回指定日期下周的指定周几
`string`	`trunc(string date, string format)`	返回日期date月份的第一天/年中的第一天日期
`double`	`months_between(date1, date2)`	返回date1到date2之间的月数
`string`	`date_format(date/timestamp/string ts, string fmt)`	返回指定日期格式

1.4 条件函数

返回类型	名称	描述
`T`	`if(boolean testCondition, T valueTrue, T valueFalseOrNull)`	当testCondition为`true`时，返回valueTrue；否则返回`alueFalseOrNull`
`T`	``
`boolean`	`isnull( a )`	假如a是`null`，则返回`true`；否则`false`
`boolean`	`isnotnull ( a )`	假如a是`null`，则返回`false`；否则`true`
`T`	`nvl(T value, T default_value)`	假如value是`null`，则返回默认值；否则返回value。`HIve 0.11+`
`T`	`coalesce(T v1, T v2, ...)`	非`null`则返回第一个v；假如所有v是`null`则返回`null`
`T`	`case a when b then c [when d then e]* [else f] end`	当a=b，则返回c；当a=d，则返回e；其他返回f
`T`	`case when a then b [when c then d]* [else e] end`	当a=true，则返回b；当c=true，则返回d；其他返回e
`T`	`nullif( a, b )`	假如a=b，则返回null；其他返回a。`Hive 2.3.0+`
`void`	`assert_true(boolean condition)`	假如condition不为`true`，则抛出异常，否则返回null。`Hive 0.8.0+`

实例：

hive (test)> select from_unixtime(unix_timestamp(), 'yyyyMMdd');
OK
20190619

1.5 字符串函数

返回类型	名称	描述
`int`	`ascii(string str)`	返回字符串str第一个字符的ascii码
`string`	`base64(binary bin)`	将参数从二进制转换为base64字符串
`int`	`character_length(string str)`	`Hive 2.2.0+`。返回str中包含的utf-8字符数。`char_length`是这个函数的简写
`string`	`chr(bigint\|double A)`	返回等价于a的二进制的ascii码字符。`Hive 1.3.0+`、`Hive 2.1.0+`
`string`	`concat(string\|binary A, string\|binary B...)`	返回输入字符串连接后的结果，支持任意个输入字符串
`string`	`concat_ws(string SEP, array)`
`string`	`concat_ws(string SEP, string A, string B...)`	返回输入字符串连接后的结果，SEP表示各个字符串间的分隔符
`array>`	`context_ngrams(array>, array, int K, int pf)`
`string`	`decode(binary bin, string charset)`	`Hive 0.12.0+`。使用提供的字符集（`'US-ASCII', 'ISO-8859-1', 'UTF-8', 'UTF-16BE', 'UTF-16LE', 'UTF-16'`）将第一个参数解码为一个字符串。假如参数为`null`，那么结果也是`null`。
`binary`	`encode(string src, string charset)`	`Hive 0.12.0+`。使用提供的字符集（`'US-ASCII', 'ISO-8859-1', 'UTF-8', 'UTF-16BE', 'UTF-16LE', 'UTF-16'`）将第一个参数编码为一个二进制
`string`	`elt(N int,str1 string,str2 string,str3 string,...)`	返回指定索引号的字符串。例如：`elt(2,'hello','world')`返回`world`。假如N小于1或大于索引号数字，则返回`null`
`int`	`field(val T,val1 T,val2 T,val3 T,...)`	返回val的索引。若找不到则返回0。
`int`	`find_in_set(string str, string strList)`	返回str在strlist第一次出现的位置，strlist是用逗号分割的字符串。如果没有找该str字符，则返回0
`string`	`format_number(number x, int d)`	将数值X转换成"#,###,###.##"格式字符串，并保留d位小数，如果d为0，将进行四舍五入且不保留小数
`string`	`get_json_object(string json_string, string path)`	解析json的字符串json_string，返回path指定的内容。如果输入的json字符串无效，那么返回NULL。
`boolean`	`in_file(string str, string filename)`	假如str以整行出现在文件中，则返回`true`。
`string`	`initcap(string A)`	`Hive 1.1.0+`。返回字符串，每个单词的第一个字母为大写，所有其他字母为小写。单词由空格分隔。
`int`	`instr(string str, string substr)`	查找字符串str中子字符串substr出现的位置，如果查找失败将返回0，如果任一参数为Null将返回null，注意位置为从1开始的
`int`	`length(string A)`	返回字符串A的长度
`int`	`locate(string substr, string str[, int pos])`	查找字符串str中子字符串substr出现的位置，如果查找失败将返回0，如果任一参数为Null将返回null，注意位置为从1开始的
`string`	`lower(string A) lcase(string A)`	返回字符串A的小写格式
`string`	`lpad(string str, int len, string pad)`	将str进行用pad进行左补足到len位
`string`	`ltrim(string A)`	去除字符串左边的空格
`array>`	`ngrams(array>, int N, int K, int pf)`
`int`	`octet_length(string str)`
`string`	`parse_url(string urlString, string partToExtract [, string keyToExtract])`	URL解析函数，返回URL中指定的部分。partToExtract的有效值为：HOST, PATH, QUERY, REF, PROTOCOL, AUTHORITY, FILE, and USERINFO
`string`	`printf(String format, Obj... args)`
`string`	`quote(String text)`
`string`	`regexp_extract(string subject, string pattern, int index)`	正则表达式解析函数，将字符串subject按照pattern正则表达式的规则拆分，返回index指定的字符
`string`	`regexp_replace(string INITIAL_STRING, string PATTERN, string REPLACEMENT)`	正则表达式替换函数，将字符串A中的符合java正则表达式B的部分替换为C。注意，在有些情况下要使用转义字符,类似oracle中的regexp_replace函数。
`string`	`repeat(string str, int n)`	返回重复n次后的str字符串
`string`	`replace(string A, string OLD, string NEW)`
`string`	`reverse(string A)`	返回字符串A的反转结果
`string`	`rpad(string str, int len, string pad)`	将str进行用pad进行右补足到len位
`string`	`rtrim(string A)`	去除字符串右边的空格
`array>`	`sentences(string str, string lang, string locale)`
`string`	`soundex(string A)`
`array`	`space(int n)`	返回长度为n的空字符串
`array`	`split(string str, string pat)`	按照pat字符串分割str，会返回分割后的字符串数组
`map`	`str_to_map(text[, delimiter1, delimiter2])`
`string`	`substr(string\|binary A, int start) substring(string\|binary A, int start)`	返回字符串A从start位置到结尾的字符串
`string`	`substr(string\|binary A, int start, int len) substring(string\|binary A, int start, int len)`	返回字符串A从start位置开始，长度为len的字符串
`string`	`substring_index(string A, string delim, int count)`
`string`	`translate(string\|char\|varchar input, string\|char\|varchar from, string\|char\|varchar to)`
`string`	`trim(string A)`	去除字符串两边的空格
`binary`	`unbase64(string str)`
`string`	`upper(string A) ucase(string A)`	返回字符串A的大写格式

实例：

hive (test)> select elt(2,'hello','world');
OK
world
Time taken: 0.134 seconds, Fetched: 1 row(s)
hive (test)> select elt(3,'hello','world');
OK
NULL

1.6 数据屏蔽函数

返回类型	名称	描述
`string`	`mask(string str[, string upper[, string lower[, string number]]])`	`Hive 2.1.0+`。返回str的屏蔽版本。默认情况下，大写字母转换为`X`，小写字母转换为`x`，数字转换为`n`。例如：`mask("abcd-EFGH-8765-4321")`将返回`xxxx-XXXX-nnnn-nnnn`
`string`	`mask_first_n(string str[, int n])`	`Hive 2.1.0+`。返回前n个值被屏蔽的str的屏蔽版本
`string`	`mask_last_n(string str[, int n])`	`Hive 2.1.0+`。返回最后n个值被屏蔽的str的屏蔽版本
`string`	`mask_show_first_n(string str[, int n])`	`Hive 2.1.0+`。返回str的屏蔽版本，显示未屏蔽的前n个字符
`string`	`mask_show_last_n(string str[, int n])`	`Hive 2.1.0+`。返回str的屏蔽版本，显示未屏蔽的最后n个字符
`string`	`mask_hash(string\|char\|varchar str)`	`Hive 2.1.0+`。返回基于str的哈希值

1.7 Misc. 函数

返回类型	名称	描述
`varies`	`java_method(class, method[, arg1[, arg2..]])`	`reflect`的同义词。`Hive 0.9.0+`
`varies`	`reflect(class, method[, arg1[, arg2..]])`	通过使用反射匹配参数签名来调用Java方法。`Hive 0.7.0+`
`int`	`hash(a1[, a2...])`	返回参数的哈希值。`Hive 0.4+`
`string`	`current_user()`	从配置的验证管理器返回当前用户名。`Hive 1.2.0+`
`string`	`logged_in_user()`	从会话状态返回当前用户名 `Hive 2.2.0+`
`string`	`current_database()`	返回当前数据库名称。`Hive 0.13.0+`
`string`	`md5(string/binary)`	计算字符串或二进制文件的MD5 128位校验和。`Hive 1.3.0`
`string`	`sha1(string/binary)、sha(string/binary)`	计算字符串或二进制的SHA-1摘要，并将值作为十六进制字符串返回。`Hive 1.3.0+`
`bigint`	`crc32(string/binary)`	为字符串或二进制参数计算循环冗余校验值并返回bigint值。`Hive 1.3.0+`
`string`	`sha2(string/binary, int)`	计算SHA-2散列函数族 (SHA-224, SHA-256, SHA-384, and SHA-512)。`Hive 1.3.0+`
`binary`	`aes_encrypt(input string/binary, key string/binary)`	使用AES加密输入。`Hive 1.3.0+`
`binary`	`aes_decrypt(input binary, key string/binary)`	使用AES解密输入。`Hive 1.3.0+`
`string`	`version()`	返回Hive的版本。`Hive 2.1.0+`
`bigint`	`surrogate_key([write_id_bits, task_id_bits])`	在表中输入数据时自动为行生成数字ID。只能用作ACID的默认值或只插入表。

1.7.0 xpath

下方函数都描述在LanguageManual XPathUDF：
xpath, xpath_short, xpath_int, xpath_long, xpath_float, xpath_double, xpath_number, xpath_string

1.7.1 get_json_object

支持限制版本的JSONPath：

$ root对象
. 子操作符
[] array的下标运算符
* []的通配符

不支持的语法：

零长度的字符串作为key
.. 递归下降
@当前对象/元素
()脚本表达式
?()过滤（脚本）表达式
[,] 联合运算符
[start:end.step]array切片操作符

实例：src_json表是一个单列、单行的表

{"store":
  {"fruit":\[{"weight":8,"type":"apple"},{"weight":9,"type":"pear"}],
   "bicycle":{"price":19.95,"color":"red"}
  },
 "email":"amy@only_for_json_udf_test.net",
 "owner":"amy"
}

使用下方的查询，可提取json对象中的字段：

hive> SELECT get_json_object(src_json.json, '$.owner') FROM src_json;
amy
 
hive> SELECT get_json_object(src_json.json, '$.store.fruit\[0]') FROM src_json;
{"weight":8,"type":"apple"}
 
hive> SELECT get_json_object(src_json.json, '$.non_exist_key') FROM src_json;
NULL

2、内置聚合函数

返回类型	名称	描述
`bigint`	`count(*)`，`count(expr)`， `count(DISTINCT expr[, expr...])`	个数统计函数。`count(*)`计检索出的行的个数，包括NULL值的行。`count(expr)`返回指定字段的非空值的个数。`count(DISTINCT expr[, expr...])`返回指定字段的不同的非空值的个数
`double`	`sum(col)`，`sum(DISTINCT col)`	`sum(col)`统计结果集中col的相加的结果；`sum(DISTINCT col)`统计结果中col不同值相加的结果
`double`	`avg(col)`，`avg(distinct col)`	`avg(col)`统计结果集中col的平均值；`avg(distinct col)`统计结果中col不同值相加的平均值
`double`	`min(col)`	统计结果集中col字段的最小值
`double`	`max(col)`	统计结果集中col字段的最大值
`double`	`variance(col)`，`var_pop(col)`	非空集合总体变量函数，统计结果集中col非空集合的总体变量（忽略null）
`double`	`var_samp(col)`	非空集合样本变量函数，统计结果集中col非空集合的样本变量（忽略null）
`double`	`stddev_pop(col)`	该函数计算总体标准偏离，并返回总体变量的平方根，其返回值与`var_pop()`函数的平方根相同
`double`	`stddev_samp(col)`	该函数计算样本标准偏离
`double`	`covar_pop(col1, col2)`	返回组中一对数值列的总体协方差
`double`	`covar_samp(col1, col2)`	返回组中一对数值列的样本协方差
`double`	`corr(col1, col2)`	返回组中一对数值列的Pearson相关系数
`double`	`percentile(bigint col, p)`	中位数函数，求准确的第pth个百分位数，p必须介于0和1之间，但是col字段目前只支持整数，不支持浮点数类型
`array`	`percentile(bigint col, array(p1 [, p2]...))`	中位数函数，功能和上述类似，之后后面可以输入多个百分位数，返回类型也为array，其中为对应的百分位数。
`double`	`percentile_approx(double col, p [, B])`	近似中位数函数，求近似的第pth个百分位数，p必须介于0和1之间，返回类型为double，但是col字段支持浮点类型。参数B控制内存消耗的近似精度，B越大，结果的准确度越高。默认为10,000。当col字段中的distinct值的个数小于B时，结果为准确的百分位数
`array`	`percentile_approx(double col, array(p1 [, p2]...) [, B])`	功能和上述类似，之后后面可以输入多个百分位数，返回类型也为array，其中为对应的百分位数。
`double`	`regr_avgx(independent, dependent)`	`Hive 2.2.0`，相当于`avg(dependent)`
`double`	`regr_avgy(independent, dependent)`	`Hive 2.2.0`，相当于`avg(dependent)`
`double`	`regr_count(independent, dependent)`	`Hive 2.2.0`，返回用于适合线性回归线的non-null对的数目
`double`	`regr_intercept(independent, dependent)`	`Hive 2.2.0`，返回线性回归线的y-intercept。例如：b的值依赖于`= a*`，而不依赖于`+ b`
`double`	`regr_r2(independent, dependent)`	`Hive 2.2.0`，返回回归的确定系数
`double`	`regr_slope(independent, dependent)`	`Hive 2.2.0`，返回线性回归线的坡度
`double`	`regr_sxx(independent, dependent)`	`Hive 2.2.0`，相当于`regr_count(independent, dependent) * var_pop(dependent)`
`double`	`regr_sxy(independent, dependent)`	`Hive 2.2.0`，相当于`regr_count(independent, dependent) * covar_pop(independent, dependent)`
`double`	`regr_syy(independent, dependent)`	`Hive 2.2.0`，相当于`regr_count(independent, dependent) * var_pop(independent)`
`array`	`histogram_numeric(col, b)`	以b为基准计算col的直方图信息
`array`	`collect_set(col)`	返回一组消除了重复元素的对象
`array`	`collect_list(col)`	返回具有重复项的对象列表。`Hive 0.13.0+`
`integer`	`ntile(integer x)`	将一个有序分区划分为x组，称为bucket，并为分区中的每一行分配一个bucket编号。`Hive 0.11.0+`

3、内置表生成函数

普通的用户定义函数（UDF），如concat()，接受一个输入行并输出一个输出行。相反，表生成函数将单个输入行转换为多个输出行。

row-set columns types	名称	描述
`T`	`explode(ARRAY a)`	数组转成多行函数
`T_key,T_value`	`explode(MAP m)`	map中每个key-value对，生成一行，key为一列，value为一列
`int,T`	`posexplode(ARRAY a)`	使用int类型的附加位置列将数组分解为多行
`T1,...,Tn`	`inline(ARRAY> a)`	将结构数组分解为多行
`T1,...,Tn/r`	`stack(int r,T1 V1,...,Tn/r Vn)`	将n个值v1，…，vn分解为r行
`string1,...,stringn`	`json_tuple(string jsonStr,string k1,...,string kn)`	获取JSON字符串和一组n个键，并返回一个n值的元组。
`string 1,...,stringn`	`parse_url_tuple(string urlStr,string p1,...,string pn)`	获取url字符串和一组n个url部分，并返回n个值的元组。

实例1：explode (array)

hive (test)> select explode(array('A','B','C'));
OK
A
B
C
Time taken: 0.37 seconds, Fetched: 3 row(s)
hive (test)> select explode(array('A','B','C')) as col;
OK
A
B
C
Time taken: 0.115 seconds, Fetched: 3 row(s)
hive (test)> select tf.* from (select 0) t lateral view explode(array('A','B','C')) tf;
OK
A
B
C
Time taken: 3.067 seconds, Fetched: 3 row(s)
hive (test)> select tf.* from (select 0) t lateral view explode(array('A','B','C')) tf as col;
OK
A
B
C
Time taken: 0.106 seconds, Fetched: 3 row(s)

实例2：explode (map)

hive (test)> select explode(map('A',10,'B',20,'C',30));
OK
A       10
B       20
C       30
Time taken: 0.153 seconds, Fetched: 3 row(s)
hive (test)> select explode(map('A',10,'B',20,'C',30)) as (key,value);
OK
A       10
B       20
C       30
Time taken: 0.108 seconds, Fetched: 3 row(s)
hive (test)> select tf.* from (select 0) t lateral view explode(map('A',10,'B',20,'C',30)) tf;
OK
A       10
B       20
C       30
Time taken: 0.529 seconds, Fetched: 3 row(s)
hive (test)> select tf.* from (select 0) t lateral view explode(map('A',10,'B',20,'C',30)) tf as key,value;
OK
A       10
B       20
C       30
Time taken: 0.237 seconds, Fetched: 3 row(s)

实例3：posexplode (array)

select posexplode(array('A','B','C'));
select posexplode(array('A','B','C')) as (pos,val);
select tf.* from (select 0) t lateral view posexplode(array('A','B','C')) tf;
select tf.* from (select 0) t lateral view posexplode(array('A','B','C')) tf as pos,val;

实例4：inline (array of structs)

select inline(array(struct('A',10,date '2015-01-01'),struct('B',20,date '2016-02-02')));
select inline(array(struct('A',10,date '2015-01-01'),struct('B',20,date '2016-02-02'))) as (col1,col2,col3);
select tf.* from (select 0) t lateral view inline(array(struct('A',10,date '2015-01-01'),struct('B',20,date '2016-02-02'))) tf;
select tf.* from (select 0) t lateral view inline(array(struct('A',10,date '2015-01-01'),struct('B',20,date '2016-02-02'))) tf as col1,col2,col3;

实例5：stack (values)

select stack(2,'A',10,date '2015-01-01','B',20,date '2016-01-01');
select stack(2,'A',10,date '2015-01-01','B',20,date '2016-01-01') as (col0,col1,col2);
select tf.* from (select 0) t lateral view stack(2,'A',10,date '2015-01-01','B',20,date '2016-01-01') tf;
select tf.* from (select 0) t lateral view stack(2,'A',10,date '2015-01-01','B',20,date '2016-01-01') tf as col0,col1,col2;

使用SELECT udtf(col) AS colAlias...语法有一些限制：

select不允许使用其他表达式，如：SELECT pageid, explode(adid_list) AS myCol是不支持的
UDTF不能嵌套，如：SELECT explode(explode(adid_list)) AS myCol不支持
GROUP BY / CLUSTER BY / DISTRIBUTE BY / SORT BY是不支持的，比如：SELECT explode(adid_list) AS myCol ... GROUP BY myCol是不支持的。

4、其他

参考

参考LanguageManual UDF-Hive Operators and User-Defined Functions (UDFs)

你可能感兴趣的:(Hive,操作符,函数,Hive,聚合函数,表生成函数)

C语言宏函数南林yan C语言 c语言
一、什么是宏函数？通过宏定义的函数是宏函数。如下，编译器在预处理阶段会将Add(x,y)替换为((x)*(y))#defineAdd(x,y)((x)*(y))#defineAdd(x,y)((x)*(y))intmain(){inta=10;intb=20;intd=10;intc=Add(a+d,b)*2;cout<
C语言如何定义宏函数？小九格物 c语言
在C语言中，宏函数是通过预处理器定义的，它在编译之前替换代码中的宏调用。宏函数可以模拟函数的行为，但它们不是真正的函数，因为它们在编译时不会进行类型检查，也不会分配存储空间。宏函数的定义通常使用#define指令，后面跟着宏的名称和参数列表，以及宏展开后的代码。宏函数的定义方式：1.基本宏函数：这是最简单的宏函数形式，它直接定义一个表达式。#defineSQUARE(x)((x)*(x))2.带参
c++ 的iostream 和 c++的stdio的区别和联系黄卷青灯77 c++算法开发语言 iostream stdio
在C++中，iostream和C语言的stdio.h都是用于处理输入输出的库，但它们在设计、用法和功能上有许多不同。以下是两者的区别和联系：区别1.编程风格iostream（C++风格）：C++标准库中的输入输出流类库，支持面向对象的输入输出操作。典型用法是cin（输入）和cout（输出），使用>操作符来处理数据。更加类型安全，支持用户自定义类型的输入输出。#includeintmain(){in
《大清方方案》| 第二话谁佐清欢
和珅究竟说了些什么？竟能令堂堂九五之尊龙颜失色！此处暂且按下不表；单说这位乾隆皇帝，果真不愧是康熙从小带过的，一旦决定了要做的事，便杀伐决断毫不含糊。他当即亲自拟旨，着令和珅为钦差大臣，全权负责处理方方事件，并钦赐尚方宝剑，遇急则三品以下官员可先斩后奏。和珅身负皇上重托，岂敢有半点怠慢，当夜即率领相关人等，马不停蹄杀奔江汉。这一路上，和珅的几位幕僚一直在商讨方方事件的处置方案。有位年轻幕僚建议快刀
【一起学Rust | 设计模式】习惯语法——使用借用类型作为参数、格式化拼接字符串、构造函数广龙宇一起学Rust #Rust设计模式 rust 设计模式开发语言
提示：文章写完后，目录可以自动生成，如何生成可参考右边的帮助文档文章目录前言一、使用借用类型作为参数二、格式化拼接字符串三、使用构造函数总结前言Rust不是传统的面向对象编程语言，它的所有特性，使其独一无二。因此，学习特定于Rust的设计模式是必要的。本系列文章为作者学习《Rust设计模式》的学习笔记以及自己的见解。因此，本系列文章的结构也与此书的结构相同（后续可能会调成结构），基本上分为三个部分
每日一题——第八十四题互联网打工人no1 C语言程序设计每日一练 c语言
题目：编写函数1、输入10个职工的姓名和职工号2、按照职工由大到小顺序排列，姓名顺序也随之调整3、要求输入一个职工号，用折半查找法找出该职工的姓名#define_CRT_SECURE_NO_WARNINGS#include#include#defineMAX_EMPLOYEES10typedefstruct{intid;charname[50];}Empolyee;voidinputEmploye
Python教程：一文了解使用Python处理XPath 旦莫 Python进阶 python 开发语言
目录1.环境准备1.1安装lxml1.2验证安装2.XPath基础2.1什么是XPath？2.2XPath语法2.3示例XML文档3.使用lxml解析XML3.1解析XML文档3.2查看解析结果4.XPath查询4.1基本路径查询4.2使用属性查询4.3查询多个节点5.XPath的高级用法5.1使用逻辑运算符5.2使用函数6.实战案例6.1从网页抓取数据6.1.1安装Requests库6.1.2代
LLM 词汇表落难Coder LLMs NLP 大语言模型大模型 llama 人工智能
Contextwindow“上下文窗口”是指语言模型在生成新文本时能够回溯和参考的文本量。这不同于语言模型训练时所使用的大量数据集，而是代表了模型的“工作记忆”。较大的上下文窗口可以让模型理解和响应更复杂和更长的提示，而较小的上下文窗口可能会限制模型处理较长提示或在长时间对话中保持连贯性的能力。Fine-tuning微调是使用额外的数据进一步训练预训练语言模型的过程。这使得模型开始表示和模仿微调数
郎朗大婚娶公主：所有光环的背后，都是十年如一日的自律简小尘
近日，关于郎朗大婚的新闻上了热搜，看了新娘的照片，既有天使般的面容，更有魔鬼般的身材，关键是人家还身世好，又有才华，这真的是让所有男人羡慕嫉妒恨哪。有些人不禁会想，“凭什么郎朗的人生就象开挂了一样，可我却每天都活得这么狼狈！”其实，每个开挂的人生背后，都是苦行僧般的自律。01欲戴王冠，必承其重。练琴不能只靠兴趣，更需要自律！我们先来看一下朗朗在小时候的作息时间表：早晨5:45起床，练琴1小时。中午
SQL Server_查询某一数据库中的所有表的内容 qq_42772833 SQL Server 数据库 sqlserver
1.查看所有表的表名要列出CrabFarmDB数据库中的所有表（名），可以使用以下SQL语句：USECrabFarmDB;--切换到目标数据库GOSELECTTABLE_NAMEFROMINFORMATION_SCHEMA.TABLESWHERETABLE_TYPE='BASETABLE';对这段SQL脚本的解释：SELECTTABLE_NAME：这个语句的作用是从查询结果中选择TABLE_NAM
python是什么意思中文-在python中%是什么意思编程大乐趣
Python中%有两种：1、数值运算：%代表取模，返回除法的余数。如：>>>7%212、%操作符（字符串格式化，stringformatting），说明如下：%[(name)][flags][width].[precision]typecode(name)为命名flags可以有+，-，''或0。+表示右对齐。-表示左对齐。''为一个空格，表示在正数的左侧填充一个空格，从而与负数对齐。0表示使用0填
Day17笔记-高阶函数 ~在杰难逃~ Python 笔记 python 开发语言 pycharm 数据分析
高阶函数【重点掌握】函数的本质：函数是一个变量，函数名是一个变量名，一个函数可以作为另一个函数的参数或返回值使用如果A函数作为B函数的参数，B函数调用完成之后，会得到一个结果，则B函数被称为高阶函数常用的高阶函数：map(),reduce(),filter(),sorted()1.map()map(func,iterable)，返回值是一个iterator【容器，迭代器】func:函数iterab
Python快速入门 —— 第三节：类与对象孤华暗香 Python快速入门 python 开发语言
第三节：类与对象目标：了解面向对象编程的基础概念，并学会如何定义类和创建对象。内容：类与对象：定义类：class关键字。类的构造函数：__init__()。类的属性和方法。对象的创建与使用。示例：classStudent:def__init__(self,name,age,major):self.name&#
数据仓库——维度表一致性墨染丶eye 背诵数据仓库
数据仓库基础笔记思维导图已经整理完毕，完整连接为：数据仓库基础知识笔记思维导图维度一致性问题从逻辑层面来看，当一系列星型模型共享一组公共维度时，所涉及的维度称为一致性维度。当维度表存在不一致时，短期的成功难以弥补长期的错误。维度时确保不同过程中信息集成起来实现横向钻取货活动的关键。造成横向钻取失败的原因维度结构的差别，因为维度的差别，分析工作涉及的领域从简单到复杂，但是都是通过复杂的报表来弥补设计
Python爬虫解析工具之xpath使用详解 eqa11 python 爬虫开发语言
文章目录Python爬虫解析工具之xpath使用详解一、引言二、环境准备1、插件安装2、依赖库安装三、xpath语法详解1、路径表达式2、通配符3、谓语4、常用函数四、xpath在Python代码中的使用1、文档树的创建2、使用xpath表达式3、获取元素内容和属性五、总结Python爬虫解析工具之xpath使用详解一、引言在Python爬虫开发中，数据提取是一个至关重要的环节。xpath作为一门
Redis系列：Geo 类型赋能亿级地图位置计算 Ly768768 redis bootstrap 数据库
1前言我们在篇深刻理解高性能Redis的本质的时候就介绍过Redis的几种基本数据结构，它是基于不同业务场景而设计的：动态字符串(REDIS_STRING)：整数(REDIS_ENCODING_INT)、字符串(REDIS_ENCODING_RAW)双端列表(REDIS_ENCODING_LINKEDLIST)压缩列表(REDIS_ENCODING_ZIPLIST)跳跃表(REDIS_ENCODI
ARM驱动学习之基础小知识 JT灬新一 ARM 嵌入式 arm开发学习
ARM驱动学习之基础小知识•sch原理图工程师工作内容–方案–元器件选型–采购（能不能买到，价格）–原理图（涉及到稳定性）•layout画板工程师–layout（封装、布局，布线，log）（涉及到稳定性）–焊接的一部分工作（调试阶段板子的焊接）•驱动工程师–驱动，原理图，layout三部分的交集容易发生矛盾•PCB研发流程介绍–方案，原理图(网表)–layout工程师（gerber文件）–PCB板
ARM驱动学习之5 LEDS驱动 JT灬新一嵌入式 C 底层 arm开发学习单片机
ARM驱动学习之5LEDS驱动知识点：•linuxGPIO申请函数和赋值函数–gpio_request–gpio_set_value•三星平台配置GPIO函数–s3c_gpio_cfgpin•GPIO配置输出模式的宏变量–S3C_GPIO_OUTPUT注意点：DRIVER_NAME和DEVICE_NAME匹配。实现步骤：1.加入需要的头文件：//Linux平台的gpio头文件#include//三
【PG】常见数据库、表属性设置江无羡数据库
PG的常见属性配置方法数据库复制、备份相关表的复制标识单表操作批量表操作链接数据库复制、备份相关表的复制标识单表操作通过ALTER语句单独更改一张表的复制标识。ALTERTABLE[tablename]REPLICAIDENTITYFULL;批量表操作通过代码块的方式，对某个schema中的所有表一起更新其复制标识。SELECTtablename,CASErelreplidentWHEN'd'TH
Rust基础知识 GRKF15 rust 开发语言后端
1.Rust语言简介1.1基础语法变量声明：let关键字用于声明变量，可以指定或不指定类型，如leta=10;和letmutc=30i32;。函数定义：使用fn关键字定义函数，并指定参数类型及返回类型，如fnadd(i:i32,j:i32)->i32{i+j}。控制流：包括if、else等，控制语句后需要使用;来结束语句。1.2数据类型整数类型：i8、i16、i32、i64、i128，以及无符号的
nosql数据库技术与应用知识点皆过客，揽星河 NoSQL nosql 数据库大数据数据分析数据结构非关系型数据库
Nosql知识回顾大数据处理流程数据采集(flume、爬虫、传感器)数据存储(本门课程NoSQL所处的阶段)Hdfs、MongoDB、HBase等数据清洗(入仓)Hive等数据处理、分析(Spark、Flink等)数据可视化数据挖掘、机器学习应用(Python、SparkMLlib等)大数据时代存储的挑战(三高)高并发(同一时间很多人访问)高扩展(要求随时根据需求扩展存储)高效率(要求读写速度快)
数据结构之哈希表 X同学的开始数据结构数据结构散列表
哈希表(散列表)出现的原因在顺序表中查找时，需要从表头开始，依次遍历比较a[i]与key的值是否相等，直到相等才返回索引i；在有序表中查找时，我们经常使用的是二分查找，通过比较key与a[i]的大小来折半查找，直到相等时才返回索引i。最终通过索引找到我们要找的元素。但是，这两种方法的效率都依赖于查找中比较的次数。我们有一种想法，能不能不经过比较，而是直接通过关键字key一次得到所要的结果呢？这时，
一比一复刻手表哪里可以买到？推荐三个可靠渠道腕表世界
在我国，提及一比一复刻手表，人们总是充满好奇与争议。这种高度仿真的复刻手表，凭借其精湛的工艺、时尚的设计，以及与正品相差无几的质感，深受一部分消费者的喜爱。但与此同时，其背后的侵权争议也一直不断。那么，究竟哪里可以买到这些令人心动的一比一复刻手表呢？腕表咨询微信：10428850一、何为一比一复刻手表？一比一复刻手表，指的是严格按照正版手表的设计、尺寸和工艺制作的仿制品。这些手表在材质、外观、功能
insert into select 主键自增_mybatis拦截器实现主键自动生成 weixin_39521651 insert into select 主键自增 mybatis delete返回值 mybatis insert返回主键 mybatis insert返回对象 mybatis plus insert返回主键 mybatis plus 插入生成id
前言前阵子和朋友聊天，他说他们项目有个需求，要实现主键自动生成，不想每次新增的时候，都手动设置主键。于是我就问他，那你们数据库表设置主键自动递增不就得了。他的回答是他们项目目前的id都是采用雪花算法来生成，因此为了项目稳定性，不会切换id的生成方式。朋友问我有没有什么实现思路，他们公司的orm框架是mybatis，我就建议他说，不然让你老大把mybatis切换成mybatis-plus。mybat
STM32中的计时与延时 lupinjia STM32 stm32 单片机
前言在裸机开发中，延时作为一种规定循环周期的方式经常被使用，其中尤以HAL库官方提供的HAL_Delay为甚。刚入门的小白可能会觉得既然有官方提供的延时函数，而且精度也还挺好，为什么不用呢？实际上HAL_Delay中有不少坑，而这些也只是HAL库中无数坑的其中一些。想从坑里跳出来还是得加强外设原理的学习和理解，切不可只依赖HAL库。除了延时之外，我们在开发中有时也会想要确定某段程序的耗时，这就需要
python多线程程序设计之一 IT_Beijing_BIT #Python 程序设计语言 python
python多线程程序设计之一全局解释器锁线程APIsthreading.active_count()threading.current_thread()threading.excepthook(args,/)threading.get_native_id()threading.main_thread()threading.stack_size([size])线程对象成员函数构造器start/ru
4.C_数据结构_队列荣世蓥数据结构数据结构
概述什么是队列：队列是限定在两端进行插入操作和删除操作的线性表。具有先入先出(FIFO)的特点相关名词：队尾：写入数据的一段队头：读取数据的一段空队：队列中没有数据，队头指针=队尾指针满队：队列中存满了数据，队尾指针+1=队头指针循环队列1、基本内容循环队列是以数组形式构成的队列数据结构。循环队列的结构体如下：typedefintdata_t;//队列数据类型#defineN64//队列容量typ
Java爬虫框架（一）--架构设计狼图腾-狼之传说 java 框架 java 任务 html解析器存储电子商务
一、架构图那里搜网络爬虫框架主要针对电子商务网站进行数据爬取，分析，存储，索引。爬虫：爬虫负责爬取，解析，处理电子商务网站的网页的内容数据库：存储商品信息索引：商品的全文搜索索引Task队列：需要爬取的网页列表Visited表：已经爬取过的网页列表爬虫监控平台：web平台可以启动，停止爬虫，管理爬虫，task队列，visited表。二、爬虫1.流程1)Scheduler启动爬虫器，TaskMast
Android应用性能优化轻口味 Android
Android手机由于其本身的后台机制和硬件特点，性能上一直被诟病，所以软件开发者对软件本身的性能优化就显得尤为重要；本文将对Android开发过程中性能优化的各个方面做一个回顾与总结。Cache优化ListView缓存：ListView中有一个回收器，Item滑出界面的时候View会回收到这里，需要显示新的Item的时候，就尽量重用回收器里面的View；每次在getView函数中inflate新
C++ lambda闭包消除类成员变量 barbyQAQ c++c++java 算法
原文链接：https://blog.csdn.net/qq_51470638/article/details/142151502一、背景在面向对象编程时，常常要添加类成员变量。然而类成员一旦多了之后，也会带来干扰。拿到一个类，一看成员变量好几十个，就问你怕不怕？二、解决思路可以借助函数式编程思想，来消除一些不必要的类成员变量。三、实例举个例子：classClassA{public:...intfu
书其实只有三类西蜀石兰类
一个人一辈子其实只读三种书，知识类、技能类、修心类。知识类的书可以让我们活得更明白。类似十万个为什么这种书籍，我一直不太乐意去读，因为单纯的知识是没法做事的，就像知道地球转速是多少一样（我肯定不知道），这种所谓的知识，除非用到，普通人掌握了完全是一种负担，维基百科能找到的东西，为什么去记忆？知识类的书，每个方面都涉及些，让自己显得不那么没文化，仅此而已。社会认为的学识渊博，肯定不是站在
《TCP/IP 详解，卷1：协议》学习笔记、吐槽及其他 bylijinnan tcp
《TCP/IP 详解，卷1：协议》是经典，但不适合初学者。它更像是一本字典，适合学过网络的人温习和查阅一些记不清的概念。这本书，我看的版本是机械工业出版社、范建华等译的。这本书在我看来，翻译得一般，甚至有明显的错误。如果英文熟练，看原版更好： http://pcvr.nl/tcpip/ 下面是我的一些笔记，包括我看书时有疑问的地方，也有对该书的吐槽，有不对的地方请指正： 1.
Linux—— 静态IP跟动态IP设置 eksliang linux IP
一.在终端输入 vi /etc/sysconfig/network-scripts/ifcfg-eth0 静态ip模板如下： DEVICE="eth0" #网卡名称 BOOTPROTO="static" #静态IP（必须） HWADDR="00:0C:29:B5:65:CA" #网卡mac地址 IPV6INIT=&q
Informatica update strategy transformation 18289753290
更新策略组件：标记你的数据进入target里面做什么操作，一般会和lookup配合使用，有时候用0,1,1代表 forward rejected rows被选中，rejected row是输出在错误文件里，不想看到reject输出，将错误输出到文件，因为有时候数据库原因导致某些column不能update，reject就会output到错误文件里面供查看，在workflow的
使用Scrapy时出现虽然队列里有很多Request但是却不下载，造成假死状态酷的飞上天空 request
现象就是：程序运行一段时间，可能是几十分钟或者几个小时，然后后台日志里面就不出现下载页面的信息，一直显示上一分钟抓取了0个网页的信息。刚开始已经猜到是某些下载线程没有正常执行回调方法引起程序一直以为线程还未下载完成，但是水平有限研究源码未果。经过不停的google终于发现一个有价值的信息，是给twisted提出的一个bugfix 连接地址如下http://twistedmatrix.
利用预测分析技术来进行辅助医疗蓝儿唯美医疗
2014年，克利夫兰诊所（Cleveland Clinic）想要更有效地控制其手术中心做膝关节置换手术的费用。整个系统每年大约进行2600例此类手术，所以，即使降低很少一部分成本，都可以为诊所和病人节约大量的资金。为了找到适合的解决方案，供应商将视野投向了预测分析技术和工具，但其分析团队还必须花时间向医生解释基于数据的治疗方案意味着什么。克利夫兰诊所负责企业信息管理和分析的医疗
java 线程(一)：基础篇 DavidIsOK java 多线程线程
&nbs
Tomcat服务器框架之Servlet开发分析 aijuans servlet
最近使用Tomcat做web服务器，使用Servlet技术做开发时，对Tomcat的框架的简易分析：疑问：为什么我们在继承HttpServlet类之后，覆盖doGet(HttpServletRequest req, HttpServetResponse rep)方法后，该方法会自动被Tomcat服务器调用，doGet方法的参数有谁传递过来？怎样传递？分析之我见： doGet方法的
揭秘玖富的粉丝营销之谜与小米粉丝社区类似 aoyouzi 揭秘玖富的粉丝营销之谜
玖富旗下悟空理财凭借着一个微信公众号上线当天成交量即破百万，第七天成交量单日破了1000万;第23天时，累计成交量超1个亿……至今成立不到10个月，粉丝已经超过500万，月交易额突破10亿，而玖富平台目前的总用户数也已经超过了1800万，位居P2P平台第一位。很多互联网金融创业者慕名前来学习效仿，但是却鲜有成功者，玖富的粉丝营销对外至今仍然是个谜。　　近日，一直坚持微信粉丝营销
Java web的会话跟踪技术百合不是茶 url会话 Cookie会话 Seession会话 Java Web 隐藏域会话
会话跟踪主要是用在用户页面点击不同的页面时,需要用到的技术点会话:多次请求与响应的过程 1,url地址传递参数,实现页面跟踪技术格式:传一个参数的 url?名=值传两个参数的 url?名=值 &名=值关键代码
web.xml之Servlet配置 bijian1013 java web.xml Servlet配置
定义： <servlet> <servlet-name>myservlet</servlet-name> <servlet-class>com.myapp.controller.MyFirstServlet</servlet-class> <init-param> <param-name>
利用svnsync实现SVN同步备份 sunjing SVN 同步 E000022 svnsync 镜像
1. 在备份SVN服务器上建立版本库 svnadmin create test 2. 创建pre-revprop-change文件 cd test/hooks/ cp pre-revprop-change.tmpl pre-revprop-change 3. 修改pre-revprop-
【分布式数据一致性三】MongoDB读写一致性 bit1129 mongodb
本系列文章结合MongoDB，探讨分布式数据库的数据一致性，这个系列文章包括：数据一致性概述与CAP 最终一致性(Eventually Consistency) 网络分裂(Network Partition)问题多数据中心(Multi Data Center) 多个写者(Multi Writer)最终一致性一致性图表(Consistency Chart) 数据
Anychart图表组件-Flash图转IMG普通图的方法白糖_ Flash
问题背景：项目使用的是Anychart图表组件，渲染出来的图是Flash的，往往一个页面有时候会有多个flash图，而需求是让我们做一个打印预览和打印功能，让多个Flash图在一个页面上打印出来。那么我们打印预览的思路是获取页面的body元素，然后在打印预览界面通过$("body").append(html)的形式显示预览效果，结果让人大跌眼镜：Flash是
Window 80端口被占用 WHY? bozch 端口占用 window
平时在启动一些可能使用80端口软件的时候，会提示80端口已经被其他软件占用，那一般又会有那些软件占用这些端口呢？下面坐下总结： 1、web服务器是最经常见的占用80端口的，例如：tomcat , apache , IIS , Php等等； 2
编程之美-数组的最大值和最小值-分治法（两种形式） bylijinnan 编程之美
import java.util.Arrays; public class MinMaxInArray { /** * 编程之美数组的最大值和最小值分治法 * 两种形式 */ public static void main(String[] args) { int[] t={11,23,34,4,6,7,8,1,2,23}; int[]
Perl正则表达式 chenbowen00 正则表达式 perl
首先我们应该知道 Perl 程序中，正则表达式有三种存在形式，他们分别是：匹配：m/<regexp>;/ （还可以简写为 /<regexp>;/ ，略去 m）替换：s/<pattern>;/<replacement>;/ 转化：tr/<pattern>;/<replacemnt>;
[宇宙与天文]行星议会是否具有本行星大气层以外的权力呢? comsci
举个例子: 地球,地球上由200多个国家选举出一个代表地球联合体的议会,那么现在地球联合体遇到一个问题,地球这颗星球上面的矿产资源快要采掘完了....那么地球议会全体投票,一致通过一项带有法律性质的议案,既批准地球上的国家用各种技术手段在地球以外开采矿产资源和其它资源........ &
Oracle Profile 使用详解 daizj oracle profile 资源限制
Oracle Profile 使用详解转一、目的： Oracle系统中的profile可以用来对用户所能使用的数据库资源进行限制，使用Create Profile命令创建一个Profile，用它来实现对数据库资源的限制使用，如果把该profile分配给用户，则该用户所能使用的数据库资源都在该profile的限制之内。二、条件：创建profile必须要有CREATE PROFIL
How HipChat Stores And Indexes Billions Of Messages Using ElasticSearch & Redis dengkane elasticsearch Lucene
This article is from an interview with Zuhaib Siddique, a production engineer at HipChat, makers of group chat and IM for teams. HipChat started in an unusual space, one you might not
循环小示例，菲波拉契序列，循环解一元二次方程以及switch示例程序 dcj3sjt126com c 算法
# include <stdio.h> int main(void) { int n; int i; int f1, f2, f3; f1 = 1; f2 = 1; printf("请输入您需要求的想的序列："); scanf("%d", &n); for (i=3; i<n; i
macbook的lamp环境 dcj3sjt126com lamp
sudo vim /etc/apache2/httpd.conf /Library/WebServer/Documents 是默认的网站根目录重启Mac上的Apache服务这个命令很早以前就查过了，但是每次使用的时候还是要在网上查：停止服务：sudo /usr/sbin/apachectl stop 开启服务：s
java ArrayList源码下 shuizhaosi888 ArrayList源码
版本 jdk-7u71-windows-x64 JavaSE7 ArrayList源码上：http://flyouwith.iteye.com/blog/2166890 /** * 从这个列表中移除所有c中包含元素 */ public boolean removeAll(Collection<?> c) {
Spring Security（08）——intercept-url配置 234390216 Spring Security intercept-url 访问权限访问协议请求方法
intercept-url配置目录 1.1 指定拦截的url 1.2 指定访问权限 1.3 指定访问协议 1.4 指定请求方法 1.1 &n
Linux环境下的oracle安装 jayung oracle
linux系统下的oracle安装本文档是Linux(redhat6.x、centos6.x、redhat7.x) 64位操作系统安装Oracle 11g(Oracle Database 11g Enterprise Edition Release 11.2.0.4.0 - 64bit Production)，本文基于各种网络资料精心整理而成，共享给有需要的朋友。如有问题可联系：QQ：52-7
hotspot虚拟机 leichenlei java HotSpot jvm 虚拟机文档
JVM参数 http://docs.oracle.com/javase/6/docs/technotes/guides/vm/index.html JVM工具 http://docs.oracle.com/javase/6/docs/technotes/tools/index.html JVM垃圾回收 http://www.oracle.com
读《Node.js项目实践：构建可扩展的Web应用》 ——引编程慢慢变成系统化的“砌砖活” noaighost Web node.js
读《Node.js项目实践：构建可扩展的Web应用》 ——引编程慢慢变成系统化的“砌砖活” 眼里的Node.JS 初初接触node是一年前的事，那时候年少不更事。还在纠结什么语言可以编写出牛逼的程序，想必每个码农都会经历这个月经性的问题：微信用什么语言写的？facebook为什么推荐系统这么智能，用什么语言写的？dota2的外挂这么牛逼，用什么语言写的？……用什么语言写这句话，困扰人也是阻碍
快速开发Android应用 rensanning android
Android应用开发过程中，经常会遇到很多常见的类似问题，解决这些问题需要花时间，其实很多问题已经有了成熟的解决方案，比如很多第三方的开源lib，参考 Android Libraries 和 Android UI/UX Libraries。编码越少，Bug越少，效率自然会高。但可能由于根本没听说过、听说过但没用过、特殊原因不能用、自己已经有了解决方案等等原因，这些成熟的解决
理解Java中的弱引用 tomcat_oracle java 工作面试
　不久之前，我面试了一些求职Java高级开发工程师的应聘者。我常常会面试他们说，“你能给我介绍一些Java中得弱引用吗？”，如果面试者这样说，“嗯，是不是垃圾回收有关的？”，我就会基本满意了，我并不期待回答是一篇诘究本末的论文描述。　　然而事与愿违，我很吃惊的发现，在将近20多个有着平均5年开发经验和高学历背景的应聘者中，居然只有两个人知道弱引用的存在，但是在这两个人之中只有一个人真正了
标签输出html标签" target="_blank">关于标签输出html标签 xshdch jsp
http://back-888888.iteye.com/blog/1181202 关于<c:out value=""/>标签的使用，其中有一个属性是escapeXml默认是true(将html标签当做转移字符，直接显示不在浏览器上面进行解析)，当设置escapeXml属性值为false的时候就是不过滤xml，这样就能在浏览器上解析html标签， &nb