后季暖

hive函数大全、常用函数（超全！！！）

一、关系运算：

1. 等值比较: =

2. 不等值比较: <>

3. 小于比较: <

4. 小于等于比较:

5. 大于比较: >

6. 大于等于比较: >=

7. 空值判断: IS NULL

8. 非空判断: IS NOT NULL

9. LIKE 比较: LIKE

10. JAVA 的 LIKE 操作: RLIKE

11. REGEXP 操作: REGEXP

二、数学运算：

1. 加法操作: +

2. 减法操作: -

3. 乘法操作: *

4. 除法操作: /

5. 取余操作: %

6. 位与操作: &

7. 位或操作: |

8. 位异或操作: ^

9．位取反操作: ~

三、逻辑运算：

1. 逻辑与操作: AND

2. 逻辑或操作: OR

3. 逻辑非操作: NOT

四、数值计算

1. 取整函数: round

2. 指定精度取整函数: round

3. 向下取整函数: floor

4. 向上取整函数: ceil

5. 向上取整函数: ceiling

6. 取随机数函数: rand

7. 自然指数函数: exp

8. 以 10 为底对数函数: log10

9. 以 2 为底对数函数: log2

10. 对数函数: log

11. 幂运算函数: pow

12. 幂运算函数: power

13. 开平方函数: sqrt

14. 二进制函数: bin

15. 十六进制函数: hex

16. 反转十六进制函数: unhex

17. 进制转换函数: conv

18. 绝对值函数: abs

19. 正取余函数: pmod

20. 正弦函数: sin

21. 反正弦函数: asin

22. 余弦函数: cos

23. 反余弦函数: acos

24. positive 函数: positive

25. negative 函数: negative

五、日期函数

1. UNIX 时间戳转日期函数: from_unixtime

2. 获取当前 UNIX 时间戳函数: unix_timestamp

3. 日期转 UNIX 时间戳函数: unix_timestamp

4. 指定格式日期转 UNIX 时间戳函数: unix_timestamp

5. 日期时间转日期函数: to_date

6. 日期转年函数: year

7. 日期转月函数: month

8. 日期转天函数: day

9. 日期转小时函数: hour

10. 日期转分钟函数: minute

11. 日期转秒函数: second

12. 日期转周函数: weekofyear

13. 日期比较函数: datediff

14. 日期增加函数: date_add

15. 日期减少函数: date_sub

16.字符串解析成日期函数：date_format

六、条件函数

1. If 函数: if

2. 非空查找函数: COALESCE

3. 条件判断函数：CASE

4. 条件判断函数：CASE

七、字符串函数

1. 字符串长度函数：length

2. 字符串反转函数：reverse

3. 字符串连接函数：concat

4. 带分隔符字符串连接函数：concat_ws

5. 字符串截取函数：substr,substring

6. 字符串截取函数：substr,substring

7. 字符串转大写函数：upper,ucase

8. 字符串转小写函数：lower,lcase

9. 去空格函数：trim

10. 左边去空格函数：ltrim

11. 右边去空格函数：rtrim

12. 正则表达式替换函数：regexp_replace

13. 正则表达式解析函数：regexp_extract

14. URL 解析函数：parse_url

15. json 解析函数：get_json_object

16. 空格字符串函数：space

17. 重复字符串函数：repeat

18. 首字符 ascii 函数：ascii

19. 左补足函数：lpad

20. 右补足函数：rpad

21. 分割字符串函数: split

22. 集合查找函数: find_in_set

八、集合统计函数

1. 个数统计函数: count

2. 总和统计函数: sum

3. 平均值统计函数: avg

4. 最小值统计函数: min

5. 最大值统计函数: max

6. 非空集合总体变量函数: var_pop

7. 非空集合样本变量函数: var_samp

8. 总体标准偏离函数: stddev_pop

9. 样本标准偏离函数: stddev_samp

10．中位数函数: percentile

11. 中位数函数: percentile

12. 近似中位数函数: percentile_approx

13. 近似中位数函数: percentile_approx

14. 直方图: histogram_numeric

九、复合类型构建操作

1. Map 类型构建: map

2. Struct 类型构建: struct

3. array 类型构建: array

十、复杂类型访问操作

1. array 类型访问: A[n]

2. map 类型访问: M[key]

3. struct 类型访问: S.x

十一、复杂类型长度统计函数

1. Map 类型长度函数: size(Map)

2. array 类型长度函数: size(Array)

3. 类型转换函数

一、关系运算：

1. 等值比较: =

语法：A=B 操作类型：所有基本类型描述: 如果表达式 A 与表达式 B 相等，则为 TRUE；否则为 FALSE 举例： hive> select 1 from lxw_dual where 1=1; 1

2. 不等值比较: <>

语法: A <> B

操作类型: 所有基本类型

描述: 如果表达式 A 为 NULL，或者表达式 B 为 NULL，返回 NULL；如果表达式 A 与表达式 B 不相等，则为 TRUE；否则为 FALSE

举例： hive> select 1 from lxw_dual where 1 <> 2;

3. 小于比较: <

语法: A < B

操作类型: 所有基本类型

描述: 如果表达式 A 为 NULL，或者表达式 B 为 NULL，返回 NULL；如果表达式 A 小于表达式 B，则为 TRUE；否则为 FALSE

举例： hive> select 1 from lxw_dual where 1 < 2; 1

4. 小于等于比较:

语法: A

操作类型: 所有基本类型

描述: 如果表达式 A 为 NULL，或者表达式 B 为 NULL，返回 NULL；如果表达式 A 小于或者等于表达式 B，则为 TRUE；否则为 FALSE

举例： hive> select 1 from lxw_dual where 1

5. 大于比较: >

语法: A > B

操作类型: 所有基本类型

描述: 如果表达式 A 为 NULL，或者表达式 B 为 NULL，返回 NULL；如果表达式 A 大于表达式 B，则为 TRUE；否则为 FALSE

举例： hive> select 1 from lxw_dual where 2 > 1; 1

6. 大于等于比较: >=

语法: A >= B

操作类型: 所有基本类型

描述: 如果表达式 A 为 NULL，或者表达式 B 为 NULL，返回 NULL；如果表达式 A 大于或者等于表达式 B，则为 TRUE；否则为 FALSE

举例： hive> select 1 from lxw_dual where 1 >= 1; 1

注意：String 的比较要注意(常用的时间比较可以先 to_date 之后再比较)

hive> select * from lxw_dual; OK 2011111209 00:00:00 2011111209 hive> select a,b,ab,a=b from lxw_dual; 2011111209 00:00:00 2011111209 false true false

7. 空值判断: IS NULL

语法: A IS NULL

操作类型: 所有类型

描述: 如果表达式 A 的值为 NULL，则为 TRUE；否则为 FALSE

举例： hive> select 1 from lxw_dual where null is null; 1

8. 非空判断: IS NOT NULL

语法: A IS NOT NULL

操作类型: 所有类型

描述: 如果表达式 A 的值为 NULL，则为 FALSE；否则为 TRUE

举例： hive> select 1 from lxw_dual where 1 is not null; 1

9. LIKE 比较: LIKE

语法: A LIKE B

操作类型: strings

描述: 如果字符串 A 或者字符串 B 为 NULL，则返回 NULL；如果字符串 A 符合表达式 B

的正则语法，则为 TRUE；否则为 FALSE。B 中字符”_”表示任意单个字符，而字符”%”表示任意数量的字符。

举例： hive> select 1 from lxw_dual where 'football' like 'foot%'; 1 hive> select 1 from lxw_dual where 'football' like 'foot____'; 1

注意：否定比较时候用 NOT A LIKE B

hive> select 1 from lxw_dual where NOT 'football' like 'fff%'; 1

10. JAVA 的 LIKE 操作: RLIKE

语法: A RLIKE B

操作类型: strings

描述: 如果字符串 A 或者字符串 B 为 NULL，则返回 NULL；如果字符串 A 符合 JAVA 正则表达式 B 的正则语法，则为 TRUE；否则为 FALSE。

举例： hive> select 1 from lxw_dual where 'footbar’ rlike '^f.*r$’; 1

注意：判断一个字符串是否全为数字：

hive>select 1 from lxw_dual where '123456' rlike '^\\d+$'; 1 hive> select 1 from lxw_dual where '123456aa' rlike '^\\d+$';

11. REGEXP 操作: REGEXP

语法: A REGEXP B

操作类型: strings

描述: 功能与 RLIKE 相同

举例： hive> select 1 from lxw_dual where 'footbar' REGEXP '^f.*r$'; 1

二、数学运算：

1. 加法操作: +

语法: A + B

操作类型：所有数值类型

说明：返回 A 与 B 相加的结果。结果的数值类型等于 A 的类型和 B 的类型的最小父类型（详见数据类型的继承关系）。比如，int + int 一般结果为 int 类型，而 int + double 一般结果为 double 类型

举例： hive> select 1 + 9 from lxw_dual; 10 hive> create table lxw_dual as select 1 + 1.2 from lxw_dual; hive> describe lxw_dual; _c0 double

2. 减法操作: -

语法: A – B

操作类型：所有数值类型

说明：返回 A 与 B 相减的结果。结果的数值类型等于 A 的类型和 B 的类型的最小父类型（详见数据类型的继承关系）。比如，int – int 一般结果为 int 类型，而 int – double 一般结果为 double 类型

举例： hive> select 10 – 5 from lxw_dual; 5 hive> create table lxw_dual as select 5.6 – 4 from lxw_dual; hive> describe lxw_dual; _c0 double

3. 乘法操作: *

语法: A * B

操作类型：所有数值类型

说明：返回 A 与 B 相乘的结果。结果的数值类型等于 A 的类型和 B 的类型的最小父类型（详见数据类型的继承关系）。注意，如果 A 乘以 B 的结果超过默认结果类型的数值范围，则需要通过 cast 将结果转换成范围更大的数值类型

举例： hive> select 40 * 5 from lxw_dual; 200

4. 除法操作: /

语法: A / B

操作类型：所有数值类型

说明：返回 A 除以 B 的结果。结果的数值类型为 double

举例： hive> select 40 / 5 from lxw_dual; 8.0

注意：hive 中最高精度的数据类型是 double,只精确到小数点后 16 位，在做除法运算的时候要特别注意

hive>select ceil(28.0/6.999999999999999999999) from lxw_dual limit 1;

结果为 4 hive>select ceil(28.0/6.99999999999999) from lxw_dual limit 1;

结果为 5

5. 取余操作: %

语法: A % B

操作类型：所有数值类型

说明：返回 A 除以 B 的余数。结果的数值类型等于 A 的类型和 B 的类型的最小父类型（详见数据类型的继承关系）。

举例： hive> select 41 % 5 from lxw_dual; 1 hive> select 8.4 % 4 from lxw_dual; 0.40000000000000036

注意：精度在 hive 中是个很大的问题，类似这样的操作最好通过 round 指定精度

hive> select round(8.4 % 4 , 2) from lxw_dual; 0.4

6. 位与操作: &

语法: A & B

操作类型：所有数值类型

说明：返回 A 和 B 按位进行与操作的结果。结果的数值类型等于 A 的类型和 B 的类型的最小父类型（详见数据类型的继承关系）。

举例： hive> select 4 & 8 from lxw_dual; 0 hive> select 6 & 4 from lxw_dual; 4

7. 位或操作: |

语法: A | B

操作类型：所有数值类型

说明：返回 A 和 B 按位进行或操作的结果。结果的数值类型等于 A 的类型和 B 的类型的最小父类型（详见数据类型的继承关系）。

举例： hive> select 4 | 8 from lxw_dual; 12 hive> select 6 | 8 from lxw_dual; 14

8. 位异或操作: ^

语法: A ^ B

操作类型：所有数值类型

说明：返回 A 和 B 按位进行异或操作的结果。结果的数值类型等于 A 的类型和 B 的类型的最小父类型（详见数据类型的继承关系）。

举例： hive> select 4 ^ 8 from lxw_dual; 12 hive> select 6 ^ 4 from lxw_dual; 2

9．位取反操作: ~

语法: ~A

操作类型：所有数值类型

说明：返回 A 按位取反操作的结果。结果的数值类型等于 A 的类型。

举例： hive> select ~6 from lxw_dual; -7 hive> select ~4 from lxw_dual; -5

三、逻辑运算：

1. 逻辑与操作: AND

语法: A AND B

操作类型：boolean

说明：如果 A 和 B 均为 TRUE，则为 TRUE；否则为 FALSE。如果 A 为 NULL 或 B 为 NULL，则为 NULL

举例： hive> select 1 from lxw_dual where 1=1 and 2=2; 1

2. 逻辑或操作: OR

语法: A OR B

操作类型：boolean

说明：如果 A 为 TRUE，或者 B 为 TRUE，或者 A 和 B 均为 TRUE，则为 TRUE；否则为 FALSE

举例： hive> select 1 from lxw_dual where 1=2 or 2=2; 1

3. 逻辑非操作: NOT

语法: NOT A

操作类型：boolean

说明：如果 A 为 FALSE，或者 A 为 NULL，则为 TRUE；否则为 FALSE

举例： hive> select 1 from lxw_dual where not 1=2; 1

四、数值计算

1. 取整函数: round

语法: round(double a)

返回值: BIGINT

说明: 返回 double 类型的整数值部分（遵循四舍五入）

举例： hive> select round(3.1415926) from lxw_dual; 3 hive> select round(3.5) from lxw_dual; 4 hive> create table lxw_dual as select round(9542.158) from lxw_dual; hive> describe lxw_dual; _c0 bigint

2. 指定精度取整函数: round

语法: round(double a, int d)

返回值: DOUBLE

说明: 返回指定精度 d 的 double 类型

举例： hive> select round(3.1415926,4) from lxw_dual; 3.1416

3. 向下取整函数: floor

语法: floor(double a)

返回值: BIGINT

说明: 返回等于或者小于该 double 变量的最大的整数

举例： hive> select floor(3.1415926) from lxw_dual; 3 hive> select floor(25) from lxw_dual; 25

4. 向上取整函数: ceil

语法: ceil(double a)

返回值: BIGINT

说明: 返回等于或者大于该 double 变量的最小的整数

举例： hive> select ceil(3.1415926) from lxw_dual; 4 hive> select ceil(46) from lxw_dual; 46

5. 向上取整函数: ceiling

语法: ceiling(double a)

返回值: BIGINT

说明: 与 ceil 功能相同

举例： hive> select ceiling(3.1415926) from lxw_dual; 4 hive> select ceiling(46) from lxw_dual; 46

6. 取随机数函数: rand

语法: rand(),rand(int seed)

返回值: double

说明: 返回一个 0 到 1 范围内的随机数。如果指定种子 seed，则会等到一个稳定的随机数序列

举例： hive> select rand() from lxw_dual; 0.5577432776034763 hive> select rand() from lxw_dual; 0.6638336467363424 hive> select rand(100) from lxw_dual; 0.7220096548596434 hive> select rand(100) from lxw_dual; 0.7220096548596434

7. 自然指数函数: exp

语法: exp(double a)

返回值: double

说明: 返回自然对数 e 的 a 次方

举例： hive> select exp(2) from lxw_dual; 7.38905609893065

自然对数函数: ln

语法: ln(double a)

返回值: double

说明: 返回 a 的自然对数

举例： hive> select ln(7.38905609893065) from lxw_dual; 2.0

8. 以 10 为底对数函数: log10

语法: log10(double a)

返回值: double

说明: 返回以 10 为底的 a 的对数

举例： hive> select log10(100) from lxw_dual; 2.0

9. 以 2 为底对数函数: log2

语法: log2(double a)

返回值: double

说明: 返回以 2 为底的 a 的对数

举例： hive> select log2(8) from lxw_dual; 3.0

10. 对数函数: log

语法: log(double base, double a)

返回值: double

说明: 返回以 base 为底的 a 的对数

举例： hive> select log(4,256) from lxw_dual; 4.0

11. 幂运算函数: pow

语法: pow(double a, double p)

返回值: double

说明: 返回 a 的 p 次幂

举例： hive> select pow(2,4) from lxw_dual; 16.0

12. 幂运算函数: power

语法: power(double a, double p)

返回值: double

说明: 返回 a 的 p 次幂,与 pow 功能相同

举例： hive> select power(2,4) from lxw_dual; 16.0

13. 开平方函数: sqrt

语法: sqrt(double a)

返回值: double

说明: 返回 a 的平方根

举例： hive> select sqrt(16) from lxw_dual; 4.0

14. 二进制函数: bin

语法: bin(BIGINT a)

返回值: string

说明: 返回 a 的二进制代码表示

举例： hive> select bin(7) from lxw_dual; 111

15. 十六进制函数: hex

语法: hex(BIGINT a)

返回值: string

说明: 如果变量是 int 类型，那么返回 a 的十六进制表示；如果变量是 string 类型，则返回该字符串的十六进制表示

举例： hive> select hex(17) from lxw_dual; 11 hive> select hex(‘abc’) from lxw_dual; 616263

16. 反转十六进制函数: unhex

语法: unhex(string a)

返回值: string

说明: 返回该十六进制字符串所代码的字符串

举例： hive> select unhex(‘616263’) from lxw_dual; abc hive> select unhex(‘11’) from lxw_dual; - hive> select unhex(616263) from lxw_dual; abc

17. 进制转换函数: conv

语法: conv(BIGINT num, int from_base, int to_base)

返回值: string

说明: 将数值 num 从 from_base 进制转化到 to_base 进制

举例： hive> select conv(17,10,16) from lxw_dual; 11 hive> select conv(17,10,2) from lxw_dual; 10001

18. 绝对值函数: abs

语法: abs(double a) abs(int a)

返回值: double int

说明: 返回数值 a 的绝对值

举例： hive> select abs(-3.9) from lxw_dual; 3.9 hive> select abs(10.9) from lxw_dual; 10.9

19. 正取余函数: pmod

语法: pmod(int a, int b),pmod(double a, double b)

返回值: int double

说明: 返回正的 a 除以 b 的余数

举例： hive> select pmod(9,4) from lxw_dual; 1 hive> select pmod(-9,4) from lxw_dual; 3

20. 正弦函数: sin

语法: sin(double a)

返回值: double

说明: 返回 a 的正弦值

举例： hive> select sin(0.8) from lxw_dual; 0.7173560908995228

21. 反正弦函数: asin

语法: asin(double a)

返回值: double

说明: 返回 a 的反正弦值

举例： hive> select asin(0.7173560908995228) from lxw_dual; 0.8

22. 余弦函数: cos

语法: cos(double a)

返回值: double

说明: 返回 a 的余弦值

举例： hive> select cos(0.9) from lxw_dual; 0.6216099682706644

23. 反余弦函数: acos

语法: acos(double a)

返回值: double

说明: 返回 a 的反余弦值

举例： hive> select acos(0.6216099682706644) from lxw_dual; 0.9

24. positive 函数: positive

语法: positive(int a), positive(double a)

返回值: int double

说明: 返回 a

举例： hive> select positive(-10) from lxw_dual; -10 hive> select positive(12) from lxw_dual; 12

25. negative 函数: negative

语法: negative(int a), negative(double a)

返回值: int double

说明: 返回-a

举例： hive> select negative(-5) from lxw_dual; 5 hive> select negative(8) from lxw_dual; -8

五、日期函数

1. UNIX 时间戳转日期函数: from_unixtime

语法: from_unixtime(bigint unixtime[, string format])

返回值: string

说明: 转化 UNIX 时间戳（从 1970-01-01 00:00:00 UTC 到指定时间的秒数）到当前时区的时间格式

举例： hive> select from_unixtime(1323308943,'yyyyMMdd') from lxw_dual; 20111208

2. 获取当前 UNIX 时间戳函数: unix_timestamp

语法: unix_timestamp()

返回值: bigint

说明: 获得当前时区的 UNIX 时间戳

举例： hive> select unix_timestamp() from lxw_dual; 1323309615

3. 日期转 UNIX 时间戳函数: unix_timestamp

语法: unix_timestamp(string date)

返回值: bigint

说明: 转换格式为"yyyy-MM-dd HH:mm:ss"的日期到 UNIX 时间戳。如果转化失败，则返回 0。

举例： hive> select unix_timestamp('2011-12-07 13:01:03') from lxw_dual; 1323234063

4. 指定格式日期转 UNIX 时间戳函数: unix_timestamp

语法: unix_timestamp(string date, string pattern)

返回值: bigint

说明: 转换 pattern 格式的日期到 UNIX 时间戳。如果转化失败，则返回 0。

举例： hive> select unix_timestamp('20111207 13:01:03','yyyyMMdd HH:mm:ss') from lxw_dual; 1323234063

5. 日期时间转日期函数: to_date

语法: to_date(string timestamp)

返回值: string

说明: 返回日期时间字段中的日期部分。

举例： hive> select to_date('2011-12-08 10:03:01') from lxw_dual; 2011-12-08

6. 日期转年函数: year

语法: year(string date)

返回值: int

说明: 返回日期中的年。

举例： hive> select year('2011-12-08 10:03:01') from lxw_dual; 2011 hive> select year('2012-12-08') from lxw_dual; 2012

7. 日期转月函数: month

语法: month (string date)

返回值: int

说明: 返回日期中的月份。

举例： hive> select month('2011-12-08 10:03:01') from lxw_dual; 12 hive> select month('2011-08-08') from lxw_dual; 8

8. 日期转天函数: day

语法: day (string date)

返回值: int

说明: 返回日期中的天。

举例： hive> select day('2011-12-08 10:03:01') from lxw_dual; 8 hive> select day('2011-12-24') from lxw_dual; 24

9. 日期转小时函数: hour

语法: hour (string date)

返回值: int

说明: 返回日期中的小时。

举例： hive> select hour('2011-12-08 10:03:01') from lxw_dual; 10

10. 日期转分钟函数: minute

语法: minute (string date)

返回值: int

说明: 返回日期中的分钟。

举例： hive> select minute('2011-12-08 10:03:01') from lxw_dual; 3

11. 日期转秒函数: second

语法: second (string date)

返回值: int

说明: 返回日期中的秒。

举例： hive> select second('2011-12-08 10:03:01') from lxw_dual; 1

12. 日期转周函数: weekofyear

语法: weekofyear (string date)

返回值: int

说明: 返回日期在当前的周数。

举例： hive> select weekofyear('2011-12-08 10:03:01') from lxw_dual; 49

13. 日期比较函数: datediff

语法: datediff(string enddate, string startdate)

返回值: int

说明: 返回结束日期减去开始日期的天数。

举例： hive> select datediff('2012-12-08','2012-05-09') from lxw_dual; 213

14. 日期增加函数: date_add

语法: date_add(string startdate, int days)

返回值: string

说明: 返回开始日期 startdate 增加 days 天后的日期。

举例： hive> select date_add('2012-12-08',10) from lxw_dual; 2012-12-18

15. 日期减少函数: date_sub

语法: date_sub (string startdate, int days)

返回值: string

说明: 返回开始日期 startdate 减少 days 天后的日期。

举例： hive> select date_sub('2012-12-08',10) from lxw_dual; 2012-11-28

16.字符串解析成日期函数：date_format

举例：SELECT DATE_FORMAT('2022-07-04 15:10:25', 'yyyy-MM-dd HH:mm:ss') AS time;

六、条件函数

1. If 函数: if

语法: if(boolean testCondition, T valueTrue, T valueFalseOrNull)

返回值: T

说明: 当条件 testCondition 为 TRUE 时，返回 valueTrue；否则返回 valueFalseOrNull

举例： hive> select if(1=2,100,200) from lxw_dual; 200 hive> select if(1=1,100,200) from lxw_dual; 100

2. 非空查找函数: COALESCE

语法: COALESCE(T v1, T v2, …)

返回值: T

说明: 返回参数中的第一个非空值；如果所有值都为 NULL，那么返回 NULL

举例： hive> select COALESCE(null,'100','50′) from lxw_dual; 100

3. 条件判断函数：CASE

语法: CASE a WHEN b THEN c [WHEN d THEN e]* [ELSE f] END

返回值: T

说明：如果 a 等于 b，那么返回 c；如果 a 等于 d，那么返回 e；否则返回 f

举例： hive> Select case 100 when 50 then 'tom' when 100 then 'mary' else 'tim' end from lxw_dual; mary hive> Select case 200 when 50 then 'tom' when 100 then 'mary' else 'tim' end from lxw_dual; tim

4. 条件判断函数：CASE

语法: CASE WHEN a THEN b [WHEN c THEN d]* [ELSE e] END

返回值: T

说明：如果 a 为 TRUE,则返回 b；如果 c 为 TRUE，则返回 d；否则返回 e

举例： hive> select case when 1=2 then 'tom' when 2=2 then 'mary' else 'tim' end from lxw_dual; mary hive> select case when 1=1 then 'tom' when 2=2 then 'mary' else 'tim' end from lxw_dual; tom

七、字符串函数

1. 字符串长度函数：length

语法: length(string A)

返回值: int

说明：返回字符串 A 的长度

举例： hive> select length('abcedfg') from lxw_dual; 7

2. 字符串反转函数：reverse

语法: reverse(string A)

返回值: string

说明：返回字符串 A 的反转结果

举例： hive> select reverse(abcedfg’) from lxw_dual; gfdecba

3. 字符串连接函数：concat

语法: concat(string A, string B…)

返回值: string

说明：返回输入字符串连接后的结果，支持任意个输入字符串

举例： hive> select concat(‘abc’,'def’,'gh’) from lxw_dual; abcdefgh

4. 带分隔符字符串连接函数：concat_ws

语法: concat_ws(string SEP, string A, string B…)

返回值: string

说明：返回输入字符串连接后的结果，SEP 表示各个字符串间的分隔符

举例： hive> select concat_ws(',','abc','def','gh') from lxw_dual; abc,def,gh

5. 字符串截取函数：substr,substring

语法: substr(string A, int start),substring(string A, int start)

返回值: string

说明：返回字符串 A 从 start 位置到结尾的字符串

举例： hive> select substr('abcde',3) from lxw_dual; cde hive> select substring('abcde',3) from lxw_dual; cde hive> select substr('abcde',-1) from lxw_dual; （和 ORACLE 相同） e

6. 字符串截取函数：substr,substring

语法: substr(string A, int start, int len),substring(string A, int start, int len)

返回值: string

说明：返回字符串 A 从 start 位置开始，长度为 len 的字符串

举例： hive> select substr('abcde',3,2) from lxw_dual; cd hive> select substring('abcde',3,2) from lxw_dual; cd hive>select substring('abcde',-2,2) from lxw_dual; de

7. 字符串转大写函数：upper,ucase

语法: upper(string A) ucase(string A)

返回值: string

说明：返回字符串 A 的大写格式

举例： hive> select upper('abSEd') from lxw_dual; ABSED hive> select ucase('abSEd') from lxw_dual; ABSED

8. 字符串转小写函数：lower,lcase

语法: lower(string A) lcase(string A)

返回值: string

说明：返回字符串 A 的小写格式

举例： hive> select lower('abSEd') from lxw_dual; absed hive> select lcase('abSEd') from lxw_dual; absed

9. 去空格函数：trim

语法: trim(string A)

返回值: string

说明：去除字符串两边的空格

举例： hive> select trim(' abc ') from lxw_dual; abc

10. 左边去空格函数：ltrim

语法: ltrim(string A)

返回值: string

说明：去除字符串左边的空格

举例： hive> select ltrim(' abc ') from lxw_dual; abc

11. 右边去空格函数：rtrim

语法: rtrim(string A)

返回值: string

说明：去除字符串右边的空格

举例： hive> select rtrim(' abc ') from lxw_dual; abc

12. 正则表达式替换函数：regexp_replace

语法: regexp_replace(string A, string B, string C)

返回值: string

说明：将字符串 A 中的符合 java 正则表达式 B 的部分替换为 C。注意，在有些情况下要使用转义字符,类似 oracle 中的 regexp_replace 函数。

举例： hive> select regexp_replace('foobar', 'oo|ar', '') from lxw_dual; fb

13. 正则表达式解析函数：regexp_extract

语法: regexp_extract(string subject, string pattern, int index)

返回值: string

说明：将字符串 subject 按照 pattern 正则表达式的规则拆分，返回 index 指定的字符。

举例： hive> select regexp_extract('foothebar', 'foo(.*?)(bar)', 1) from lxw_dual; the hive> select regexp_extract('foothebar', 'foo(.*?)(bar)', 2) from lxw_dual; bar hive> select regexp_extract('foothebar', 'foo(.*?)(bar)', 0) from lxw_dual; foothebar

注意，在有些情况下要使用转义字符，下面的等号要用双竖线转义，这是 java 正则表达式的规则。

select data_field, regexp_extract(data_field,'.*?bgStart\\=([^&]+)',1) as aaa, regexp_extract(data_field,'.*?contentLoaded_headStart\\=([^&]+)',1) as bbb, regexp_extract(data_field,'.*?AppLoad2Req\\=([^&]+)',1) as ccc from pt_nginx_loginlog_st where pt = '2012-03-26' limit 2;

14. URL 解析函数：parse_url

语法: parse_url(string urlString, string partToExtract [, string keyToExtract])

返回值: string

说明：返回 URL 中指定的部分。partToExtract 的有效值为：HOST, PATH, QUERY, REF, PROTOCOL, AUTHORITY, FILE, and USERINFO.

举例： hive> select parse_url('http://facebook.com/path1/p.php?k1=v1&k2=v2#Ref1', 'HOST') from lxw_dual; facebook.com hive> select parse_url('http://facebook.com/path1/p.php?k1=v1&k2=v2#Ref1', 'QUERY', 'k1') from lxw_dual; v1

15. json 解析函数：get_json_object

语法: get_json_object(string json_string, string path)

返回值: string

说明：解析 json 的字符串 json_string,返回 path 指定的内容。如果输入的 json 字符串无效，那么返回 NULL。

举例： hive> select get_json_object('{"store": > {"fruit":\[{"weight":8,"type":"apple"},{"weight":9,"type":"pear"}], > "bicycle":{"price":19.95,"color":"red"} > }, > "email":"amy@only_for_json_udf_test.net", > "owner":"amy" > } > ','$.owner') from lxw_dual; amy

16. 空格字符串函数：space

语法: space(int n)

返回值: string

说明：返回长度为 n 的字符串

举例： hive> select space(10) from lxw_dual; hive> select length(space(10)) from lxw_dual; 10

17. 重复字符串函数：repeat

语法: repeat(string str, int n)

返回值: string

说明：返回重复 n 次后的 str 字符串

举例： hive> select repeat('abc',5) from lxw_dual; abcabcabcabcabc

18. 首字符 ascii 函数：ascii

语法: ascii(string str)

返回值: int

说明：返回字符串 str 第一个字符的 ascii 码

举例： hive> select ascii('abcde') from lxw_dual; 97

19. 左补足函数：lpad

语法: lpad(string str, int len, string pad)

返回值: string

说明：将 str 进行用 pad 进行左补足到 len 位

举例： hive> select lpad('abc',10,'td') from lxw_dual; tdtdtdtabc

注意：与 GP，ORACLE 不同，pad 不能默认

20. 右补足函数：rpad

语法: rpad(string str, int len, string pad)

返回值: string

说明：将 str 进行用 pad 进行右补足到 len 位

举例： hive> select rpad('abc',10,'td') from lxw_dual; abctdtdtdt

21. 分割字符串函数: split

语法: split(string str, string pat)

返回值: array

说明: 按照 pat 字符串分割 str，会返回分割后的字符串数组

举例： hive> select split('abtcdtef','t') from lxw_dual; ["ab","cd","ef"]

22. 集合查找函数: find_in_set

语法: find_in_set(string str, string strList)

返回值: int

说明: 返回 str 在 strlist 第一次出现的位置，strlist 是用逗号分割的字符串。如果没有找该 str 字符，则返回 0

举例： hive> select find_in_set('ab','ef,ab,de') from lxw_dual; 2 hive> select find_in_set('at','ef,ab,de') from lxw_dual; 0

八、集合统计函数

1. 个数统计函数: count

语法: count(*), count(expr), count(DISTINCT expr[, expr_.])

返回值: int

说明: count(*)统计检索出的行的个数，包括 NULL 值的行；count(expr)返回指定字段的非空值的个数；count(DISTINCT expr[, expr_.])返回指定字段的不同的非空值的个数

举例： hive> select count(*) from lxw_dual; 20 hive> select count(distinct t) from lxw_dual; 10

2. 总和统计函数: sum

语法: sum(col), sum(DISTINCT col)

返回值: double

说明: sum(col)统计结果集中 col 的相加的结果；sum(DISTINCT col)统计结果中 col 不同值相加的结果

举例： hive> select sum(t) from lxw_dual; 100 hive> select sum(distinct t) from lxw_dual; 70

3. 平均值统计函数: avg

语法: avg(col), avg(DISTINCT col)

返回值: double

说明: avg(col)统计结果集中 col 的平均值；avg(DISTINCT col)统计结果中 col 不同值相加的平均值

举例： hive> select avg(t) from lxw_dual; 50 hive> select avg (distinct t) from lxw_dual; 30

4. 最小值统计函数: min

语法: min(col)

返回值: double

说明: 统计结果集中 col 字段的最小值

举例： hive> select min(t) from lxw_dual; 20

5. 最大值统计函数: max

语法: maxcol)

返回值: double

说明: 统计结果集中 col 字段的最大值

举例： hive> select max(t) from lxw_dual; 120

6. 非空集合总体变量函数: var_pop

语法: var_pop(col)

返回值: double

说明: 统计结果集中 col 非空集合的总体变量（忽略 null）

举例：

7. 非空集合样本变量函数: var_samp

语法: var_samp (col)

返回值: double

说明: 统计结果集中 col 非空集合的样本变量（忽略 null）

举例：

8. 总体标准偏离函数: stddev_pop

语法: stddev_pop(col)

返回值: double

说明: 该函数计算总体标准偏离，并返回总体变量的平方根，其返回值与 VAR_POP 函数的平方根相同

举例：

9. 样本标准偏离函数: stddev_samp

语法: stddev_samp (col)

返回值: double

说明: 该函数计算样本标准偏离

举例：

10．中位数函数: percentile

语法: percentile(BIGINT col, p)

返回值: double

说明: 求准确的第 pth 个百分位数，p 必须介于 0 和 1 之间，但是 col 字段目前只支持整数，不支持浮点数类型

举例：

11. 中位数函数: percentile

语法: percentile(BIGINT col, array(p1 [, p2]…))

返回值: array

说明: 功能和上述类似，之后后面可以输入多个百分位数，返回类型也为 array，其中为对应的百分位数。

举例： select percentile(score,) from lxw_dual；取 0.2，0.4 位置的数据

12. 近似中位数函数: percentile_approx

语法: percentile_approx(DOUBLE col, p [, B])

返回值: double

说明: 求近似的第 pth 个百分位数，p 必须介于 0 和 1 之间，返回类型为 double，但是

col 字段支持浮点类型。参数 B 控制内存消耗的近似精度，B 越大，结果的准确度越高。默认为 10,000。当 col 字段中的 distinct 值的个数小于 B 时，结果为准确的百分位数

举例：

13. 近似中位数函数: percentile_approx

语法: percentile_approx(DOUBLE col, array(p1 [, p2]…) [, B])

返回值: array

说明: 功能和上述类似，之后后面可以输入多个百分位数，返回类型也为 array，其中为对应的百分位数。

举例：

14. 直方图: histogram_numeric

语法: histogram_numeric(col, b)

返回值: array‘x’,‘y’}>

说明: 以 b 为基准计算 col 的直方图信息。

举例： hive> select histogram_numeric(100,5) from lxw_dual; [{"x":100.0,"y":1.0}]

九、复合类型构建操作

1. Map 类型构建: map

语法: map (key1, value1, key2, value2, …)

说明：根据输入的 key 和 value 对构建 map 类型

举例： hive> Create table lxw_test as select map('100','tom','200','mary') as t from lxw_dual; hive> describe lxw_test; t map hive> select t from lxw_test; {"100":"tom","200":"mary"}

2. Struct 类型构建: struct

语法: struct(val1, val2, val3, …)

说明：根据输入的参数构建结构体 struct 类型

举例： hive> create table lxw_test as select struct('tom','mary','tim') as t from lxw_dual; hive> describe lxw_test; t struct hive> select t from lxw_test; {"col1":"tom","col2":"mary","col3":"tim"}

3. array 类型构建: array

语法: array(val1, val2, …)

说明：根据输入的参数构建数组 array 类型

举例： hive> create table lxw_test as select array("tom","mary","tim") as t from lxw_dual; hive> describe lxw_test; t array hive> select t from lxw_test; ["tom","mary","tim"]

十、复杂类型访问操作

1. array 类型访问: A[n]

语法: A[n]

操作类型: A 为 array 类型，n 为 int 类型

说明：返回数组 A 中的第 n 个变量值。数组的起始下标为 0。比如，A 是个值为['foo', 'bar']

的数组类型，那么 A[0]将返回'foo',而 A[1]将返回'bar'

举例： hive> create table lxw_test as select array("tom","mary","tim") as t from lxw_dual; hive> select t[0],t[1],t[2] from lxw_test; tom mary tim

2. map 类型访问: M[key]

语法: M[key]

操作类型: M 为 map 类型，key 为 map 中的 key 值

说明：返回 map 类型 M 中，key 值为指定值的 value 值。比如，M 是值为{'f' -> 'foo', 'b' -> 'bar', 'all' -> 'foobar'}的 map 类型，那么 M['all']将会返回'foobar'

举例： hive> Create table lxw_test as select map('100','tom','200','mary') as t from lxw_dual; hive> select t['200'],t['100'] from lxw_test; mary tom

3. struct 类型访问: S.x

语法: S.x

操作类型: S 为 struct 类型

说明：返回结构体 S 中的 x 字段。比如，对于结构体 struct foobar {int foo, int bar}，

foobar.foo 返回结构体中的 foo 字段

举例： hive> create table lxw_test as select struct('tom','mary','tim') as t from lxw_dual; hive> describe lxw_test; t struct hive> select t.col1,t.col3 from lxw_test; tom tim

十一、复杂类型长度统计函数

1. Map 类型长度函数: size(Map)

语法: size(Map)

返回值: int

说明: 返回 map 类型的长度

举例： hive> select size(map('100','tom','101','mary')) from lxw_dual; 2

2. array 类型长度函数: size(Array)

语法: size(Array)

返回值: int

说明: 返回 array 类型的长度

举例： hive> select size(array('100','101','102','103')) from lxw_dual; 4

3. 类型转换函数

类型转换函数: cast

语法: cast(expr as )

返回值: Expected "=" to follow "type"

说明: 返回 array 类型的长度

举例： hive> select cast(1 as bigint) from lxw_dual;

你可能感兴趣的:(hive,大数据,hadoop)

csv转为utf8编码_中文的csv文件的编码改成utf8的方法 John Sheppard csv转为utf8编码
直奔主题：把包含中文的csv文件的编码改成utf-8的方法：啰嗦几句：在用pandas读取hive导出的csv文件时，经常会遇到类似UnicodeDecodeError:'gbk'codeccan'tdecodebyte0xa3inposition12这样的问题，这种问题是因为导出的csv文件包含中文，且这些中文的编码不是gbk，直接用excel打开这些文件还会出现乱码，但用记事本打开这些csv则
企业信息化整体架构图 weixin_33937913 系统架构
今天无意间发现一张企业信息化的图，放在这里以后参考。CollaboraticeCommerce转载于:https://www.cnblogs.com/Masterpiece/archive/2004/12/29/83696.html
分块查找算法 1haooo 算法 java 算法开发语言数据结构
分块的原则前一块的最大数据，小于后一窥啊中所有的数据（块内无序，块间有序）块数数量一般等于数字的个数开根号。比如：16个数字一般分为4块左右。publicclassblockSearch{publicstaticvoidmain(String[]args){int[]arr={16,5,9,12,21,18,32,23,37,26,45,34,50,48,61,52,73,66};//共18个元素
Spark集群启动与关闭陈沐 spark spark hadoop big data
Hadoop集群和Spark的启动与关闭Hadoop集群开启三台虚拟机均启动ZookeeperzkServer.shstartMaster1上面执行启动HDFSstart-dfs.shslave1上面执行开启YARNstart-yarn.shslave2上面执行开启YARN的资源管理器yarn-daemon.shstartresourcemanager(如果nodeManager没有启动(正常情况
Hive函数大全：从核心内置函数到自定义UDF实战指南（附详细案例与总结）一个天蝎座白勺程序猿大数据开发从入门到实战合集 hive hadoop 数据仓库
目录背景‌一、Hive函数分类与核心函数表‌1.内置函数分类‌2.用户自定义函数（UDF）分类二、常用函数详解与实战案例‌1.数学函数‌2.字符串函数‌3.窗口函数‌4.自定义UDF实战‌三、总结与优化建议‌1.核心总结2.性能优化建议‌3.常问问题背景‌Hive作为Hadoop生态中最常用的数据仓库工具，其强大的函数库是高效处理和分析海量数据的核心能力之一。Hive函数分为‌内置函数‌和‌用户自
dcm4che jamie_zhengmin dcm4che archive jboss 工具服务器
dcm4che工具包DICOMtoolkitDICOM工具包dcm4chee归档服务器器IHE影像管理器和影像归档执行器（dcm4jbossarchive影像归档器，影像扫描检查和报告的管理）dcm4che2重架构dcm4che的重架构实现
将Hive数据导出为CSV和Excel格式的方法翠绿探寻 hive excel hadoop 编程
将Hive数据导出为CSV和Excel格式的方法在Hive中存储和处理大规模数据是一项常见的任务。有时候，我们需要将Hive中的数据导出为CSV或Excel格式，以便进行进一步的分析或与其他工具进行集成。本文将介绍如何使用编程的方式将Hive数据导出为CSV和Excel格式，并提供相应的源代码。Hive数据导出为CSV格式要将Hive数据导出为CSV格式，我们可以使用Hive的内置函数INSERT
MongoDB数据库使用及常见问题微笑的曙光（StevenLi）数据库数据库 mongodb
MongoDB数据库之所以备受青睐，关键在于其独特的优势满足了现代应用的需求。它采用文档型存储，数据结构灵活，无需事先定义表结构，非常适合处理复杂且多变的数据。MongoDB具备高性能和可扩展性，能够轻松应对大数据量和高并发的访问，通过分片技术实现水平扩展，确保系统稳定运行。同时，它提供了强大的数据一致性和可靠性保障，支持多种复制和故障转移机制，确保数据的高可用性和持久性。此外，MongoDB拥有
智慧社区2.0 陈陈爱java java
项目亮点1.技术架构层面✅多数据源整合（MySQL+Redis+HDFS+OSS）核心亮点：不仅仅是单一数据库，而是根据数据特性使用MySQL（结构化数据）+Redis（缓存）+HDFS（大数据存储）+OSS（对象存储），提高了系统的数据存储效率和查询速度。面试时可以强调：Redis作为缓存，加速社区热点数据访问，减少MySQL压力。HDFS存储海量日志和AI任务数据，支持后续分析。OSS解决图片
Pandas与PySpark混合计算实战：突破单机极限的智能数据处理方案 Eqwaak00 Pandas pandas 学习 python 科技开发语言
引言：大数据时代的混合计算革命当数据规模突破十亿级时，传统单机Pandas面临内存溢出、计算缓慢等瓶颈。PySpark虽能处理PB级数据，但在开发效率和局部计算灵活性上存在不足。本文将揭示如何构建Pandas+PySpark混合计算管道，在保留Pandas便捷性的同时，借助Spark分布式引擎实现百倍性能提升，并通过真实电商用户画像案例演示全流程实现。一、混合架构设计原理1.1技术栈优势分析维度P
Hadoop MapReduce 词频统计（WordCount）代码解析教程我不是少爷. Java基础 hadoop mapreduce 大数据
一、概述这是一个基于HadoopMapReduce框架实现的经典词频统计程序。程序会统计输入文本中每个单词出现的次数，并将结果输出到HDFS文件系统。二、代码结构packagecom.bigdata.wc;//Hadoop核心类库导入importorg.apache.hadoop.conf.Configuration;importorg.apache.hadoop.fs.Path;//数据类型定义
智能汽车：驶向未来的革命智能设备
一、引言汽车，作为现代文明的标志，正经历着一场前所未有的变革。人工智能、大数据、云计算等技术的飞速发展，正推动着汽车从单纯的交通工具向智能移动空间转变。智能汽车，作为这场变革的主角，正悄然改变着我们的出行方式和生活方式。二、智能汽车的定义与发展现状智能汽车，是指搭载先进传感器、控制器、执行器等装置，并融合现代通信与网络技术，实现车与X（人、车、路、云端等）智能信息交换、共享，具备复杂环境感知、智能
介绍 Apache Spark 的基本概念和在大数据分析中的应用佛渡红尘 apache
ApacheSpark是一个开源的集群计算框架，最初由加州大学伯克利分校的AMPLab开发，用于大规模数据处理和分析。相比于传统的MapReduce框架，Spark具有更快的数据处理速度和更强大的计算能力。ApacheSpark的基本概念包括：弹性分布式数据集（RDD）：是Spark中基本的数据抽象，是一个可并行操作的分区记录集合。RDD可以在集群中的节点间进行分布式计算。转换（Transform
从“笨重大象”到“敏捷火花”：Hadoop与Spark的大数据技术进化之路 Echo_Wish 大数据大数据 hadoop spark
从“笨重大象”到“敏捷火花”：Hadoop与Spark的大数据技术进化之路说起大数据技术，Hadoop和Spark可以说是这个领域的两座里程碑。Hadoop曾是大数据的开山之作，而Spark则带领我们迈入了一个高效、灵活的大数据处理新时代。那么，它们的演变过程到底有何深意？背后技术上的取舍和选择，又意味着什么？一、Hadoop：分布式存储与计算的奠基者Hadoop诞生于互联网流量爆发式增长的时代，
最新计算机专业毕设论文选题大全基于BeautifulSoup的毕业设计详细题目100套优质毕设项目分享(源码+论文)✅ 会写代码的羊毕设选题课程设计 beautifulsoup 毕业设计毕业设计题目毕设题目 python 网络爬虫
文章目录前言最新毕设选题（建议收藏起来）基于BeautifulSoup的毕业设计选题毕设作品推荐前言2025全新毕业设计项目博主介绍：✌全网粉丝10W+,CSDN全栈领域优质创作者，博客之星、掘金/华为云/阿里云等平台优质作者。技术范围：SpringBoot、Vue、SSM、HLMT、Jsp、PHP、Nodejs、Python、爬虫、数据可视化、小程序、大数据、机器学习等设计与开发。主要内容：免费
hadoop集群关闭命令顺序_启动和关闭Hadoop集群命令步骤氪老师 hadoop集群关闭命令顺序
启动和关闭Hadoop集群命令步骤总结：1.在master上启动hadoop-daemon.shstartnamenode.2.在slave上启动hadoop-daemon.shstartdatanode.3.用jps指令观察执行结果.4.用hdfsdfsadmin-report观察集群配置情况.5.通过http://npfdev1:50070界面观察集群运行情况.(如果遇到问题看https://
Flume详解——介绍、部署与使用克里斯蒂亚诺罗纳尔多阿维罗 flume 大数据分布式
1.Flume简介ApacheFlume是一个专门用于高效地收集、聚合、传输大量日志数据的分布式、可靠的系统。它特别擅长将数据从各种数据源（如日志文件、消息队列等）传输到HDFS、HBase、Kafka等大数据存储系统。特点：可扩展：支持大规模数据传输，灵活扩展容错性：支持数据恢复和失败重试，确保数据不丢失多种数据源：支持日志文件、网络数据、HTTP请求、消息队列等多种来源流式处理：数据边收集边传
智能租赁系统助力数字化转型提升管理效率与服务质量红点租赁系统开发其他
内容概要在当今快速发展的商业环境中，智能租赁系统正如一位得力助手，帮助企业以数字化的方式提升管理效率与服务质量。想象一下，传统的租赁管理就像是一场需要精确时间安排的舞蹈，而智能租赁系统则提供了高科技的音响设备，让整个表演流畅无比。通过先进的数字技术，比如云计算和大数据分析，这些系统能够优化资源配置，让企业的每一分钱都花得物有所值。更妙的是，智能租赁系统不仅高效处理日常事务，还能提供精确的数据分析，
金融租赁系统智慧风控实践探索红点租赁系统开发其他
内容概要当传统金融租赁还在和纸质合同较劲时，兴业金融租赁系统已经玩起了"变形金刚式"的智慧风控。这套系统就像给资产装上了GPS定位器+心电图监测仪，通过物联网传感器实时捕捉设备运行数据，配合卫星定位追踪车辆轨迹，再让大数据分析引擎消化海量场景信息——从工地的混凝土搅拌频率到物流车队的急刹车次数，全被转化成可量化的风险坐标。技术手段业务指标提升应用场景案例物联网传感器异常响应速度提升70%工程机械油
在kali linux中配置hadoop伪分布式 we19a0sen 三数据分析分布式 linux hadoop
目录一.配置静态网络二.配置主机名与IP地址映射三.配置SSH免密登录四.配置Java和Hadoop环境五.配置Hadoop伪分布式六.启动与验证一.配置静态网络原因：Hadoop集群依赖稳定的网络通信，动态IP可能导致节点失联。静态IP确保节点始终通过固定地址通信。操作步骤：#修改网络配置文件sudovim/etc/network/interfaces#添加内容（根据实际网络修改）：autoet
07-单链表-单链表基本操作哆啦A梦阳 2025算法机试算法数据结构
题目来源826.单链表-AcWing题库思路详见代码，主要思想就是用数组来模拟链表的创建。数组其实跟静态链表等价，由于动态链表动态new对于大数据太过于耗时，因此采用数组的方式。那数组如何起到链表的效果？用下标来索引。代码#includeusingnamespacestd;constintN=100010;inthead,e[N],ne[N],idx;//初始化voidinit(){head=-1
debian11安装MongoDB 韩搏 Linux基础 mongodb 数据库
debian11bit64安装MongoDB6.0安装必要的包sudoaptinstallgnupgcurl导入MongoDB公钥curl-fsSLhttps://www.mongodb.org/static/pgp/server-6.0.asc|sudogpg--dearmor-o/usr/share/keyrings/mongodb-archive-keyring.gpg创建MongoDB源列
linux 安装anaconda与jupyter notebook配置土豆土豆，我是洋芋 python
一、anaconda安装在官网或清华镜像下载anaconda在载前看一下自己的系统版本，下载对应的anaconda版本。在系统中输入：cat/proc/version，如下图所示##下载地址1）官网：https://www.anaconda.com/distribution/2）清华镜像：https://mirrors.tuna.tsinghua.edu.cn/anaconda/archive/安
如果我想成为一名大数据和算法工程师，我需要学会哪些技能，获取大厂的offer 红豆和绿豆杂谈大数据算法
成为一名大数据和算法工程师并获取大厂Offer，需要掌握一系列核心技能，并具备丰富的项目经验与扎实的理论基础。以下是详细的技能要求和建议：---###**1.数学与理论基础**-**数学知识**：掌握线性代数、微积分、概率论和统计学，这些是设计和理解算法的基础。-**机器学习理论**：深入理解常见机器学习算法（如线性回归、逻辑回归、决策树、随机森林、SVM、K-means等），了解其原理、优缺点及
KVM 内核优化全攻略：全方位释放服务器性能 TechStack 创行者 KVM Linux 服务器运维 KVM
KVM内核优化全攻略：全方位释放服务器性能在云计算、大数据、人工智能等前沿技术蓬勃发展的当下，服务器性能面临着前所未有的挑战。KVM（Kernel-basedVirtualMachine）作为开源虚拟化解决方案，凭借高效稳定的特性，广泛应用于企业数据中心。要充分发挥KVM性能优势，对其内核进行全面优化势在必行。本文将为你详细介绍一套涵盖通用优化及其他关键优化点的完整KVM内核优化方案，并结合实际案
Hive 与 SparkSQL 的语法差异及性能对比自然术算 Hive hive hadoop 大数据 spark
在大数据处理领域，Hive和SparkSQL都是极为重要的工具，它们为大规模数据的存储、查询和分析提供了高效的解决方案。虽然二者都致力于处理结构化数据，并且都采用了类似SQL的语法来方便用户进行操作，但在实际使用中，它们在语法细节和性能表现上存在诸多差异。了解这些差异，对于开发者根据具体业务场景选择合适的工具至关重要。语法差异数据定义语言（DDL）表创建语法Hive：在Hive中创建表时，需要详细
Oracle V$SESSION详解雨的遐想 oracle 数据库
V$SESSION是SYS用户下面对于SYS.V_$SESSION视图的同义词。在本视图中，每一个连接到数据库实例中的session都拥有一条记录。包括用户session及后台进程如DBWR，LGWR，arcchiver等等。1.V$SESSION中的常用列V$SESSION是基础信息视图，用于找寻用户SID或SADDR，及检查用户的动态：（1）SQL_HASH_VALUE，SQL_ADDRESS
【实操回顾】基于Apache SeaTunnel从MySQL同步到PostgreSQL——Demo方舟计划 SeaTunnel apache mysql postgresql
文章作者：马全才奥克斯集团大数据工程师编辑整理：国电南自赵鸿辉白鲸开源曾辉本文详细演示了如何通过ApacheSeaTunnel2.3.9实现**MySQL**到PostgreSQL的全量数据同步。非常感谢马全才老师花费业余时间为大家演示制作的Demo，也欢迎更多朋友贡献自己熟悉的同步场景，详细请参考社区Demo方舟活动：https://mp.weixin.qq.com/s/5gpiZZ0-8a4I
Flink 初体验：从 Hello World 到实时数据流处理小诸葛IT课堂 flink 大数据
在大数据处理领域，ApacheFlink以其卓越的流批一体化处理能力脱颖而出，成为众多企业构建实时数据应用的首选框架。本文将带领你迈出Flink学习的第一步，从基础概念入手，逐步引导你编写并运行第一个Flink程序——经典的WordCount，让你亲身感受Flink在实时数据流处理方面的强大魅力。一、Flink基础概念速览1.1什么是FlinkFlink是一个分布式流批一体化开源平台，旨在对无界和
大数据开发之Kubernetes篇----安装部署Kubernetes&dashboard 豆豆总 kubernetes
Kubernetes简介由于公司有需要，需要将外后的服务外加Tensorflow模型部署加训练全部集成到k8s上，所以特意记录下这次简单部署的过程。k8s安装部署首先，我们在部署任何大型的组件前都必须要做的事情就是关闭防火墙和设置hostname了vi/etc/hostsk8s001xxx.xxx.xxx.xxk8s002xxx.xxx.xxx.xx...systemctlstopfirewall
scala的option和some 矮蛋蛋编程 scala
原文地址： http://blog.sina.com.cn/s/blog_68af3f090100qkt8.html 对于学习 Scala 的 Java™ 开发人员来说，对象是一个比较自然、简单的入口点。在本系列前几期文章中，我介绍了 Scala 中一些面向对象的编程方法，这些方法实际上与 Java 编程的区别不是很大。我还向您展示了 Scala 如何重新应用传统的面向对象概念，找到其缺点
NullPointerException Cb123456 android BaseAdapter
java.lang.NullPointerException: Attempt to invoke virtual method 'int android.view.View.getImportantForAccessibility()' on a null object reference 出现以上异常.然后就在baidu上
PHP使用文件和目录天子之骄 php文件和目录读取和写入 php验证文件 php锁定文件
PHP使用文件和目录 1.使用include()包含文件 (1)：使用include()从一个被包含文档返回一个值 (2)：在控制结构中使用include() include_once()函数需要一个包含文件的路径，此外，第一次调用它的情况和include()一样，如果在脚本执行中再次对同一个文件调用，那么这个文件不会再次包含。在php.ini文件中设置
SQL SELECT DISTINCT 语句何必如此 sql
SELECT DISTINCT 语句用于返回唯一不同的值。 SQL SELECT DISTINCT 语句在表中，一个列可能会包含多个重复值，有时您也许希望仅仅列出不同（distinct）的值。 DISTINCT 关键词用于返回唯一不同的值。 SQL SELECT DISTINCT 语法 SELECT DISTINCT column_name,column_name F
java冒泡排序 3213213333332132 java 冒泡排序
package com.algorithm; /** * @Description 冒泡 * @author FuJianyong * 2015-1-22上午09:58:39 */ public class MaoPao { public static void main(String[] args) { int[] mao = {17,50,26,18,9,10
struts2.18 +json,struts2-json-plugin-2.1.8.1.jar配置及问题！ 7454103 DAO spring Ajax json qq
struts2.18 出来有段时间了！（貌似是稳定版）闲时研究下下！貌似 sruts2 搭配 json 做 ajax 很吃香！实践了下下！不当之处请绕过！呵呵网上一大堆 struts2+json 不过大多的json 插件都是 jsonplugin.34.jar strut
struts2 数据标签说明 darkranger jsp bean struts servlet Scheme
数据标签主要用于提供各种数据访问相关的功能，包括显示一个Action里的属性，以及生成国际化输出等功能数据标签主要包括： action ：该标签用于在JSP页面中直接调用一个Action，通过指定executeResult参数，还可将该Action的处理结果包含到本页面来。 bean ：该标签用于创建一个javabean实例。如果指定了id属性，则可以将创建的javabean实例放入Sta
链表.简单的链表节点构建 aijuans 编程技巧
/*编程环境WIN-TC*/ #include "stdio.h" #include "conio.h" #define NODE(name, key_word, help) \ Node name[1]={{NULL, NULL, NULL, key_word, help}} typedef struct node { &nbs
tomcat下jndi的三种配置方式 avords tomcat
jndi(Java Naming and Directory Interface，Java命名和目录接口)是一组在Java应用中访问命名和目录服务的API。命名服务将名称和对象联系起来，使得我们可以用名称访问对象。目录服务是一种命名服务，在这种服务里，对象不但有名称，还有属性。 tomcat配置
关于敏捷的一些想法 houxinyou 敏捷
从网上看到这样一句话：“敏捷开发的最重要目标就是：满足用户多变的需求，说白了就是最大程度的让客户满意。” 感觉表达的不太清楚。感觉容易被人误解的地方主要在“用户多变的需求”上。第一种多变，实际上就是没有从根本上了解了用户的需求。用户的需求实际是稳定的，只是比较多，也比较混乱，用户一般只能了解自己的那一小部分，所以没有用户能清楚的表达出整体需求。而由于各种条件的，用户表达自己那一部分时也有
富养还是穷养，决定孩子的一生 bijian1013 教育人生
是什么决定孩子未来物质能否丰盛？为什么说寒门很难出贵子，三代才能出贵族？真的是父母必须有钱，才能大概率保证孩子未来富有吗？-----作者：@李雪爱与自由事实并非由物质决定，而是由心灵决定。一朋友富有而且修养气质很好，兄弟姐妹也都如此。她的童年时代，物质上大家都很贫乏，但妈妈总是保持生活中的美感，时不时给孩子们带回一些美好小玩意，从来不对孩子传递生活艰辛、金钱来之不易、要懂得珍惜
oracle 日期时间格式转化征客丶 oracle
oracle 系统时间有 SYSDATE 与 SYSTIMESTAMP； SYSDATE：不支持毫秒，取的是系统时间； SYSTIMESTAMP：支持毫秒，日期，时间是给时区转换的，秒和毫秒是取的系统的。日期转字符窜：一、不取毫秒： TO_CHAR(SYSDATE, 'YYYY-MM-DD HH24:MI:SS') 简要说明， YYYY 年 MM 月
【Scala六】分析Spark源代码总结的Scala语法四 bit1129 scala
1. apply语法 FileShuffleBlockManager中定义的类ShuffleFileGroup，定义： private class ShuffleFileGroup(val shuffleId: Int, val fileId: Int, val files: Array[File]) { ... def apply(bucketId
Erlang中有意思的bug bookjovi erlang
代码中常有一些很搞笑的bug，如下面的一行代码被调用两次（Erlang beam） commit f667e4a47b07b07ed035073b94d699ff5fe0ba9b Author: Jovi Zhang <[email protected]> Date: Fri Dec 2 16:19:22 2011 +0100 erts:
移位打印10进制数转16进制-2008-08-18 ljy325 java 基础
/** * Description 移位打印10进制的16进制形式 * Creation Date 15-08-2008 9:00 * @author 卢俊宇 * @version 1.0 * */ public class PrintHex { // 备选字符 static final char di
读《研磨设计模式》-代码笔记-组合模式 bylijinnan java 设计模式
声明：本文只为方便我个人查阅和理解，详细的分析以及源代码请移步原作者的博客http://chjavach.iteye.com/ import java.util.ArrayList; import java.util.List; abstract class Component { public abstract void printStruct(Str
利用cmd命令将.class文件打包成jar chenyu19891124 cmd jar
cmd命令打jar是如下实现：在运行里输入cmd，利用cmd命令进入到本地的工作盘符。(如我的是D盘下的文件有此路径 D:\workspace\prpall\WEB-INF\classes) 现在是想把D:\workspace\prpall\WEB-INF\classes路径下所有的文件打包成prpall.jar。然后继续如下操作： cd D: 回车 cd workspace/prpal
[原创]JWFD v0.96 工作流系统二次开发包 for Eclipse 简要说明 comsci eclipse 设计模式算法工作 swing
JWFD v0.96 工作流系统二次开发包 for Eclipse 简要说明 &nb
SecureCRT右键粘贴的设置 daizj secureCRT 右键粘贴
一般都习惯鼠标右键自动粘贴的功能，对于SecureCRT6.7.5 ，这个功能也已经是默认配置了。老版本的SecureCRT其实也有这个功能，只是不是默认设置，很多人不知道罢了。菜单： Options->Global Options ...->Terminal 右边有个Mouse的选项块。 Copy on Select Paste on Right/Middle
Linux 软链接和硬链接 dongwei_6688 linux
1.Linux链接概念Linux链接分两种，一种被称为硬链接（Hard Link），另一种被称为符号链接（Symbolic Link）。默认情况下，ln命令产生硬链接。【硬连接】硬连接指通过索引节点来进行连接。在Linux的文件系统中，保存在磁盘分区中的文件不管是什么类型都给它分配一个编号，称为索引节点号(Inode Index)。在Linux中，多个文件名指向同一索引节点是存在的。一般这种连
DIV底部自适应 dcj3sjt126com JavaScript
<!DOCTYPE html PUBLIC "-//W3C//DTD XHTML 1.0 Transitional//EN" "http://www.w3.org/TR/xhtml1/DTD/xhtml1-transitional.dtd"> <html xmlns="http://www.w3.org/1999/xhtml&q
Centos6.5使用yum安装mysql——快速上手必备 dcj3sjt126com mysql
第1步、yum安装mysql [root@stonex ~]# yum -y install mysql-server 安装结果： Installed: mysql-server.x86_64 0:5.1.73-3.el6_5 &nb
如何调试JDK源码 frank1234 jdk
相信各位小伙伴们跟我一样，想通过JDK源码来学习Java，比如collections包，java.util.concurrent包。可惜的是sun提供的jdk并不能查看运行中的局部变量，需要重新编译一下rt.jar。下面是编译jdk的具体步骤： 1.把C:\java\jdk1.6.0_26\sr
Maximal Rectangle hcx2013 max
Given a 2D binary matrix filled with 0's and 1's, find the largest rectangle containing all ones and return its area. public class Solution { public int maximalRectangle(char[][] matrix)
Spring MVC测试框架详解——服务端测试 jinnianshilongnian spring mvc test
随着RESTful Web Service的流行，测试对外的Service是否满足期望也变的必要的。从Spring 3.2开始Spring了Spring Web测试框架，如果版本低于3.2，请使用spring-test-mvc项目（合并到spring3.2中了）。 Spring MVC测试框架提供了对服务器端和客户端（基于RestTemplate的客户端）提供了支持。 &nbs
Linux64位操作系统（CentOS6.6）上如何编译hadoop2.4.0 liyong0802 hadoop
一、准备编译软件 1.在官网下载jdk1.7、maven3.2.1、ant1.9.4，解压设置好环境变量就可以用。环境变量设置如下：（1）执行vim /etc/profile （2）在文件尾部加入: export JAVA_HOME=/home/spark/jdk1.7 export MAVEN_HOME=/ho
StatusBar 字体白色 pangyulei status
[[UIApplication sharedApplication] setStatusBarStyle:UIStatusBarStyleLightContent]; /*you'll also need to set UIViewControllerBasedStatusBarAppearance to NO in the plist file if you use this method
如何分析Java虚拟机死锁 sesame java thread oracle 虚拟机 jdbc
英文资料： Thread Dump and Concurrency Locks Thread dumps are very useful for diagnosing synchronization related problems such as deadlocks on object monitors. Ctrl-\ on Solaris/Linux or Ctrl-B
位运算简介及实用技巧（一）：基础篇 tw_wangzhengquan 位运算
http://www.matrix67.com/blog/archives/263 去年年底写的关于位运算的日志是这个Blog里少数大受欢迎的文章之一，很多人都希望我能不断完善那篇文章。后来我看到了不少其它的资料，学习到了更多关于位运算的知识，有了重新整理位运算技巧的想法。从今天起我就开始写这一系列位运算讲解文章，与其说是原来那篇文章的follow-up，不如说是一个r
jsearch的索引文件结构 yangshangchuan 搜索引擎 jsearch 全文检索信息检索 word分词
jsearch是一个高性能的全文检索工具包，基于倒排索引，基于java8，类似于lucene，但更轻量级。 jsearch的索引文件结构定义如下： 1、一个词的索引由=分割的三部分组成：第一部分是词第二部分是这个词在多少