huobumingbai1234

HUE--hive函数大全

日常工作常用的hive函数总结

公司前端hive环境主要用hue，里面内置的有函数文档，正好把这些函数全部总结下，按照内置文档的顺序

一、Aggregate--聚合类

1、avg(col)

--返回某一列的平均值

2、count([DISTINCT] col)

--对某一列计数

3、stddev_pop(col)

--返回某一列的标准偏差

4、stddev_samp(col)

--返回数据列无偏样本的标准偏差

5、sum(col)

6、max(col)

7、min(col)

8、corr(col1, col2)

--返回两列的皮尔逊相关系数

9、covar_pop(col1, col2)

--返回两列数据的总体协方差

10、covar_samp(col1, col2)

--返回两列数据样本的协方差

11、collect_set(col)

--返回一组消除了重复元素的对象,返回的是一个集合

12、collect_list(col)

--返回具有重复项的对象列表

13、histogram_numeric(col, b)

--返回array

14、ntile(INT x)

--该函数将已经排序的分区分到x个桶中，并为每行分配一个桶号。这可以容易的计算三分位，四分位，十分位，百分位和其它通用的概要统计

15、percentile(BIGINT col, p)

--返回组中列的精确第p个百分点（不适用于浮点类型）。 p必须介于0和1之间。注意：真正的百分位数只能用整数值计算。如果您的输入不是整数，请使用PERCENTILE_APPROX。

16、percentile(BIGINT col, array(p1 [, p2]...))

--返回array类型，返回组内某个列精确的第p1，p2，……位百分数，p必须在0和1之间，同上

16、percentile_approx(DOUBLE col, p [, B])

--返回组中数值列（包括浮点类型）的近似pth百分点（或百分点p1，p2，..）。 B参数以内存为代价控制逼近精度。较高的值会产生更好的近似值，默认值为10,000。当col中不同值的数量小于B时，这会得出确切的百分位数值。

17、percentile_approx(DOUBLE col, array(p1 [, p2]...) [, B])

--返回array，同上，可以返回多个百分点

18、variance(col)

--返回组中数字列的方差

19、var_pop(col)

--返回组中数字列的方差。

20、var_samp(col)

--返回组中数字列的无偏样本方差。

21、regr_avgx(T independent, T dependent)

--计算回归线的自变量(expr2)的平均值，去掉了空对(expr1, expr2)后，等于AVG(expr2)。截至Hive 2.2.0。

22、regr_avgy(T independent, T dependent)

--计算回归线的应变量(expr1)的平均值，去掉了空对(expr1, expr2)后，等于AVG(expr1)。截至Hive 2.2.0

23、regr_count(T independent, T dependent)

--返回用于拟合线性回归线的非空对数。截至Hive 2.2.0。

24、regr_intercept(T independent, T dependent)

--返回线性回归的直线的y轴截距，即方程中的b值取决于= a *独立+ b。截至Hive 2.2.0。

25、regr_r2(T independent, T dependent)

--返回回归的确定系数。截至Hive 2.2.0。

26、regr_slope(T independent, T dependent)

--返回线性回归线的斜率，即方程式中的a值依赖于=a*独立+ b。截至Hive 2.2.0。

27、regr_sxx(T independent, T dependent)

--返回值等于REGR_COUNT(expr1, expr2) * VAR_POP(expr2)

28、regr_sxy(T independent, T dependent)

--返回值等于REGR_COUNT(expr1, expr2) * COVAR_POP(expr1, expr2)

29、regr_syy(T independent, T dependent)

--返回值等于REGR_COUNT(expr1, expr2) * VAR_POP(expr1)

二、Analytic--分析函数

1、cume_dist()

--计算一行在组中的相对位置，CUME_DIST总是返回大于0、小于或等于1的数，该数表示该行在N行中的位置

例子：

2、dense_rank() OVER([partition_by_clause] order_by_clause)

--返回从1开始的递增整数序列。输出序列为ORDER BY表达式的重复值生成重复整数。

例：

3、first_value() OVER([partition_by_clause] order_by_clause [window_clause])

--从窗口的第一行返回表达式值。如果输入表达式为NULL，则返回值为NULL。

例：

4、lag(expr [,offset] [,default]) OVER() ([partition_by_clause] order_by_clause)

--该函数使用前一行的列值返回表达式的值。您可以指定一个整数偏移量，它指定一个行位置，位于当前行之前的某些行数。表达式参数中的任何列引用都引用该前一行中的列值。

例：

5、last_value(expr) OVER([partition_by_clause] order_by_clause [window_clause])

--返回窗口中最后一行的表达式值。如果输入表达式为NULL，返回值为NULL。

例：

6、lead(expr[,offset] [,default]) OVER([partition_by_clause] order_by_clause)

--此函数使用以下行的列值返回表达式的值。指定一个整数偏移量，它指定行位置到当前行之后的若干行。表达式参数中的任何列引用都引用来自后面的行的列值。

例：

7、percent_rank()

--按百分比排序

例：

8、rank() OVER([partition_by_clause] order_by_clause)

--返回整数的升序，从1开始。输出序列为表达式的重复值生成重复整数。在为“绑定”输入值生成重复输出值之后，函数通过绑定值的数量来增加序列。

例：

9、row_number() OVER([partition_by_clause] order_by_clause)

--分组排序，同一组内相同值会给不同序号

三、 Collection--集合函数

1、array_contains(Arraya,val)

--如果数组内包含val,返回True

例：

如果fullname这一列不是数组形式，先用array()函数转化下

select array_contains(array(fullname),'a') from ods.baseorganize

2、map_keys(Map a)

--返回map中的所有key,返回类型array

select map_keys(complaintDetail) from tmp.crm_data_customer_complain

3、map_values(Map a)

--返回map中的所有values,返回类型array

4、size(Map|Array a)

--返回映射或数组类型中的元素数目。

5、sort_array(Array a)

--根据数组元素的自然排序将输入数组按升序排序，并返回数组。

四、Complex Type--复合类型

1、array(val1，val2....) --创建具有给定元素的数组

2、create_union(tag,val1,val2,...) --用标记参数指向的值创建一个联合类型

3、map(key1, value1, ...) --创建具有给定键/值对的映射。

4、named_struct(name1, val1, ...) --用给定的字段名和值创建结构。

注意：这里的name和val只能是给定的值，用已有的列不行

5、struct(val1, val2, ...)

--创建具有给定字段值的结构。

这里的val可以是已有的列，也可以是给定的值

五、Conditional--有条件的函数

1、assert_true(BOOLEAN condition)

--如果成立返回NULL，如果不成立报异常

2、coalesce(T v1, T v2, ...)

--返回其参数中的第一个非空表达式，当你要在n个字段中选取某一个非空值

例：

3、if()

4、isnotnull(a)

--如果不是NULL返回TRUE,否则返回FALSE

5、isnull(a)

--如果是NULL返回TRUE,否则返回FALSE

6、nullif(a, b)

--如果a=b,返回NULL,否则返回a

7、nvl(T value, T default_value)

--如果value是空，返回default_value，否则返回value

六、Date---日期函数

1、add_months(DATE|STRING|TIMESTAMP start_date, INT num_months)

--返回开始日期之后的num_months,开始日期可以是date型，string型，TIMESTAMP型的，num_months是整形的

2、current_date

--返回当前日期，同一个查询中返回的是同一个日期

3、current_timestamp()

--返回当前的时间戳，同一个查询中返回的是同一个时间戳

4、datediff(STRING enddate, STRING startdate)

--返回结束日期和开始日期之间的间隔天数

5、date_add(DATE startdate, INT days)

--开始日期加几天

6、date_format(DATE|TIMESTAMP|STRING ts, STRING fmt)

--按指定格式返回时间date 如：date_format("2016-06-22","MM-dd")=06-22

7、date_sub(DATE startdate, INT days)

--开始日期减几天

8、day(STRING date)

--返回一个date或TIMESTAMP的日，例：day('1970-11-01 00:00:00') = 1, day('1970-11-01') = 1

9、dayofmonth(STRING date)

--同上

10、extract(field FROM source)

--返回日期/时间的单独部分，比如年、月、日、小时、分钟等等

支持提取的类型有：day, dayofweek, hour, minute, month, quarter, second, week and year.

11、from_unixtime(BIGINT unixtime [, STRING format])

--将时间的秒值转换成format格式（format可为“yyyy-MM-dd hh:mm:ss”,“yyyy-MM-dd hh”,“yyyy-MM-dd hh:mm”等等）如from_unixtime(1250111000,"yyyy-MM-dd") 得到2009-03-12

12、from_utc_timestamp(T a, STRING timezone)

--如果给定的时间戳并非UTC，则将其转化成指定的时区下时间戳

13、hour(STRING date)

--返回时间字符串小时

14、last_day(STRING date)

--返回这个月的最后一天的日期，忽略时分秒部分（HH:mm:ss）

15、minute(STRING date)

--返回时间字符串的分钟

16、month(STRING date)

--返回时间字符串的月

17、months_between(DATE|TIMESTAMP|STRING date1, DATE|TIMESTAMP|STRING date2)

--返回date1与date2之间相差的月份，如date1>date2，则返回正，如果date1

18、next_day(STRING start_date, STRING day_of_week)

--返回当前时间的下一个星期X所对应的日期如：next_day('2015-01-14', 'TU') = 2015-01-20 以2015-01-14为开始时间，其下一个星期二所对应的日期为2015-01-20

19、quarter(DATE|TIMESTAMP|STRING a)

--返回当前时间属于哪个季度

20、second(STRING date)

--返回时间字符串的秒

21、to_date(STRING timestamp)

--返回字符串的日期部分，结果1970-01-01这种形式

22、to_utc_timestamp(T a, STRING timezone)

--如果给定指定的时区下时间戳，则将其转化成UTC下的时间戳

23、trunc(STRING date, STRING format)

--返回时间的最开始年份或月份如trunc("2016-06-26",“MM”)=2016-06-01 trunc("2016-06-26",“YY”)=2016-01-01 注意所支持的格式为MONTH/MON/MM, YEAR/YYYY/YY

24、unix_timestamp([STRING date [, STRING pattern]])

--获取本地时区下的时间戳

25、weekofyear(STRING date)

--返回时间字符串位于一年中的第几个周内如weekofyear("1970-11-01 00:00:00") = 44, weekofyear("1970-11-01") = 44

26、year(STRING date)

--返回时间字符串的年份部分

七、Mathematical--数学函数

1、abs(DOUBLE a)

--求绝对值

2、acos(DECIMAL|DOUBLE a)

--求反余弦值,a介于-1到1之间，否则返回NULL值

3、asin(DECIMAL|DOUBLE a)

--求反正弦值,a介于-1到1之间，否则返回NULL值

4、atan(DECIMAL|DOUBLE a)

--求反正切值

5、bin(BIGINT a)

--计算二进制a的STRING类型，a为BIGINT类型

6、bround(DOUBLE a [, INT decimals])

--银行家舍入法（1~4：舍，6~9：进，5->前位数是偶：舍，5->前位数是奇：进）

7、cbrt(DOUBLE a)

--求a的立方根

8、ceil(DOUBLE a)

--求其不小于小给定实数的最小整数如：ceil(6) =ceil(6.9) = 6

9、ceiling(DOUBLE a)

--同上

10、conv(BIGINT|STRING a, INT from_base, INT to_base)

--将GIGINT/STRING类型的num从from_base进制转换成to_base进制

11、cos(DECIMAL|DOUBLE a)

--求余弦值

12、degrees(DECIMAL|DOUBLE a)

--将弧度值转换角度值

13、e()

--返回常数e

14、exp(DECIMAL|DOUBLE a)

--返回e的a幂次方， a可为小数

15、factorial(INT a)

--求a的阶乘

16、floor(DOUBLE a)

--向下取整,最数轴上最接近要求的值的左边的值 6.10->6 -3.4->-4

17、greatest(T a1, T a2, ...)

--求最大值

18、hex(BIGINT|BINARY|STRING a)

--计算十六进制a的STRING类型，如果a为STRING类型就转换成字符相对应的十六进制

19、least(T a1, T a2, ...)

--求最小值,返回值列表的最小值。当一个或多个参数为NULL时固定为返回null，并且严格的类型限制放宽，与“<”运算符一致。

20、ln(DECIMAL|DOUBLE a)

--返回a的自然对数

21、log(DECIMAL|DOUBLE base, DECIMAL|DOUBLE a)

--以base为底的对数，base 与 a都是DOUBLE类型

22、log10(DECIMAL|DOUBLE a)

--返回以10为底a的对数

23、log2(DECIMAL|DOUBLE a)

--返回以2为底a的对数

24、negative(T a)

--返回-a

25、pi()

--返回π

26、pmod(T a, T b)

--a对b取模

27、positive(T a)

--返回a，觉得这个函数完全没有意义

28、pow(DOUBLE a, DOUBLE p)

--返回a的p次方

29、pow(DOUBLE a, DOUBLE p)

--返回a的p次幂，同上

30、radians(DECIMAL|DOUBLE a)

--将角度值转换成弧度值

31、rand([INT seed])

--每行返回一个DOUBLE型随机数,seed是随机因子

32、round(DOUBLE a [, INT d])

--返回对a四舍五入的BIGINT值

33、shiftleft(T a, INT b)

--按位左移

34、shiftright(T a, INT b)

--按位右移

35、shiftrightunsigned(T a, INT b)

--无符号按位右移（<<<）

36、sign(T a)

--如果a是正数则返回1.0，是负数则返回-1.0，否则返回0.0

37、sin(DECIMAL|DOUBLE a)

--返回a的正弦

38、sqrt(DECIMAL|DOUBLE a)

--返回a的平方根

39、tan(DECIMAL|DOUBLE a)

--返回a的正切值

40、unhex(STRING a)

--hex的逆方法

41、width_bucket(NUMBER expr, NUMBER min_value, NUMBER max_value, INT num_buckets)

--通过将expr映射到第i个相同大小的存储桶中，返回0到num_buckets + 1之间的整数。通过将[min_value，max_value]分成相同大小的区域来制作桶。如果expr max_value返回num_buckets + 1。（从Hive 3.0.0开始）

八、Misc--各种各样的类型

1、aes_decrypt(BINARY input, STRING|BINARY key)

--使用AES解密输入（从Hive 1.3.0开始）。可以使用128位，192位或256位的密钥长度。如果安装了Java加密扩展（JCE）无限强度管辖策略文件，则可以使用192位和256位密钥。如果任一参数为NULL或者密钥长度不是允许值之一，则返回值为NULL。例如：aes_decrypt（unbase64（'y6Ss + zCYObpCbgfWfyNWTw =='），'1234567890123456'）='ABC'。

2、aes_encrypt(STRING|BINARY input, STRING|BINARY key)

--使用AES加密输入（自Hive 1.3.0起）。可以使用128位，192位或256位的密钥长度。如果安装了Java加密扩展（JCE）无限强度管辖策略文件，则可以使用192位和256位密钥。如果任一参数为NULL或者密钥长度不是允许值之一，则返回值为NULL。例如：base64（aes_encrypt（'ABC'，'1234567890123456'））='y6Ss + zCYObpCbgfWfyNWTw =='。

3、crc32(STRING|BINARY a)

--计算字符串或二进制参数的循环冗余校验值并返回bigint值（从Hive 1.3.0开始）。例如：crc32（'ABC'）= 2743272264。

4、current_database() --返回当前的数据库名称

5、current_user() --返回当前的用户名称

6、get_json_object(STRING json, STRING jsonPath)

--从指定路径上的JSON字符串抽取出JSON对象，并返回这个对象的JSON格式，如果输入的JSON是非法的将返回NULL,注意此路径上JSON字符串只能由数字字母下划线组成且不能有大写字母和特殊字符，且key不能由数字开头，这是由于Hive对列名的限制

7、hash(a1[, a2...]) --返回参数的哈希值

8、java_method(class, method[, arg1[, arg2..]]) --所谓的匹配参数签名java方法，利用反射。

9、md5(STRING|BINARY a)

--计算字符串或二进制的MD5 128位校验和（自Hive 1.3.0起）。该值作为32位十六进制数字的字符串返回，如果参数为NULL，则返回NULL。例如：md5（'ABC'）='902fbdd2b1df0c4f70b4a5d23525e932'。

10、reflect(class, method[, arg1[, arg2..]]) --匹配参数签名java方法，利用反射。

11、sha(STRING|BINARY a)

--计算字符串或二进制文件的SHA-1摘要，并以十六进制字符串形式返回值（自Hive 1.3.0开始）。例如：sha1（'ABC'）='3c01bdbb26f358bab27f267924aa2c9a03f'

12、sha1(STRING|BINARY a) --同上

13、sha2(STRING|BINARY a, INT b)

--计算SHA-2系列散列函数（SHA-224，SHA-256，SHA-384和SHA-512）（自Hive 1.3.0起）。第一个参数是要散列的字符串或二进制文件。第二个参数表示结果的所需位长度，它的值必须是224,256,384,512或0（相当于256）。从Java 8开始支持SHA-224。如果任一参数为NULL或哈希长度不是允许值之一，则返回值为NULL。例如：sha2（'ABC'，256）='b5d4045c3f466fa91fe2cc6abe79232a1a'

14、version()

--返回hive的使用版本,

--字符串包含2个字段，第一个是生成号，第二个是生成哈希。示例：“"select version();可能返回:2.1.0.2.5.0.0.1245 R027 59B9C5CE1A3D7D6B6D2E6DE23 78FB0C9322。实际结果将取决于您的构建。

15、array xpath(STRING xml, STRING xpath)

--xpath UDF家族是JDK提供的Java XPath库javax.xml.xpath的包装器。该库基于XPath 1.0规范。

16、xpath_boolean(STRING xml, STRING xpath)

--16-22都是这个意思

--UDF的XPath的家庭在java XPath库包装javax.xml.xpath通过JDK提供。该库是基于XPath 1规范的。

17、xpath_float(STRING xml, STRING xpath)

18、xpath_int(STRING xml, STRING xpath)

19、xpath_long(STRING xml, STRING xpath)

20、xpath_number(STRING xml, STRING xpath)

21、xpath_short(STRING xml, STRING xpath)

22、xpath_string(STRING xml, STRING xpath)

九、String--字符串

1、ascii(STRING str)

--返回str中首个ASCII字符串的整数值

2、base64(BINARY bin)

--将二进制bin转换成64位的字符串

3、chr(BIGINT|DOUBLE a)

--返回具有与a等价的二进制字符(Hive 1.3.0到2.1.0)。如果a大于256，则结果等于chr(% 256)。例如:选择对应(88);返回“X”。

4、char_length(STRING a)

--返回str中包含的UTF-8字符的数量(从Hive 2.2.0开始)。这是字符长度的简写。

5、character_length(STRING a)

--返回str中包含的UTF-8字符的数量(从Hive 2.2.0开始)。函数char_length是这个函数的简写。

6、concat(STRING|BINARY a, STRING|BINARY b....)

--返回连接作为参数传入的字符串或字节所产生的字符串或字节。例如，concat(“foo”、“bar”)会产生“foobar”。注意，这个函数可以接受任意数量的输入字符串。

7、concat_ws(STRING sep, STRING a, STRING b...), concat_ws(STRING sep, Array)

--类似于concat()，但是使用自定义分隔符SEP。

8、context_ngrams(Array>, Array, INT k, INT pf)

--返回array>

--与ngram类似，但context_ngram()允许你预算指定上下文(数组)来去查找子序列，具体看StatisticsAndDataMining(这里的解释更易懂)（https://cwiki.apache.org/confluence/display/Hive/StatisticsAndDataMining）

-- Returns the top-k contextual N-grams from a set of tokenized sentences, given a string of "context".

9、decode(BINARY bin, STRING charset)

--使用指定的字符集charset将二进制值bin解码成字符串，支持的字符集有：'US-ASCII', 'ISO-8859-1', 'UTF-8', 'UTF-16BE', 'UTF-16LE', 'UTF-16'，如果任意输入参数为NULL都将返回NULL

10、elt(INT n, STRING str, STRING str1, ...])

--返回索引号处的字符串。例如，elt(2，“hello”，“world”)返回“world”。如果N小于1或大于参数数，则返回NULL。

11、encode(STRING src, STRING charset)

--使用指定的字符集charset将字符串编码成二进制值，支持的字符集有：'US-ASCII', 'ISO-8859-1', 'UTF-8', 'UTF-16BE', 'UTF-16LE', 'UTF-16'，如果任一输入参数为NULL都将返回NULL

12、field(T val, T val1, ...])

--…列表或0如果没有找到，返回val1、val2、val3中的val索引。例如字段('world'，'say'，'hello'，'world')返回3。支持所有原始类型，使用string .equals(x)对参数进行比较。如果val是NULL，返回值为0。

--Returns the index of val in the val1,val2,val3,... list or 0 if not found. For example field('world','say','hello','world') returns 3. All primitive types are supported, arguments are compared using str.equals(x). If val is NULL, the return value is 0.

13、find_in_set(STRING str, STRING strList)

--返回以逗号分隔的字符串中str出现的位置，如果参数str为逗号或查找失败将返回0，如果任一参数为NULL将返回NULL,例如，find_in_set('ab'， 'abc,b,ab,c,def')返回3。

14、format_number(NUMBER x, INT d)

--将数值X转换成"#,###,###.##"格式字符串，并保留d位小数，如果d为0，将进行四舍五入且不保留小数

15、format_number(NUMBER x, INT d)

16、initcap(STRING a)

--将字符串A转换第一个字母大写其余字母小写的字符串（hive1.1）

17、instr(STRING str, STRING substr)

--查找字符串str中子字符串substr出现的位置，如果查找失败将返回0，如果任一参数为Null将返回null，注意位置为从1开始的

18、in_file(STRING str, STRING filename)

--如果文件名为filename的文件中有一行数据与字符串str匹配成功就返回true

19、length(STRING a)

--返回字符串的长度

20、levenshtein(STRING a, STRING b)

--计算两个字符串之间的差异大小如：levenshtein('kitten', 'sitting') = 3

21、lcase(STRING a)

22、lower(STRING a)

--21、22同一个意思，将字符串A的所有字母转换成小写字母

23、locate(STRING substr, STRING str [, INT pos])

--查找字符串str中的pos位置后字符串substr第一次出现的位置

24、lpad(STRING str, INT len, STRING pad)

--从左边开始对字符串str使用字符串pad填充，最终len长度为止，如果字符串str本身长度比len大的话，将去掉多余的部分

25、ltrim(STRING a)

--去掉字符串A前面的空格

26、 ngrams(Array> a, INT n, INT k, INT pf)

--返回array>，返回出现次数TOP K的的子序列,n表示子序列的长度，具体看StatisticsAndDataMining (https://cwiki.apache.org/confluence/display/Hive/StatisticsAndDataMining)

27、octet_length(STRING a)

--返回在UTF-8编码中保存字符串str所需的八进制数(从Hive 2.2.0开始)。注意，octet_length(str)可以大于character_length(str)。

28、parse_url(string urlString, string partToExtract [, string keyToExtract])

--返回从URL中抽取指定部分的内容，参数url是URL字符串，而参数partToExtract是要抽取的部分，这个参数包含(HOST, PATH, QUERY, REF, PROTOCOL, AUTHORITY, FILE, and USERINFO,例如：parse_url('http://facebook.com/path1/p.php?k1=v1&k2=v2#Ref1', 'HOST') ='facebook.com'，如果参数partToExtract值为QUERY则必须指定第三个参数key 如：parse_url('http://facebook.com/path1/p.php?k1=v1&k2=v2#Ref1', 'QUERY', 'k1') =‘v1’

--Returns the specified part from the URL. Valid values for partToExtract include HOST, PATH, QUERY, REF, PROTOCOL, AUTHORITY, FILE, and USERINFO. For example, parse_url('http://facebook.com/path1/p.php?k1=v1&k2=v2#Ref1', 'HOST') returns 'facebook.com'. Also a value of a particular key in QUERY can be extracted by providing the key as the third argument, for example, parse_url('http://facebook.com/path1/p.php?k1=v1&k2=v2#Ref1', 'QUERY', 'k1') returns 'v1'.

29、printf(STRING format, Obj... args)

--按照printf风格格式输出字符串

30、regexp_extract(string subject, string pattern, int index)

--抽取字符串subject中符合正则表达式pattern的第index个部分的子字符串，注意些预定义字符的使用，如第二个参数如果使用'\s'将被匹配到s,'\\s'才是匹配空格

--Returns the string extracted using the pattern. For example, regexp_extract('foothebar', 'foo(.*?)(bar)', 2) returns 'bar.' Note that some care is necessary in using predefined character classes: using '\s' as the second argument will match the letter s; '\\s' is necessary to match whitespace, etc. The 'index' parameter is the Java regex Matcher group() method index.

31、 regexp_replace(string INITIAL_STRING, string PATTERN, string REPLACEMENT)

--按照Java正则表达式PATTERN将字符串INTIAL_STRING中符合条件的部分成REPLACEMENT所指定的字符串，如里REPLACEMENT这空的话，抽符合正则的部分将被去掉如：regexp_replace("foobar", "oo|ar", "") = 'fb.' 注意些预定义字符的使用，如第二个参数如果使用'\s'将被匹配到s,'\\s'才是匹配空格

--Returns the string resulting from replacing all substrings in INITIAL_STRING that match the java regular expression syntax defined in PATTERN with instances of REPLACEMENT. For example, regexp_replace("foobar", "oo|ar", "") returns 'fb.' Note that some care is necessary in using predefined character classes: using '\s' as the second argument will match the letter s; '\\s' is necessary to match whitespace, etc.

32、repeat(STRING str, INT n)

--重复输出n遍字符串str

33、replace(STRING a, STRING old, STRING new)

--返回字符串a，其中所有未重叠的旧替换为新的(如Hive 1.3.0和2.1.0)。示例:选择replace("ababab","abab","Z");返回“Zab”。

34、reverse(STRING a)

--反转字符串

35、rpad(STRING str, INT len, STRING pad)

--从右边开始对字符串str使用字符串pad填充，最终len长度为止，如果字符串str本身长度比len大的话，将去掉多余的部分

36、rtrim(STRING a)

--去掉字符串后面出现的空格

37、 sentences(string str, string lang, string locale)

--返回array>类型，字符串str将被转换成单词数组，如：sentences('Hello there! How are you?') =( ("Hello", "there"), ("How", "are", "you") )

38、soundex(STRING a)

--将普通字符串转换成soundex字符串(hive1.2)

39、space(INT n)

--返回n个空格

40、split(STRING str, STRING pat)

--返回array 在pat周围分割str (pat) (pat是一个正则表达式)。

41、str_to_map(text[, delimiter1, delimiter2])

--返回map，将字符串str按照指定分隔符转换成Map，第一个参数是需要转换字符串，第二个参数是键值对之间的分隔符，默认为逗号;第三个参数是键值之间的分隔符，默认为"="

--Splits text into key-value pairs using two delimiters. Delimiter1 separates text into K-V pairs, and Delimiter2 splits each K-V pair. Default delimiters are ',' for delimiter1 and '=' for delimiter2.

42、substr(STRING|BINARY A, INT start [, INT len])

--对于字符串A,从start位置开始截取字符串并返回，例如，substr('foobar'， 4)='bar'

43、substring(STRING|BINARY a, INT start [, INT len])

--同上

44、substring_index(string A, string delim, int count)

--在计数分隔符delim之前返回字符串A的子串（自Hive 1.3.0开始）。如果count是正数，则返回最后一个分隔符左边的数字（从左数起）。如果count为负数，则返回最后一个分隔符右边的数字（从右数起）。 Substring_index在搜索delim时执行区分大小写的匹配

--Returns the substring from string A before count occurrences of the delimiter delim (as of Hive 1.3.0). If count is positive, everything to the left of the final delimiter (counting from the left) is returned. If count is negative, everything to the right of the final delimiter (counting from the right) is returned. Substring_index performs a case-sensitive match when searching for delim. Example: substring_index('www.apache.org', '.', 2) = 'www.apache'.

--将input出现在from中的字符串替换成to中的字符串如：translate("MOBIN","BIN","M")="MOM"

46、trim(STRING a)

--去掉字符串A前面的空格

47、ucase(STRING a)

48、upper(STRING a)

--将字符串A中的字母转换成大写字母

49、unbase64(STRING a)

--将64位的字符串转换二进制值

十、Data Masking--数据屏蔽

1、mask(STRING str [, STRING upper [, STRING lower [, STRING number]]])

--返回一个隐藏的str版本(Hive 2.1.0)。默认情况下，大写字母转换为“X”，小写字母转换为“X”，数字转换为“n”。例如，mask(“abcd-EFGH-8765-4321”)返回xxxx- xxxx- nnn-nnnn。您可以通过提供额外的参数来覆盖掩码中使用的字符:第二个参数控制大写字母的掩码字符，小写字母的第三个参数和数字的第四个参数。例如,面具(“abcd - efgh - 8765 - 8765”,“U”、“l”、“#”)返回llll-UUUU - # # # # # # # #。

--Returns a masked version of str (as of Hive 2.1.0). By default, upper case letters are converted to "X", lower case letters are converted to "x" and numbers are converted to "n". For example mask("abcd-EFGH-8765-4321") results in xxxx-XXXX-nnnn-nnnn. You can override the characters used in the mask by supplying additional arguments: the second argument controls the mask character for upper case letters, the third argument for lower case letters and the fourth argument for numbers. For example, mask("abcd-EFGH-8765-4321", "U", "l", "#") results in llll-UUUU-####-####.

2、mask_first_n(STRING str [, INT n])

--返回带有第一个n值的屏蔽版本的str(如Hive 2.1.0)。大写字母被转换为“X”，小写字母被转换为“X”，数字被转换为“n”。例如，mask_first_n(“1234-5678-8765-4321”，4)结果为nnnn-5678-8765-4321。

--Returns a masked version of str with the first n values masked (as of Hive 2.1.0). Upper case letters are converted to "X", lower case letters are converted to "x" and numbers are converted to "n". For example, mask_first_n("1234-5678-8765-4321", 4) results in nnnn-5678-8765-4321.

3、mask_last_n(STRING str [, INT n])

--返回带有最后n个值(如Hive 2.1.0)的屏蔽版本的str。大写字母被转换为“X”，小写字母被转换为“X”，数字被转换为“n”。例如，mask_last_n(“1234-5678-8765-4321”，4)结果是1234-5678-8765-nnnn。

--Returns a masked version of str with the last n values masked (as of Hive 2.1.0). Upper case letters are converted to "X", lower case letters are converted to "x" and numbers are converted to "n". For example, mask_last_n("1234-5678-8765-4321", 4) results in 1234-5678-8765-nnnn.

4、mask_show_first_n(STRING str [, INT n])

--返回str的隐藏版本，显示前n个字符未被屏蔽（从Hive 2.1.0开始）。大写字母转换为“X”，小写字母转换为“x”，数字转换为“n”。例如，mask_show_first_n（“1234-5678-8765-4321”，4）产生1234-nnnn-nnnn-nnnn。

--Returns a masked version of str, showing the first n characters unmasked (as of Hive 2.1.0). Upper case letters are converted to "X", lower case letters are converted to "x" and numbers are converted to "n". For example, mask_show_first_n("1234-5678-8765-4321", 4) results in 1234-nnnn-nnnn-nnnn.

5、mask_show_last_n(STRING str [, INT n])

--返回一个隐藏的str版本，显示最后n个未隐藏字符(截至Hive 2.1.0)。大写字母被转换为“X”，小写字母被转换为“X”，数字被转换为“n”。例如，mask_show_last_n(“1234-5678-8765-4321”，4)结果是nnnn-nnn -nn -4321。

--Returns a masked version of str, showing the last n characters unmasked (as of Hive 2.1.0). Upper case letters are converted to "X", lower case letters are converted to "x" and numbers are converted to "n". For example, mask_show_last_n("1234-5678-8765-4321", 4) results in nnnn-nnnn-nnnn-4321.

6、mask_hash(STRING|CHAR|VARCHAR str)

--返回基于str的散列值(如Hive 2.1.0)。哈希是一致的，可以用来在表之间连接蒙面值。对于非字符串类型，此函数返回null。

--Returns a hashed value based on str (as of Hive 2.1.0). The hash is consistent and can be used to join masked values together across tables. This function returns null for non-string types.

十一、Table Generating--表格生成

1、explode(array a)

--对于a中的每个元素，将生成一行且包含该元素

2、explode(ARRAY)

--每行对应数组中的一个元素

3、explode(MAP)

--每行对应每个map键-值，其中一个字段是map的键，另一个字段是map的值

4、inline(Array a)

--将结构体数组提取出来并插入到表中

5、json_tuple(STRING jsonStr, STRING k1, STRING k2, ...)

--从一个JSON字符串中获取多个键并作为一个元组返回，与get_json_object不同的是此函数能一次获取多个键值

--The parse_url_tuple() UDTF is similar to parse_url(), but can extract multiple parts of a given URL,

returning the data in a tuple. Values for a particular key in QUERY can be extracted by appending a colon and the key to the partToExtract argument.

6、posexplode(ARRAY)

--与explode类似，不同的是还返回各元素在数组中的位置

--posexplode() is similar to explode but instead of just returning the elements of the array it returns the element as well as its position in the original array.

7、stack(INT n, v1, v2, ..., vk)

--把M列转换成N行，每行有M/N个字段，其中n必须是个常数

十二、Type Conversion--类型转化

1、binary(BINARY|STRING a) --将输入的值转化为二进制

2、cast(a as T) --格式转化，如果转化不成功会返回NULL值

你可能感兴趣的:(hive)

linux grep命令蓝菱 linux linux grep 正则表达式
转自http://www.cnblogs.com/end/archive/2012/02/21/2360965.htm1.作用Linux系统中grep命令是一种强大的文本搜索工具，它能使用正则表达式搜索文本，并把匹配的行打印出来。grep全称是GlobalRegularExpressionPrint，表示全局正则表达式版本，它的使用权限是所有用户。2.格式grep[options]3.主要参数[o
【已解决】将CentOS7系统安装至U盘（四）：安装Qt5.14.2（解决#error qt requires c++11 support问题） pyengine qt c++开发语言 centos
目录1下载安装文件2安装Qt5.14.2和QtCreator3解决编译问题1下载安装文件从Qt官网或清华大学镜像站https://mirrors.tuna.tsinghua.edu.cn/gnu/gcchttps://mirrors.tuna.tsinghua.edu.cn/qt/archive/qt/5.14/5.14.2/下载Qt安装文件。以清华大学镜像站为例，下载如下：wgethttps:/
安装Qt 5.15.2 noodleboy qt
安装Qt5.15.2自Qt5.15开始，Qt不提供离线安装包了，需要使用在线安装器安装，但是Qt5.15版本不直接显示。需要勾选Archive选项，且很有可能需要梯子工具。
Sqoop安装部署愿与狸花过一生大数据 sqoop hadoop hive
ApacheSqoop简介Sqoop（SQL-to-Hadoop）是Apache开源项目，主要用于：将关系型数据库中的数据导入Hadoop分布式文件系统（HDFS）或相关组件（如Hive、HBase）。将Hadoop处理后的数据导出回关系型数据库。核心特性批量数据传输支持从数据库表到HDFS/Hive的全量或增量数据迁移。并行化处理基于MapReduce实现并行导入导出，提升大数据量场景的效率。自
Mysql-经典实战案例（10）：如何用PT-Archiver完成大表的自动归档从不删库的DBA Mysql 经典实战案例 mysql 数据库
真实痛点：电商订单表存储优化场景现状分析某电商平台订单表（order_info）每月新增500万条记录主库：高频读写，SSD存储（空间告急）历史库：HDD存储，只读查询优化目标✅自动迁移7天前的订单到历史库✅每周六23:30执行，不影响业务高峰✅确保数据一致性第一章：前期准备：沙盒实验室搭建1.1实验环境架构生产库：10.33.112.22历史库：10.30.76.41.2环境初始化（双节点执行）
Hive面试题御风行云天面试题大全 hive hadoop 数据仓库面试
Hive面试题1Hive基础概念1.1解释Hive是什么以及它的用途Hive的主要用途：1.2描述Hive架构和组件1.HiveCLI/Beeline和WebUI2.HiveQL3.HiveDriver（驱动）4.Metastore5.Compiler（编译器）6.Optimizer（优化器）7.Executor（执行器）8.HadoopCoreComponents（核心组件）9.HiveUDFs
Hive 实际应用场景及对应SQL示例小技工丨大数据随笔 hive sql hadoop 大数据数据仓库
Hive实际应用场景及对应SQL示例一、‌日志分析场景‌**场景说明‌：**处理大规模日志数据（如Web访问日志），分析用户行为或系统运行状态。SQL示例‌：--统计每日UV（用户访问量）SELECTdate,COUNT(DISTINCTuser_id)ASdaily_uvFROMweb_logsWHEREevent_type='page_view'GROUPBYdate;技术要点‌：使用DIST
#Hadoop全分布式安装 #mysql安装 #hive安装砸吧砸吧 hadoop hive yarn mysql
分布式（多台机器部署不同组件）与集群（多台机器部署相同组件）概念。Linux基础命令linux具有文件数：目录、文件，从根目录开始，路径具有唯一性。pwd：显示当前路径特殊符号：/：根目录.：隐藏文件，如果路径以.开始，表示当前目录下..：当前目录下的上一级~：当前目录的home目录--help：帮助命令使用linux常用操作命令tab键：自动补全ls：显示指定目录内容默认：当前路径-a：显示所有
hive 使用oracle数据库 sardtass hadoop hive 开源项目
hive使用oracle作为数据源，导入数据使用sqoop或kettle或自己写代码（淘宝的开源项目中有一个xdata就是淘宝自己写的）。感觉sqoop比kettle快多了，淘宝的xdata没用过。hive默认使用derby作为存储表信息的数据库，默认在哪启动就在哪建一个metadata_db文件放数据，可以在conf下的hive-site.xml中配置为一个固定的位置，这样不论在哪启动都可以了。
HiveMetastore 的架构简析 houzhizhen hive hive
HiveMetastore的架构简析HiveMetastore是Hive元数据管理的服务。可以把元数据存储在数据库中。对外通过api访问。hive_metastore.thrift对外提供的Thrift接口定义在文件standalone-metastore/src/main/thrift/hive_metastore.thrift中。内容包括用到的结构体和枚举，和常量，和rpcService。如分
Hive与Spark的UDF：数据处理利器的对比与实践窝窝和牛牛 hive spark hadoop
文章目录Hive与Spark的UDF：数据处理利器的对比与实践一、UDF概述二、HiveUDF解析实现原理代码示例业务应用三、SparkUDF剖析-JDBC方式使用SparkThriftServer设置通过JDBC使用UDFSparkUDF的Java实现（用于JDBC方式）通过beeline客户端连接使用业务应用场景四、Hive与SparkUDF在JDBC模式下的对比五、实际部署与最佳实践六、总结
尚硅谷电商数仓6.0，hive on spark,spark启动不了新时代赚钱战士 hive spark hadoop
在datagrip执行分区插入语句时报错[42000][40000]Errorwhilecompilingstatement:FAILED:SemanticExceptionFailedtogetasparksession:org.apache.hadoop.hive.ql.metadata.HiveException:FailedtocreateSparkclientforSparksessio
qt-5.15.2 源码编译 Linux weixin_40857106 服务器运维
QT官方源码下载地址：https://download.qt.io/archive/qt/5.15/5.15.12/single/qt-everywhere-opensource-src-5.15.12.tar.xz安装Qt所需的依赖：sudoaptinstallbuild-essentiallibgl1-mesa-devlibxkbcommon-devlibnss3-devlibdbus-1-d
鸿蒙HarmonyOS开发：应用程序静态包-HAR 让开，我要吃人了鸿蒙开发 OpenHarmony HarmonyOS harmonyos 华为移动开发前端 html 开发语言鸿蒙
HAR（HarmonyArchive）是静态共享包，可以包含代码、C++库、资源和配置文件。通过HAR可以实现多个模块或多个工程共享ArkUI组件、资源等相关代码。使用场景作为二方库，发布到OHPM私仓，供公司内部其他应用使用。作为三方库，发布到OHPM中心仓，供其他应用使用。约束限制HAR不支持在设备上单独安装/运行，只能作为应用模块的依赖项被引用。HAR不支持在配置文件中声明UIAbility
flutter 使用xcodebuild 命令打包ipa 肥肥呀呀呀 flutter
苹果打ipa包(注意苹果打包需要连接真机)方式一、1.先执行flutterbuildios生成framework2.执行命令xcodebuild-exportArchive-archivePathbuild/ios/Runner.xcarchive-exportOptionsPlistexportOptions.plist-exportPathbuild/ios/ipaexportOptions.
Hadoop相关面试题努力的搬砖人. java 面试 hadoop
以下是150道Hadoop面试题及其详细回答，涵盖了Hadoop的基础知识、HDFS、MapReduce、YARN、HBase、Hive、Sqoop、Flume、ZooKeeper等多个方面，每道题目都尽量详细且简单易懂：Hadoop基础概念类1.什么是Hadoop？Hadoop是一个由Apache基金会开发的开源分布式计算框架，主要用于处理和存储大规模数据集。它提供了高容错性和高扩展性的分布式存
oracle cdc logminer与oracle xstream 24k小善 java 大数据 flink
以下为OracleCDC技术中XStream与LogMiner的核心差异解析，结合技术背景、实现原理、性能表现等维度进行系统化对比。一、技术背景与定位差异LogMiner：官方日志分析工具的非正式应用最初设计用于数据库管理员（DBA）审计和分析历史日志，非专为CDC场景优化[1][9][16]。通过解析归档日志（ArchiveLog）或在线日志（OnlineRedoLog）提取变更记录，采用轮询机
csv转为utf8编码_中文的csv文件的编码改成utf8的方法 John Sheppard csv转为utf8编码
直奔主题：把包含中文的csv文件的编码改成utf-8的方法：啰嗦几句：在用pandas读取hive导出的csv文件时，经常会遇到类似UnicodeDecodeError:'gbk'codeccan'tdecodebyte0xa3inposition12这样的问题，这种问题是因为导出的csv文件包含中文，且这些中文的编码不是gbk，直接用excel打开这些文件还会出现乱码，但用记事本打开这些csv则
企业信息化整体架构图 weixin_33937913 系统架构
今天无意间发现一张企业信息化的图，放在这里以后参考。CollaboraticeCommerce转载于:https://www.cnblogs.com/Masterpiece/archive/2004/12/29/83696.html
Hive函数大全：从核心内置函数到自定义UDF实战指南（附详细案例与总结）一个天蝎座白勺程序猿大数据开发从入门到实战合集 hive hadoop 数据仓库
目录背景‌一、Hive函数分类与核心函数表‌1.内置函数分类‌2.用户自定义函数（UDF）分类二、常用函数详解与实战案例‌1.数学函数‌2.字符串函数‌3.窗口函数‌4.自定义UDF实战‌三、总结与优化建议‌1.核心总结2.性能优化建议‌3.常问问题背景‌Hive作为Hadoop生态中最常用的数据仓库工具，其强大的函数库是高效处理和分析海量数据的核心能力之一。Hive函数分为‌内置函数‌和‌用户自
dcm4che jamie_zhengmin dcm4che archive jboss 工具服务器
dcm4che工具包DICOMtoolkitDICOM工具包dcm4chee归档服务器器IHE影像管理器和影像归档执行器（dcm4jbossarchive影像归档器，影像扫描检查和报告的管理）dcm4che2重架构dcm4che的重架构实现
将Hive数据导出为CSV和Excel格式的方法翠绿探寻 hive excel hadoop 编程
将Hive数据导出为CSV和Excel格式的方法在Hive中存储和处理大规模数据是一项常见的任务。有时候，我们需要将Hive中的数据导出为CSV或Excel格式，以便进行进一步的分析或与其他工具进行集成。本文将介绍如何使用编程的方式将Hive数据导出为CSV和Excel格式，并提供相应的源代码。Hive数据导出为CSV格式要将Hive数据导出为CSV格式，我们可以使用Hive的内置函数INSERT
debian11安装MongoDB 韩搏 Linux基础 mongodb 数据库
debian11bit64安装MongoDB6.0安装必要的包sudoaptinstallgnupgcurl导入MongoDB公钥curl-fsSLhttps://www.mongodb.org/static/pgp/server-6.0.asc|sudogpg--dearmor-o/usr/share/keyrings/mongodb-archive-keyring.gpg创建MongoDB源列
linux 安装anaconda与jupyter notebook配置土豆土豆，我是洋芋 python
一、anaconda安装在官网或清华镜像下载anaconda在载前看一下自己的系统版本，下载对应的anaconda版本。在系统中输入：cat/proc/version，如下图所示##下载地址1）官网：https://www.anaconda.com/distribution/2）清华镜像：https://mirrors.tuna.tsinghua.edu.cn/anaconda/archive/安
Hive 与 SparkSQL 的语法差异及性能对比自然术算 Hive hive hadoop 大数据 spark
在大数据处理领域，Hive和SparkSQL都是极为重要的工具，它们为大规模数据的存储、查询和分析提供了高效的解决方案。虽然二者都致力于处理结构化数据，并且都采用了类似SQL的语法来方便用户进行操作，但在实际使用中，它们在语法细节和性能表现上存在诸多差异。了解这些差异，对于开发者根据具体业务场景选择合适的工具至关重要。语法差异数据定义语言（DDL）表创建语法Hive：在Hive中创建表时，需要详细
Oracle V$SESSION详解雨的遐想 oracle 数据库
V$SESSION是SYS用户下面对于SYS.V_$SESSION视图的同义词。在本视图中，每一个连接到数据库实例中的session都拥有一条记录。包括用户session及后台进程如DBWR，LGWR，arcchiver等等。1.V$SESSION中的常用列V$SESSION是基础信息视图，用于找寻用户SID或SADDR，及检查用户的动态：（1）SQL_HASH_VALUE，SQL_ADDRESS
Spark任务读取hive表数据导入es 小小小小小小小小小小码农 hive elasticsearch spark java
使用elasticsearch-hadoop将hive表数据导入es，超级简单1.引入pomorg.elasticsearchelasticsearch-hadoop9.0.0-SNAPSHOT2.创建sparkconf//spark参数设置SparkConfsparkConf=newSparkConf();//要写入的索引sparkConf.set("es.resource","");//es集
Redis 安装详细教程（小白版）小小鸭程序员 spring java AI编程 spring cloud redis
一、Windows系统安装Redis方法1：直接安装（推荐新手）下载RedisforWindows访问微软维护的Redis版本：https://github.com/microsoftarchive/redis/releases下载Redis-x64-3.2.100.msi（或最新版本）安装包。安装Redis双击下载的.msi文件点击下一步，勾选“AddRedisinstallationfolde
Hive SQL 精进系列：REGEXP_REPLACE 函数的用法进一步有进一步的欢喜 Hive SQL 精进系列 hive sql hadoop
目录一、引言二、REGEXP_REPLACE函数基础2.1基本语法参数详解2.2简单示例三、REGEXP_REPLACE函数的应用场景3.1去除特殊字符3.2统一字符串格式四、REGEXP_REPLACE与REPLACE函数的对比4.1功能差异4.2适用场景五、REGEXP_REPLACE与REGEXP函数的对比5.1功能差异5.2适用场景六、总结一、引言字符串处理是数据处理中的常见需求，Hive
Hive SQL 精进系列：SUBSTR 函数的多样用法进一步有进一步的欢喜 Hive SQL 精进系列 hive sql hadoop
目录一、引言二、SUBSTR函数基础介绍2.1基本语法2.2参数详解2.3简单示例三、SUBSTR函数常见应用场景3.1提取日期中的年份、月份或日期3.2隐藏部分敏感信息四、SUBSTR函数高级用法4.1结合条件判断动态截取4.2处理复杂字符串模式五、总结一、引言SUBSTR函数是HiveSQL中一个用于字符串截取的重要函数，在处理文本数据时发挥着关键作用。本文将全面且深入地介绍HiveSQL中S
Java开发中，spring mvc 的线程怎么调用？小麦麦子 spring mvc
今天逛知乎，看到最近很多人都在问spring mvc 的线程http://www.maiziedu.com/course/java/ 的启动问题，觉得挺有意思的，那哥们儿问的也听仔细，下面的回答也很详尽，分享出来，希望遇对遇到类似问题的Java开发程序猿有所帮助。问题：在用spring mvc架构的网站上，设一线程在虚拟机启动时运行，线程里有一全局
maven依赖范围 bitcarter maven
1.test 测试的时候才会依赖，编译和打包不依赖，如junit不被打包 2.compile 只有编译和打包时才会依赖 3.provided 编译和测试的时候依赖，打包不依赖，如：tomcat的一些公用jar包 4.runtime 运行时依赖，编译不依赖 5.默认compile 依赖范围compile是支持传递的，test不支持传递 1.传递的意思是项目A，引用
Jaxb org.xml.sax.saxparseexception : premature end of file darrenzhu xml premature JAXB
如果在使用JAXB把xml文件unmarshal成vo(XSD自动生成的vo)时碰到如下错误： org.xml.sax.saxparseexception : premature end of file 很有可能时你直接读取文件为inputstream，然后将inputstream作为构建unmarshal需要的source参数。InputSource inputSource = new In
CSS Specificity 周凡杨 html 权重 Specificity css
有时候对于页面元素设置了样式，可为什么页面的显示没有匹配上呢？ because specificity CSS 的选择符是有权重的，当不同的选择符的样式设置有冲突时，浏览器会采用权重高的选择符设置的样式。规则： HTML标签的权重是1 Class 的权重是10 Id 的权重是100
java与servlet g21121 servlet
servlet 搞java web开发的人一定不会陌生，而且大家还会时常用到它。下面是java官方网站上对servlet的介绍： java官网对于servlet的解释写道 Java Servlet Technology Overview Servlets are the Java platform technology of choice for extending and enha
eclipse中安装maven插件 510888780 eclipse maven
1.首先去官网下载 Maven： http://www.apache.org/dyn/closer.cgi/maven/binaries/apache-maven-3.2.3-bin.tar.gz 下载完成之后将其解压，我将解压后的文件夹：apache-maven-3.2.3，并将它放在 D:\tools目录下，即 maven 最终的路径是：D:\tools\apache-mave
jpa@OneToOne关联关系布衣凌宇 jpa
Nruser里的pruserid关联到Pruser的主键id，实现对一个表的增删改，另一个表的数据随之增删改。 Nruser实体类 //***************************************************************** @Entity @Table(name="nruser") @DynamicInsert @Dynam
我的spring学习笔记11-Spring中关于声明式事务的配置 aijuans spring 事务配置
这两天学到事务管理这一块，结合到之前的terasoluna框架，觉得书本上讲的还是简单阿。我就把我从书本上学到的再结合实际的项目以及网上看到的一些内容，对声明式事务管理做个整理吧。我看得Spring in Action第二版中只提到了用TransactionProxyFactoryBean和<tx:advice/>,定义注释驱动这三种，我承认后两种的内容很好，很强大。但是实际的项目当中
java 动态代理简单实现 antlove java handler proxy dynamic service
dynamicproxy.service.HelloService package dynamicproxy.service; public interface HelloService { public void sayHello(); } dynamicproxy.service.impl.HelloServiceImpl package dynamicp
JDBC连接数据库百合不是茶 JDBC编程 JAVA操作oracle数据库
如果我们要想连接oracle公司的数据库，就要首先下载oralce公司的驱动程序，将这个驱动程序的jar包导入到我们工程中; JDBC链接数据库的代码和固定写法; 1,加载oracle数据库的驱动; &nb
单例模式中的多线程分析 bijian1013 java thread 多线程 java多线程
谈到单例模式，我们立马会想到饿汉式和懒汉式加载，所谓饿汉式就是在创建类时就创建好了实例，懒汉式在获取实例时才去创建实例，即延迟加载。饿汉式： package com.bijian.study; public class Singleton { private Singleton() { } // 注意这是private 只供内部调用 private static
javascript读取和修改原型特别需要注意原型的读写不具有对等性 bijian1013 JavaScript prototype
对于从原型对象继承而来的成员，其读和写具有内在的不对等性。比如有一个对象A，假设它的原型对象是B，B的原型对象是null。如果我们需要读取A对象的name属性值，那么JS会优先在A中查找，如果找到了name属性那么就返回；如果A中没有name属性，那么就到原型B中查找name，如果找到了就返回；如果原型B中也没有
【持久化框架MyBatis3六】MyBatis3集成第三方DataSource bit1129 dataSource
MyBatis内置了数据源的支持，如： <environments default="development"> <environment id="development"> <transactionManager type="JDBC" /> <data
我程序中用到的urldecode和base64decode,MD5 bitcarter c MD5 base64decode urldecode
这里是base64decode和urldecode，Md5在附件中。因为我是在后台所以需要解码： string Base64Decode(const char* Data,int DataByte,int& OutByte) { //解码表 const char DecodeTable[] = { 0, 0, 0, 0, 0, 0
腾讯资深运维专家周小军：QQ与微信架构的惊天秘密 ronin47
社交领域一直是互联网创业的大热门，从PC到移动端，从OICQ、MSN到QQ。到了移动互联网时代，社交领域应用开始彻底爆发，直奔黄金期。腾讯在过去几年里，社交平台更是火到爆，QQ和微信坐拥几亿的粉丝，QQ空间和朋友圈各种刷屏，写心得，晒照片，秀视频，那么谁来为企鹅保驾护航呢？支撑QQ和微信海量数据背后的架构又有哪些惊天内幕呢？本期大讲堂的内容来自今年2月份ChinaUnix对腾讯社交网络运营服务中心
java-69-旋转数组的最小元素。把一个数组最开始的若干个元素搬到数组的末尾，我们称之为数组的旋转。输入一个排好序的数组的一个旋转，输出旋转数组的最小元素 bylijinnan java
public class MinOfShiftedArray { /** * Q69 旋转数组的最小元素 * 把一个数组最开始的若干个元素搬到数组的末尾，我们称之为数组的旋转。输入一个排好序的数组的一个旋转，输出旋转数组的最小元素。 * 例如数组{3, 4, 5, 1, 2}为{1, 2, 3, 4, 5}的一个旋转，该数组的最小值为1。 */ publ
看博客，应该是有方向的 Cb123456 反省看博客
看博客，应该是有方向的: 我现在就复习以前的，在补补以前不会的，现在还不会的，同时完善完善项目，也看看别人的博客. 我刚突然想到的: 1.应该看计算机组成原理，数据结构，一些算法，还有关于android,java的。 2.对于我，也快大四了，看一些职业规划的，以及一些学习的经验，看看别人的工作总结的. 为什么要写
[开源与商业]做开源项目的人生活上一定要朴素,尽量减少对官方和商业体系的依赖 comsci 开源项目
为什么这样说呢？因为科学和技术的发展有时候需要一个平缓和长期的积累过程，但是行政和商业体系本身充满各种不稳定性和不确定性，如果你希望长期从事某个科研项目，但是却又必须依赖于某种行政和商业体系，那其中的过程必定充满各种风险。。。所以，为避免这种不确定性风险，我
一个 sql优化（[精华] 一个查询优化的分析调整全过程！很值得一看） cwqcwqmax9 sql
见 http://www.itpub.net/forum.php?mod=viewthread&tid=239011 Web翻页优化实例提交时间: 2004-6-18 15:37:49 回复发消息环境： Linux ve
Hibernat and Ibatis dashuaifu Hibernate ibatis
Hibernate VS iBATIS 简介 Hibernate 是当前最流行的O/R mapping框架，当前版本是3.05。它出身于sf.net，现在已经成为Jboss的一部分了 iBATIS 是另外一种优秀的O/R mapping框架，当前版本是2.0。目前属于apache的一个子项目了。相对Hibernate“O/R”而言，iBATIS 是一种“Sql Mappi
备份MYSQL脚本 dcj3sjt126com mysql
#!/bin/sh # this shell to backup mysql #[email protected] (QQ:1413161683 DuChengJiu) _dbDir=/var/lib/mysql/ _today=`date +%w` _bakDir=/usr/backup/$_today [ ! -d $_bakDir ] && mkdir -p
iOS第三方开源库的吐槽和备忘 dcj3sjt126com ios
转自 ibireme的博客做iOS开发总会接触到一些第三方库，这里整理一下，做一些吐槽。目前比较活跃的社区仍旧是Github，除此以外也有一些不错的库散落在Google Code、SourceForge等地方。由于Github社区太过主流，这里主要介绍一下Github里面流行的iOS库。首先整理了一份 Github上排名靠
html wlwmanifest.xml eoems html xml
所谓优化wp_head()就是把从wp_head中移除不需要元素，同时也可以加快速度。步骤：加入到function.php remove_action('wp_head', 'wp_generator'); //wp-generator移除wordpress的版本号，本身blog的版本号没什么意义，但是如果让恶意玩家看到，可能会用官网公布的漏洞攻击blog remov
浅谈Java定时器发展 hacksin java 并发 timer 定时器
java在jdk1.3中推出了定时器类Timer,而后在jdk1.5后由Dou Lea从新开发出了支持多线程的ScheduleThreadPoolExecutor，从后者的表现来看，可以考虑完全替代Timer了。 Timer与ScheduleThreadPoolExecutor对比： 1. Timer始于jdk1.3,其原理是利用一个TimerTask数组当作队列
移动端页面侧边导航滑入效果 ini jquery Web html5 css javascirpt
效果体验：http://hovertree.com/texiao/mobile/2.htm可以使用移动设备浏览器查看效果。效果使用到jquery-2.1.4.min.js，该版本的jQuery库是用于支持HTML5的浏览器上，不再兼容IE8以前的浏览器，现在移动端浏览器一般都支持HTML5，所以使用该jQuery没问题。HTML文件代码： <!DOCTYPE html> <h
AspectJ+Javasist记录日志 kane_xie aspectj javasist
在项目中碰到这样一个需求，对一个服务类的每一个方法，在方法开始和结束的时候分别记录一条日志，内容包括方法名，参数名+参数值以及方法执行的时间。 @Override public String get(String key) { // long start = System.currentTimeMillis(); // System.out.println("Be
redis学习笔记 MJC410621 redis NoSQL
1)nosql数据库主要由以下特点：非关系型的、分布式的、开源的、水平可扩展的。 1，处理超大量的数据 2，运行在便宜的PC服务器集群上， 3，击碎了性能瓶颈。 1)对数据高并发读写。 2)对海量数据的高效率存储和访问。 3)对数据的高扩展性和高可用性。 redis支持的类型： Sring 类型 set name lijie get name lijie set na
使用redis实现分布式锁 qifeifei
在多节点的系统中，如何实现分布式锁机制，其中用redis来实现是很好的方法之一，我们先来看一下jedis包中，有个类名BinaryJedis,它有个方法如下： public Long setnx(final byte[] key, final byte[] value) { checkIsInMulti(); client.setnx(key, value); ret
BI并非万能，中层业务管理报表要另辟蹊径张老师的菜大数据 BI 商业智能信息化
BI是商业智能的缩写，是可以帮助企业做出明智的业务经营决策的工具，其数据来源于各个业务系统，如ERP、CRM、SCM、进销存、HER、OA等。 BI系统不同于传统的管理信息系统，他号称是一个整体应用的解决方案，是融入管理思想的强大系统：有着系统整体的设计思想，支持对所有
安装rvm后出现rvm not a function 或者ruby -v后提示没安装ruby的问题 wudixiaotie function
1.在~/.bashrc最后加入 [[ -s "$HOME/.rvm/scripts/rvm" ]] && source "$HOME/.rvm/scripts/rvm" 2.重新启动terminal输入： rvm use ruby-2.2.1 --default 把当前安装的ruby版本设为默