小丑鱼1127

HIVE函数集合（全）

HIVE函数集合

函数名	含义及实例
ABS	abs（x） - 返回x的绝对值示例： > SELECT abs（0）FROM src LIMIT 1; 0 > SELECT abs（-5）FROM src LIMIT 1; 五
ACOS	acos（x） - 如果-1 <= x <= 1则返回x的反余弦值，否则返回NULL 例如： > SELECT acos（1）FROM src LIMIT 1; 0 > SELECT acos（2）FROM src LIMIT 1;
ADD_MONTHS	add_months（start_date，num_months） - 返回start_date之后的num_months日期。 start_date是格式为'yyyy-MM-dd HH：mm：ss'或'yyyy-MM-dd'的字符串。num_months是一个数字。start_date的时间部分被忽略。示例： > SELECT add_months（'2009-08-31'，1）FROM src LIMIT 1; '2009-09-30'
AES_DECRYPT	aes_decrypt（输入二进制，密钥字符串/二进制） - 使用AES解密输入。 AES（高级加密标准）算法。可以使用128,192或256位的密钥长度。如果安装了Java Cryptography Extension（JCE）Unlimited Strength Jurisdiction Policy Files，则可以使用192和256位密钥。如果任一参数为NULL或密钥长度不是允许值之一，则返回值为NULL。示例：> SELECT aes_decrypt（unbase64（'y6Ss + zCYObpCbgfWfyNWTw =='），'1234567890123456'）; 'ABC'
AES_ENCRYPT	aes_encrypt（输入字符串/二进制，密钥字符串/二进制） - 使用AES加密输入。 AES（高级加密标准）算法。可以使用128,192或256位的密钥长度。如果安装了Java Cryptography Extension（JCE）Unlimited Strength Jurisdiction Policy Files，则可以使用192和256位密钥。如果任一参数为NULL或密钥长度不是允许值之一，则返回值为NULL。示例：> SELECT base64（aes_encrypt（'ABC'，'1234567890123456'））; 'y6Ss + zCYObpCbgfWfyNWTw =='
and	a1和a2和......以及 - 逻辑和
array	array（n0，n1 ...） - 使用给定元素创建数组
array_contains	array_contains（array，value） - 如果数组包含值，则返回TRUE。示例： > SELECT array_contains（array（1,2,3），2）FROM src LIMIT 1; 真正
ASCII	ascii（str） - 返回str的第一个字符的数值如果str为空则返回0;如果str为NULL，则返回NULL 示例： > SELECT ascii（'222'）FROM src LIMIT 1; 50 > SELECT ascii（2）FROM src LIMIT 1; 50
asin	asin（x） - 如果-1 <= x <= 1则返回x的反正弦，否则返回NULL 例如： > SELECT asin（0）FROM src LIMIT 1; 0 > SELECT asin（2）FROM src LIMIT 1; 空值
ASSERT_TRUE	assert_true（condition） - 如果'condition'不为真，则抛出异常。示例： > SELECT assert_true（x> = 0）FROM src LIMIT 1; 空值
atan	atan（x） - 返回x的atan（arctan）（x是弧度）示例： > SELECT atan（0）FROM src LIMIT 1; 0
avg	avg（x） - 返回一组数字的平均值
BASE64	base64（bin） - 将参数从二进制转换为base 64字符串
between	在[NOT] BETWEEN b和c之间 - 评估a是否在b和c之间
bin	bin（n） - 返回二进制 n中的n是BIGINT。如果n为NULL，则返回NULL。示例： > SELECT bin（13）FROM src LIMIT 1'1101'
bloom_filter	函数'bloom_filter'没有文档
bround	bround（x [，d]） - 使用HALF_EVEN舍入模式将x舍入到d小数位。银行家的四舍五入。该值四舍五入到最接近的偶数。也称为高斯舍入。示例： > SELECT bround（12.25,1）; 12.2
cardinality_violation	cardinality_violation（n0，n1 ...） - 引发基数违规
case	CASE a WHEN b THEN c [WHEN d THEN e]* [ELSE f] END - When a = b, returns c; when a = d, return e; else return f Example: SELECT CASE deptno WHEN 1 THEN Engineering WHEN 2 THEN Finance ELSE admin END, CASE zone WHEN 7 THEN Americas ELSE Asia-Pac END FROM emp_details
CBRT	cbrt（double） - 返回double值的立方根。示例： > SELECT cbrt（27.0）; 3.0
ceil	ceil（x） - 求小于x的最小整数同义词：ceiling 示例： > SELECT ceil（-0.1）FROM src LIMIT 1; 0 > SELECT ceil（5）FROM src LIMIT 1; 五
ceiling	ceiling（x） - 找到不小于x的最小整数同义词：ceil 例： > SELECT ceiling（-0.1）FROM src LIMIT 1; 0 > SELECT ceiling（5）FROM src LIMIT 1; 五
CHAR_LENGTH	char_length（str \| binary） - 返回str或二进制数据中的字符数别名：character_length 示例： > SELECT char_length（'HUX81'）FROM src LIMIT 1; 五
CHARACTER_LENGTH	character_length（str \| binary） - 返回str或二进制数据中的字符数别名：char_length 示例： > SELECT character_length（'HUX81'）FROM src LIMIT 1; 五
CHR	chr（str） - 将n中的n：[0,256]转换为ascii等价物作为varchar。如果n小于0则返回空字符串。如果n> 256，则返回chr（n％256）。示例： > SELECT chr（'48'）FROM src LIMIT 1; '0' > SELECT chr（'65'）FROM src LIMIT 1; '一个'
coalesce	coalesce（a1，a2，...） - 返回第一个非空参数示例： > SELECT coalesce（NULL，1，NULL）FROM src LIMIT 1; 1
collect_list	collect_list（x） - 返回具有重复项的对象列表
collect_set	collect_set（x） - 返回一组消除了重复元素的对象
compute_stats	compute_stats（x） - 返回一组基本类型值的统计摘要。
CONCAT	concat（str1，str2，... strN） - 返回str1，str2，... strN或concat（bin1，bin2，... binN）的串联 - 返回二进制数据bin1，bin2，...中的字节串联。 .. binN 如果任何参数为NULL，则返回NULL。示例： > SELECT concat（'abc'，'def'）FROM src LIMIT 1; 'ABCDEF'
CONCAT_WS	concat_ws（separator，[string \| array（string）] +） - 返回由分隔符分隔的字符串的串联。示例： > SELECT concat_ws（'。'，'www'，array（'facebook'，'com'））FROM src LIMIT 1; 'www.facebook.com'
context_ngrams	context_ngrams（expr，array ，k，pf）估计适合指定上下文的top-k最频繁的n-gram。第二个参数指定一个字符串，用于指定n-gram元素的位置，其中空值表示必须由n-gram元素填充的“空白”。主表达式必须是字符串数组或字符串数组数组，例如句子（）UDF的返回类型。第二个参数指定上下文 - 例如，数组（“i”，“love”，null） - 它将估计主表达式中“i love”短语后面的顶部“k”字。可选的第四个参数'pf'控制启发式使用的内存。值越大，精度越高，但要使用更多内存。用法示例： SELECT context_ngrams（句子（lower（review）），array（“i”，“love”，null，null），10）FROM电影会尝试确定“我爱”之后的10个最常见的双字短语自由形式自然语言电影评论数据库。
CONV	conv（num，from_base，to_base） - 将num从from_base转换为to_base 如果to_base为负数，则将num视为有符号整数，否则将其视为无符号整数。示例： > SELECT conv（'100'，2,10）FROM src LIMIT 1; '4' > SELECT conv（-10,16，-10）FROM src LIMIT 1; '16'
corr	corr（y，x） - 返回一组数字对之间的Pearson相关系数该函数将任意一对数字类型作为参数，并返回一个double。任何具有NULL的对都将被忽略。如果应用于空集：返回NULL。如果N * SUM（x * x）= SUM（x）* SUM（x）：返回NULL。如果N * SUM（y * y）= SUM（y）* SUM（y）：返回NULL。否则，它计算以下内容： COVAR_POP（x，y）/（STDDEV_POP（x）* STDDEV_POP（y））其中x和y都不为空， COVAR_POP是总体协方差， STDDEV_POP是总体标准差。
COS	cos（x） - 返回x的余弦值（x是弧度）示例： > SELECT cos（0）FROM src LIMIT 1; 1
count	count（*） - 返回检索到的行的总数，包括包含NULL值的行。 count（expr） - 返回提供的表达式为非NULL的行数。 count（DISTINCT expr [，expr ...]） - 返回提供的表达式唯一且非NULL的行数。
Covr_pop	covar_pop（x，y） - 返回一组数字对的总体协方差该函数将任意一对数字类型作为参数，并返回一个double。任何具有NULL的对都将被忽略。如果该函数应用于空集，则返回NULL 。否则，它计算以下内容：（SUM（x * y）-SUM（x）* SUM（y）/ COUNT（x，y））/ COUNT（x，y）其中x和y都不为空。
Covr_samp	covar_samp（x，y） - 返回一组数字对的样本协方差该函数将任意一对数字类型作为参数，并返回一个double。任何具有NULL的对都将被忽略。如果应用于空集：返回NULL。如果应用于具有单个元素的集合：将返回NULL。否则，它计算以下内容：（SUM（x * y）-SUM（x）* SUM（y）/ COUNT（x，y））/（COUNT（x，y）-1）其中x和y都不为null 。 1
CRC32	crc32（str或bin） - 计算字符串或二进制参数的循环冗余校验值并返回bigint值。示例： > SELECT crc32（'ABC'）; 2743272264 > SELECT crc32（binary（'ABC'））; 2743272264
create_union	create_union（tag，obj1，obj2，obj3，...） - 使用给定标记的对象创建一个联合示例： > SELECT create_union（1,1，“one”）FROM src LIMIT 1; 一
CUME_DIST	函数'cume_dist'没有文档
current_database	current_database（） - 当前使用数据库名称返回
current_database	current_date（） - 返回查询评估开始时的当前日期。同一查询中current_date的所有调用都返回相同的值。
CURRENT_TIMESTAMP	current_timestamp（） - 返回查询评估开始时的当前时间戳。同一查询中的current_timestamp的所有调用都返回相同的值
current_user	current_user（） - 返回当前用户名
DATE_ADD	date_add（start_date，num_days） - 返回start_date之后的num_days日期。 start_date是格式为'yyyy-MM-dd HH：mm：ss'或'yyyy-MM-dd'的字符串。num_days是一个数字。start_date的时间部分被忽略。示例： > SELECT date_add（'2009-07-30'，1）FROM src LIMIT 1; '2009-07-31'
date_format	date_format（date / timestamp / string，fmt） - 以日期格式fmt指定的格式将日期/时间戳/字符串转换为字符串值。支持的格式是SimpleDateFormat格式 - https://docs.oracle.com/javase/7/docs/api/java/text/SimpleDateFormat.html。第二个参数fmt应该是常量。示例：> SELECT date_format（'2015-04-08'，'y'）; '2015'
DATE_SUB	date_sub（start_date，num_days） - 返回start_date之前的num_days日期。 start_date是格式为'yyyy-MM-dd HH：mm：ss'或'yyyy-MM-dd'的字符串。num_days是一个数字。start_date的时间部分被忽略。示例： > SELECT date_sub（'2009-07-30'，1）FROM src LIMIT 1; '2009-07-29'
DATEDIFF	datediff（date1，date2） - 返回date1和date2之间的天数 date1和date2是格式为'yyyy-MM-dd HH：mm：ss'或'yyyy-MM-dd'的字符串。时间部分被忽略。如果date1早于date2，则结果为负。示例： > SELECT datediff（'2009-07-30'，'2009-07-31'）FROM src LIMIT 1; 1
day	day（param） - 返回日期/时间戳的月份日期或间隔的日期组件同义词：dayofmonth param可以是以下之一： 1。格式为'yyyy-MM-dd HH：mm：ss'的字符串或'yyyy-MM-dd'。 2.日期值 3.时间戳值 4.日间隔时间值示例： > SELECT day（'2009-07-30'）FROM src LIMIT 1; 三十
DAYOFMONTH	dayofmonth（param） - 返回日期/时间戳的月份日期或间隔的日期组成部分别名：day param可以是以下之一： 1。格式为'yyyy-MM-dd HH：mm：ss'的字符串或'yyyy-MM-dd'。 2.日期值 3.时间戳值 4.日间隔时间值示例： > SELECT dayofmonth（'2009-07-30'）FROM src LIMIT 1; 三十
dayofweek	dayofweek（param） - 返回日期/时间戳的星期几（1 =星期日，2 =星期一，...，7 =星期六） param可以是以下之一： 1。格式为'yyyy-MM的字符串-dd HH：mm：ss'或'yyyy-MM-dd'。 2.日期值 3.时间戳值示例： > SELECT dayofweek （'2009-07-30'）FROM src LIMIT 1; 五
decode	decode（bin，str） - 使用第二个参数字符集解码第一个参数字符集的可能选项是'US-ASCII'，'ISO-8859-1'， 'UTF-8'，'UTF-16BE'， 'UTF-16LE'和'UTF-16'。如果任一参数为null，则结果也将为null
degrees	degrees（x） - 将弧度转换为度数示例： > SELECT degrees（30）FROM src LIMIT 1; -1
DENSE_RANK	函数'dense_rank'没有文档
DIV	a div b - 将a除以b舍入为长整数示例： > SELECT 3 div 2 FROM src LIMIT 1; 1
e	e（） - 返回E 示例： > SELECT e（）FROM src LIMIT 1; 2.718281828459045
elt	elt（n，str1，str2，...） - 返回第n个字符串例如： > SELECT elt（1，'face'，'book'）FROM src LIMIT 1; '面对'
encode	encode（str，str） - 使用第二个参数字符集对第一个参数进行编码字符集的可能选项是“US-ASCII”，“ISO-8859-1”， “UTF-8”，“UTF-16BE”， 'UTF-16LE'和'UTF-16'。如果任一参数为null，则结果也将为null
ewah_bitmap	ewah_bitmap（expr） - 返回列的EWAH压缩位图表示。
ewah_bitmap_and	ewah_bitmap_and（b1，b2） - 返回EWAH压缩的位图，该位图是两个位图的按位AND。
ewah_bitmap_empty	ewah_bitmap_empty（bitmap） - 测试EWAH压缩位图是否全为零的谓词
ewah_bitmap_or	ewah_bitmap_or（b1，b2） - 返回EWAH压缩位图，该位图是两个位图的按位OR。
EXP	exp（x） - 返回e到x的幂的例子： > SELECT exp（0）FROM src LIMIT 1; 1
explode	explode（a） - 将数组a的元素分成多行，或将map的元素分成多个行和列
extract_union	extract_union（union [，tag]） - 递归地将联合分解为结构或简单地提取给定的标记。 > SELECT extract_union（{0：“foo”}）。tag_0 FROM src; foo > SELECT extract_union（{0：“foo”}）。tag_1 FROM src; null > SELECT extract_union（{0：“foo”}，0）FROM src; foo > SELECT extract_union（{0：“foo”}，1）FROM src; 空值
factorial	factorial（int） - 返回n阶乘。有效n为[0..20]。如果n超出[0..20]范围，则返回null。示例： > SELECT factorial（5）; 120
field	field（str，str1，str2，...） - 返回str1，str2，...列表中str的索引或0如果未找到则支持所有基元类型，使用str.equals（x）比较参数。如果str为NULL，则返回值为0。
FIND_IN_SET	find_in_set（str，str_array） - 返回str_array中str的第一个匹配项，其中str_array是逗号分隔的字符串。如果任一参数为null，则返回null。如果第一个参数有逗号，则返回0。示例： > SELECT find_in_set（'ab'，'abc，b，ab，c，def'）FROM src LIMIT 1; 3 > SELECT * FROM src1 WHERE NOT find_in_set（key，'311,128,345,956'）= 0; 311 val_311 128
FIRST_VALUE	函数'first_value'没有文档
floor	floor（x） - 查找不大于x的最大整数示例： > SELECT floor（-0.1）FROM src LIMIT 1; -1 > SELECT floor（5）FROM src LIMIT 1; 五
floor_day	floor_day（param） - 返回一天的时间戳粒度 param需要是一个时间戳值示例： > SELECT floor_day（CAST（'yyyy-MM-dd HH：mm：ss'AS TIMESTAMP））FROM src; yyyy-MM-dd 00:00:00
floor_hour	floor_hour（param） - 返回一小时的时间戳粒度 param需要是一个时间戳值示例： > SELECT floor_hour（CAST（'yyyy-MM-dd HH：mm：ss'AS TIMESTAMP））FROM src; yyyy-MM-dd HH：00：00
floor_minute	floor_minute（param） - 返回一分钟时间戳，粒度 param需要是一个时间戳值示例： > SELECT floor_minute（CAST（'yyyy-MM-dd HH：mm：ss'AS TIMESTAMP））FROM src; yyyy-MM-dd HH：mm：00
floor_month	floor_month（param） - 返回一个月的时间戳粒度 param需要是一个时间戳值示例： > SELECT floor_month（CAST（'yyyy-MM-dd HH：mm：ss'AS TIMESTAMP））FROM src; yyyy-MM-01 00:00:00
floor_quarter	floor_quarter（param） - 返回四分之一粒度 param的时间戳需要是一个时间戳值示例： > SELECT floor_quarter（CAST（'yyyy-MM-dd HH：mm：ss'AS TIMESTAMP））FROM src; yyyy-xx-01 00:00:00 5
floor_second	floor_second（param） - 返回第二个粒度参数的时间戳需要是时间戳值示例： > SELECT floor_second（CAST（'yyyy-MM-dd HH：mm：ss'AS TIMESTAMP））FROM src; yyyy-MM-dd HH：mm：ss
floor_week	floor_week（param） - 返回一周的时间戳粒度 param需要是一个时间戳值示例： > SELECT floor_week（CAST（'yyyy-MM-dd HH：mm：ss'AS TIMESTAMP））FROM src; yyyy-MM-xx 00:00:00
floor_year	floor_year（param） - 返回一年中的时间戳粒度 param需要是一个时间戳值示例： > SELECT floor_year（CAST（'yyyy-MM-dd HH：mm：ss'AS TIMESTAMP））FROM src; yyyy-01-01 00:00:00
format_number	format_number（X，D或F） - 将数字X格式化为'＃，###，###。##'等格式，舍入到D小数位，或者使用指定格式F格式化，并返回结果作为字符串。如果D为0，则结果没有小数点或小数部分。这应该像MySQL的FORMAT 示例： > SELECT format_number（12332.123456,4）FROM src LIMIT 1; '12,332.1235' > SELECT format_number（12332.123456，'##################。###'）FROM src LIMIT 1; '12332.123'
FROM_UNIXTIME	from_unixtime（unix_time，format） - 以指定的格式返回unix_time 示例： > SELECT from_unixtime（0，'yyyy-MM-dd HH：mm：ss'）FROM src LIMIT 1; '1970-01-01 00:00:00'
from_utc_timestamp	from_utc_timestamp（timestamp，string timezone） - 假设给定的时间戳是UTC并转换为给定的时区（从Hive 0.8.0开始）
get_json_object	get_json_object（json_txt，path） - 从路径中提取json对象从基于指定的json路径的json字符串中提取json对象，并返回提取的json对象的json字符串。如果输入json字符串无效，它将返回null。支持的JSONPath限制版本： $：Root对象。：子运算符 []：数组 *的下标运算符：[] 不支持的通配符值得注意： ''：作为键的零长度字符串 ..：递归下降＆amp;＃064; ：当前对象/元素（）：脚本表达式？（）：过滤器（脚本）表达式。 [，]：联盟运营商 [start：end：step]：数组切片运算符
get_splits	get_splits（string，int） - 返回引用的表字符串的长度为int serialized的数组。
maximum	maximum（v1，v2，...） - 返回值列表中的最大值示例： > SELECT maximum（2,3,1）FROM src LIMIT 1; 3
grouping	grouping（a，b） - 指示是否聚合指定的列表达式。返回1表示聚合，0表示未聚合。 a是分组ID，b是我们要提取的索引
hash	hash（a1，a2，...） - 返回参数的哈希值
hex	hex（n，bin或str） - 将参数转换为十六进制如果参数是字符串，则为字符串中的每个字符返回两个十六进制数字。如果参数是数字或二进制，则返回十六进制表示。示例： > SELECT hex（17）FROM src LIMIT 1; 'H1' > SELECT hex（'Facebook'）FROM src LIMIT 1; '46616365626F6F6B'
histogram_numeric	histogram_numeric（expr，nb） - 使用nb bin计算数字'expr'的直方图。示例： > SELECT histogram_numeric（val，3）FROM src; [{ “×”：100， “Y”：14.0}，{ “×”：200， “Y”：22.0}，{ “×”：290.5， “Y”：11.0}] 返回值是表示直方图区间中心的（x，y）对数组。随着'nb'的值增加，直方图近似得到更细粒度，但可能会产生异常值周围的伪影。在实践中，20-40个直方图箱似乎运行良好，倾斜或较小的数据集需要更多的箱。请注意，此函数会创建一个具有非均匀bin宽度的直方图。它不能保证直方图的均方误差，但实际上与R / S-Plus统计计算包产生的直方图相当。
hour	hour（param） - 返回字符串/ timestamp / interval的小时组件 param可以是以下之一： 1。格式为'yyyy-MM-dd HH：mm：ss'或'HH：mm：ss'的字符串。 2.时间戳值 3.日间隔值示例： > SELECT hour（'2009-07-30 12:58:59'）FROM src LIMIT 1; 12 > SELECT hour（'12：58：59'） from src LIMIT 1; 12
if	IF（expr1，expr2，expr3） - 如果expr1为TRUE（expr1 <> 0且expr1 <> NULL）则IF（）返回expr2; 否则返回expr3。IF（）返回数值或字符串值，具体取决于使用它的上下文。
test in	test in（val1，val2 ...） - 如果test等于任何valN，则返回true
in_bloom_filter
in_file中	in_file（str，filename） - 如果str出现在文件中，则返回true
index	index（a，n） - 返回a的第n个元素
INITCAP	initcap（str） - 返回str，每个单词的第一个字母用大写字母表示，所有其他字母用小写字母表示。单词由空格分隔。示例： > SELECT initcap（'tHe soap'）FROM src LIMIT 1; '肥皂'
inline	inline（ARRAY（STRUCT（）[，STRUCT（）] - 将数据和结构分解为表
INSTR	instr（str，substr） - 返回str中第一次出现substr的索引例如： > SELECT instr（'Facebook'，'boo'）FROM src LIMIT 1; 五
internal_interval	internal_interval（intervalType，intervalArg）此方法不是设计用于直接调用它 - 它为'INTERVAL（intervalArg）intervalType'构造提供内部支持
isnotnull	isnotnull a - 如果a不为NULL则返回true，否则返回false
isnull a	isnull a - 如果a为NULL则返回true，否则返回false
java_method	java_method（class，method [，arg1 [，arg2 ..]]）使用反射调用方法同义词：reflect 使用此UDF通过匹配参数签名来调用Java方法
json_tuple	json_tuple（jsonStr，p1，p2，...，pn） - 与get_json_object类似，但它需要多个名称并返回一个元组。所有输入参数和输出列类型都是字符串。函数类：org.apache.hadoop.hive.ql.udf.generic.GenericUDTFJSONTuple
LAG	LAG（scalar_expression [，offset] [，default]）OVER（[query_partition_clause] order_by_clause）; LAG函数用于访问前一行的数据。示例：选择p1.p_mfgr，p1.p_name，p1.p_size， p1.p_size - lag（p1.p_size，1，p1.p_size）over（由p1.p_mfgr按p1.p_name排序）作为deltaSz 从part p1 join p1.p_partkey = p2.p_partkey上的p2部分
last_day	last_day（date） - 返回日期所属月份的最后一天。 date是格式为'yyyy-MM-dd HH：mm：ss'或'yyyy-MM-dd'的字符串。日期的时间部分被忽略。示例： > SELECT last_day（'2009-01-12'）FROM src LIMIT 1; '2009-01-31'
LAST_VALUE
LCASE	lcase（str） - 返回str，所有字符都改为小写同义词：lower 示例： > SELECT lcase（'Facebook'）FROM src LIMIT 1; “Facebook的
lead	LEAD（scalar_expression [，offset] [，default]）OVER（[query_partition_clause] order_by_clause）; LEAD函数用于从下一行返回数据。示例：选择p_name，p_retailprice，lead（p_retailprice）over（）为l1， lag（p_retailprice）over（）为l2 ，其中p_retailprice = 1173.15
least	least（v1，v2，...） - 返回值列表中的最小值示例： > SELECT least（2,3,1）FROM src LIMIT 1; 1
length	length（str \| binary） - 返回str的长度或二进制数据中的字节数示例： > SELECT length（'Facebook'）FROM src LIMIT 1; 8
levenshtein	levenshtein（str1，str2） - 该函数计算两个弦之间的Levenshtein距离。 Levenshtein距离是用于测量两个序列之间差异的字符串度量。非正式地，两个单词之间的Levenshtein距离是将一个单词改为另一个单词所需的单字符编辑（即插入，删除或替换）的最小数量。它以弗拉基米尔·莱文斯坦（Vladimir Levenshtein）的名字命名，他在1965年考虑过这个距离。例如：>选择levenshtein（'小猫'，'坐着'）; 3
like	like（str，pattern） - 检查str是否匹配模式示例： > SELECT a.* FROM srcpart a WHERE a.hr like'％2'LIMIT 1; 27 val_27 2008-04-08 12
LN	ln（x） - 返回x的自然对数示例： > SELECT ln（1）FROM src LIMIT 1; 0
locate	locate（substr，str [，pos]） - 返回位置pos后str中第一次出现substr的位置示例： > SELECT locate（'bar'，'foobarbar'，5）FROM src LIMIT 1; 7
log	log（[b]，x） - 返回x与base b的对数示例： > SELECT log（13,13）FROM src LIMIT 1; 1
LOG10	log10（x） - 返回x的基数为10的对数示例： > SELECT log10（10）FROM src LIMIT 1; 1
LOG2	log2（x） - 返回x的基数为2的对数示例： > SELECT log2（2）FROM src LIMIT 1; 1
LOGGED_IN_USER	logged_in_user（） - 返回登录的用户名 SessionState GetUserName - 会话初始化时提供的用户名
lower	lower（str） - 返回str，所有字符都改为小写同义词：lcase 示例： > SELECT lower（'Facebook'）FROM src LIMIT 1; “Facebook的
LPAD	lpad（str，len，pad） - 返回str，左边用pad填充长度为len 如果str长于len，则返回值缩短为len个字符。如果是空填充字符串，则返回值为null。示例： > SELECT lpad（'hi'，5，'??'）FROM src LIMIT 1; '??? hi' > SELECT lpad（'hi'，1，'??'）FROM src LIMIT 1; 'h' > SELECT lpad（'hi'，5，''）FROM src LIMIT 1; 空值
LTRIM	ltrim（str） - 从str中删除前导空格字符例如： > SELECT ltrim（'facebook'）FROM src LIMIT 1; “Facebook的
lower	lower（key0，value0，key1，value1 ...） - 创建具有给定键/值对的映射
map_keys	map_keys（map） - 返回包含输入映射键的无序数组
map_values	map_values（map） - 返回包含输入映射值的无序数组。
mask	掩盖给定值示例： mask（ccn） mask（ccn，'X'，'x'，'0'） mask（ccn，'x'，'x'，'x'）参数： mask（value，upperChar， lowerChar，digitChar，otherChar，numberChar，dayValue，monthValue，yearValue） value - 要屏蔽的值。支持的类型：TINYINT，SMALLINT，INT，BIGINT，STRING，VARCHAR，CHAR，DATE upperChar - 用大写字符替换大写字符的字符。指定-1以保留原始字符。默认值：' X'lowerChar - 用小写替换小写字符的字符。指定-1以保留原始字符。默认值：'x' digitChar - 用数字字符替换的字符。指定-1以保留原始字符。默认值：' n'otherChar - 用其替换所有其他字符的字符。指定-1以保留原始字符。默认值：-1 numberChar - 用数字替换数字的字符。有效值：0-9。默认值：' 1'dayValue - 用日期替换日期字段的值。指定-1以保留原始值。有效值：1-31。默认值：1 monthValue - 用日期替换日期中的月份字段的值。指定-1以保留原始值。有效值：0-11。默认值：0 yearValue - 用日期替换年份字段的值。指定-1以保留原始值。默认值：0
mask_first_n	掩盖值的前n个字符示例： mask_first_n（ccn，8） mask_first_n（ccn，8，'x'，'x'，'x'）参数： mask（value，charCount，upperChar，lowerChar，digitChar，otherChar， numberChar） value - 要屏蔽的值。支持的类型：TINYINT，SMALLINT，INT，BIGINT，STRING，VARCHAR，CHAR charCount - 字符数。默认值：4 upperChar - 用大写字符替换大写字符的字符。指定-1以保留原始字符。默认值：' X'lowerChar - 用小写替换小写字符的字符。指定-1以保留原始字符。默认值：'x' digitChar - 用数字字符替换的字符。指定-1以保留原始字符。默认值：' n'otherChar - 用其替换所有其他字符的字符。指定-1以保留原始字符。默认值：-1 numberChar - 用数字替换数字的字符。有效值：0-9。默认值：'1'
mask_hash	返回给定值的哈希值示例： mask_hash（value）参数： value - 要掩码的值。支持的类型：STRING，VARCHAR，CHAR
mask_last_n	屏蔽值的最后n个字符示例： mask_last_n（ccn，8） mask_last_n（ccn，8，'x'，'x'，'x'）参数： mask_last_n（value，charCount，upperChar，lowerChar，digitChar，otherChar， numberChar） value - 要屏蔽的值。支持的类型：TINYINT，SMALLINT，INT，BIGINT，STRING，VARCHAR，CHAR charCount - 字符数。默认值：4 upperChar - 用大写字符替换大写字符的字符。指定-1以保留原始字符。默认值：' X'lowerChar - 用小写替换小写字符的字符。指定-1以保留原始字符。默认值：'x' digitChar - 用数字字符替换的字符。指定-1以保留原始字符。默认值：' n'otherChar - 用其替换所有其他字符的字符。指定-1以保留原始字符。默认值：-1 numberChar - 用数字替换数字的字符。有效值：0-9。默认值：'1'
mask_show_first_n	掩码除了值的前n个字符以外的所有字符示例： mask_show_first_n（ccn，8） mask_show_first_n（ccn，8，'x'，'x'，'x'）参数： mask_show_first_n（value，charCount，upperChar，lowerChar，digitChar，otherChar ，numberChar） value - 要屏蔽的值。支持的类型：TINYINT，SMALLINT，INT，BIGINT，STRING，VARCHAR，CHAR charCount - 字符数。默认值：4 upperChar - 用大写字符替换大写字符的字符。指定-1以保留原始字符。默认值：' X'lowerChar - 用小写替换小写字符的字符。指定-1以保留原始字符。默认值：'x' digitChar - 用数字字符替换的字符。指定-1以保留原始字符。默认值：' n'otherChar - 用其替换所有其他字符的字符。指定-1以保留原始字符。默认值：-1 numberChar - 用数字替换数字的字符。有效值：0-9。默认值：'1'
mask_show_last_n	掩码除了值的最后n个字符之外的所有例子： mask_show_last_n（ccn，8） mask_show_last_n（ccn，8，'x'，'x'，'x'）参数： mask_show_last_n（value，charCount，upperChar，lowerChar，digitChar，otherChar ，numberChar） value - 要屏蔽的值。支持的类型：TINYINT，SMALLINT，INT，BIGINT，STRING，VARCHAR，CHAR charCount - 字符数。默认值：4 upperChar - 用大写字符替换大写字符的字符。指定-1以保留原始字符。默认值：' X'lowerChar - 用小写替换小写字符的字符。指定-1以保留原始字符。默认值：'x' digitChar - 用数字字符替换的字符。指定-1以保留原始字符。默认值：' n'otherChar - 用其替换所有其他字符的字符。指定-1以保留原始字符。默认值：-1 numberChar - 用数字替换数字的字符。有效值：0-9。默认值：'1'
matchpath
max	max（expr） - 返回expr的最大值
MD5	md5（str或bin） - 为字符串或二进制文件计算MD5 128位校验和。该值以32个十六进制数字的字符串形式返回，如果参数为NULL，则返回NULL。示例： > SELECT md5（'ABC'）; '902fbdd2b1df0c4f70b4a5d23525e932' > SELECT md5（二进制（'ABC'））; '902fbdd2b1df0c4f70b4a5d23525e932'
min	min（expr） - 返回expr的最小值
minute	minute（param） - 返回字符串/ timestamp / interval的分钟组件 param可以是以下之一： 1。格式为'yyyy-MM-dd HH：mm：ss'或'HH：mm：ss'的字符串。 2.时间戳值 3.日间隔值示例： > SELECT分钟（'2009-07-30 12:58:59'）FROM src LIMIT 1; 58 > SELECT分钟（'12：58：59'）from src LIMIT 1; 58
mod	a mod b - 当除以b时返回余数同义词：％
month	month（param） - 返回日期/时间戳/间隔的月份组件 param可以是以下之一： 1。格式为'yyyy-MM-dd HH：mm：ss'或'yyyy-MM-dd'的字符串。 2.日期值 3.时间戳值 4.年 - 月间隔值示例： > SELECT月（'2009-07-30'）FROM src LIMIT 1; 7
MONTHS_BETWEEN	months_between（date1，date2，roundOff） - 返回date1和date2之间的月数。如果date1晚于date2，则结果为正。如果date1早于date2，则结果为负数。如果date1和date2是该月的同一天或两个月的最后几天，则结果始终为整数。否则，UDF将根据31天的月份计算结果的小数部分，并考虑时间组件date1和date2的差异。 date1和date2类型可以是日期，时间戳或字符串，格式为'yyyy-MM-dd'或'yyyy-MM-dd HH：mm：ss'。结果默认舍入为8位小数。否则设置roundOff = false。示例： > SELECT months_between（'1997-02-28 10:30:00'，' 3.94959677
named_struct	named_struct（name1，val1，name2，val2，...） - 使用给定的字段名称和值创建结构
negative	negative a - 返回-a
next_day	next_day（start_date，day_of_week） - 返回晚于start_date并按指示命名的第一个日期。 start_date是格式为'yyyy-MM-dd HH：mm：ss'或'yyyy-MM-dd'的字符串。day_of_week是星期几（例如，Mo，星期五，星期五）。例如： > SELECT next_day（'2015-01-14'，'TU'）FROM src LIMIT 1; “2015年1月20日”
ngrams	ngrams（expr，n，k，pf） - 估计由字符串序列组成的行中的前k个n-gram，表示为字符串数组或字符串数组数组。'pf'是一个可选的精度因子，用于控制内存使用量。参数'n'指定估计什么类型的n-gram。Unigrams是n = 1，并且bigrams是n = 2.通常，n不会大于约5.'k'参数指定UDAF将返回多少个最高频率的n-gram。可选的精度因子'pf'指定用于估计的内存量; 更多的内存将提供更准确的频率计数，但可能会使JVM崩溃。默认值为20，内部保持20 * k n-gram，但仅返回k个最高频率的值。输出是一组具有前n个n-gram的结构。爆炸（）这个UDAF的输出可能很方便。
noop
noopstreaming
noopwithmap
noopwithmapstreaming
not	not a - 逻辑而不是同义词：！
ntile
NULLIF	SELECT nullif（1,1），nullif（1,2）
NVL	nvl（value，default_value） - 如果value为null则返回默认值，否则返回value 示例： > SELECT nvl（null，'bla'）FROM src LIMIT 1; BLA
OCTET_LENGTH	octet_length（str \| binary） - 返回str或二进制数据中的字节数示例： > SELECT octet_length（'HUX8 '）FROM src LIMIT 1; 15
or	a1或a2或......或 - 逻辑或
parse_url	parse_url（url，partToExtract [，key]） - 从URL中提取部件：HOST，PATH，QUERY，REF，PROTOCOL，AUTHORITY，FILE，USERINFO 键指定要提取的查询示例： > SELECT parse_url（'http：/ /facebook.com/path/p1.php?query=1'，'HOST'）FROM src LIMIT 1; 'facebook.com' > SELECT parse_url（'http://facebook.com/path/p1.php?query=1'，'QUERY'）from src LIMIT 1; 'query = 1' > SELECT parse_url（'http://facebook.com/path/p1.php?query=1'，'QUERY'，'query'）FROM src LIMIT 1; '1'
parse_url_tuple	parse_url_tuple（url，partname1，partname2，...，partnameN） - 从URL中提取N（N> = 1）个部分。它需要一个URL和一个或多个部件名，并返回一个元组。所有输入参数和输出列类型都是字符串。部件名称：HOST，PATH，QUERY，REF，PROTOCOL，AUTHORITY，FILE，USERINFO，QUERY：注意：部件名区分大小写，不应包含不必要的空格。示例： > SELECT b。* FROM src LATERAL VIEW parse_url_tuple（fullurl，'HOST'，'PATH'，'QUERY'，'QUERY：id'）b as host，path，query，query_id LIMIT 1; > SELECT parse_url_tuple（a.fullurl，'HOST'，'PATH'，'QUERY'，'REF'，'PROTOCOL'，'FILE'，'AUTHORITY'，'
PERCENT_RANK
percentile	percentile（expr，pc） - 返回pc上expr的百分位数（范围：[0,1]）。pc可以是double或double数组
percentile_approx	percentile_approx（expr，pc，[nb]） - 对于非常大的数据，使用可选参数[nb]作为要使用的直方图区间数，从直方图计算近似百分位数值。较高的nb值导致更准确的近似，代价是更高的内存使用量。 'expr'可以是任何数字列，包括双精度和浮点数，'pc'可以是具有请求百分位数的单个double / float，也可以是具有多个百分位数的double / float数组。如果未指定'nb'，则默认近似值使用10,000个直方图区间，这意味着如果'expr'中有10,000个或更少的唯一值，则可以获得精确的结果。百分位数（）函数总是计算精确百分位数，如果列中有太多唯一值，则可能会耗尽内存，这就需要此功能。示例（使用更精细的直方图近似请求三个百分位数）： > SELECT percentile_approx（val，array（0.5,0.95,0.98），100000）FROM somedata; [0.05,1.64,2.26]
pi	pi（） - 返回pi 示例： > SELECT pi（）FROM src LIMIT 1; 3.14159 ...
PMOD	a pmod b - 计算正模数
posexplode	posexplode（a） - 表现得像数组爆炸，但包括原始数组中项目的位置
positive	positive a - 返回a
POW	pow（x1，x2） - 将x1提升到x2的幂。同义词：power 例如： > SELECT pow（2,3）FROM src LIMIT 1; 8
power	power（x1，x2） - 将x1提升到x2的幂。同义词：pow 示例： > SELECT power（2,3）FROM src LIMIT 1; 8
printf	printf（String format，Obj ... args） - 可以根据printf样式格式字符串格式化字符串的函数示例： > SELECT printf（“Hello World％d％s”，100，“days”）FROM src LIMIT 1; “Hello World 100天”
quarter	quarter（date / timestamp / string） - 返回日期的季度，范围为1到4. 示例：> SELECT quarter（'2015-04-08'）; 2
radians	radians（x） - 将度数转换为弧度例如： > SELECT radians（90）FROM src LIMIT 1; 1.5707963267949mo
rand	rand（[seed]） - 返回0到1之间的伪随机数
rank
reflect	reflect（class，method [，arg1 [，arg2 ..]]）使用反射调用方法同义词：java_method 使用此UDF通过匹配参数签名来调用Java方法
reflect2	reflect2（arg0，method [，arg1 [，arg2 ..]]）使用反射调用arg0的方法使用此UDF通过匹配参数签名来调用Java方法
regexp	str regexp regexp - 如果str匹配regexp则返回true，否则返回false 同义词：rlike 示例： > SELECT'fb'reexx ''*'FROM src LIMIT 1; 真正
REGEXP_EXTRACT	regexp_extract（str，regexp [，idx]） - 提取与regexp匹配的组示例： > SELECT regexp_extract（'100-200'，'（\ d +） - （\ d +）'，1）FROM src LIMIT 1; '100'
REGEXP_REPLACE	regexp_replace（str，regexp，rep） - 将与regexp匹配的str的所有子串替换为rep 示例： > SELECT regexp_replace（'100-200'，'（\ d +）'，'num'）FROM src LIMIT 1; 'NUM-NUM'
REGR_AVGX	egr_avgx（y，x） - 计算自变量的平均值。该函数将任意一对数字类型作为参数，并返回一个double。任何具有NULL的对都将被忽略。如果应用于空集：返回NULL。否则，它计算以下内容： AVG（X）
REGR_AVGY	regr_avgy（y，x） - 计算因变量的平均值。该函数将任何一对数字类型作为参数，并返回一个double。任何具有NULL的对都将被忽略。如果应用于空集：返回NULL。否则，它会计算以下内容： AVG（Y）
REGR_COUNT	regr_count（y，x） - 返回非空对的数量该函数将任何一对数字类型作为参数，并返回long。任何具有NULL的对都将被忽略。
REGR_INTERCEPT	regr_intercept（y，x） - 返回回归线的y轴截距。该函数将任何一对数字类型作为参数，并返回一个double。任何具有NULL的对都将被忽略。如果应用于空集：返回NULL。如果N * SUM（x * x）= SUM（x）* SUM（x）：返回NULL。否则，它计算以下内容：（SUM（y）* SUM（x * x）-SUM（X）* SUM（x * y））/（N * SUM（x * x）-SUM（x）* SUM（ X））
REGR_R2	regr_r2（y，x） - 返回回归线的确定系数（也称为R平方或拟合度）。该函数将任何一对数字类型作为参数，并返回一个double。任何具有NULL的对都将被忽略。如果应用于空集：返回NULL。如果N * SUM（x * x）= SUM（x）* SUM（x）：返回NULL。如果N * SUM（y * y）= SUM（y）* SUM（y）：返回1。否则，它计算以下内容： POWER（N * SUM（x * y）-SUM（x）* SUM（y），2）/（（N * SUM（x * x）-SUM（x）* SUM（x ））（N SUM（y * y）-SUM（y）* SUM（y）））
REGR_SLOPE	regr_slope（y，x） - 返回线性回归线的斜率该函数将任意一对数字类型作为参数，并返回一个double。任何具有NULL的对都将被忽略。如果应用于空集：返回NULL。如果N * SUM（x * x）= SUM（x）* SUM（x）：返回NULL（拟合将是垂直的）。否则，它计算如下：（N * SUM（x * y）-SUM（x）* SUM（y））/（N * SUM（x * x）-SUM（x）* SUM（x））
REGR_SXX	regr_sxx（y，x） - 辅助分析函数该函数将任何一对数字类型作为参数，并返回一个double。任何具有NULL的对都将被忽略。如果应用于空集：返回NULL。否则，它计算以下内容： SUM（x * x）-SUM（x）* SUM（x）/ N.
REGR_SXY	regr_sxy（y，x） - 返回一个值，该值可用于评估回归模型的统计有效性。该函数将任何一对数字类型作为参数，并返回一个double。任何具有NULL的对都将被忽略。如果应用于空集：返回NULL。如果N * SUM（x * x）= SUM（x）* SUM（x）：返回NULL。否则，它计算以下内容： SUM（x * y）-SUM（x）* SUM（y）/ N.
REGR_SYY	regr_syy（y，x） - 辅助分析函数该函数将任何一对数字类型作为参数，并返回一个double。任何具有NULL的对都将被忽略。如果应用于空集：返回NULL。否则，它计算以下内容： SUM（y * y）-SUM（y）* SUM（y）/ N.
repeat	repeat（str，n） - 重复str n次示例： > SELECT repeat（'123'，2）FROM src LIMIT 1; '123123'
replace	replace（str，search，rep） - 将'search'与'rep'匹配的所有子串替换为'rep' 示例： > SELECT replace（'Hack and Hue'，'H'，'BL'）FROM src LIMIT 1; 'BLACK和BLUE'
replicate_rows	replicate_rows（n，cols ...） - 将1行变为n行
reverse	reverse（str） - reverse str 示例： > SELECT reverse（'Facebook'）FROM src LIMIT 1; 'koobecaF'
RLIKE	str rlike regexp - 如果str匹配regexp则返回true，否则返回false 别名：regexp 示例： > SELECT'fb'rlike'。*'FROM src LIMIT 1; 真正
round	round（x [，d]） - 舍入x到d小数位示例： > SELECT round（12.3456,1）FROM src LIMIT 1; 12.3'
ROW_NUMBER
RPAD	rpad（str，len，pad） - 返回str，右边填充pad，长度为len 如果str长于len，则返回值缩短为len个字符。如果是空填充字符串，则返回值为null。示例： > SELECT rpad（'hi'，5，'??'）FROM src LIMIT 1; “喜???” > SELECT rpad（'hi'，1，'??'）FROM src LIMIT 1; 'h' > SELECT rpad（'hi'，5，''）FROM src LIMIT 1; 空值
RTRIM	rtrim（str） - 从str中删除尾随空格字符例如： > SELECT rtrim（'facebook'）FROM src LIMIT 1; “Facebook的
second	second（date） - 返回字符串/ timestamp / interval的第二个组成部分 param可以是以下之一： 1。格式为'yyyy-MM-dd HH：mm：ss'或'HH：mm：ss'的字符串。 2.时间戳值 3.日间隔值示例： > SELECT second（'2009-07-30 12:58:59'）FROM src LIMIT 1; 59 > SELECT second（'12：58：59'）FROM src LIMIT 1; 59
sentences	sentences（str，lang，country） - 将str拆分成句子数组，其中每个句子都是一个单词数组。'lang'和'country'参数是可选的，如果省略，则使用默认语言环境。例如： > SELECT句子（'你好！我是UDF。'）FROM src LIMIT 1; [[“Hello”，“there”]，[“I”，“am”，“a”，“UDF”]] > SELECT句子（评论，语言）FROM movies; 不必要的标点符号（例如英语中的句点和逗号）会自动删除。如果指定，'lang'应该是两个字母的ISO-639语言代码（例如'en'），'country'应该是两个字母的ISO-3166代码（例如'us'）。并非所有国家/地区和语言代码都受到完全支持，如果指定了不受支持的代码，则使用默认语言环境来处理该字符串。
sha	sha（str或bin） - 计算字符串或二进制的SHA-1摘要，并将值作为十六进制字符串返回。别名：sha1 例如： > SELECT sha（'ABC'）; '3c01bdbb26f358bab27f267924aa2c9a03fcfdb8' > SELECT sha（binary（'ABC'））; '3c01bdbb26f358bab27f267924aa2c9a03fcfdb8'
sha1	sha1（str或bin） - 计算字符串或二进制的SHA-1摘要，并将值作为十六进制字符串返回。别名：sha 示例： > SELECT sha1（'ABC'）; '3c01bdbb26f358bab27f267924aa2c9a03fcfdb8' > SELECT sha1（二进制（'ABC'））; '3c01bdbb26f358bab27f267924aa2c9a03fcfdb8'
SHA2	sha2（string / binary，len） - 计算SHA-2系列散列函数（SHA-224，SHA-256，SHA-384和SHA-512）。第一个参数是要进行哈希处理的字符串或二进制文件。第二个参数表示结果的所需位长度，其值必须为224,256,384,512或0（相当于256）。从Java 8开始支持SHA-224。如果任一参数为NULL或散列长度不是允许值之一，则返回值为NULL。示例：> SELECT sha2（'ABC'，256）; 'b5d4045c3f466fa91fe2cc6abe79232a1a57cdf104f7a26e716e0a1e2789df78'
shiftleft	shiftleft（a，b） - 按位左移为tinyint，smallint和int a返回int。返回bigint的bigint a。示例： > SELECT shiftleft（2,1）; 4
shiftright	shiftright（a，b） - 按位右移为tinyint，smallint和int a返回int。返回bigint的bigint a。示例： > SELECT shiftright（4,1）; 2
shiftrightunsigned	shiftrightunsigned（a，b） - 按位无符号右移为tinyint，smallint和int a返回int。返回bigint的bigint a。示例： > SELECT shiftrightunsigned（4,1）; 2
sign	sign（x） - 返回x的符号示例： > SELECT sign（40）FROM src LIMIT 1; 1
sin	sin（x） - 返回x的正弦值（x以弧度表示）例如： > SELECT sin（0）FROM src LIMIT 1; 0
size	size（a） - 返回a的大小
sort_array	sort_array（array（obj1，obj2，...）） - 根据数组元素的自然顺序按升序对输入数组进行排序。示例： > SELECT sort_array（array（'b'，'d'，'c'，'a'））FROM src LIMIT 1; 'A B C D'
sort_array_by	sort_array_by（array（obj1，obj2，...），'f1'，'f2'，...，['ASC'，'DESC']） - 按用户指定的顺序（ASC，DESC）对输入元组数组进行排序by desired field [s] name如果用户未提及排序顺序，则dafault排序顺序为升序示例： > SELECT sort_array_by（array（struct（'g'，100），struct（'b'，200）），'col1 '，'ASC'） from src LIMIT 1; 阵列（结构（ 'B'，200），结构（ 'G'，100））
soundex	soundex（string） - 返回字符串的soundex代码。 soundex代码由名称的第一个字母后跟三个数字组成。示例： > SELECT soundex（'Miller'）; M460
space	space（n） - 返回n个空格示例： > SELECT space（2）FROM src LIMIT 1; ''
split	split（str，regex） - Splits str匹配正则表达式的匹配示例： > SELECT split（'oneAtwoBthreeC'，'[ABC]'）FROM src LIMIT 1; [“一二三”]
sq_count_check	sq_count_check（x） - 对标量子查询表达式进行内部检查，以确保返回最多一行仅供内部使用
sqrt	sqrt（x） - 返回x的平方根示例： > SELECT sqrt（4）FROM src LIMIT 1; 2
stack	stack（n，cols ...） - 将k列转换为n行，每行大小为k / n
STD	std（x） - 返回一组数字的标准偏差别名：stddev，stddev_pop
STDDEV	stddev（x） - 返回一组数字的标准偏差别名：std，stddev_pop
STDDEV_POP	stddev_pop（x） - 返回一组数字的标准偏差别名：std，stddev
STDDEV_SAMP	stddev_samp（x） - 返回一组数字的样本标准差
str_to_map	str_to_map（text，delimiter1，delimiter2） - 通过解析文本使用两个分隔符将文本拆分为键值对来创建映射。第一个分隔符分隔对，第二个分隔符分配键和值。如果只给出一个参数，则使用默认分隔符：'，'作为delimiter1，'：'作为delimiter2。
struct	struct（col1，col2，col3，...） - 使用给定的字段值创建结构
SUBSTR	substr（str，pos [，len]） - 返回str的子字符串，该字符串以pos开头并且长度为len orsubstr（bin，pos [，len]） - 返回以pos开头且长度为的字节数组的片段len 同义词：substring pos是一个基于1的索引。如果pos <0，则通过从str的结尾向后计数来确定起始位置。示例： > SELECT substr（'Facebook'，5）FROM src LIMIT 1; 'book' > SELECT substr（'Facebook'， - 5）FROM src LIMIT 1; 'ebook' > SELECT substr（'Facebook'，5,1）FROM src LIMIT 1; 'B'
substring	substring（str，pos [，len]） - 返回str的子字符串，该字符串以pos开头，长度为len orsubstring（bin，pos [，len]） - 返回以pos开头且长度为的字节数组的片段len 同义词：substr pos是一个基于1的索引。如果pos <0，则通过从str的结尾向后计数来确定起始位置。示例： > SELECT substring（'Facebook'，5）FROM src LIMIT 1; 'book' > SELECT substring（'Facebook'， - 5）FROM src LIMIT 1; 'ebook' > SELECT substring（'Facebook'，5,1）FROM src LIMIT 1; 'B'
SUBSTRING_INDEX	substring_index（str，delim，count） - 在分隔符delim的计数出现之前，从字符串str返回子字符串。如果count为正数，则返回最终分隔符左侧的所有内容（从左侧开始计算）。如果count为负数，则返回最终分隔符右侧的所有内容（从右侧开始计算）。在搜索delim时，Substring_index执行区分大小写的匹配。示例： > SELECT substring_index（'www.apache.org'，'。'，2）; 'www.apache'
sum	sum（x） - 返回一组数字的总和
tan	tan（x） - 返回x的正切（x是弧度）示例： > SELECT tan（0）FROM src LIMIT 1; 1
to_date	to_date（expr） - 提取日期或日期时间表达式expr的日期部分示例： > SELECT to_date（'2009-07-30 04:17:52'）FROM src LIMIT 1; '2009-07-30'
to_unix_timestamp	to_unix_timestamp（date [，pattern]） - 返回UNIX时间戳将指定时间转换为自1970-01-01以来的秒数。
to_utc_timestamp	to_utc_timestamp（timestamp，string timezone） - 假设给定时间戳在给定时区内并转换为UTC（从Hive 0.8.0开始）
translate	translate（input，from，to） - 通过将from字符串中的字符替换为to字符串中的相应字符来转换输入字符串 translate（字符串输入，字符串from，string to）是在PostGreSQL中翻译的等效函数。它在输入字符串（第一个参数）上逐个字符地工作。检查输入中的字符是否存在于from字符串中（第二个参数）。如果匹配发生，则获得字符串到字符串（第三个参数），该字符出现在与字符串中的字符相同的索引处。此字符在输出字符串中发出，而不是从输入字符串中的原始字符发出。如果to字符串比from字符串短，则to字符串中的相同索引处可能不存在字符。在这种情况下，原始字符不会发出任何内容，而是从输出字符串中删除它。例如， translate（'abcdef'，'adc'，'19'）返回'1b9ef'将'a'替换为'1'，'d'替换为'9'并从输入字符串中删除'c' （'abc d'， ''，''）返回'abcd'从输入字符串中删除所有空格如果输入字符串中多次出现相同的字符，则第一个出现的字符是考虑匹配的字符。但是，不建议在from字符串中多次使用相同的字符，因为它不是必需的，这增加了混乱。例如， translate（'abcdef'，'ada'，'192'）返回'1bc9ef'将'a'替换为'1'，将'd'替换为'9'
trim	trim（str） - 从str中删除前导和尾随空格字符示例： > SELECT trim（'facebook'）FROM src LIMIT 1; “Facebook的"
TRUNC	trunc（date，fmt）/ trunc（N，D） - 返回如果输入是日期，则返回日期，其中当天的时间部分被截断为格式模型fmt指定的单位。如果省略fmt，则日期将截断为最近的一天。它目前仅支持'MONTH'/'MON'/'MM'，'QUARTER'/'Q'和'YEAR'/'YYYY'/'YY'作为格式。如果输入是数字组，则返回N截断为D十进制地方。如果省略D，则N被截断为0位.D可以是负截断（使零）小数点左边的D位。 date是格式为'yyyy-MM-dd HH：mm：ss'或'yyyy-MM-dd'的字符串。日期的时间部分被忽略。示例： > SELECT trunc('2009-02-12', 'MM'); OK '2009-02-01' > SELECT trunc('2017-03-15', 'Q'); OK '2017-01-01' > SELECT trunc('2015-10-27', 'YEAR'); OK '2015-01-01' > SELECT trunc(1234567891.1234567891,4); OK 1234567891.1234 > SELECT trunc(1234567891.1234567891,-4); OK 1234560000 > SELECT trunc(1234567891.1234567891,0); OK 1234567891 > SELECT trunc(1234567891.1234567891); OK 1234567891
UCASE	ucase（str） - 返回str，所有字符都更改为大写同义词：upper 示例： > SELECT ucase（'Facebook'）FROM src LIMIT 1; 'FACEBOOK'
unbase64	unbase64（str） - 将参数从base 64字符串转换为binary
UNHEX	unhex（str） - 将十六进制参数转换为二进制执行HEX（str）的反向操作。也就是说，它将参数中的每对十六进制数字解释为数字，并将其转换为数字的字节表示形式。该结果字符返回一个二进制字符串。示例： > SELECT DECODE(UNHEX('4D7953514C'), 'UTF-8') from src limit 1; 'MySQL' 参数字符串中的字符必须是合法的十六进制数字：'0'..'9'，'A'..'F'，'a'..'f'。如果UNHEX（）在参数中遇到任何非十六进制数字，则返回NULL。也，
UNIX_TIMESTAMP	unix_timestamp（date [，pattern]） - 将时间转换为数字将指定时间转换为自1970-01-01以来的秒数。不推荐使用unix_timestamp（void）重载，使用current_timestamp。
upper	upper（str） - 返回str，所有字符都更改为大写同义词：ucase 示例： > SELECT upper（'Facebook'）FROM src LIMIT 1; 'FACEBOOK'
UUID	uuid（） - 返回通用唯一标识符（UUID）字符串。该值作为规范的UUID 36字符字符串返回。示例： > SELECT uuid（）; '0baf1f52-53df-487f-8292-99a03716b688' > SELECT uuid（）; '36718a53-84f5-45d6-8796-4f79983ad49d'
VAR_POP	var_pop（x） - 返回一组数字的方差同义词：方差
VAR_SAMP	var_samp（x） - 返回一组数字的样本方差
variance	variance（x） - 返回一组数字的方差同义词：var_pop
version	version（） - 返回Hive构建版本字符串 - 包括基本版本和修订版本。
WEEKOFYEAR	weekofyear（date） - 返回给定日期的一年中的一周。一周被认为是在星期一开始，第一周是第一周，> 3天。示例： > SELECT weekofofar（'2008-02-20'）FROM src LIMIT 1; 8 > SELECT weekofyear（'1980-12-31 12:59:59'）FROM src LIMIT 1; 1
when	CASE WHEN a THEN b [WHEN c THEN d]* [ELSE e] END - When a = true, returns b; when c = true, return d; else return e Example: SELECT CASE WHEN deptno=1 THEN Engineering WHEN deptno=2 THEN Finance ELSE admin END, CASE WHEN zone=7 THEN Americas ELSE Asia-Pac END FROM emp_details
windowingtablefunction
XPath	xpath（xml，xpath） - 返回xml节点中与xpath表达式匹配的值的字符串数组示例： > SELECT xpath（' b1 b2 b3 c1 c2 '，'a / text（）'）FROM src LIMIT 1 [] > SELECT xpath（' < b> b1 b2 b3 c1 c2 '，'a / b / text（）'）FROM src LIMIT 1 [“b1”，“b2”，“b3”] > SELECT xpath（' b1 b2 b3 c1 c2 '，'a / c / text（）'）FROM src LIMIT 1 [“c1”，“c2”]
xpath_boolean	xpath_boolean（xml，xpath） - 计算布尔xpath表达式示例： > SELECT xpath_boolean（' 1 '，'a / b'）FROM src LIMIT 1; true > SELECT xpath_boolean（' 1 '，'a / b = 2'）FROM src LIMIT 1; 假
xpath_double	xpath_double（xml，xpath） - 返回与xpath表达式匹配的double值别名：xpath_number 示例： > SELECT xpath_double（' 1 2 ' ，'sum（a / b）'） from src LIMIT 1; 3.0
xpath_float	xpath_float（xml，xpath） - 返回与xpath表达式匹配的浮点值示例： > SELECT xpath_float（' 1 2 '，'sum （a / b）'）FROM src LIMIT 1; 3.0
xpath_int	xpath_int（xml，xpath） - 返回与xpath表达式匹配的整数值示例： > SELECT xpath_int（' 1 2 '，'sum （a / b）'）FROM src LIMIT 1; 3
xpath_long	xpath_long（xml，xpath） - 返回与xpath表达式匹配的long值示例： > SELECT xpath_long（' 1 2 '，'sum （a / b）'）FROM src LIMIT 1; 3
xpath_number	xpath_number（xml，xpath） - 返回与xpath表达式匹配的double值别名：xpath_double 示例： > SELECT xpath_number（' 1 2 ' ，'sum（a / b）'）from src LIMIT 1; 3.0
xpath_short	xpath_short（xml，xpath） - 返回与xpath表达式匹配的short值示例： > SELECT xpath_short（' 1 2 '，'sum （a / b）'）FROM src LIMIT 1; 3
xpath_string	xpath_string（xml，xpath） - 返回与xpath表达式匹配的第一个xml节点的文本内容示例： > SELECT xpath_string（' b cc '，'a / c'）FROM src LIMIT 1; 'cc' > SELECT xpath_string（' b1 b2 '，'a / b'）FROM src LIMIT 1; 'b1' > SELECT xpath_string（' b1 b2 '，'a / b [2]'）FROM src LIMIT 1; 'b2' > SELECT xpath_string（' b1 b2 '，'a'）FROM src LIMIT 1; 'B1B2'
year	year（param） - 返回日期/时间戳/间隔的年份组件 param可以是以下之一： 1。格式为'yyyy-MM-dd HH：mm：ss'或'yyyy-MM-dd'的字符串。 2.日期值 3.时间戳值 4.年 - 月间隔值示例： > SELECT year（'2009-07-30'）FROM src LIMIT 1; 2009年

你可能感兴趣的:(hive)

nosql数据库技术与应用知识点皆过客，揽星河 NoSQL nosql 数据库大数据数据分析数据结构非关系型数据库
Nosql知识回顾大数据处理流程数据采集(flume、爬虫、传感器)数据存储(本门课程NoSQL所处的阶段)Hdfs、MongoDB、HBase等数据清洗(入仓)Hive等数据处理、分析(Spark、Flink等)数据可视化数据挖掘、机器学习应用(Python、SparkMLlib等)大数据时代存储的挑战(三高)高并发(同一时间很多人访问)高扩展(要求随时根据需求扩展存储)高效率(要求读写速度快)
浅谈MapReduce Android路上的人 Hadoop 分布式计算 mapreduce 分布式框架 hadoop
从今天开始，本人将会开始对另一项技术的学习，就是当下炙手可热的Hadoop分布式就算技术。目前国内外的诸多公司因为业务发展的需要，都纷纷用了此平台。国内的比如BAT啦，国外的在这方面走的更加的前面，就不一一列举了。但是Hadoop作为Apache的一个开源项目，在下面有非常多的子项目，比如HDFS，HBase,Hive，Pig,等等，要先彻底学习整个Hadoop，仅仅凭借一个的力量，是远远不够的。
Presto【基础 01】简介+架构+数据源+数据模型 2401_84254343 程序员架构
一个Catalog包含Schema和Connector。例如，配置JMX的Catalog，通过JXMConnector访问JXM信息。当执行一条SQL语句时，可以同时运行在多个Catalog。Presto处理table时，是通过表的完全限定（fully-qualified）名来找到Catalog。例如，一个表的权限定名是hive.test_data.test，则test是表名，test_data是
大数据毕业设计hadoop+spark+hive知识图谱租房数据分析可视化大屏租房推荐系统 58同城租房爬虫房源推荐系统房价预测系统计算机毕业设计机器学习深度学习人工智能 2401_84572577 程序员大数据 hadoop 人工智能
做了那么多年开发，自学了很多门编程语言，我很明白学习资源对于学一门新语言的重要性，这些年也收藏了不少的Python干货，对我来说这些东西确实已经用不到了，但对于准备自学Python的人来说，或许它就是一个宝藏，可以给你省去很多的时间和精力。别在网上瞎学了，我最近也做了一些资源的更新，只要你是我的粉丝，这期福利你都可拿走。我先来介绍一下这些东西怎么用，文末抱走。（1）Python所有方向的学习路线（
大数据之flink与hive 星辰_mya 大数据 flink hive
其实吧我不太想写flink，因为线上经验确实不多，这也是我需要补的地方，没有条件创造条件，先来一篇吧flink：高性能低延迟流批一体的分布式计算框架基于事件时间对实时数据精准处理快速响应支持批处理，高效离线分析和数据挖掘数据仓库的引擎丰富数据源/接收器，集成多种数据存储格式和源，比较常见就是咱们今天的主题hive了checkpoint恢复机制，故障恢复快速恢复计算任务分布式弹性扩展，据业务灵活增加
hive血缘关系之输入表与目标表的解析 zxfBdd hive 大数据治理大数据
接了一个新需求：需要做数据仓库的血缘关系。正所谓兵来将挡水来土掩，那咱就动手吧。血缘关系是数据治理的一块，其实有专门的第三方数据治理框架，但考虑到目前的线上环境已经趋于稳定，引入新的框架无疑是劳民伤财，伤筋动骨，所以就想以最小的代价把这个事情给做了。目前我们考虑做的血缘关系呢只是做输入表和输出表，最后会形成一张表与表之间的链路图。这个东西的好处就是有助于仓库人员梳理业务，后面可能还会做字段之间的血
初级练习[3]:Hive SQL子查询应用大数据深度洞察 Hive hive sql hadoop 数据仓库大数据数据库
目录环境准备看如下链接子查询查询所有课程成绩均小于60分的学生的学号、姓名查询没有学全所有课的学生的学号、姓名解释：没有学全所有课，也就是该学生选修的课程数<总的课程数。查询出只选修了三门课程的全部学生的学号和姓名环境准备看如下链接环境准备https://blog.csdn.net/qq_45115959/article/details/142057624?spm=1001.2014.3001.5
Linux下载压缩包：tar.gz、zip、tar.bz2格式全攻略 promise524 Linux linux 运维服务器后端 bash shell
在Linux中，下载各种格式的压缩包（如.tar.gz、.zip、.tar.bz2等）通常使用命令行工具如wget和curl。1.使用wget下载压缩包wget是Linux中最常用的文件下载工具，支持HTTP、HTTPS、FTP等协议，可以直接从命令行下载文件。基本命令：wget[URL]下载.tar.gz文件wgethttps://test.com/archive.tar.gz此命令将从指定的U
Anaconda版本和Python版本对应关系纬领网络 python anaconda3
官网下载地址：https://repo.anaconda.com/archive/下载地址：https://mirrors.tuna.tsinghua.edu.cn/anaconda/archive/anaconda3版本基础python版本Anaconda3-2024.06-1Python3.12.4Anaconda3-2024.02-1Python3.11.7Anaconda3-2023.09
R语言包AMORE安装报错问题以及RStudio与Rtools环境配置卡卡_R-Python R语言数据分析与可视化 r语言开发语言
在使用R语言进行AMORE安装时会遇到报错，这时候需要采用解决办法：'''AMORE包安装，需要离线官网下载安装包：Indexof/src/contrib/Archive/AMORE(r-project.org)https://cran.r-project.org/src/contrib/Archive/AMORE/一、出现的问题最近开始学习R语言，安装了最新版的R4.4.1和RStudio，但安
中级练习[3]：Hive SQL用户行为与商品销售数据分析大数据深度洞察 Hive hive 数据仓库大数据 sql
目录1.用户累计消费金额及VIP等级查询1.1题目需求1.2代码实现2.首次下单后第二天连续下单的用户比率查询2.1题目需求2.2代码实现3.每个商品销售首年的年份、销售数量和销售金额统计3.1题目需求3.2代码实现1.用户累计消费金额及VIP等级查询1.1题目需求从订单信息表(order_info)中统计每个用户截止其每个下单日期的累积消费金额，以及每个用户在其每个下单日期的VIP等级。VIP等
Python基础知识进阶之正则表达式_头歌python正则表达式进阶前端陈萨龙程序员 python 学习面试
最后硬核资料：关注即可领取PPT模板、简历模板、行业经典书籍PDF。技术互助：技术群大佬指点迷津，你的问题可能不是问题，求资源在群里喊一声。面试题库：由技术群里的小伙伴们共同投稿，热乎的大厂面试真题，持续更新中。知识体系：含编程语言、算法、大数据生态圈组件（Mysql、Hive、Spark、Flink）、数据仓库、Python、前端等等。网上学习资料一大堆，但如果学到的知识不成体系，遇到问题时只是
编程常用命令总结 Yellow0523 Linux BigData 大数据
编程命令大全1.软件环境变量的配置JavaScalaSparkHadoopHive2.大数据软件常用命令Spark基本命令Spark-SQL命令Hive命令HDFS命令YARN命令Zookeeper命令kafka命令Hibench命令MySQL命令3.Linux常用命令Git命令conda命令pip命令查看Linux系统的详细信息查看Linux系统架构(X86还是ARM，两种方法都可)端口号命令L
博客园怎么了？ YYH1992
新年好，给大家拜个早年！今年来到安徽过年，无聊中，不知不觉中又来到博客园了（忠实粉丝哦），却发现一件奇怪的事情，请看截图难道博客园被挂马了？抑或其它问题？如果真有问题，还请dudu抓紧时间修正，免得影响我们园子的声誉！我要下线了，出去买回家的车票了，只能年后回家了。。。转载于:https://www.cnblogs.com/HollisYao/archive/2008/02/06/1065351.
linux下文件的复制、移动与删除搬砖中年人
一、文件复制命令cp命令格式：cp[-adfilprsu]源文件(source)目标文件(destination)cp[option]source1source2source3...directory参数说明：-a:是指archive的意思，也说是指复制所有的目录-d:若源文件为连接文件(linkfile)，则复制连接文件属性而非文件本身-f:强制(force)，若有重复或其它疑问时，不会询问用户
2024年最全使用Python求解方程_python解方程(1)，字节面试官迟到 2401_84569545 程序员 python 学习面试
最后硬核资料：关注即可领取PPT模板、简历模板、行业经典书籍PDF。技术互助：技术群大佬指点迷津，你的问题可能不是问题，求资源在群里喊一声。面试题库：由技术群里的小伙伴们共同投稿，热乎的大厂面试真题，持续更新中。知识体系：含编程语言、算法、大数据生态圈组件（Mysql、Hive、Spark、Flink）、数据仓库、Python、前端等等。网上学习资料一大堆，但如果学到的知识不成体系，遇到问题时只是
兼容 Trino Connector，扩展 Apache Doris 数据源接入能力｜Lakehouse 使用手册 vvvae1234 apache
ApacheDoris内置支持包括Hive、Iceberg、Hudi、Paimon、LakeSoul、JDBC在内的多种Catalog，并为其提供原生高性能且稳定的访问能力，以满足与数据湖的集成需求。而随着ApacheDoris用户的增加，新的数据源连接需求也随之增加。因此，从3.0版本开始，ApacheDoris引入了TrinoConnector兼容框架。Trino/Presto作为业界较早应用
SAP HANA makaitai BW sap 数据库工具报表 layer 服务器
原文地址：http://LiuAlex.com/archives/1776也是刚刚开始学习HANA的一些知识，一边看书一遍做笔记，说到底无非是用自己的语言来理解标准帮组文档所讲解的意思，肯定有理解失误的地方，毕竟没有参加过标准培训，即使有培训，从老师那边来的知识也不可能是完整的传授过来，中间多少的知识遗漏是正常的，所以多看看HELP的文档，应该可以原汁原味的理解作者的意思。这张图片是从SAPHAN
Hive SQL查询汇总分析大数据深度洞察 Hive hive sql hadoop 数据仓库数据库大数据
目录SQL查询汇总分析成绩查询查询编号为“02”的课程的总成绩查询参加考试的学生个数分组查询查询各科成绩最高和最低的分查询每门课程有多少学生参加了考试（有考试成绩）查询男生、女生人数分组结果的条件查询平均成绩大于60分的学生的学号和平均成绩查询至少选修四门课程的学生学号查询同姓（假设每个学生姓名的第一个字为姓）的学生名单并统计同姓人数大于2的姓查询每门课程的平均成绩，结果按平均成绩升序排序，平均成
RMAN-08137 rman delete archivelog force jnrjian 数据库 oracle
deleteforcearchiveloguntiltime'trunc(sysdate-4)'backedup1timestodevicetypedisk;SymptomsDatabaseAClonedtoDatabaseBonCloneserver.GoldenGateisConfiguredonSourcedatbaseA.DatabaseBwhichisclonedfromSourcedo
hive表格统计信息不准确 weixin_41956627 hive hive hadoop 数据仓库
问题描述有个hive分区表，orc存储格式，有个分区，查询selectcount(1)fromtablewheredt='yyyyMMdd'结果是0，但查询select*fromtablewheredt='yyyyMMdd'又能查到数据，去hdfs对应目录下查看，也能看到有数据文件解决执行如下sqlANALYZETABLEdb.table1PARTITION(dt='20240908')COMPU
Conda创建环境失败：000和404错误柚柚柚柚柚 conda
一、首先下载Anaconda1.打开网址Indexof/anaconda/archive/|清华大学开源软件镜像站|TsinghuaOpenSourceMirror，滑到最底部，下载Anaconda3-5.3.1-Linux-x86_64.sh。2.使用winscp拖动本地的Anaconda3-5.3.1-Linux-x86_64.sh到服务器的个人工作目录下。二、安装Anaconda软件，创建虚
C#中两个问号的含义 weixin_30363981 测试
stringstrParam=Request.Params["param"]??"";取??左边的值,如果??左边的值为null则取右边的值转载于:https://www.cnblogs.com/shadowtale/archive/2012/10/19/2731152.html
如何下载各个版本的tomcat-比如tomcat9 耳边轻语999 tomcat java
1，找到tomcat官网https://tomcat.apache.org/ApacheTomcat®-Welcome!找到tomcat9，或者archives1.1，找到对应版本1.2，找到小版本1.3，找到bin2，Indexof/dist/tomcat/tomcat-9/v9.0.39/bin2.1，下载对应的解压版本或者安装版本
Percona-toolkit工具详解小一_d28d
1.pt工具安装[root@master~]#yuminstall-ypercona-toolkit-3.1.0-2.el7.x86_64.rpm2.常用工具使用介绍2.1pt-archiver归档表#重要参数--limit100每次取100行数据用pt-archive处理--txn-size100设置100行为一个事务提交一次，--where'id>/root/db/checksum.logpt
Ubuntu更换apt-get的下载源愤愤的有痣青年
将以下内容替换/etc/apt/sources.list中的内容deb-srchttp://archive.ubuntu.com/ubuntuxenialmainrestricted#Addedbysoftware-propertiesdebhttp://mirrors.aliyun.com/ubuntu/xenialmainrestricteddeb-srchttp://mirrors.aliy
apt 下载指定架构的包及离线安装的方法错误重复学习记录 linux
#设置系统架构sudodpkg--add-architectureamd64#安装apt-rdependssudoaptinstallapt-rdepends#创建单独的目录mkdir-p/home/apt/postgresql-client-common#仅下载安装包sudoapt-getinstall--download-onlysudomv/var/cache/apt/archives/*/
游戏运营环节的一些关键转化率 turtle081025 数据分析游戏网络游戏运营
转载于http://www.gamedatas.com/archives/134转化率这个指标在各行各业的数据分析中运用的非常之广泛，例如：电商中就会存在，点击到订单生成的一系列转化率，传统的销售行业也会在做广告的时候考虑该广告能够转化多少订单，而在游戏行业，转化率同样是一个不容忽视的指标。一般来说，游戏运营的过程中主要会关注到这些转化率：1.下载-安装（激活）转化率；2.安装（激活）-注册转化率
Python API操作RocketMQ 京城小筑 #Python编程 python
背景：开发背景:公司相关报表需求需要将订单业务数据同步至RocketMQ中，由于需要保证开发的一致性(多个部门协同开发)，所以采用读取Hive离线数据的方式通过PythonAPI写入RocketMQ中，便于其他开发同事调用~开发环境:本地调试系统MacPython3.7.5rocketmq0.4.4(Python模块)rocketmq-client-python2.0.0(Python模块)服务器
hive搭建 -----内嵌模式和本地模式 lzhlizihang hive hadoop
文章目录一、内嵌模式（使用较少）1、上传、解压、重命名2、配置环境变量3、配置conf下的hive-env.sh4、修改conf下的hive-site.xml5、启动hadoop集群6、给hdfs创建文件夹7、修改hive-site.xml中的非法字符8、初始化元数据9、测试是否成功10、内嵌模式的缺点二、本地模式（最常用）1、检查mysql是否正常2、上传、解压、重命名3、配置环境变量4、修改c
集合框架天子之骄 java 数据结构集合框架
集合框架集合框架可以理解为一个容器，该容器主要指映射(map)、集合(set)、数组(array)和列表(list)等抽象数据结构。从本质上来说，Java集合框架的主要组成是用来操作对象的接口。不同接口描述不同的数据类型。简单介绍： Collection接口是最基本的接口，它定义了List和Set，List又定义了LinkLi
Table Driven（表驱动）方法实例 bijian1013 java enum Table Driven 表驱动
实例一： /** * 驾驶人年龄段 * 保险行业，会对驾驶人的年龄做年龄段的区分判断 * 驾驶人年龄段：01-[18,25);02-[25,30);03-[30-35);04-[35,40);05-[40,45);06-[45,50);07-[50-55);08-[55,+∞) */ public class AgePeriodTest { //if...el
Jquery 总结 cuishikuan java jquery Ajax Web jquery方法
1.$.trim方法用于移除字符串头部和尾部多余的空格。如：$.trim(' Hello ') // Hello2.$.contains方法返回一个布尔值，表示某个DOM元素（第二个参数）是否为另一个DOM元素（第一个参数）的下级元素。如：$.contains(document.documentElement, document.body); 3.$
面向对象概念的提出麦田的设计者 java 面向对象面向过程
面向对象中，一切都是由对象展开的，组织代码，封装数据。在台湾面向对象被翻译为了面向物件编程，这充分说明了，这种编程强调实体。下面就结合编程语言的发展史，聊一聊面向过程和面向对象。 c语言由贝尔实
linux网口绑定被触发 linux
刚在一台IBM Xserver服务器上装了RedHat Linux Enterprise AS 4，为了提高网络的可靠性配置双网卡绑定。一、环境描述我的RedHat Linux Enterprise AS 4安装双口的Intel千兆网卡，通过ifconfig -a命令看到eth0和eth1两张网卡。二、双网卡绑定步骤： 2.1 修改/etc/sysconfig/network
XML基础语法肆无忌惮_ xml
一、什么是XML？ XML全称是Extensible Markup Language，可扩展标记语言。很类似HTML。XML的目的是传输数据而非显示数据。XML的标签没有被预定义，你需要自行定义标签。XML被设计为具有自我描述性。是W3C的推荐标准。二、为什么学习XML？用来解决程序间数据传输的格式问题做配置文件充当小型数据库三、XML与HTM
为网页添加自己喜欢的字体知了ing 字体秒表 css
@font-face { font-family: miaobiao;//定义字体名字 font-style: normal; font-weight: 400; src: url('font/DS-DIGI-e.eot');//字体文件 } 使用： <label style="font-size:18px;font-famil
redis范围查询应用-查找IP所在城市矮蛋蛋 redis
原文地址： http://www.tuicool.com/articles/BrURbqV 需求根据IP找到对应的城市原来的解决方案 oracle表（ip_country）：查询IP对应的城市： 1.把a.b.c.d这样格式的IP转为一个数字，例如为把210.21.224.34转为3524648994 2. select city from ip_
输入两个整数，计算百分比 alleni123 java
public static String getPercent(int x, int total){ double result=(x*1.0)/(total*1.0); System.out.println(result); DecimalFormat df1=new DecimalFormat("0.0000%");
百合——————>怎么学习计算机语言百合不是茶 java 移动开发
对于一个从没有接触过计算机语言的人来说，一上来就学面向对象，就算是心里上面接受的了，灵魂我觉得也应该是跟不上的，学不好是很正常的现象，计算机语言老师讲的再多，你在课堂上面跟着老师听的再多，我觉得你应该还是学不会的，最主要的原因是你根本没有想过该怎么来学习计算机编程语言，记得大一的时候金山网络公司在湖大招聘我们学校一个才来大学几天的被金山网络录取，一个刚到大学的就能够去和
linux下tomcat开机自启动 bijian1013 tomcat
方法一：修改Tomcat/bin/startup.sh 为: export JAVA_HOME=/home/java1.6.0_27 export CLASSPATH=$CLASSPATH:$JAVA_HOME/lib/tools.jar:$JAVA_HOME/lib/dt.jar:. export PATH=$JAVA_HOME/bin:$PATH export CATALINA_H
spring aop实例 bijian1013 java spring AOP
1.AdviceMethods.java package com.bijian.study.spring.aop.schema; public class AdviceMethods { public void preGreeting() { System.out.println("--how are you!--"); } } 2.beans.x
[Gson八]GsonBuilder序列化和反序列化选项enableComplexMapKeySerialization bit1129 serialization
enableComplexMapKeySerialization配置项的含义 Gson在序列化Map时，默认情况下，是调用Key的toString方法得到它的JSON字符串的Key，对于简单类型和字符串类型，这没有问题，但是对于复杂数据对象，如果对象没有覆写toString方法，那么默认的toString方法将得到这个对象的Hash地址。 GsonBuilder用于
【Spark九十一】Spark Streaming整合Kafka一些值得关注的问题 bit1129 Stream
包括Spark Streaming在内的实时计算数据可靠性指的是三种级别： 1. At most once，数据最多只能接受一次，有可能接收不到 2. At least once, 数据至少接受一次，有可能重复接收 3. Exactly once 数据保证被处理并且只被处理一次，具体的多读几遍http://spark.apache.org/docs/lates
shell脚本批量检测端口是否被占用脚本 ronin47
#!/bin/bash cat ports |while read line do#nc -z -w 10 $line nc -z -w 2 $line 58422>/dev/null2>&1if[ $?-eq 0]then echo $line:ok else echo $line:fail fi done 这里的ports 既可以是文件
java-2.设计包含min函数的栈 bylijinnan java
具体思路参见：http://zhedahht.blog.163.com/blog/static/25411174200712895228171/ import java.util.ArrayList; import java.util.List; public class MinStack { //maybe we can use origin array rathe
Netty源码学习-ChannelHandler bylijinnan java netty
一般来说，“有状态”的ChannelHandler不应该是“共享”的，“无状态”的ChannelHandler则可“共享” 例如ObjectEncoder是“共享”的, 但 ObjectDecoder 不是因为每一次调用decode方法时，可能数据未接收完全（incomplete），它与上一次decode时接收到的数据“累计”起来才有可能是完整的数据，是“有状态”的 p
java生成随机数 cngolon java
方法一： /** * 生成随机数 * @author [email protected] * @return */ public synchronized static String getChargeSequenceNum(String pre){ StringBuffer sequenceNum = new StringBuffer(); Date dateTime = new D
POI读写海量数据 ctrain 海量数据
import java.io.FileOutputStream; import java.io.OutputStream; import org.apache.poi.xssf.streaming.SXSSFRow; import org.apache.poi.xssf.streaming.SXSSFSheet; import org.apache.poi.xssf.streaming
mysql 日期格式化date_format详细使用 daizj mysql date_format 日期格式转换日期格式化
日期转换函数的详细使用说明 DATE_FORMAT(date,format) Formats the date value according to the format string. The following specifiers may be used in the format string. The&n
一个程序员分享8年的开发经验 dcj3sjt126com 程序员
在中国有很多人都认为IT行为是吃青春饭的，如果过了30岁就很难有机会再发展下去!其实现实并不是这样子的，在下从事.NET及JAVA方面的开发的也有8年的时间了，在这里在下想凭借自己的亲身经历，与大家一起探讨一下。明确入行的目的很多人干IT这一行都冲着“收入高”这一点的，因为只要学会一点HTML, DIV+CSS，要做一个页面开发人员并不是一件难事，而且做一个页面开发人员更容
android欢迎界面淡入淡出效果 dcj3sjt126com android
很多Android应用一开始都会有一个欢迎界面，淡入淡出效果也是用得非常多的，下面来实现一下。主要代码如下： package com.myaibang.activity; import android.app.Activity;import android.content.Intent;import android.os.Bundle;import android.os.CountDown
linux 复习笔记之常见压缩命令 eksliang tar解压 linux系统常见压缩命令 linux压缩命令 tar压缩
转载请出自出处:http://eksliang.iteye.com/blog/2109693 linux中常见压缩文件的拓展名 *.gz gzip程序压缩的文件 *.bz2 bzip程序压缩的文件 *.tar tar程序打包的数据，没有经过压缩 *.tar.gz tar程序打包后，并经过gzip程序压缩 *.tar.bz2 tar程序打包后，并经过bzip程序压缩 *.zi
Android 应用程序发送shell命令 gqdy365 android
项目中需要直接在APP中通过发送shell指令来控制lcd灯，其实按理说应该是方案公司在调好lcd灯驱动之后直接通过service送接口上来给APP，APP调用就可以控制了，这是正规流程，但我们项目的方案商用的mtk方案，方案公司又没人会改，只调好了驱动，让应用程序自己实现灯的控制，这不蛋疼嘛！！！！发就发吧！一、关于shell指令：我们知道，shell指令是Linux里面带的
java 无损读取文本文件 hw1287789687 读取文件无损读取读取文本文件 charset
java 如何无损读取文本文件呢？以下是有损的 @Deprecated public static String getFullContent(File file, String charset) { BufferedReader reader = null; if (!file.exists()) { System.out.println("getFull
Firebase 相关文章索引 justjavac firebase
Awesome Firebase 最近谷歌收购Firebase的新闻又将Firebase拉入了人们的视野，于是我做了这个 github 项目。 Firebase 是一个数据同步的云服务，不同于 Dropbox 的「文件」，Firebase 同步的是「数据」，服务对象是网站开发者，帮助他们开发具有「实时」（Real-Time）特性的应用。开发者只需引用一个 API 库文件就可以使用标准 RE
C++学习重点 lx.asymmetric C++笔记
1.c++面向对象的三个特性：封装性，继承性以及多态性。 2.标识符的命名规则：由字母和下划线开头，同时由字母、数字或下划线组成；不能与系统关键字重名。 3.c++语言常量包括整型常量、浮点型常量、布尔常量、字符型常量和字符串性常量。 4.运算符按其功能开以分为六类：算术运算符、位运算符、关系运算符、逻辑运算符、赋值运算符和条件运算符。 &n
java bean和xml相互转换 q821424508 java bean xml xml和bean转换 java bean和xml转换
这几天在做微信公众号做的过程中想找个java bean转xml的工具，找了几个用着不知道是配置不好还是怎么回事，都会有一些问题，然后脑子一热谢了一个javabean和xml的转换的工具里，自己用着还行，虽然有一些约束吧，还是贴出来记录一下顺便你提一下下，这个转换工具支持属性为集合、数组和非基本属性的对象。 packag
C 语言初级位运算 1140566087 位运算 c
第十章位运算 1、位运算对象只能是整形或字符型数据，在VC6.0中int型数据占4个字节 2、位运算符：运算符作用 ~ 按位求反 << 左移 >> 右移 & 按位与 ^ 按位异或 | 按位或他们的优先级从高到低； 3、位运算符的运算功能： a、按位取反： ~01001101 = 101
14点睛Spring4.1-脚本编程 wiselyman spring4
14.1 Scripting脚本编程脚本语言和java这类静态的语言的主要区别是:脚本语言无需编译,源码直接可运行; 如果我们经常需要修改的某些代码,每一次我们至少要进行编译,打包,重新部署的操作,步骤相当麻烦; 如果我们的应用不允许重启,这在现实的情况中也是很常见的; 在spring中使用脚本编程给上述的应用场景提供了解决方案,即动态加载bean; spring支持脚本