Hive获取连续时间posexplode

获取连续的日期

场景:每月初要获得一个配置表,每天的配置情况都在表中。那么就要获得这个月中的每一天

假如我们需要获取2020-07-15至2020-07-21间所有的日期,可以像这样写

SELECT
	pos,
	date_add( start_date, pos ) dd
FROM
	( SELECT '2020-07-15' AS start_date, '2020-07-21' AS end_date ) temp 
	lateral VIEW 
	posexplode ( split ( space( datediff( end_date, start_date ) ), '' ) ) t 
	AS pos, val

 

下面简单解释下这个sql,首先看下posexplode函数中包含的部分

split ( space( datediff( '2020-07-21', '2020-07-15' ) ), '' ) 
  • 1

datediff函数计算两个日期间相差的天数(这里返回6)
space函数会根据传入的数字返回对应长度的空格(这里返回长度为6的空字符串)
split函数将字符串按指定分隔符进行拆分(这里返回如下数组)

[" "," "," "," "," "," ",""]
  • 1

有了上面的数组我们再通过posexplode函数将列转行,并获取行号
最后通过date_add与行号获取一个递增的日期

获取连续的月份

假如我们需要获取今年一月到7月的月份,可以像这样写

SELECT
	pos,
	SUBSTR( add_months ( 
	FROM_UNIXTIME( unix_timestamp( SUBSTR( start_date, 1, 4 ), 'yyyy' ))
	, pos ), 1, 7 ) AS ym 
FROM
	( SELECT '2020-07-20' AS start_date ) tmp 
	lateral VIEW posexplode ( split ( space( 6 ), '' ) ) t AS pos, val

 Hive获取连续时间posexplode_第1张图片
这里我们假定传入参数是个日期,截取日期中年份并通过时间函数转为当年第一个月
后面思路和获取连续日期相同,如果需要获取当年所有月份可以将space(6)改为space(11)

你可能感兴趣的:(Hive)