场景:每月初要获得一个配置表,每天的配置情况都在表中。那么就要获得这个月中的每一天
假如我们需要获取2020-07-15至2020-07-21间所有的日期,可以像这样写
SELECT
pos,
date_add( start_date, pos ) dd
FROM
( SELECT '2020-07-15' AS start_date, '2020-07-21' AS end_date ) temp
lateral VIEW
posexplode ( split ( space( datediff( end_date, start_date ) ), '' ) ) t
AS pos, val
下面简单解释下这个sql,首先看下posexplode函数中包含的部分
split ( space( datediff( '2020-07-21', '2020-07-15' ) ), '' )
datediff函数计算两个日期间相差的天数(这里返回6)
space函数会根据传入的数字返回对应长度的空格(这里返回长度为6的空字符串)
split函数将字符串按指定分隔符进行拆分(这里返回如下数组)
[" "," "," "," "," "," ",""]
有了上面的数组我们再通过posexplode函数将列转行,并获取行号
最后通过date_add与行号获取一个递增的日期
假如我们需要获取今年一月到7月的月份,可以像这样写
SELECT
pos,
SUBSTR( add_months (
FROM_UNIXTIME( unix_timestamp( SUBSTR( start_date, 1, 4 ), 'yyyy' ))
, pos ), 1, 7 ) AS ym
FROM
( SELECT '2020-07-20' AS start_date ) tmp
lateral VIEW posexplode ( split ( space( 6 ), '' ) ) t AS pos, val
这里我们假定传入参数是个日期,截取日期中年份并通过时间函数转为当年第一个月
后面思路和获取连续日期相同,如果需要获取当年所有月份可以将space(6)改为space(11)