44.日期交叉问题(品牌活动天数计算)

44.日期交叉问题(品牌活动天数计算)_第1张图片
思路分析:
(1)计算表中每一条数据所对应的活动天数days
(2)使用posexplode函数对days炸裂求其索引值index
(3)使用开始日期+index补全后面每一个活动日期in_date
(4)按品牌对in_date做去重计数就可以求得品牌的活动天数了

**注:
该问题的核心点有两个(1)split(space(days), ‘’)函数按照数字构建空字符串再将其切分重构为一个数组;
(2)lateral view posexplode(split(space(days), ‘’)) tmp as index,value
函数,将数组拆分为多行且每一行都保留有它的索引值,它的返回值一个是索引一个是真实的值,需要用索引值来辅助做日期补全。
select length(space(2));>2
select size(split(space(2), ‘’));
>3
SELECT posexplode(split(space(2), ‘’));==>0 1 2,结果从0开始且会比原始值多1
**

代码实现:

SELECT 
    brand,
    count(distinct in_date) promotion_day_count
from(
        select 
            brand,
            -- 开始日期+位置计算出活动每一天日期
            date_add(start_date, index) in_date 
        from(
                SELECT 
                    brand,
                    start_date,
                    end_date,
                    --天数
                    datediff(end_date, start_date) as days
                from promotion_info
            ) t1 lateral view posexplode(split(space(days), '')) tmp as index
            ,value
    ) t2
group by brand;

你可能感兴趣的:(hive,SQL,数据库,hive,大数据)