离线数仓和实时数仓割裂的痛点,数据湖方案

离线数仓和实时数仓割裂的痛点:
1)离线加工数据产出时效性不足
2)实时加工可观测性,可运维性较弱
3)批流双链路,双份资源开销
4)全天计算资源高峰集中在凌晨

数据湖方案:
数据入湖增量计算,提升时效
流表二像性,可流式消费,可批查
计算存储批流一体,可重跑
增量计算将凌晨计算打散到整天

你可能感兴趣的:(大数据)