数据湖技术之核心特性篇

一. 湖仓一体关键技术特性 

        原有的数仓模式为业务解决了很大的业务需求问题,很好的服务于公司的数据分析服务。但是由于本身的一些机制问题,导致一些方面受到了限制,无法更好的去扩展。引入数据湖技术,可以更好的演进整体架构模式,形成一套湖仓一体的模式。

        其实主要是借助了数据湖的一些关键技术特性,比如对整体事务的支持,更加高效的支持schema演进,且代价非常小,支持不同版本的schema。数据实效性可以达到分钟级别的延迟(准实时层面),支持的数据类型更加丰富,业务应用起来比较简便,同时整体更加具有开放性,支持各种模式,便于后续进行业务整合和扩展,另外也能对整体架构模式进行升级,比如说支持存算分离部署模式。

数据湖技术之核心特性篇_第1张图片

二. 湖仓一体化解决的核心问题

        湖仓一体化是在原有数仓模式上引入数据湖技术,去整合业务臃肿的链路,让业务架构更加健壮、容易扩展,同时也可以带来很多其他的好处,帮忙业务解决一些痛点问题,概括来说主要解决了四个核心问题,第一个是多架构差异问题,避免了链路的重复以及规避了数据口径不一致风险问题,第二个是存储层面的降本,实现了一份落地数据,多种用途的模式,第三个是借助一些技术能力,比如说各种索引技术模式的应用等,可以对数据分析进行提效,最后一个是解决架构扩展性弱的问题,融合数据湖后方便架构进一步扩展。

数据湖技术之核心特性篇_第2张图片

三. 总结

        湖仓一体化可以很好的去帮忙业务进行架构升级以及解决一些核心的痛点问题,而且在降本增效方面也有很大的优势。随着数据湖技术继续不断的发展,整体架构会更加稳定,更多地应用于线上业务,让业务在面对不同场景时可以高效便捷的进行数据处理,同时也能让数据链路更加的优良,从整体角度达到降本提效的要求。

你可能感兴趣的:(数据湖,数据仓库)