使用MaxCompute进行数据质量核查

数据质量问题一直是大数据分析系统关注的重点,如何发现数据质量问题,提升数据质量,一直是各生产及业务系统的追求点。通过此课程,可迅速掌握发现数据质量问题的方法,解决数据质量问题。

通过本案例,学员可了解影响数据质量的因素,出现数据质量问题的类型,掌握通过MaxCompute(DateIDE)设计数据质量监控的方法,最终独立解决常见的数据质量监控需求。

数据质量基本介绍

什么是数据质量?

数据质量顾名思义就是数据的质量

数据质量是数据分析结论有效性和准确性的基础,也是最重要的前提和保障

数据质量是数据分析应用的基础,为了获得可靠的数据,企业必须密切关注数据质量,数据质量将是直接影响系统应用成功的关键

大数据计算服务(MaxCompute,原ODPS )由阿里云自主研发,提供针对TB/PB级数 据、实时性要求不高的分布式处理能力,应用于数据分析、挖掘、商业智能等领域。阿里巴巴的数据业务都运行在ODPS上。

为什么进行数据质量管理?

企业数据质量与业务绩效之间存在着直接联系,高质量的数据可以使公司保持竞争力,并在经济动荡时期立于不败之地

大数据时代,如果没有良好的数据质量,大数据将会对决策产生误导,甚至产生不可估量的结果

目前,分析系统中的数据流转和处理环节越来越多,数据越来越复杂,数据质量出错的环节也就越来越多

为保证数据更好的为公司及企业的战略提供正确、有力的支撑,必须就要保证数据质量的准确,进而必须要进行严格的数据质量监控,以保证数据的可靠性、高质量

Apsara Clouder大数据专项技能认证:使用MaxCompute进行数据质量核查

更多精品课程点击:阿里云大学

你可能感兴趣的:(使用MaxCompute进行数据质量核查)