量化评价和质化评价举例_数据质量量化评价研究与实现

庄计龙 陈敏刚

摘 要:近年来,随着科学技术的飞速发展,信息化、数字化社会正在形成。伴随而来的是数据质量问题越来越凸显。本文在分析了当前数据质量评价标准的基础上,确定以GB/T 25000.24为基础构建数据质量评价模型,并对指标权重进行研究。相比使用单个权重计算方法,本文综合Delphi法、层次分析法和基于信息熵的熵权系数法计算综合权重,使得权重进一步客观。针对当层次分析法的判断矩阵经计算不满足一致性时,重新构造判断矩阵成本高的问题,文章引入了诱导矩阵修正法来修正判断矩阵以尽可能避免重新构造判断矩阵。最后本文开发了相应的数据质量评价系统,有效地提高了数据质量评价工作的质量和效率。

关键词:数据质量;评价模型;层次分析法;熵权系数法

文章编号:2095-2163(2019)04-0071-05 中图分类号:TP311.13 文献标志码:A

0 引 言

近年来,随着科学技术的飞速发展,信息化、数字化社会正在形成。计算机系统软件已经渗透到生活的各个方面,这些软件不断地产生新的海量数据。此外,不仅仅是IT行业,越来越多的行业涉及到了数据的处理,如银行、保险、零售业、等等,数据已经成为新时代最重要的资产之一[1]。

但这些数据可能由于人为录入的错误、人为篡改、机械故障等原因,往往會存在数据属性缺失、数据相似重复、数据属性值异常等问题。这些错误可能会造成数据冗余,浪费存储的空间,甚至可能导致数据分析挖

你可能感兴趣的:(量化评价和质化评价举例)