投标演示项目准备

这几天投标国家污染源普查项目,要求有一个demo演示系统功能,同时也提供了普查的样例数据,按照演示的要求,准备了一个演示场景,如下:
投标演示项目准备_第1张图片
按照要求,演示要涵盖4个方面的内容,由于时间仓促,只导入了工业污染源的4张表的数据进行演示,同时由于样例数据很少,为了演示效果,按照数据格式也造了一些模拟数据,这4个方面的功能分别如下:

  • 数据清洗与入库。将工业源数据导入hive数据库,通过清洗工具,为工业企业基本情况表的字段配置清洗规则,演示配置了统一社会信用代码的格式检查,若存在不符合规范的字符,则将符合规范的部分提取出来;
  • 数据处理。将清洗后的数据进行关联,建立工业企业基本情况、工业企业废水治理与排放情况、工业企业废气治理与排放情况模型,统计各关键指标的数值。建立集市数据模型,将汇总数据导入到MySQL库,用于分析展现;
  • 统计分析。利用报表可视化工具,建立“全国工业污染源普查数据分析”报表,包括了普查对象分布、废水排放与主要污染物分布、废气排放与主要污染物分布三类分析,总计3个分析页面。
  • 用户权限,演示用户管理、角色管理、权限管理等功能。

你可能感兴趣的:(数据分析,数据治理)