【华为数据之道学习笔记】3-6 观测数据

       观测数据是通过观测工具获取的数据,观测对象一般为人、事、物、环境。

       相比传统数据,观测数据通常数据量较大且是过程性的,由机器自动采集生成。不同感知方式获取的观测数据,其数据资产管理要素不同。

       观测数据的感知方式可分为软感知和硬感知。软感知是使用软件或者各种技术进行数据收集,收集的对象存在于数字世界,通常不依赖于物理设备,一般是自动运行的程序或脚本;硬感知是利用设备或装置进行数据收集,收集的对象为物理世界中的物理实体,或者是以物理实体为载体的信息,其数据的感知过程是数据从物理世界向数字世界的转化过程。

       观测数据的特征有如下几点:

       1)观测数据通常数据量较大且是过程性的,主要用作监控分析。例如,视频监控器产生的视频数据、操作系统产生的日志记录数据等;

       2)观测数据由机器自动采集生成。例如,各种传感器或探针记录观测对象产生的数据;

       3)观测数据是观测工具采集回来的原始数据(Raw Data),仅转换结构和格式,不做任何业务规则解析。

       观测数据的管理模型如图3-9所示。

       观测工具的元数据可以作为数据资产管理:软感知(埋点、日志收集、爬虫)观测工具抽象成业务对象,由IT部门担任数据Owner进行统一管理;硬感知观测工具作为资源类数据,也建议作为业务对象由相应的领域担任数据Owner进行管理。

       原则上,观测对象要定义成业务对象进行管理,这是观测数据管理的前提条件。

       观测数据需要记录观测工具、观测对象。针对不同感知方式获取的观测数据,其资产管理方案也不尽相同。例如,以用户界面浏览记录为例,如果是对销售机会点的查询访问观测,应当归属到相应业务领域;如果是对页面性能、页面UV、PV的观测,应当归属到IT部门。

你可能感兴趣的:(#,数据中台,华为数据之道,读书笔记)