数据产品工作指北(1)-基础概念

数据被提到了越来越重要的位置,但是数据产品的内涵是什么;数据中台越来越频繁的被提起,那么新入门的人如何去理解和把握。

想要了解数据,先要知道指标和维度两个概念。

指标:衡量失误发展程度的单位和方法,通常需要经过加和、平均等聚合统计才能得到,并且是在一定条件下才有意义。例如,UV/PV、页面停留时间、用户获取成本等数据;

维度:事物现象的某种特征。例如,性别、地区、时间等;

通常情况下我们需要在不同维度查看各类的指标,所以有公式:指标 = 维度 + 度量。举一个简单的例子,如“上海市男性互联网从业人数”指标中,有三个维度,即城市、行业、性别;有一个度量,即从业人数。且度量和维度之间可以相互转换,需要与具体的应用场景相结合,如用户收入本身是一个度量,但是如果需要按照用户收入划分为高收入、中收入、低收入群体时,这个度量就变成了一个维度。

在了解这两个概念后,我们还需要了解一下数据模型:粗浅的可以分为主题域模型、概念模型、逻辑和物理模型、DB。

主题域模型:展示企业有哪些数据,类似于世界地图,展示地球上有多少个国家等信息,例如TFM的SID、Teladata的FS-LDM。

概念模型:主题域模型的细化,类似于世界地图下的中国地图,他是针对某一特定主体的详细描述。

逻辑模型:具体定义每一个实体、每一个实体的每一个属性以及实体之间的关系。

物理模型:定义数据库的具体配置方式,如数据的字段类型、长度、分区、索引等。逻辑模型和物理模型应当是一一对应的关系,即一个实体对应一个逻辑模型和一个物理模型。

接下来就是数据中台的概念。这里不给出具体的概念,但给出一些特点:具备业务属性,输入的是原始数据,输出的是指标;数据中台的建设主要包含:主题域的构建、业务过程的划分、数据模型的设计、指标/维度/度量的管理、数据的管理等内容。

那么对于目前的绝大部分公司来说,数据产品的发展通常会经历报表中心-大数据中心-数据中台的发展历程。这不仅在于不同的发展的阶段数据的重要程度不同,而且在于公司对数据的认知在不断的发展。我们必须清楚,一个产品最终是为用户服务,如果用户没有数据思维,那么做得再好的数据产品都不会有很好的应用,也就不会受到更多的重视。所以这样的历程,其实也是培养用户数据思维的历程。数据产品经理需要避免陷入报表、大屏、自助分析、BI等具体应用的泥淖中,这只是应用,更应该注重的是数据中心的整体建设。

这里只讲从大数据中心到数据中台的一小部分。

数据中心两步走的战略:一是业务,二是数据。

业务:需要产品经理熟悉业务流与数据产生关键节点,划分主题域,收集指标、统计逻辑、数据源。这里分享一篇BI建模全流程的文章,以供参考和借鉴:https://mp.weixin.qq.com/s/VNhXsJsXpKy5HrxqBvAhMw

数据:数据涉及到的内容有很多,如大数据开发、任务运维、数据集成等。这里以元数据为起点,重点介绍三个内容:数仓设计、指标系统、数据地图。另外还有数据质量监控、数据资产中心等内容。

数仓设计:常规的有ODS(业务原始数据)--DWD(清洗的明细数据)--DWS(轻度聚合的汇总数据)--ADS/DM(应用层、集市层数据)四层结构,好的数仓设计会使得数据被一层一层有序访问,无需跨层访问,最后的应用也仅对ADS/DM层数据库表进行访问,提高效率。

指标体系:常规的由业务口径、计算逻辑、数据来源等信息组成,通过清晰明确流程化的方式管理和展示指标信息,使得各业务线在使用数据时能够建立需求 -- 开发 -- 发布的全套协作流程。

数据地图:作为数据中台的门户,提供数据的快速检索、数据字典、数据学员、数据特征信息等查询,以可视化的形式展示数据的原始业务 -- 数据导入 -- 数据加工 -- 数据模型 -- 指标 -- 应用的全流程。

你可能感兴趣的:(数据产品工作指北(1)-基础概念)