数据治理-大数据与数据科学-定义大数据战略与业务需求

组织试图解决什么问题,需要分析什么

        虽然数据科学的优点是它可以为组织提供一个新的视角,但该组织仍然需要一个起点。一个组织可以决定如何使用这些数据来理解业务或业务环境,证明关于新产品价值的想法,探索未知的事物,或者发明一种新的商业方法。在项目实施的各个阶段,制订一个评估这些举措的计划非常重要,并且需要在多个时间点评估该计划的价值和可行性。

要使用或获取的数据源是什么

        内部资源可能易于使用,但也可能在范围上受到限制。外部资源可能很有用,但不在业务控制范围内(由其他人管理,或者不受任何人控制,如社交媒体)。许多供应商在这个领域竞争,所需数据元素或数据集合通常存在多个数据源。获取那些已经存在和整合的数据,可以降低总体投资成本。

提供数据的及时性和范围

        许多元素可以实时提供,也定时提供快照,甚至可以整合和汇总。针对静止数据的计算算法与流式计算算法之间存在巨大差异,低延迟数据是理想的,但往往以牺牲大量机器学习能力为代价。不要为了满足下游数据使用需求而采用最小化集成级别。

对其他数据结构的影响以及其他数据结构的相关性

        可能需要对其他数据结构进行结构或内容改造,使其适合与大数据集成整合。

对现有建模数据的影响

        包括扩展对客户、产品和营销方法的知识。

你可能感兴趣的:(数据治理,大数据,数据治理)