我的大数据方法论:求扔砖

对于数据分析师而言,掌握一套方法论至关重要。搞数据挖掘,需要知道CRISP-DM,5A以及SEMMA三种过程模型或方法论。然而对于大数据,对于各位打算成为数据科学家的读者,是否想过总结一套适合自己的大数据方法论呢?这里抛出拙著,希望广泛讨论,不足之处,敬请赐教~

整体构思:

有观点认为大数据本身是种方法论,对于此,我持保留观点。然而对很多想实现大数据,想发展成为大数据公司的企业而言,面对大数据却有些无从下手。所以有必要对如何搞大数据做一翻思考,并基于此,抽象出通用的流程出来。这里,划分为六个环节:商业分析、场景设计、业务理解、数据规划、智能建模、深度应用。一个企业要实现大数据,可以有很多方法,本方法主要提供一种参考。首先从商业角度考虑,布局,挖掘商机,这个很容易忽略,往往通过布局一种生态,对企业未来发展十分有利。其实通过场景设计,找准大数据的真正定位,比如做提供什么样的服务可以实现双赢,做一款什么样的产品以什么样的方式运营可以刺激需求可以获利,没有这种认识和觉悟,是做不了大数据的。另外,比较重要的两点是数据和平台。我一直认为大数据对计算和分析的要求很高,即便只有几百KB的数据,想实现精度很高的模型,也会产生极大的运算量,所以需要依靠平台,没有平台,拿什么来计算,拿什么来提高性能。另外一个维度就是数据,大数据要实现跨界就必然引入更多数据,除了公司自己的数据外,还有合作方的数据,还有数据对接的数据等等,这个量是很大的。玩的越大,数据关系越复杂,说明数据的数据也越大,对平台的挑战也越大。

最后,一切分析和挖掘的目的都在于运用,如何让分析的结果产生更大的价值,如何有效地解决客户的问题呢?我的观点是要把应用做深,在不经意间,引导用户,满足潜在需求,提高效率,刺激需求

下面,通过一个例子说明本方法论:

(1)商业分析

某游戏公司为了刺激玩家的活跃度,尝试与银行进行跨界合作(玩游戏需要用币,银行卡有积分需要消费),寻找新的商机

(2)场景设计

该游戏公司通过分析发现,用户的银行卡积分使用率很低,在玩家游戏币不足的场景下,通过银行卡积分兑换游戏币,提升玩家活跃度

(3)业务理解

通过业务理解,该游戏公司确定了提升玩家活跃度10%的目标,并分析了影响提升玩家活跃度的诸多因素

(4)数据规划

基于与银行合作的考虑,该游戏公司与银行在数据绝对安全的情况下实现了数据的对接,并与现在数据进行有效集成,同时规划后期采集和使用的数据

(5)智能建模

该游戏公司基于数据+平台的理念,构建了一套智能学习平台,通过配置建模流程和规则,得出建模结果,该公司基于此制定了详细可靠的业务规则

(6)深度应用

基于业务规则,当玩家游戏币余额不足时,会根据玩家当时的心态分析结果,决定是否呈现银行卡积分兑换游戏币的功能。该公司最终达到了商业目标




你可能感兴趣的:(我的大数据方法论:求扔砖)