数据化运营的定义与剖析
目前并未有人对数据化运营给出一个明确的定义:遇到这样的情况,我一般会做说文解字的工作,即弄清楚什么是运营、什么是数据化,然后两者是如何结合起来的。
讲到运营,必然讲到营销,现代营销理论最早可以追溯到罗姆·麦卡锡的《基础营销》谈到的4P(product\price\place\promotion)理论,从4P的顺序和定义可以看出,该理论核心是产品,但随着商业社会的发展,竞争日趋激烈,商品数量及品类逐渐丰富,商业的重心逐步由产品转移到了消费者,因此应运而生4C(consumer\cost\convenience\communication)理论,具体来讲,即
1、customer’s needsand wants;
2、cost and value tosatisfy consumer’s needs and wands;
3、convenience tobuy;
4、communicationwith consumer;
进入二十一世纪后,随着计算机行业的发展,科技的进步,大数据时代的来临,市场营销面临越来越苛刻的营销预算、海量的运营数据堆积和存储,4C理论在商业部分发达国家已经不再适用,于是nPnC的理论随之出现。在此,以3P3C为例说明:
1、Probability:营销、运营以概率为核心,追求精细化、精准率;——这儿的概率有两层意思,从宏观上来讲,可以定义为特定消费群体整体的概率,从微观上讲,可以定义为具体某个消费者的响应概率;前者如目标市场定位、寻找相似特征的潜在用户,后者如关联算法、预测响应模型等
2、Product:注重产品功能,强调产品卖点
3、Prospects:目标用户定位(市场细分)
4、Creative:创意——包括产品、文案、活动、合作等(营销大师科特勒非常重视现代化营销上的创新,为此著有《水平营销》一书,下次可与读者一起分享)
5、Channel:渠道定位与投资回报核算
6、Cost/price:成本/价格
在这其中,数据分析挖掘所支撑的目标响应概率是核心,以此基础上围绕产品功能优化(产品A\B测试)、目标用户细分(用户聚类)、活动(文案)创意(活动成效对比)、渠道优化(渠道收益对比)、成本调整(投入产出比)等环节,共同促成数据化运营的完善,这儿需要重点说明的是,虽然在新的营销理论中,数据分析挖掘涉及到营销各个环节的决策与分析,但这并不是说市场营销以数据分析部门为重,企业的核心、企业的利润来源仍然是运营及市场部门,数据分析部门所提供的是分析的工具,是对企业营销的武装,企业将产品推向用户仍需要能够解决用户痛点的产品、精准化市场定位、合适的渠道合作、创意化营销方案等这些基本元素,因此在大数据浪潮中,企业或非盈利部门应正确看待数据的作用和地位,合理地利用数据,切不可妖魔化或小觑之。
讲到这里,我们能够自己给大数据运营下个定义,即:以企业(机构)海量数据的存储和分析挖掘应用为核心支持的、企业全员参与的,以精准、细分和精细化为特点的运营制度和战略;或者说是企业(机构)常规运营的基础上增添数据分析和数据挖掘的精准支持。
数据运营并非一蹴而就:
首先,需要企业全员参与的意识:只有所有部门员工达成这种意识,自觉运用简单或复杂的数据分析工具,才能真正实现助力企业从数据中发掘信息财富。只有这样,产品开发提出的新概念来源于用户反馈数据而不是拍脑袋出来的;运营人员才会提升运营前准备、运营中把握、运营后反馈、修正,提升预见能力和掌控能力而不是被动地抄KPI报表;客服不再满足于为客户提供服务,而是有意识地挖掘有价值的客户新需求;企业数据挖掘团队也不再是孤军奋战于技术及项目工作,而是肩负企业全员的数据意识、数据运用技巧的推广责任。如此,数据部门才能够将其精神、血脉融于企业之中,带动其它各部门的脉动,发挥出数据资产真正的价值。
其次,数据化运营应形成一种常态化的制度或流程:企业日常工作中所使用的数据结构和层次能够判断出该企业在数据应用上的水准和效率;
最后,数据化运营需要高层的倡导与推动:海量数据开发和应用是跨多部门、多技术、多专业的整合性流程,这些挑战并非企业单个部门所能够承担。当今互联网的巨头在数据化道路上无不是如此,如在12年阿里就设立了CDO(chiefdata officer),实行“数据分享平台”的战略。
为何数据化运营:
1、企业竞争白热化的时代,传统的运营方法很难提升企业的运营效率;
2、数据挖掘、数据存储技术的飞速发展;
3、互联网企业与生俱来的特点就是大数据,而随着互联网+进程的加快,互联网、物联网、云计算技术的打通,大数据已经不再是互联网企业的专属。数据已成为企业的最大财富,在16年的云栖大会上,马云创造性地提出了五新,其中一新便是新资产(即大数据资产)。未来商业的竞争优势来源于对数据的解读和快速反应能力。
实行数据化运营的前提:
1、能够实现企业级海量数据的存储:随着分布式技术成熟及网络服务器的发展,解决了数据仓库、计算能力的一大难题,但企业实行数据化运营仍需要投入巨额成本在数据存储仓库搭建、维护及人力成本上;
2、拥有精细化运营的需求:如垄断企业或极细分的区域性小企业,对精细化、个性化运营需求并不强烈,没有必要实行数据化运营;
3、数据分析和数据挖掘技术的有效应用:一者企业需要一支能够胜任数据分析和挖掘技术的工作团队,包括拥有数理统计、数据仓库、数据挖掘、业务学习及快速学习能力;二者数据分析团队与业务团队能够相互协同配合,分析团队不仅能够得到业务团队的参与与支持且业务团队拥有相应的数据化运营的能力和水平。
4、决策层的倡导与支持
当前数据化运营的新发展——数据领域的新业态:
1、数据产品作为商业智能的一个单独的发展和应用方向;即用户在某些特定领域或特定数据时可以独立分析和展示结果,而不需要分析师帮助的数据工具,如淘宝的“量子恒道”、百度的“百度分析”;
2、数据PD(product designer)成为数据分析和商业智能的一个细分职业;
3、泛BI概念的深入人心:即逐渐淡化数据分析师团队作为企业数据分析的唯一专业队伍形象,让更多的业务部门员工也逐渐掌握数据分析的技能和意识;数据分析师承担向业务部门指导、传授数据分析和探索的能力培养工作;
什么是数据挖掘
即从数据集合中抽取隐藏在数据中的那些有用信息的过程,我称其为有效化和显性化;它包括数据库、人工智能、机器学习、统计学、高性能计算、模式识别、神经网络、数据可视化、信息检索、空间数据分析等多领域的知识和技术。
数据分析和数据挖掘的区别:
1、数据挖掘擅于处理大数据,是直接从大型数据库中抓取数据并分析;
2、一般借助于数据挖掘工具,而并不需要特别的专业统计背景;
3、统计分析的前提是概率假设,但对于海量数据的数据挖掘来说,并不需要这些假设;
4、统计分析往往会出现一个或一组函数结果,但数据挖掘侧重于应用,很多时候并不需要明确的函数关系,甚至不知道哪些变量在起作用;
实际应用中,分析与挖掘无分高下,应结合具体业务情况和业务需求来采用合适的技术。
数据挖掘主流技术——不详细说,之后再与读者展开分享:
1、决策树:顾名思义,该技术规则是从根部开始,逐渐细分到各枝干,每个枝干即为一个规则,主要算法为CHAID(chi-square automatic interaction detector)—因变量为类别型变量|检验方法为卡方检验、CART(classificationand regression tree)--检验方法为基尼系数等不纯度指标、ID3\C4.5\C5.0(iterative dichotomiser)--检验方法为信息增益。
2、神经网络:用计算机模拟人脑思维,简单来讲,该技术是通过输入多非线性模型及不同模型间的加权互联,最终等到一个输出模型,主要算法为反馈传播(backpropagation)、多层前向型(multilayerfeed-forward)。多用于信号处理、模式识别、专家系统、预测系统。
3、回归:包括线性回归、非线性回归和逻辑回归(logistic regression);
4、关联规则:主要目的是找出数据集中的频繁模式,即cooccurrence relationships;如购物篮分析;主要算法为Apriori算法;
5、聚类:顾名思义,不做解释,主要算法包括划分法(K-means)和层次法,主要用于数据处理阶段的探索和运营阶段的群体划分;
6、贝叶斯分类:罗胖虽是个文科生,但他对贝叶斯的理解还是非常到位的,该技术理念与人脑对事物判定的方法相似,典型案例就是“三人成虎”,即随着信息的增多,结论就逐渐明朗,当然如果信息是有偏的,结果也不一定准,就如这个例子一样。
7、支持向量机(SVM):使用超平面分类的方法,这儿不展开讨论,它对于复杂的非线性决策边界的建模能力高且不易过似合,但需要的训练数据量较大。
8、主成分分析:该技术属于传统统计分析范畴,主要原理为将多个原始变量合并成若干主成分,再用于建模分析,从而降低了数据的维度。它的推广延伸即为因子分析。该技术在数据处理、降维、变量关系的探索方面;
9、假设检验:即小概率事件原理,即观测小概率事件在假设成立的情况下是否成立;
互联网行业数据挖掘特点:
1、数据海量性ß互联网面向海量用户及由此产生的海量网络日志
2、数据分析(挖掘)周期短ß技术进步、白热化的竞争
3、数据分析(挖掘)成果时效性短ß用户行为变化迅速
请听下回分解:数据化运营主要应用项目类型&数据团队与其它部门的分工协作
#######################################################################
欢迎微信交流:左码为作者微信,右码为作者公众号(博客文章会同步于公众号发布)