2000年之前,还是core db 的时代,人们还在构建交易信息化系统
GB时代
2000-2010, EDW的时代,这么大的交易数据,存哪儿啊,怎么用
TB时代
2010-2020,BigData的时代,不光有交易数据了,还有好多网络数据,半结构化,非结构化数据,Internet时代,80%是非结构化数据
PB时代
主线:
大数据并不是那么神秘,他和我们的国计民生有着重要的关系,他代表着一个未来的趋势,代表一种新的技术和方法来诠释
新时代的信息
奥巴马 的数据分析团队
曾经在2008年的大选中就帮助过Obama夺取过胜利
如今他尝到了甜头,数据分析团队扩充到了几十人,是之前的5倍
奥巴马获胜,国内A股得益的是哪家?
估计n多的博士,分析师,经过海量的测算和模型预测,都得不出一致正确的答案。
答案是 澳柯玛。。。为什么,因为A股需要想象力
所以说,大数据并不是绝对意义上的数据量大才能叫做大数据分析。
而超越传统结构化数据的,更多v(variety)的信息的分析的思路和方法,才能够称得上叫大数据分析。
还是拿上面的例子,这里涉及到文本分析和心理学以及想象力。。。
但是说实话,国内要能真正应用大数据,发挥他的最大威力,难度相当大。
为什么?
涉及到数据的,都是一把手工程,传统的非大数据BI都难以做得很好,何谈大数据,以国内IT领先的运营商和银行(非互联网企业)来说
他们都没有做到企业内数据的完全共享和整体挖掘,其他企业能难说。
为什么?
因为这个涉及到不同部门之间的利益问题,在大型企业尤其明显。技术和数据共享的壁垒边界相当明显。
即使可能某些小的企业做到了数据共享,还是没有太大起色
为什么?
这个涉及到文化和政治形态特性,国内永远是人治,没有做到data-driven,而且偏向于内敛和谨慎的态度,基本上都会在可选的技术范围内选择
风险最小,又可行的方案,这样没错,但是丧失了领先的机会。
最后,最终的还是涉及到人的问题
数据深层次分析,
大数据技能的人才非常罕见
即便上面都做完了,我们如何创造性的从中挖掘出真实的insights并将之与实际的ROI联系起来,这是最后,也是最大一道坎。
国内,国外媒体吹嘘了半天大数据,为什么没有听到过特别有名的案例,听说过,也不是特别具体?
1. 如果您听说过Gartner的技术成熟度曲线(或者叫炒作曲线)理论,你就会明白,现在大部分人认为大数据还在过热期,即将达到膨胀的顶点。
这意味着什么,意味着大众认为,或者这项技术本身还未达到可以随便就落地的成熟阶段,或者说市场才刚开始意识到BigData的前途和能力,
但没有太多的成功案例和最佳实践来帮助降低新技术引入的风险,也就是对风险收益没有信心。
但是这是一个典型的鸡与蛋的问题。不过市场上面总会有
敢想敢冲,
敢作敢为的人第一个吃螃蟹,并在经历了艰辛之后收获
丰硕的喜悦。
这些成功的企业往往便成为业界的翘楚和标杆,走自己的路,让别人去追赶。
说实话,真的等到技术成熟到瓜熟蒂落,这便不是获得先机和优势的手段了,只是一种不得已而为之疲于应付的补救了。
2. 大数据究竟对于客户来说,究竟有什么好处
我的观点是,你个人想达到的目标的便利性和你出卖自己隐私之间取得平衡
换而言之,你愿意暴露自己多少隐私来换取好处?
我们来考虑两个极端
A 愿意告诉所有的企业和个人自己的收入,喜好,家庭,朋友关系,等等
B 什么都不愿意告诉别人,问了也不说
你认为企业要获得这样的客户需要花费多少的成本?
而我们现在来看大数据擅长的领域或者目前看来最适合的场景,都是和客户的360度视图和客户偏好相关的
这就是平衡,一方面企业试图挖掘客户的这些信息,达到市场细分,精确营销,抓住目标客户的目的,
一方面客户担心自己的隐私暴露,被太多的企业骚扰甚至被不法分子利用。
但另一方面,我们希望企业能够理解关怀自己,给予最好的服务。
这是有事务本质的内部矛盾,这个在当今的中国显得尤为突出,因为公信力的缺失和法律法规的薄弱。
一个例子,Wallmart首创的供货方库存机制,将自己的库存信息暴露给供货方,由他们决定何时供货
节省仓储,加快商品周转率。
这就是为什么中国人觉得外国人普遍比较傻,比较好骗的原因,应为发达社会是法制,有信仰,人们不用为这种事情操心,所以建立得了信任关系
进行合作能更加的高效和安全,社会如此进入良性循环,优胜劣汰,整个国家生产力和发展水平更高。