如何对抗BAT数据霸权?

咱不急,先来撩开“BAT数据霸权”的面纱。

关于大数据,有一个传奇故事:美国“创投教父”彼得·蒂尔创立的Palantir公司,通过大数据分析,帮助美国政府抓住了本·拉登。

对此,有人拍手叫好,有人惊叹莫名,而我,在好奇之外,细思极恐:大数据已经越来越成为一种壁垒极高的资产,如果不采取措施,数据就会被BAT等大公司垄断,小公司根本没有出路。

BAT数据霸权已经兵临城下


如何对抗BAT数据霸权?_第1张图片

据2016腾讯智慧峰会披露的数据显示,全网日均产生的可记录数据规模高达18万亿GB。这使得近年来数字数据的数量每3年多就会翻一番。

在全网大数据面前,BAT的数据当然是沧海一粟。但我说它们有形成数据霸权的嫌疑,并不是指他们的数据量大得惊人(当然,他们相比其他公司来说,数据量是遥遥领先的),而是他们的数据实在太有价值。

未来大数据的核心叫“社会化大数据”,人和人的关系、人和数据的关系都要用数据关联和呈现。而BAT三家公司,牢牢把持着互联网搜索、社交以及电商的入口,并且利用巨量的产业资本,将触角四处延伸,聚起了一座座“大数据金矿”。

从数据类型看,腾讯数据最为全面,这与其互联网业务全面相关,其最大的特点是基于社交的各种用户行为和娱乐数据。阿里最为突出的是电商数据,其数据最大特点是从浏览到支付形成的用户漏斗式转化数据。百度的数据以用户搜索的关键词、爬虫抓取的网页、图片和视频数据为主,其特点是通过搜索关键词更直接反映用户兴趣和需求,以非结构化数据更多。

它们所积累的大数据已成为一种底层资产,是帮助它们不断开疆拓土的“骁兵悍将”。百度利用其在搜索领域积累的大数据,现已重点转型研究人工智能,并且做到了国内领先,比肩Google、Facebook、微软等国际巨头。阿里已经通过其电商数据中的交易、信用、SNS等多种数据来决定是否可以发放贷款以及放贷的额度。腾讯的大数据目前更多的是为腾讯企业内部运营服务。

现在,BAT早已知道数据里有金子,因此会采取相对封闭的办法。即使今天不能完全发挥大数据的价值,但守着金矿,不许别人来挖。

这种做法会阻碍行业发展,最优秀的专家未必有机会获得数据进行分析处理。海银资本创始合伙人王煜全老师曾在《数据究竟是资源还是壁垒?》一文中提到一个有趣的故事:美国著名企业家、发明家、《奇点临近》作者库兹韦尔,为了利用谷歌公司的数据研究人工智能,不得不加入谷歌公司。由此可见,数据已成许多公司的核心资产,得到数据的唯一办法就是加盟BAT这类公司。


如何对抗BAT数据霸权?_第2张图片

毫无疑问,拥有大数据的BAT对用户的理解要比其竞争对手深刻许多,容易形成数据霸权。未来,数据垄断的问题会更加严重。

怎么办?

重新焕发“沉默的大多数”

在此背景下,有人提出了三点应对措施:

1.鼓励开发垄断数据之外的数据源,发掘许多“沉默的”数据的价值;

2.培养更多从事数据收集工作的专业人士;

3.每一家公司都应该进一步深入思考目前掌握的数据的作用。

在这三点措施中,第一点是至关重要的,它就像一块石子,投进湖中,涟漪会扩散到第二第三点。在采集数据源这一块,挚金资本投过的八爪鱼无疑是行业翘楚,但在发掘数据价值方面,不得不提快播原人工智能团队创立的一面数据(好了,终于来了)。


如何对抗BAT数据霸权?_第3张图片

一面数据是一家从事数据沉淀、处理、整合、理解,以及可视化工作的公司,也就是说,他们不仅做数据采集,也做数据洞察分析。一面数据CEO任栋霓曾就职于快播平台架构组,从事图像/人脸识别和搜索技术的研究与产品化。他在接受采访时表示,两年前,快播陨落,因不忍看着兄弟东奔西走,他们人工智能部门20多号程序员打算另拉起一支队伍,成立了一面数据。


如何对抗BAT数据霸权?_第4张图片

他们的办公地从30层的大厦搬到6层的小楼,就在一处工业区改造的厂房。近期Pre-A轮融资后,铅笔道曾采访过他们,文中有一处细节让人心感唏嘘。“走出小楼宽敞的货梯,任栋霓站在狭窄的走廊里,眼前没有装潢华丽的会议室、休息室,只有一间间小隔断,里面横着几条电脑桌。”任栋霓说:“突然从一个大公司的程序员,角色转化为创业公司,蛮不适应的。”

一面数据最初是给基金做数据分析,因为基金的支付能力很强,但它的市场容量很小,且很多需求是非标的。

在初期为基金服务时,一面网络也曾有过自己的迷茫,感觉自己像是一个外包公司,长期这样下去会让方向越走越窄。而他们当年创业的几个小伙伴依然希望保持自己的初心,他们认为通过技术手段获取网上越来越丰富的数据,并基于这些数据做分析及可视化,必能产生有价值的结果,帮助大家改善生活。

后来,一面主要往快消、时尚和汽车行业发展,市场边界不断扩大。任栋霓认为中国大部分的企业或个人已经完成了电子化,下一步其实就是要从电子化走到智能化。而一面要做的就是把电子化沉淀下来的东西去做出价值。他们希望能让更多人知道这些价值,便成立了自己的自媒体《数据冰山》,希望透过数据挖掘与分析,呈现互联网海面下隐藏的冰山一角。


如何对抗BAT数据霸权?_第5张图片

他们的数据风文章深受广大知友喜爱,目前数据冰山知乎专栏已有85602人关注,点赞数更是高得吓人,不信自己去看。除了知乎,微信公众号、今日头条、36Kr和i黑马等平台上也能找到他们的足迹。

自媒体的抢眼表现极大助力了他们的业务。其实今年之前,一面没有任何推广销售团队,主要的客户都直接或间接来源于数据冰山。任栋霓回忆说,知乎、广告下面,几乎每天都有客户留言,天天能接到电话。陆续,他们也签约了十几家客户。

经过两年多的发展,一面数据也得到了资本市场的认可,在开启融资仅仅3个月后,就于今年7月拿到了真格基金和联想之星的1400万融资(此处应有掌声)。

好吧,言归正传,这家公司所代表的趋势和模式究竟是怎样对抗数据霸权的呢?又是如何重新焕发数据中“沉默的大多数”?

任栋霓解释说大数据只是一个概念,或者说是一种思考问题的方法,一面落脚点在于做数据分析,然后用分析来形成洞察,去指导厂商的运营跟决策,那他们就能直接用数据驱动业务增长。

现在极少极少的公司能够用到这种数据驱动的理念去指导业务。比如在营销中,我们依然陷在李叫兽所说的“价值攫取型”战略中,想尽办法争取广告位、代言人、流量等存量资源。相对应的,“价值创造型”战略的核心则是通过切换资源的利用方式,来创造新价值。每家公司在发展过程中,都会积累大量的数据,但我们却不加重视,重视了又不知怎么合理利用。现在,我们都应把数据当成公司的重要资产,并且重新创造新的连接,而不是视而不见。

一面数据把整个流程都统合在其旗下三大产品之一的“云雀”,这是一个实时的数据洞察系统。云雀(Lark),取义于在云端穿梭,捕捉动态的百灵鸟。任栋霓说云雀不是给C端用户来采集数据的,主要是给B端去做数据监控的。用户可以用它来跟踪市场、竞品,也可以跟踪自己消费者的反馈和口碑。它是一个行业性的工具,需要非常深的业务绑定。


如何对抗BAT数据霸权?_第6张图片

大数据的特点,关键不在数据本身,而是数据的洞察力。那么第三点如何理解数据就显得尤为重要。在这背后,机器学习和知识图谱构建是关键性技术。


如何对抗BAT数据霸权?_第7张图片

任栋霓解释说,机器学习能做的无非是分类和预测。在运用机器学习时,他们大量使用到了分类功能,比如可以利用机器自动化地将几百万、上千万的用户评论分成好评跟差评,然后再将这些评论维度细化成包装的、物流的、产品质量或者说是一些打折客户的忠诚度。

这些原来都需要靠人去阅读,或者靠一些非常简单的关键词去筛选,但很不准确。只要训练样本足够多,足够完备,其实机器能够自动地帮我们把这些东西分门别类。之后我们再根据分类结果去做一个指标的监控,或者说简单的统计,就能得到很多有价值的、可以长期监控的指标。

任栋霓还提到,机器学习的分类功能也可以对一个用户本身去做分类。机器基于客户的历史行为,如订单、咨询、售后评价、参与的打折活动,将数据标签化并提取特征,再丢进机器学习的模型里去做分类,这样就能够得出一个消费者价值的体系。比如说在一个消费场景里面,一个客户对我来说,究竟是高净值客户呢?还是说有潜在流失的风险呢?还是说他的付费意愿很强,但并没有完全被我激发出来呢?又或者说他其实已经流失掉了,你再怎么唤醒他都不会回来了?

科技一定要有应用才能真正产生影响力。在这里,机器学习已经在商业分析中发挥出它独特的价值。

接下来,云雀不仅仅提供2B服务,在年底左右还会推出2C版本,毕竟未来给用户提供完整解决方案和个性化服务,才是大数据公司真正的竞争优势。到时候,我想更多人一定能感受到大数据采集、分析、可视化给工作和生活带来的巨大改变。

如今正逢资本寒冬,创业维艰,虽然任栋霓说没怎么感受到寒冬的存在,但我还是想替所有正在创业中咬牙坚持的人问一个烂大街的问题:初心对创业者来说重要吗?

任栋霓想了想,很认真地回答道:“创业过程中会有很多问题,你会不断怀疑自己所做的事情。然后市面上也有很多新的机会摆在你面前,比如说互联网金融很火,曾经的O2O也火过一段时间,但在这些新机会面前,你要坚持你原来想做的事情。你要相信你之前做的事情是有价值的,并且这个价值要在你长足持久的努力之下才会被放大,并最终体现出来。在那种时刻,如何去坚持,如何去选择,我觉得这个就是我们理解的不忘初心的含义。”

如何对抗BAT数据霸权?_第8张图片

是的,不忘初心应是一种信仰。

只要出现更多像一面这样的公司,能帮助企业和个人认识和挖掘利用大数据的价值,我想BAT数据霸权将不会再是一个值得担忧的问题。

你可能感兴趣的:(如何对抗BAT数据霸权?)