编者按/60秒钟,Flicker上会有3125张照片上传,Facebook上新发布70万条信息,YouTube有200万次观赏。图片、声音、文字以及这背后用户的习惯和轨迹构成了互联网上的数据资源,大数据时代迎面袭来。
用户的消费习惯、兴趣爱好、关系网络以及整个互联网的趋势、潮流都将成为互联网从业者关注的热点,而这一切的获取和分析都离不开大数据。一方面,社会化媒体基础上的大数据挖掘和分析将会衍生很多应用;另一方面,基于数据分析的营销咨询服务也正在兴起。
这些专注于数据挖掘和数据服务的公司将成为电子商务乃至互联网第三方服务业中的新兴力量。
数据背后潜藏着巨大的商业机会。以前只有Google、微软这样的公司能做大数据的深挖,现在已经有越来越多的创业公司进入,不同公司在不同维度的数据分析和服务正创造出新的商业模式。
《爆发》作者、全球复杂网络研究专家巴拉巴西教授表示,一项新的学术发现转化到商业模式会涉及很多的因素和很长的时间,比如社交网络理论的提出到Facebook等社交网络兴起,经过了数十年的时间。而大数据领域的商业形态发展也会有这样的滞后性,但资本市场早就开始聚焦于具备数据汇聚以及挖掘分析能力的公司,并开始投资大数据挖掘的早期项目。
大数据的价值
首先,手中握有数据的公司站在金矿上,基于数据交易即可产生很好的效益;其次,基于数据挖掘会有很多商业模式诞生。
“假如我们有了一个数据预报台,就像为企业装上了一个GPS和雷达,企业的出海将会更有把握。”马云在2012年网商大会上的演讲中形象地表示了数据的重要性。
谷歌搜索、Facebook的帖子和微博消息使得人们的行为和情绪的细节化测量成为可能。挖掘用户的行为习惯和喜好,凌乱纷繁的数据背后找到更符合用户兴趣和习惯的产品和服务,并对产品和服务进行针对性地调整和优化,这就是大数据的价值。大数据也日益显现出对各个行业的推进力。
腾云天下数据挖掘总监张夏天表示,大数据时代来临首先由数据丰富度决定的。社交网络兴起,大量的UGC(互联网术语,全称为User Generated Content,即用户生成内容的意思)内容、音频、文本信息、视频、图片等非结构化数据出现了。另外,物联网的数据量更大,加上移动互联网能更准确、更快地收集用户信息,比如位置、生活信息等数据。从数据量来说,目前已进入大数据时代,但现在的硬件明显已跟不上数据发展的脚步。
以往大数据通常用来形容一个公司创造的大量非结构化和半结构化数据,而现在提及“大数据”,通常是指解决问题的一种方法,即通过收集、整理生活中方方面面的数据,并对其进行分析挖掘,进而从中获得有价值信息,最终衍化出一种新的商业模式。
张夏天告诉记者,虽然大数据目前在国内还处于初级阶段,但是商业价值已经显现出来。首先,手中握有数据的公司站在金矿上,基于数据交易即可产生很好的效益;其次,基于数据挖掘会有很多商业模式诞生,定位角度不同,或侧重数据分析。比如帮企业做内部数据挖掘,或侧重优化,帮企业更精准找到用户,降低营销成本,提高企业销售率,增加利润。
百分点的联合创始人苏萌表示,未来,数据可能成为最大的交易商品。但数据量大并不能算是大数据,大数据的特征是数据量大、数据种类多、非标准化数据的价值最大化。因此,大数据的价值是通过数据共享、交叉复用后获取最大的数据价值。在他看来,未来大数据将会如基础设施一样,有数据提供方、管理者、监管者,数据的交叉复用将大数据变成一大产业。
据统计,目前大数据所形成的市场规模在51亿美元左右,而到2017年,此数据预计会上涨到530亿美元。
大数据已有商业模式
目前,国内网络广告投放正从传统的面向群体的营销转向个性化营销,从流量购买转向人群购买。
虽然市场大环境不好,但是具备数据挖掘能力的公司却倍受资本青睐。
国金证券TMT行业分析师赵国栋表示,大数据是一个很好的视角和工具。从资本角度来看,什么样的公司有价值,什么样的公司没有价值,从其拥有的数据规模、数据的活性和这家公司能运用、解释数据的能力,就可以看出这家公司的核心竞争力。而这几个能力正是资本关注的点。
移动互联网与社交网络兴起将大数据带入新的征程,互联网营销将在行为分析的基础上向个性化时代过渡。创业公司应用“大数据”告诉广告商什么是正确的时间,谁是正确的用户,什么是应该发表的正确内容等,这正好切中了广告商的需求。
独到科技创始人张文浩认为,社交网络产生了海量用户以及实时和完整的数据,同时社交网络也记录了用户群体的情绪,通过深入挖掘这些数据来了解用户,然后将这些分析后的数据信息推给需要的品牌商家或是微博营销公司。
实际上,将用户群精准细分,直接找到要找的用户正是社交内容背后数据挖掘所带来的结果。而通过各种算法实现的数据信息交易,正是张文浩为自己的社交数据挖掘公司设计的盈利模式。目前,这家仅仅五六个人的小公司拿到了天使投资。张文浩表示,目前,国内网络广告投放正从传统的面向群体的营销转向个性化营销,从流量购买转向人群购买。未来的市场将更多地以人为中心,主动迎合用户需求,前提就是要找到这部分人群。
在移动互联网领域,北京腾云天下科技有限公司从开发者角度找到数据挖掘的方向,通过提供免费的技术服务,帮助开发者了解应用状况。“对于腾云天下来说,服务的同时也聚集了数据,盈利方向是为开发者提供更有价值的信息服务和增值服务。”张夏天表示。
大数据的多重挑战
如何将数据信息与产品和人相结合,达到产品或服务优化是大数据商业模式延展上的挑战之一。
伴随着各种随身设备、物联网和云计算云存储等技术的发展,人和物的所有轨迹都可以被记录。在移动互联网的核心网络节点是人,不再是网页。数据大爆炸下,怎样挖掘这些数据,也面临着技术与商业的双重挑战。
在中国软件开发者大会上,腾讯首席科学家孙国政表示,“现在我们面临的挑战一方面是大数据的存储处理,更重要的是大数据如何为用户、为广大网民服务的问题。”
首先,如何将数据信息与产品和人相结合,达到产品或服务优化是大数据商业模式延展上的挑战之一。张夏天认为,大数据对算法和计算平台的挑战加大,计算开销大增。总量上升,质量下降,这是大数据带来的重大挑战。
其次,巧妇难为无米之炊,大数据的关键还是在于谁先拥有数据。多盟联合创始人兼COO张鹤表示,智能手机是根据用户营销而不是根据媒体营销。移动互联网提供了新的数据来源,数据分析能够针对每一位用户的手机信息做精准匹配,但目前大数据时代还没有真正来临。多盟虽然每天可覆盖1800万用户,但对用户行为的描述,还需要更大的数据量。
从市场角度来看,大数据还面临其他因素的挑战。架势无线CEO叶忻直言,大数据很有前景,但是市场中数据噪音太多,会导致数据价值大大降低。以无线营销为例,大量的刷量以及水军好评差评等数据已经严重干扰了数据的准确性,这实际上大大降低了数据的价值。
电商数据挖掘需要“军师”
有这样一个真实案例在微博上流传很广。
美国一名男子闯入他家附近的Target店铺(一家美国零售连锁超市)进行抗议:“你们竟然给我17岁的女儿发婴儿尿片和童车的优惠券。”店铺经理立刻向来者致歉,其实经理并不知道这是公司运行大数据系统的结果。一个月后,这位父亲来道歉,他的女儿的确怀孕了。
这个故事就是基于数据分析的精准营销的结果。百分点现在做的就是通过分析用户在网络上的消费行为数据,帮助电商企业实现“千人千面”精准营销。
大数据时代,营销将会更多地依赖数据,从而更精准地找到用户。百分百创始人苏萌表示,根据来自不同平台的数据进一步挖掘和分析,找到这些数据相对应的人群,再将这些群体进行个性化的对比,并以此展开个性化的营销服务。例如发送EDM,或者流量对接,或者跟传统搜索结合。
“大数据的一个重要趋势就是数据服务变革,针对群体,把人分成很多群体,每个都给予不同的服务。”百分点首席科学家周涛表示,以电子商务为例,传统电商推荐,多是使用协同算法,挖掘不同产品间的关联度。但在百分点,这样的算法已经从基础服务形式,下沉到推荐引擎框架底层,不直接推荐结果。
苏萌告诉记者,在数据爆炸的年代,人们经常淹没在海量商品和资讯之中,不知道自己想要什么。而百分点的数据挖掘正是主要侧重于如何找到用户需求,以及如何将数据转化为对客户的帮助。
通俗来讲,电商网站通常用的关联规则并不是个性化算法,比如白酒、花生米两个可能对所有用户都关联度很高,就会推荐这两个商品。但是个性推荐,则会通过场景和需求来调动不同算法,计算对于个体真实的用户需求。
个性化推荐知道用户喜欢什么,确实地提供商品推荐信息,于是就发挥了“导购”的作用,这无疑更能刺激购买。对于电商企业来说,在精细化运营的趋势下,无疑会为更精准的营销和用户重复购买。
以走秀网为例,采用了百分点提供的分析数据后,消费者可以通过走秀网上的“本月热销”(个性化热销榜)、“猜您喜欢的”(个性化热览榜)浏览或购买自己感兴趣的商品。其个性化服务能力大大提高。
苏萌表示,百分点每天获取的数据主要分为两类,一类是内容和商品基础数据容量,每天大约在TB级的规模;另一类是一些关于合作伙伴网络上的行为偏好数据,例如浏览过什么、收藏过什么、购买过什么等数据,这部分数据大约达到了GB级的规模。“这两类基本是离消费者最近的数据,可以说是电子商务最核心的数据。”
和线下零售不同的是,电子商务网站都有非常丰富的顾客历史数据,包括登录、点击、浏览以及购买等等。如果你把数据放在地下室让它们堆满灰尘,这些数据就是一项负资产,它们需要硬件来存储,需要人员来管理,却没有任何使用价值。
苏萌表示,在百分点有两大数据处理平台,一个是流处理平台,另一个是批处理平台。前者会处理一些实时性比较高的数据,例如消费者购买意图或者点击预估数据。而在批处理平台上面,更多的是做一些基础任务,例如全网行为的挖掘分析、BI分析、商务报表等,会按照时间调度来完成。这两个数据平台,正是个性化推荐和分析运营工具的支撑。
数据服务前景可期
产业界对于大数据的热情持续升温的同时,资本也敏锐地发现了这一趋势,并开始关注数据挖掘和服务类公司。基于此,《中国经营报》记者专访了对这个领域深有研究的IDG资本合伙人李丰。
《中国经营报》:现在大数据越来越多被提及,你觉得数据挖掘在商业模式上有什么新的趋势?
李丰:大数据就是实时数据的处理和实时结果的导向,越来越多的数据挖掘前端化,或者说直接为消费者感知和直接提供消费者所需要的服务,通常形式是诞生了各种各样的个性化推荐的服务。
《中国经营报》:在大数据背景下,对于各种从事数据挖掘的公司有什么新的机会?
李丰:大数据的前提是数据总量的迅速增加以及数据的流动性增加,前者是由于用户的行为在手机和电脑上越来越多,门槛越来越低;另外一个因素是因为各种平台的开放导致流动性增加,以上两个因素的诞生才能催生更多的直接为消费者服务的大数据公司。以北京百分点信息科技有限公司(以下简称“百分点”)为例,这家公司的方向、应用和诞生时间,恰好符合了这样的趋势。
《中国经营报》:从投资角度,你怎么看数据挖掘类公司的投资价值和公司前景?
李丰:我看好以大数据为出发点的商业模式和电商的后续服务产品。它们的前景大方向是符合趋势的,但是具体产品和数据处理能力,可能是最终成败的因素。
《中国经营报》:从行业角度看做大数据的门槛在哪里?做数据挖掘需要具备哪些重要的因素?
李丰:门槛主要是如何获得大量数据,数据的质量、相关性以及是否有好的处理能力和技术,最终应用的方向是商业化的关键。
《中国经营报》:在你看来,IDG投资百分点主要看中哪几个关键点?你认为百分点所处的竞争环境如何?
李丰:百分点具有良好的团队、技术能力、行业能力以及研究能力,在它们的创始人之间既有互补又有突出。另外,它们的诞生和发展符合了大的趋势,而且相对又有一点领先。目前的竞争环境主要取决于国内互联网公司,尤其是大公司对于开放数据的态度和速度,同时也包括它们的技术能力和产品是否能够不断地超越用户的需求。