谈起大数据,可能普通大众觉得与自己的生活关系不大,但如果结合天猫双十一以及美国大选来讲,大数据就并不陌生了。
2016双11,天猫全天交易额达到1207.48亿元,背后的推手—“大数据”才只展露了一点实力而已。而让人想不到的是,大数据竟然还左右着美国大选。虽然爆出了“邮件门”等负面新闻,但在投票前的最后一刻希拉里在民调中仍是领先,胜率相当高。可是,在正式计票后,特朗普却一转民调劣势成为新一届美国总统。民调和实际结果之间为何存在着如此之大的差别?
本期猿团专访,清数科技董事长赵勇,将与读者一起,探索大数据的秘密,解密川普当选背后的故事。
以下为猿团记者专访内容,原创作品,如需转载请注明出处。
清数科技董事长兼CTO赵勇
川普当选背后,大数据功不可没
在采访赵勇之前,笔者被其履历折服:中国西部互联网与大数据产业分会会长、美国芝加哥大学博士,微软杰出员工奖获得者、中国大数据产业布道者和拓荒者,国内首位撰写大数据技术专著的作者,著作《架构大数据》、《大数据革命》等,其独立研发的SWIFT系统数据算法平台享誉数据科学界……
众多闪亮的头衔、世界出名的奖项,在这些殊荣背后,赵勇是个怎样的人呢?9日,笔者在第五维国际孵化器见到了赵勇。简单而笔挺的西装,瘦高的个头,谈吐间逻辑分明,环环相扣,眼前的赵勇像一个具有浓厚英国范儿的绅士,第一眼就让人觉得沉稳而睿智。
大数据是什么?各行各业都在谈论大数据,可对于大数据的认知,很多人还停留在“一堆大而无用的数据”阶段。你绝对想不到,看起来离我们非常遥远的大数据,与美国大选之间有着非常密切的关系。在赵勇看来,2016年的美国大选简直就是大数据的盛宴,川普就是利用大数据的分析,成功击败看起来有绝对优势的希拉里。
在大选中,辩论的重要性不言而喻,单从辩论能力来说,川普一个商人能和律师出身的高级政客辩到这份儿上,大数据分析科学家们帮了不少忙。他们运用大数据来分析希拉里过去十来年的辩论演讲,寻找她的弱点与习惯性语言、动作。
而在拉选票环节,大数据收集和整理必不可少。这次美国大选大数据以一种最有效的方法,来分析所有选民的年龄结构,根据不同年龄段、不同喜好来分段并且打分,然后利用这些资讯来优化他们在媒体上的花销,特别是在非常重要的电视广告上,并利用它的分析模型来告诉参选者,哪些地方能获得最大的收获。数据分析在每天的决策过程中发挥很重要的作用。
由数据驱动的竞选策略,将会帮候选人筛选出吸引特定选民的最佳行为。这意味着电视广告的时段和内容、网站广告的选择和展示时间,甚至是应该用电子邮件还是电话来争取这位选民的选票。说完以上这些,相信大家也很能理解大数据在美国大选里发挥的作用。
还有一个疑问。民调和实际结果之间为何存在着如此之大的差别? 赵勇表示,自从英国公投后,民调变得不那么靠谱了。据CNN于辩论后公布的数据,有62%的民众认为希拉里技压全场,只有27%的民众认为川普占了上风;而大数据公司Deep RootAnalytics的数据显示,川普已经领先了两个百分点。今年大选所依赖的数据来源也不仅仅是民意调查结果,还涵盖了诸多的如facebook这类的社交网站和公开及私有的数据库。及时准确地收集这些数据,并且帮助制定策略以获得更多的选民支持,将美国超过2亿的选民资料,与大型网站与社交网络上的个人账号相互匹配起来,将网络行为对应到具体的个体,再和已经构成的、庞大的用户个人数据相结合,最终完全由准确数据来驱动竞选策略。而以上这些就使得大数据分析技术成了两党候选人的重要武器。
美国留学斩获殊荣
利用川普当选的案例,赵勇为笔者诠释了大数据的用途。在大数据运用方面,赵勇拥有绝对权威的经验。作为北师大本科、清华大学研究生,赵勇还在清华期间,就作为研发主力参与了国家八五重点科技攻关项目-大型集装箱检测系统的研发,之后在北京电信长线公司带领研发团队,开发了全国光缆监测系统。2000年,赵勇前往美国芝加哥大学攻读博士,拜在全球云计算和数据科学旗帜人物芝加哥大学Ian Foster教授门下,开始了整整七年的数据科学研究之路。
在芝加哥大学攻读博士期间,赵勇参与到了各项美国国家级项目的研发,为之后的自主研发积累了大量宝贵的学术和实战经验。之后,经过刻苦钻研,厚积薄发,他独立研发了SWIFT系统数据算法平台,而这一算法平台被广泛运用于美国及世界科学研究领域,例如:美国能源部的SDSS斯隆数字天空扫描项目,美国航空航天局NASA的AstroPortal天文数据网关项目,引力波探测LIGO,欧洲大型强子对撞机(LHC)……
2007年,博士毕业后,赵勇前往微软公司,在搜索与广告部从事云平台上的大型精准广告系统的研发,用了短短只三年时间,他所率领的研发小组就从开始组建的4个人发展成为横跨美、中、以色列等数个国家的二百多人的团队,产值也从1000万美金增长到两亿美金。正因如此,次年赵勇便获得微软员工的最高荣誉:杰出员工奖,期间和导师共同发表的《云计算和网格计算360度比较》文章在世界云计算领域行业影响力排名第三。
归国创立清数科技
2010年夏天,赵勇看到国内数据科学广大的市场需求,抱着报效祖国的想法,从微软“净身出户”,踏上了回国的航班。
2012年,赵勇率先发起成立了中国的第一家专业大数据研究机构-清华大学大数据处理中心,组建了一支研发队伍,为中航信研发了基于大数据的新一代民航信息系统、订票实时查询系统、动态航班联程性能优化系统,为东方航空建立数据挖掘平台、电子商务网站优化系统。几乎同时,团队又直接参与国家电网业务系统一级部署顶层架构设计,研发的世界上第一款具有更深入的数学计算和推理能力的教育机器人,已在成都七中、川师附中这些知名中学推广使用……
至此,团队一直处于产业运用的最前线,完成了众多技术攻关,积累了大量的大数据技术运用经验的案例,已将大数据技术的运用延伸到国家电网、安监、金融、医疗、交通、农业、教育、车联网等多个领域。
在经过多年沉淀和积累之后,2015年,赵勇创办了成都清数科技有限公司,同时发起成立了中国西部互联网与大数据产业协会、清华大数据产业联合会西部分会等多个协会组织,创办了以大数据技术输出为特色的第五维国际孵化器与大数据产业基金。以平台思维,从大数据技术运用、研究开发、产品落地、人才培养、资源整合、项目孵化、产业基金等多个维度打造了一个大数据全产业生态链。
“NEO”,让用户一机进入大数据时代
在大数据应用趋势中,大数据概念已经提出来几年了,但真正能产生商业价值的应用很少。这里面有技术问题,一个大数据应用中心,不是一般的公司和企业能够建设维护的起的。再就是现在市场上,大数据应用人才非常难找,一是巨头企业没有在大数据人才培养上起作用,二是由于大数据还没有真正完全普及到商用、民用级别,这导致了大数据方面人才的匮乏。如何才能让企业用得起、弄得懂大数据,让大数据应用普遍化?
5月,清数科技正式发布“NEO大数据一体机”,不需要复杂的操作,不需要繁琐的机器维护,真正实现让用户一机进入大数据时代。
“NEO大数据一体机”为软硬件一体化解决方案,采用全分布式大数据处理架构,将硬件、软件整合在一个体系内,分别对软硬件进行定制优化,从而保证整体性能及稳定性。另外还可以通过纵向扩展硬件得到提升,也可以通过横向增加节点进行线性扩展,让用户一机进入大数据时代。NEO大数据一体机的出现,突破了技术壁垒,整合行业专家多年的算法经验,总结应用的共性,沉淀多个行业模型,极大的简化了大数据应用实施的流程。其领先的大数据架构,其易用性带来大数据思维的变革,助力创新创业,帮助企业转型升级,实现数字化、智能化管理,转化数据价值,助推全行业大数据革新。
目前,“NEO大数据一体机”提供全行业大数据支持,教育、金融、精准医疗、国家电网、民航、电商、旅游、农业、交通、航空、智能制造、科学计算等,不管是政府还是企业,一键式接入“NEO大数据一体机”,就可自动生成数据图像及分析,傻瓜式操作,即使不是专业人员也可使用,非常便捷。
除去“NEO大数据一体机”,清数科技利用大数据,发布了双创大数据版图,通过对全国双创企业、园区的全面数据收集和深入分析,运用多维表现形式,清晰的描绘出当前中国大众创业,万众创新的全景数据版图,通过展现资金、人才、园区等创业要素在行业和地区间的发展和流动情况,让观察者能深入剖析地区双创趋势,洞见技术和市场的发展浪潮,并特别提出清数双创指数来整体反映一个地区的双创活跃度,为政府、创业者、投资机构决策提供重要的参考依据。毫不夸张地说,未来,大数据即将成为国家战略性资源,运用到各行各业。
采访最后,赵勇的一句话深深触动了笔者,他表示,创业这条路非常艰辛,然而“不是因为有机会才坚持,而是因为坚持才有机会”,谨以此句,勉励所有坚持在创业路上的人。道阻且长,且行且坚持!
如果你也有一个创业梦,欢迎关注【猿团专访】,了解每个CEO背后的故事,或者创投信息;如果您创业成功,想与我们一起分享创业故事,预约CEO专访,欢迎发送CEO简介或公司简介至邮箱:[email protected]。
(文章来源:猿团传媒 作者:瘦司)