明略数据CTO:做国内最全面的大数据解决方案供应商

个人简介 冯是聪博士,明略联合创始人兼CTO。2003-2006年任职于朗讯中国贝尔实验室(Bell Labs);2006-2011年曾任惠普中国研究院(HP Labs China)资深研究员;现为中国人民大学信息学院企业硕士导师,上海市数据科学重点实验室(复旦大学)数据科学家。冯是聪博士也是中国第一代搜索引擎“北大天网”核心研发成员之一,现拥有20多项国内外发明专利,曾在WWW、CIKM等国际学术会议上发表论文10余篇,是大数据、云计算、计算广告学、信息检索领域的专家。如今,他致力于将技术回馈社会,是北京明略软件系统有限公司联合创始人兼CTO,在国家信息安全政策风向标下,为企业用户打造高质高效的专业大数据服务,用顶尖的技术和丰富的经验推动中国企业的发展与创新。

   

1. 各位InfoQ的读者大家下午好,我们现在正在明略北京办公室内,今天我们邀请到了明略联合创始人兼CTO冯是聪博士来接受采访。冯博士你好!

冯是聪:你好!

   

2. 请先跟我们InfoQ的读者打个招呼吧。

冯是聪:大家好,我叫冯是聪,我是明略公司的联合创始人兼CTO。

   

3. 冯博,能不能先向我们的读者介绍一下您的工作经历,以及您现在主要负责的工作内容?

冯是聪:我是在2003年博士毕业后参加了第一份工作,进入了朗讯中国贝尔实验室,在这期间我主要负责企业级应用软件的研发。

2006年我开始从事第二份工作——在惠普中国研究院做企业搜索技术研究。这期间我做了一件当时比较自豪的事情,那就是研发全球最大的缩写词在线查询与自动识别全名系统。

到2011年我加入了秒针,在秒针公司我主要从事计算广告学在互联网广告技术公司的应用工作,期间我带领团队主导完成了一些比较核心的算法,比如异常流量的排查算法、跨屏打通算法、开机广告监播算法等一些核心算法。

到2014年,我们创立了明略这家公司,现在主要负责大数据技术在企业中的落地工作,积累大数据技术的研究经验。

   

4. 您曾经在朗讯中国贝尔实验室和惠普中国研究院都工作过,这应该是很多科技人才或者是互联网工程师都非常向往的两个地方,您能不能谈谈这两段工作经历?

冯是聪:朗讯中国贝尔实验室对技术的研究非常重视。我可以先简单介绍一下贝尔实验室,大家现在知道的一些像Unix操作系统、光纤通讯,还有非常流行的C语言以及C++语言,实际上都是朗讯贝尔实验室发明的,他们会把技术研究作为公司发展的一个长期战略,并不是那种短视的科技企业,这家企业的进步也非常快。

而惠普中国研究院以及惠普实验室,其最大的特点就是它是硅谷文化的发源地,也是硅谷创新与硅谷包容文化的代表。在惠普工作过的人都知道有句非常著名的话,叫做惠普之道,英文叫做The HP Way,它说的核心思想就是,创始人David Packard认为只要一家企业作为一个平台,如果这个平台足够好的话,那么企业里面的员工就一定会全力以付的工作。那么这种思想,像后来创立的一些公司,比如Facebook还有谷歌,他们最核心的企业文化里都包含有一些惠普的思想。

在这两家企业里工作的经历,让我从基础软件、技术研究,到实际应用,这一开发完整的流程,我全部走了一遍。所以我对这两家公司一直怀着非常感恩的一个心态,也有幸在这两家公司工作过。

   

5. 您曾经在求学期间参与过北大天网这个项目,可能我们现在的很多90后的这些上网的人和开发者已经对这个词没有印象了,您能不能谈一谈这个北大天网和百度之间的关系?

冯是聪:北大天网在我读书期间,曾经是中国国内第一个做互联网搜索引擎的,这是第一家,也是做的最好的一家。现在很多人不太了解北大天网的原因,是因为北大天网启动实在是太早了。

那是1997年10月29日,我记得非常清楚,就是第一次上中国国内教育科研网,就是CERNET。那时候谷歌还没有创立,那时候最好的网站就是门户网站,就是雅虎。97年上线以后,因为我们是国内第一家能够处理中文的搜索引擎,所以非常迅速的在中国流行起来。当时上学的学生,包括企业界所有人,做中文搜索第一选择一定是北大天网。

到了2000年的时候,李彦宏从美国回来创业,然后他从我们实验室挖去了三个人,就是当时北大天网里面最核心的三个人,刘建国、周利民和雷鸣。可以这样说,百度当时最核心的技术人员,都来自于北大天网。从一定意义上也可以说,当时百度第一版本应该是来源于北大天网,所以北大天网应该算是百度的前身。

   

6. 应该说李彦宏抓住了互联网搜索这一波重要的机会,您从贝尔实验室和惠普研究院出来之后,也加入了广告系统平台,也就是秒针这家公司,现在又说创立了一家大数据公司。我们知道,数据可能依托于两个方面,一方面是说底层的基础架构,它的性能、容量是否足够支撑这种高数据量的并发,另外一方面可能是一些软件方面的开发。这两个方面都提升之后,是不是基于大数据的创业就能够现实了?或者说以前我们把这种数据保存下来,就仅仅只是保存下来了。而现在我们有机会挖掘数据背后真正的价值,这时这种商业机会成熟了,是吗?

冯是聪:确实是这样。我作为一个技术人员,一直在做技术。其实我自己有一个梦想,就是想把我们以前做的技术,无论是做基础研究,还是后来做应用研发,都能够转化成真正的科技生产力。因为现在这个时期,就是中国目前这几年,大数据技术成长的非常快,而且慢慢的变成了被广大的企业或者政府可以接受的,我们觉得时机已经非常成熟,所以我们就把以前的积累,包括在以前的工作经历、技术上的储备,义无反顾的都拿来成立了明略公司。我们最大的一个特点,就是我们在追求的梦想,就是想把以前所积累的无论技术架构方面的,还是上层应用方面,甚至是基础研究方面的一些技术,能够真正的落地,真正的转化成生产力。

   

7. 从在贝尔实验室、在惠普做基础研究,然后又转到创业公司,这是两种不同的追求,或者说两种不同的工作状态,也面对着不同的挑战和压力,当然也有不同的乐趣,那您能不能比较一下这两种工作状态的区别?

冯是聪:因为我是做技术出身的,所以我还是希望我们的技术能够转化成真正的领域内的生产力。但是我无论是做技术研究,还是做应用开发,实际上我们都是在一个企业内部做事情,我们的作用无非就是一个小螺丝钉,我做的事情所带来的是非常有限的贡献。但是,如果我们自己做一个事情,做中国本土的一个企业,这个贡献就将是不可同日而语的。

在这种情况下,我们真正想做得事情是,做一个中国本土的大数据公司,那就是我们明略的一个使命,我们想做中国技术最强的,而且落地最好的一个大数据公司。我们的口号也是“一时之杰,明略过人”,我们也是抱有产业报国的志向的。业界内的厂商大都是一些外企,而我们现在有这么好的技术和这么好的团队,我们为什么不做自己本土最好的一个大数据技术公司呢?这也是我们的一个动机。另外一点,大数据里面实际有很多涉及到国家安全与政府安全的非常机密的数据,所以我们想提供一些能够达到军工级数据安全的服务。

我们做大数据公司,核心一定是挖掘数据本身的一些价值,这个价值能够对企业、对社会有真正的益处。以前无论是在惠普中国研究院,还是在朗讯贝尔实验室,还是在秒针这样的公司,相比之下那种自己真正想做的事情,可能目标更大,也更宏伟,而且可以更多的影响到社会或是更广的一个领域,这也就是我感觉到的完全不同的乐趣。

   

8. 那其实对一家创业公司来讲,可能找准自己的定位,找准自己的目标市场、目标用户,推出第一款产品或者说最初的几个拳头产品是非常非常重要的,这也是关系到这个企业是否能够生存下去的一个关键的因素。我注意到明略现在推出了大数据平台BDP、大数据挖掘DataInsight,还有魅力报表CharmiBoard,那么为什么会首先选择推出这三款产品?

冯是聪:我们公司的定位是做中国最完整的大数据解决方案提供商,所以我们发现在客户需要一个完整的解决方案的时候,他通常就是需要这三款产品。

首先第一,他需要一个基础平台,能够把以前企业最基本的数据还有一些运算能力都管理起来,所以我们就开发了这种BDP大数据基础平台,它能做的就是最基础的工作,之后将客户的数据管理起来以后,那么自然而然的诉求就是,如何从数据中挖掘有价值的内容,因此我们又开发了第二款产品,就是所谓的大数据挖掘平台DataInsight。当价值挖出来以后,第三块也是很自然的需求了,也就是如何把挖掘结果利用有效的手段展示出来,所以我们就开发了第三款产品,叫做魅力报表CharmiBoard系统,它可以以非常直观的、非常形象的方式把我们相关的结果给展示出来。我们首先推出了这三款产品,这既是来自市场本身的需求,也是我们主动去适应市场的一个需求。

   

9. 这三款产品是一环扣一环,每个产品背后都需要另外一款产品做支撑,才能最终满足最高层次的需求。那么明略是否会考虑到以SaaS的形式提供这种服务呢?因为在很多投资人或是互联网思维看来,他们会认为SaaS是一种具有高成长性的商业模式。传统的比如case-by-case这种销售模式,可能发展到一定的规模之后,会出现比较大的瓶颈,而SaaS这种纯互联网的形式,就可以更快速的、以更低的成本扩张,您怎么看?

冯是聪:SaaS模式本身确实是有其自己的特点的。但我们认为对于中国的很多企业,比如一些大型的国有企业,或者政府,甚至一些军工类的企业,对数据的安全性要求非常高。这其中最大的一个问题,就是在大数据里面的安全技术瓶颈没有被突破的情况下,客户是不会贸然的把自己的数据放到云端,然后使用SaaS服务或者是其他的云服务。因为这里最大的风险,就是厂商有可能会把客户的数据偷偷转移到第三方平台上去,这个第三方平台是不是可信,是不是可控,这都是未知的。

明略的客户定位,正是那种对安全级别要求比较高的企业。因此我们采用的模式就是in-house或者on-premise这种服务模式。这种模式的特点,就是把我们的产品系统或服务部署在客户自己的数据中心内部,这样就会规避数据被泄露出去的风险。这种模式除了数据安全问题以外,它还有一个天然优势,那就是它能根据企业或者政府机构的需求的不一样,很容易实现定制开发,以及个性化开发。

并不是说SaaS模式不好,它确实有自己的适用范围,比如说有些中小型企业,或是对于数据安全不是那么在意的一些企业,他们不需要大量的投资去做自己的基础设施建设,也不需要建自己的计算中心,这种情况下对于SaaS就很合适。那么我们的客户定位是那种中大型的传统企业,他们对于安全的要求级别比较高的,因此我们并没有采用SaaS模式。

你可能感兴趣的:(明略数据CTO:做国内最全面的大数据解决方案供应商)