林奇:Autonomy的中国路

Autonomy的“样板工程”Blinkx中文版测试工作正在有条不紊地进行着。

    这家公司今年3月在中国找到了一家“非常大”的合作伙伴,双方共同投资的首笔资金就达亿元。业界传言,这个合作伙伴,就是网通。

林奇:Autonomy的中国路

    Autonomy是个公司名称,也是一种搜索引擎技术。“这是区别于关键词搜索的下一代搜索引擎技术,在不久的将来,它将彻底取代以Google、百度为代表的‘关键词’。”Autonomy公司的创始人,也是董事长麦克·林奇日前在来访北京时对记者说。

    从“搜索”到“发现”

    这位有点谢顶,但言谈举止都十分“英国”的英国商界巨子,严肃而认真地告诉记者:在全球商用搜索市场上,Autonomy是老大!Autonomy的市值不足Google的零头,而Google在这一市场的份额也不足Autonomy份额的零头。

    “我们拥有55%的份额,而且这些份额的一半以上来自Google的母国:美国。”林奇说,尽管Google在全球消费搜索市场上取得了巨大成功,但在商用搜索市场上的份额仅为1%。

    目前,人类研究的信息搜索技术有四个方向:关键字搜索、模式识别、语义分析、神经网络。除了关键词搜索比较成熟外,其他三项技术还处于待开发状态。Autonomy掌握了模式识别。语义分析和神经网络两个技术方向目前尚无压倒性的代表者,这两个技术方向的研究难度相对较大,估计短时间内不会有突破性研究成果。所以,模式识别就成了目前比较先进的信息搜索技术。

    传统搜索基本上采用“关键词”搜索方式,也就是“非0即1”的方式,它基于严格定义和分类的布尔表达式,即“与、或、非”表达式。这种搜索的最大弊病就是:如果关键词不确定,或者有错误疏漏,用户往往得不到自己想要的搜索结果。

    如果说传统的“关键字”搜索方法为“搜索(search)”,Autonomy采用的“模式识别”方法则应该称为“发现(discover)”,因为它可以让用户找到一些事前他们不知道的信息。Autonomy产品中提供的“聚类”功能正是“从搜索到发现”的最佳表现。这位自信的英国人认为,Autonomy在安全性和保密性,跨平台跨语种,维护成本等方面有着非常大的优势。

    林奇认为,企业级搜索需要考虑许多问题,“你不会允许公司的前台接线员搜索到CEO的邮件,也不会容忍保洁工看到某些内部文档。”

    他同时认为,维护他的产品就像维护一块砖头一样简单。他说,Autonomy的产品在数据和用户界面之间建立了一个智能检索逻辑层(IDOL),通过这个中间层,用户可以像搜索结构化数据(如数据库的数据)一样搜索上百种非机构化数据,如Word、Notes、PDF、PPT、Email数据等,甚至可以检索多媒体数据(通过专门的语音分析工具对多媒体数据文档化后即可)。

    掷硬币理论衍生出的搜索技术

    Autonomy系列产品基于两个基本理论:贝叶斯概率论和香农信息论。

    如果一枚硬币被连续抛100次,每次都是正面朝上,那么,抛第101次时,正面朝上的概率是多少?传统统计学观点的推论是:50%。而贝叶斯概率论则认为:100次连续正面朝上,证明该硬币不均衡或两面均为正面,所以抛第101次时正面朝上的概率会大大高于50%。

    贝叶斯概率论是中世纪一位叫托马斯·贝叶斯的牧师所创立的,这位古怪的牧师试图通过自己的数学推理来验证上帝之存在。这个理论在他去世后才被发表,沉寂了百年之后才被麦克·林奇发掘出来再利用,后者认为,贝叶斯的理论更加接近人的大脑思维逻辑。

    香农信息论则认为,出现频率越小的信息单元,代表的信息量越大。这也可以解释这样的现象:在一个嘈杂的房子中,我们尽管不能完全听清楚对方所有的话,但我们还是能听懂对方说话的意思。也就是说,每个信息载体会包含大量重复的冗余信息,在对这些信息的处理过程中,冗余信息的权重要低得多,甚至可以忽略。而在关键词搜索中,则相反,一个单词出现的频率越高,则该词的重要程度越高。

    正是基于这两个基本理论,Autonomy在海量信息处理中取得了巨大成功。
在林奇眼中,所有信息就像无差别的质子、中子和电子,就像电影《黑客帝国(Matrix)》中描述的那样:众生皆为同一。他要做的就是:理解它们之间的关系——用他那奇怪的数学理论。

    林奇大学时期就开始了对这些理论的研究,日后,正是这些研究,使他取得了巨大的成功。

    英国的比尔·盖茨

    林奇在英国是个传奇。他出身平民家庭,却成为了亿万富翁。这在讲究出身、等阶级观念很重的英国,是个异数。因此,他在英国一直有“英国比尔·盖茨”的称号。

    林奇是一位消防员的儿子。林奇告诉记者,当年,他曾经向父亲请教未来之路该如何走的时候,他父亲告诉他:“永远不要做那种人家都从失火的房子往外跑时你却往里跑的人。”

    父亲的经历深深地影响到了林奇的未来。

    所以,勤奋的林奇长大后并没有子承父业,而是考入了英国剑桥大学,获得博士学位,并留校成为一名教师。

    本来,林奇的父母希望儿子在剑桥好好地工作,成为一位受人尊敬的学者。“作为一个工薪阶层出身的人,在这样一个全世界著名的高等学府里工作,家人也会感觉到很骄傲。”林奇说。

    “英国是一个非常传统的国家,等级制度是历史遗留下来的,工薪阶层很难进入上层社会。”林奇完全能够理解父母对他的期望。

    直到有一天,林奇问自己:难道我这一生就这么过吗?这个问题困惑了他相当一段时间。当IT创业潮横扫全球之时,林奇突然意识得,自己在数学的某些神秘领域——图形识别算法──内所拥有的专门知识可以在商业中派上用场。他看到,许多迥然不同的人,例如希望处理数字信号的唱片录音师和希望研制识别字迹的软件程序员,所依赖的都是类似的算法。

    但是,在英国,保守的传统让“风险投资”无从生长。没有启动资金,开公司只能是梦想。怎么办?

    林奇找到了当地的一位流行歌手,并鼓起勇气,喋喋不休地把自己的奇怪理论讲给了这位歌手。这位歌手困惑地听了大半天他的理论后,对他说:“我还是无法完全了解你说的事情,但我还是决定给你投一笔钱,因为我相信你的能力。”于是,林奇拿到了第一笔“风险投资”:3000英镑。

    林奇用这笔钱创立了Neurodynamics公司,也即Autonomy公司的前身。1996年,Autonomy公司成立,林奇任CEO。随后,林奇的公司分别在英国、欧洲、美国等股票交易所上市。

    在奇迹屡见不鲜的美国,林奇的经历可能并不算什么传奇,但在保守而传统的英国,林奇的经历绝对寥若晨星。

    “有一点叛逆是很重要的。”已经事业有成的林奇以自己的经历,告诉所有有志于创业的人们,“这可能是一个人取得非凡成功的第一步。”

    目前,Autonomy在全球的业务主要集中在媒体、政府机构、金融和信息产业等需要处理大量非结构化数据的领域。像美国国土安全局、美国国防部、美国航天局、英国警察署和美国陆军等都在使用Autonomy技术,因为对于网络上出现的大量有害信息,Autonomy可以做到事前发现,从而帮助政府机构及时地反应。

    Autonomy的中国路

    2003年3月,Autonomy进入中国市场,业务主要集中在电信和政府部门,按照林奇的介绍,国家外文局、中科院、上海信访办等都是他们已完成的项目。

    “林奇的智能搜索引擎简直太神奇了,这简直是一个用计算机创造出来的神话。”一年前,陈一宏第一眼看到这个搜索引擎时就被它深深地吸引了。现在陈一宏已经是Autonomy在中国最大的合作伙伴卓越动力软件(北京)有限公司的总经理。他现在的工作就是每天坐在与Autonomy中国的联合办公室里,向来来往往的客户演示这种智能搜索引擎。

    陈一宏在自己的笔记本电脑上打开林奇控股的blinkx.com智能搜索引擎网站,当着记者的面键入了“YaoMing”(姚明)两个字,然后点一下视频搜索功能,关于姚明的视频就都显示在了屏幕上,并且搜索出的结果全都是从有姚明这两个字的那一帧开始播放。而每当演示到了这个时候,陈一宏都会显得有些激动,并不由自主地问他对面的听众:“神奇吧?!”

    如果Autonomy和中国那家大企业——可能是网通——的合作获得成功,并被推广引用的话,不论是林奇,还是陈一宏都认为,Autonomy将拥有国内搜索市场最大的份额。“最主要的目标客户群跟国外一样,是电信企业、政府部门、媒体等对信息要求更高的部门。”

    林奇表示,搜索引擎的整个故事还远未结束,现在运用的只是可以被实现的技术中很小的一部分,他的传奇才刚刚开始。(记者 段世文)

你可能感兴趣的:(auto)