Kensho和AlphaSense是怎样炼成的

作者:朱衡利、鲍捷 本文首发于文因互联官方博客:http://blog.memect.cn/?p=2944

前言——工业精神

工业革命既不是棉花时代,也不是蒸汽时代,而是进步的时代。

18世纪60年代,工业革命首先从英国的棉纺织业开始,然后传播到采矿、冶铁、交通运输等行业。从飞梭和珍妮纺纱机再到蒸汽机和内燃机,无数凝结着人类智慧的技术发明开启了这浩浩荡荡的近代五次工业革命。

蒸汽机的发明人瓦特曾以第三人称写了一本自传,他在书中这样写道:“他的脑海中萦绕着如何制造既便宜又优良的发动机。” 除了功能和美观之外,这种对经济价值的探求代表了一千年来欧洲技术理性的发展顶峰。

在技术急速引领着社会发生变革的时代,无数先锋人物被某种“诱发因素”所吸引,这一诱发因素不仅仅是一种技术突破,使其如此强有力的原因还在于低廉的价格。这种因经济价值而产生的“诱发因素”象征着一种新的潜力,能够点燃这群机敏而坚毅的先锋人物在技术和商业的想象力。换言之,诱发因索清楚地显示出,基于相关创新的企业将在成本上富有竞争力[1]。

金融与技术创新

技术革命每隔40年至60年爆发一次,它所带来的转型过程影响到社会的各个方面。而在每一次的技术革命中,金融资本都是新技术革命带来的产品和服务的最有意愿和最大胆的客户,它时刻为加快交易速度和扩大经营领域准备着,同时以一种间接但是极为重要的方式推动了每一次技术革命。

在每一次基础设施、技术和组织的创新当中,都有一些加速了货物的运输和信息的传输。这些创新通常又可以接着作为变革之源服务于货币、银行和金融部门。苏伊士运河开通之后,对于蒸汽船,国际电报线路和其他有利于迅捷国际贸易的事物都在广泛地收到资本的资助。而在由美国发起的几次信息革命中,银行就是廉价邮局、全国性铁路和电报的早期客户,也是最先使用电话、打字机和计算器的机构。

芝加哥期货交易所(The Chicago Board of Trade)建立于1848年,这正是电报线路架设到这一城市的那一年。在接下来的几年内,商人们在其他的几个主要的商业中心建立了类似的期货机构。

1887年,时任美国最大的电报公司西联公司(Western Union)总裁格林说道,西联公司传送的电报中至少有87%与商业相关,且绝大部分商业电报都是投机买卖。这种投机电报交流的大部分都是“没有运输且常常没有商品交割”的买卖。因此格林坚信,电报从“本质上”来讲是“商业和投机买卖的附属品,需要即时通信及答复”,并不是一种大众通信手段[2]。

当时,一位商业编辑曾评论说,在电报商用之前,商人们能够利用预先知道的远处的价格信息进行大规模的农产品投机买卖。而在电报商用之后,既然价格数据能够通过电报的方式快速传输,商人原先那种投机套利的方式就不复存在。取而代之的是,他们开始通过猜测在未来某个特定日期农产品可能的价格进行投机。这样,时间就取代空间作为最大的未知数。且据这位编辑估计,之前这些农产品的种植者们每年都会因为这种投机行为损失大约4000万美元,但电报商用之后,这一损失减少到原来的二十分之一。

金融的本质是信息的传递,是产生对行动和结果的预期。金融系统,无论是银行、一级市场、二级市场都是信息的传递网络。通过信息网络,当这种预期在其间被传递越精确、越快,财富就被创造出来。因而,每一次信息的革命:语言、书写、印刷、电报、电话、互联网、手机...都创造了金融的革命。

而我们当下所处的时代,就是一场新的金融革命即将发生的年代。这一次的诱发因素是人工智能。人工智能将重塑金融的信息网络,把那些传统上由经验和人脉承载的信息传递和处理渠道,渐次由机器来辅助,并且做到自动化和智能化。

要信息工业不要信息农业、矿业

在金融信息这个领域,我们已经看到无数科技企业前仆后继地涌入,江山易主、成王败寇却也存下了大大小小的各类企业,我们且将这些企业从金融数据加工成金融信息的角度来将他们审视一遍。

一种模式的企业我们可将其称之为信息农业,他们依靠人力从一些“自然资源”里刨数据,没有规模化扩大再生产的能力。这种数据农民,做不了数据的深加工,数据增值有限且产业链条不长,产出的信息价值也有限。原始积累完了,也最多只能搞点手工业为副业。

另一种模式是信息矿业,他们通过一些机械工具把一些现有的结构化、半结构化数据给开采出来,在某种场景下组装成一些更有价值的信息。这种比农业要好,但是缺陷在于开采品类有限,能做开采的人很多,技术壁垒还是不够高,所以增值有限。

那什么叫做信息工业呢?我们都知道是福特汽车敲响了现代工业的大规模生产方式的钟声,在历史的进程中究竟是什么让大规模生产成为可能呢?让我们回到20世纪初,福特改良T型车的那段时间。

1908年,在推出T型车的前夕,福特公司每一个装配工的平均工作周期,即开始重复同样作业之前所经历的工作时间,总计为514分钟。而到了1913年春天,福特在底特律海兰公园的新厂房里有了一个新的创举,就是装设了移动的总装线。工人们站在一个地方,不必走动,而总装线将汽车送到他们的面前,这一革新使工人们的工作周期从514分钟缩短为1.9分钟,汽车的生产效率以十倍、百倍的效率在增长,而这条移动总装线就是现代工厂俗称的“流水线”。

福特之所以能进行他大规模集约化生产方式的革新,是因为当时技术攻克了 “机械零件经过热处理会产生的翘曲变形” 的难题,这是过去零件不能标准化的祸根,总是依赖于机械师们一遍又一遍的手工打磨。而一旦零件翘曲变形的间题得到了解决,就使零件的数量得以减少,而且使它们变的易于相互连接在一起

那么,使金融信息工业成为可能,则也需要一种能够攻克各类“金融数据标准化”的技术。我们需要做数据的深度加工,把段落、句子、实体级别的分析做到极致,我们要把各种金融的文档都meme化继而实体化,提取它们的元数据,进而产生千千万万种数据的重组合和自动化。从数据到信息,最后再建立一个深度的金融知识网络,这就是我们要的金融信息工业。

Alphasnese——新一代金融知识引擎

在2016年福布斯美国金融科技公司50强的榜单上,出现了一家叫做AlphaSense的上榜公司,通过对该公司经进行深度调研和产品试用,发现这是一家不容小觑的公司,并发现了和其相似的几家竞品公司。

公司名称 成立时间 业务描述 融资总额
AlphaSense 2010 金融信息引擎 $3,500万

通过对这几家公司产品的剖析,相较于金融信息数据平台或者金融信息引擎,这些产品的形态更像下一代【金融知识引擎系统】。不过在介绍他们之前我们先来回顾下数据、信息、知识这三者的概念和递进关系。

  • 数据是反应客观事物运动状态的信号,通过感觉器官或观测仪器感知,形成了文本、数字、事实或图像等形式的数据。
  • 信息则是对数据进行加工处理,使数据之间建立相互联系,形成了回答某个特定问题的文本,以及被解释具有某些意义的数字、事实、图像等形式的信息。
  • 知识不是数据和信息的简单积累,知识是可用于指导实践的信息,知识是人们在改造世界的实践中所获得知识和经验的综合。
Kensho和AlphaSense是怎样炼成的_第1张图片

在投资研究的场景下,分析师通常都需要从新闻、财报、研报各种行业网站等获取大量数据、信息、知识形式的“素材”,然后再通过自己的逻辑和世界观将这些素材再组织成投资决策。我们依据素材的获取的难易程度,把它们从简到难分成5个等级:

  • 1.公司、行业、市场等新鲜的信息和数据(公司、股价、交易量..)
  • 2.相关指标、数据类信息(CPI、货运量、行业规模各种图表...)
  • 3.新鲜的论断、结论(各种看多看空的结论)
  • 4.新鲜证据(支撑论断的成为论断的事实依据)
  • 5.别人的逻辑、研究框架(全网的知识网络)

对于那些做信息工业和矿业的金融信息公司来说,其产品无外乎金融数据终端或者信息平台。前3个层级的数据信息对于用户来说都是可得的,而他们在后两层的深度信息和知识上的处理则显得有些无力。那么AlphaSense这类公司是如何通过产品在这个层面上为机构内的分析师们或多或少解决问题的呢?

他们产品组成由三大部分组成:高级语义搜索引擎、交互式知识管理系统、文档(知识)协作系统。投研人士通过高级语义搜索引擎获得各类“素材”;在交互式知识管理系统里可以有选择的对素材进行收集和管理;在知识协作系统里,可以对素材进行加工和再组织使用。

当知识切片变的足够细,并可供人们搜索、管理、再组织,这就是金融信息工业化的一个萌发阶段,这就是某种程度上局域网内的金融知识网络。

Kensho——挑起新一轮军事竞赛

我们再来看另外一个大热的Fintech公司——Kensho,其创始人是哈佛大学博士生,工程团队是从谷歌、苹果等带来的顶尖工程师,并被谷歌和高盛投资。据说他们的人工智能技术让华尔街人人自危,其公司本身具有相当高的话题性。再拜各种媒体大肆的渲染所赐,我们提起它的时候总免不了带着一些敬畏,难道机器真要取代人类了吗?甚至还要取代那些站在人类智力巅峰的华尔街分析师们。

公司名称 成立时间 业务描述 融资总额
Kensho 2013 金融人工智能数据分析工具 $6,700万

因为渠道关系,Kensho的产品对于我们绝大部分人来说仍然是个“黑箱”,我们只能通过各种外围信息来去小心翼翼的揣摩它。Kensho的创始人兼CEO Daniel Nadler是一个典型的白人精英,他有着哈佛大学的经济学博士学位,并曾经在美联储做过一段时间的访问学者。

在MIT举行的2015年Fintech年度会议上,Daniel和大众讲述了他做Kensho的始末[3]:

“ 我在Fed(美联储)的时候,桌面上有一堆像彭博、路透、capital IQ这样的工具,但是根据我对政治、天气现象、地理环境等信息得到的洞察,我使用的这些软件依然不能解决我要买什么的问题,特别是对一些事件驱动的数据分析.....后来我到了西海岸找到谷歌,谷歌的愿景是组织全世界所有的信息,但是谷歌为什么依然不能组织我作为一个金融学者使我得到洞察的这些金融信息.....。

“...我在谷歌待了几个月并告诉他们,既然你们的目标是组织全世界的信息,既然在金融领域有那么多没有结构化和被组织的信息,难道不应该有人去做些什么吗?我说服了谷歌,于是他们成为了我们最初的支撑者,并给了我们很多杰出的工程师。”

在各种场合,Daniel Nadler 总是穿着一身裁剪精良的休闲T恤和裤子,但是却搭配着一双中国程序员都会不耻的露趾皮革凉拖鞋,并顶着他那头乱糟糟的卷发。他直言批评 Mike Bloomberg (彭博终端的创始人)的生意是old-fashioned-style,说他就像懂的怎么打赢第二次世界大战的将军(而不是未来世界战争)。

Daniel Nadler 懂的如何把他自己和其公司包装成一个锐意进取的颠覆式创新者,让他犹如当年乔布斯站在科技和人文的分岔路口一般,成为站在科技和金融分叉路口的领导者。包括他任用20岁首席架构师Martin Camacho,因为后者是一个15岁就上了哈佛的少年天才。他懂的在一些场合巧妙地设计自己的行为,否则一个受过高等教育的人是不会在参加会议时全程翘着二郎腿和主持人对话。他喜欢在各种场合提到谷歌对他们的支持和高盛对他们的青睐,包括他那双看起来十分怪异的凉鞋,其实也是由著名设计师Alexander Wang设计的路易威登牌。

在知乎上有一位在纽约的用户分享了他使用Kensho产品的感受,他做了这样一句总结:Bloomberg can easily replicate this little tool and make it 100 times better。抛开哪些虚虚实实的喧嚣,我们来真正梳理下Kensho究竟在做什么[4]。

在一次采访中,Daniel介绍到Kensho是由两个部门的两条业务线组成。一个是风险分析部门,帮助大型的银行和其他金融机构理解非交易性风险,那种风险不是市场风险,而是用历史数据帮助他们分析诸如地理、天气这种影响因素带来的风险敞口。而另外一个大的业务线是全球商业媒体的分析业务,Kensho重建了商业电视媒体的分析引擎。所以kensho一方面是一个媒体公司,另一方面是一个银行风控服务机构。

我们先来看银行风控这条业务线,作为曾经在Fed工作过的金融专家,Daniel是绝对有能力和渠道来开展业务。而作为CNBC的(美国NBC环球集团所持有的全球性财经有线电视卫星新闻台)战略投资对象,媒体业务的顺利开展也在意料之内。商业电视的媒体属性使得CNBC不会对Kensho的分析能力做过高要求,毕竟对一个电视媒体来说,最重要的是新闻的速度,毕竟一个新闻在观众脑海里停留的时间非常有限。在某事件发生之后以最快的速度给出一个站得住的分析结论,这才是战胜媒体同行的关键。所以我们看到Ask-Kensho一方面可以为媒体带来一个噱头,二来则真是提高其竞争力的手段。

通过以上分析,我们看到Kensho这两条业务线对它来说都是可胜任且产生价值的,那么究竟是什么导致了“Kensho取代华尔街分析师”的传闻呢? “罪魁祸首”应该就是高盛了,因为高盛不仅是Kensho的投资人且还是他们的客户,我们来看下面一篇报道[5]:

Kensho在高盛的主要客户群是那些在银行交易大厅里的销售人员。在最近几个月,他们利用软件对买卖能源类股票和大宗商品的咨询来电进行回复,这些人想知道他们应该如何组合他们的投资,以便应对叙利亚圣战的熊熊烈火。

在过去,这些销售人员会根据他们自己对最近发生的事情以及市场反应的了解进行总结,但是会受到人类记忆能力的限制。针对特别有价值的客户,销售代表可能会要求高盛的研究分析专员进行更加完整的研究,挖掘过去的新闻事件,找出市场针对每种情况作出的回应。这种方法的问题在于,当研究结果出来时,交易机会早已溜之大吉。

Kensho只是服务于高盛部门的销售部门,帮助他们快速来应对客户的咨询,以便这些销售们能够更好地完成浅度信息的组织工作。Kensho的另外一个作用就是帮助一些研究人员完成一些初级的工作,以取代分析师『过去我每周得花两天时间做这类事情』或『过去我得专门雇佣一个人其他什么都不用做只做着一件事』的任务。

Kensho的确能够为顶尖投行进行服务,但是如果说真正地取代“分析师”,让投行有更多人的失业,也许只是一个“美丽的误解”或者“美好的愿望”。

但是如果Kensho有一天真正有了可以与华尔街分析师比拟的分析能力,变成了一个大众投资者可以使用的工具,那么其实他是促进的是市场有效性。比如有一个信号被少部分机构基金观察到并用来构建盈利策略,但随着Kensho强大的分析能力,也将其信号捕获并可供大众使用,顶尖机构因为智力不对称或者信息不对称带来的优势就会完全逐渐消失殆尽。随着越来越多的市场参与者使用同样策略,最终就会造成该策略失效。因此,市场价格得以更快、更大程度的反应“所有可以获得的信息”。

就如同19世纪的电报一般,它并没有彻底消除商人们的农产品投机交易,但是它却改变了投机行为的性质,并且减少了当时处于弱势一方的种植农们的损失。如果Kensho真的将AI技术运用到某种临界状态,使得现代金融投机的性质再次发生改变,那么彭博、路透等甚至其他基金机构本身就不得不被迫加入这场军备升级的竞赛,以避免其本身从领先者变成跟随者。

小结

在人工智能大潮席卷的时代,AlphaSense在打造金融知识引擎,Kensho在挑起新一轮军备竞赛,这些先行者正在发起一场金融信息的工业革命。这在场革命的前奏曲被吹响之后,我们是否能预料到谁会有最为光明的前途呢?

我们也应该看到,正如第一次工业革命是一个漫长的历史过程,金融信息的工业革命,也不会是短短几年就能完成的。在这个早期阶段,恐怕还处于构造“智能金融的核心引擎”的各种零件的阶段。金融分析从依赖手工的“农业”、依赖经验的“手工业”,逐渐走向“零件”的标准化,最关键的不是最终的愿景,而是如何在市场的驱动下,合理设计发展路径。AlphaSense立足于金融碎片知识的发现和重组织,Kensho立足于浅度信息快速传播和发现,都是终极愿景的必须中间环节。从前奏曲到高潮,在于实事求是,而非好高骛远。

注:文中部分观点和信息来自以下参考资料

[1]《富裕的杠杆:技术革新与经济进步》
[2]《信息改变了美国》
[3] Youtube上网络用户上传的Kensho创始人的演讲
[4] 知乎问答:《Kensho为什么会被高盛青睐》
[5] 阿尔法工场:《人工智能公司公司Kensho是如何改变华尔街的》

你可能感兴趣的:(Kensho和AlphaSense是怎样炼成的)