个人简介 刘相峰,1999年硕士研究生毕业后曾在邮电科学技术研究院软件中心从事电信软件开发与系统集成工作,2002年加入摩托罗拉全球软件集团从事移动通信网络系统软件的开发测试工作,2006年加入汤森路透公司至今,历经负责技术服务运营、项目管理以及业务拓展等方面的工作。目前担任汤森路透Elektron中国区业务主管,负责汤森路透新一代高性能金融数据网络Elektron在中国的组建及相关业务拓展。
QCon是由InfoQ主办的全球顶级技术盛会,每年在伦敦、北京、东京、纽约、圣保罗、杭州、旧金山召开。自2007年3月份首次举办以来,已经有包括传统制造、金融、电信、互联网、航空航天等领域的近万名架构师、项目经理、团队领导者和高级开发人员参加过QCon大会。
1. 欢迎来到QCon全球软件开发大会[上海站]2013。坐在我旁边的来自是汤森路透的刘相峰先生。刘相峰先生你好。
刘相峰:你好。
InfoQ:请简单的做一下自我介绍吧?
刘相峰:好的,我是来自汤森路透公司的刘相峰,目前负责我们的Elektron项目在中国区的构建和实施。汤森路透之前,我主要是在电信领域做事,先后在原来邮电部的科学研究院软件开发中心和摩托罗拉的全球软件集团做过一些电信业务和通信系统的开发、测试和集成等工作。
2. 您这次来介绍的是一个什么样的项目呢?
刘相峰:这个项目名字叫Elektron。可能大家都知道汤森路透,它主业是做金融信息服务的。金融信息服务的整个的后台或者基础架构是一个巨大的或者遍布全球的一个金融信息网络,Elektron就是我们去构建一个新一代的金融信息网络的一个名称,也是我们这个项目的名称。
3. 我们谈到的这一个非常巨大的这个信息网络,那能简单的描述一下这个汤森路透它这个信息网络到底有多复杂、多庞大吗?
刘相峰:首先全球现在的金融市场是越来越多,那这个金融信息网络,它首先是一个数据的传输。最简单来说,数据的提供者和数据的使用者,就靠这个网络去把它去连接在一起。有几个数字可以去参考,就是说全球现在有四百多家交易所,以及一些常用的交易市场,包括国内的像上交所、深交所、中金所等等,包括一些发达市场,我们的交易所,那每天可能是有几千万个这种金融工具,就是这种市场价格会在上边去做运转、传递。
4. 那有传统上的可以衡量的多少数据量在上面跑着吗,每天这个这样的数字?
刘相峰:刚才提到有四千多个,我们叫金融工具,就比方说上深交所的一个股票,我们就认为是一个金融工具,它有很多属性如价格等。有一个来去衡量它的吞吐量可以参考,就是目前每秒钟我们要去处理三百多万个这种数据的更新。那这个数据量其实在过去几年里的是一个类似于指数式增长的。
5. 那你们在设计这个系统的时候就是要面临最大的一些挑战都有什么呢?
刘相峰:最大的挑战,我们去做这个项目的最大的一个驱动力,实际上就是为了迎和新的金融市场和交易系统的需求。数据的扩张对整个的信息网络传输处理,乃至网络和平台的一个要求,就是性能的提升。所以我们看到最迫切的一个需求,来自于要求这个数据的传输,在保证准确的同时,他要保证数据的速度会越来越快,所以我们必须在整个的系统的架构设计,包括从网络,包括从软件的处理平台,包括数据的整个的一个模型、应用开发接口等方面,必须把这个性能作为一个非常优先考虑的一个提升的一个方面。
6. 我这里头多次听到你提性能这个词,那么是不是延时这种指标在你系统里头是一个非常关键的一个指标?
刘相峰:没错,因为在网络中我们一般会用一个延时来去作为它的一个速度或者性能的一个影响。那所谓的低延时那就意味着一个高性能,或者高处理一个能力。
7. 那在您看来就是如何来衡量这个系统到底是一个低递延时系统还是一个一般的系统?
刘相峰:这个其实到没有一个非常严格的一个定义,那基本上来说,它要针对不同的应用。因为一般来说,最开始的一个应用可能就是人去使用的人机界面,它可能就是一个秒级的这么一个延时,如果我们称之为延时的话。那随着它的交易越来越自动化,或者电子交易、算法交易,乃至一些这种高频交易,那它对时间的要求会越来越短,发挥到极至,可能要到毫秒级——千份之一秒级,乃至到百万之一秒,也就是微秒级,那基本上可以以这个毫秒作为一个分界点来去看,在毫秒级、亚毫秒级的话,我们可以认为是一个高性能或者低延时的一个数据,作为一个参考吧。
8. 那设计这么庞大而又要求性能这么高的一个系统的时候,就是这个整个系统规划了有多久呢?
刘相峰:我们做金融信息咨询,金融信息服务,已经是有几十年的一个时间,那我们其实现存的是有一个网络,大约是应该也是运转了一段时间。这个新的Elektron网络应该是在2005年以后开始启动,首先在一些发达市场,因为刚才讲到对性能的要求,跟市场的一个成熟程度是有相关系的,所以我们目前在像纽约、伦敦,乃至像法兰克福、乃至香港东京我们已经在部署和上线了,特别是过去三四年吧。
9. 其实就是上线的这个过程也就是要部署三四年,实际上还是一个非常庞大、非常复杂的一个系统,可以这么理解吗?
刘相峰:它是要一个设计实现,然后我们还是有个迁移,因为我们很多客户,他是已经是在用客户,我们让他去使用到更快的数据。因为更快的一个数据处理能力,我们需要一个迁移,那只是在实施部署过程中的一个细节了,那这是要耗费时间和过程。
10. 他在使用上一代的这个产品,然后现在转移到你们新的平台上面?
刘相峰:是有一个迁移的一个过程。
11. 那在这个迁移的过程中,客户有遇到什么非常重要的问题吗?
刘相峰:通常不会,目前根据我们像在纽约、伦敦等其他市场去看,因为我们在设计最关键的方面,就是它的数据模型和应用开发接口这边,我们都是向前兼容的,所以它应该能够保证在这个系统的这个平滑过渡和升级的方面的一个连续性。
12. 那向前兼容的话会不会成为这个系统的沉重的负担?
刘相峰:这个在某种程度上,可能是首先我们保证它这个系统能够顺利的去做一个迁移。但是在整个的数据建模方面也是考虑到了平衡,跟原有的数据接口方面,特别是在保持在性能和功能的丰富性和性能的这个更高的性能方面的一个均衡,这方面是有些考量的。我们的逻辑是说,会给客户,或者给一个使用者提供一个选择,就是说根据他的业务或者系统需求,它可以选择追求更高的性能,它会用一种开发接口数据模型。那他也可以选择他可以选择用另一套这个数据开发,应用开发接口,数据类型,数据模型去做,如果它的业务对性能要求并不关键。
13. 那这个开发接口是谁都可以获得的吗?
刘相峰:我们是相当于也是一个开放的开发社区,或者一个平台,只不过是专注于金融的市场数据或市场交易这边。目前也类似于苹果社区一样,现在全球,包括我们自己,我们的客户也有几万个应用,基于我们这个我们叫这个原来叫Reuters Foundation API(RFA),这个应用开发接口,实际上有些新的代码也是可以去获取的,那我们也很鼓励去在这个接口上去开发应用,因为也有帮助于我们这个数据和整个的应用平台的一个从商务上一个推广。甚至对有些应用,如果是开发者,因为将来有可能比方是个交易系统,有非常广泛的应用,我们可以从公司这边投入些资源共同开发。
14. 现在国内有一些开发的吗,应用这种接口就是?
刘相峰:目前其实国内用我们这种应用开发接口大约有几十家客户,主要是银行,国内一些比较大的内资银行和外资银行,他们会使用这个我们这个叫企业级的数据处理平台,他相当于就把很多数据去做一个类似于数据中间件的一个概念去做,也当然是一个高性能的,对金融实时数据的一个处理,那他们会在上面去做他们的一些系统。比方说银行的资金管理系统,它的一些报价系统,还有它的风险管理系统等等。
15. 这些都可以整合在用你们的API来进行一个整合是吗?
刘相峰:对,它相当于这个API帮到这些系统和这些客户来一个便利,就是说帮他屏蔽了对所有的市场数据的来源和开发接口,相当于给做了一个屏蔽。那他使用这个RFA这个应用开发接口,那他就可以说随心所欲的根据他的业务需求去获取市场。刚才讲的可能全球几百个交易所市场,不同资产类型的数据,他都可以不需要再做额外的开发去获取。
16. 那从架构的角度来讲,这么复杂的系统演进了这么长时间,汤森路透到底有多少人参于的这种架构这个设计?
刘相峰:纯粹这一块,因为刚才讲了我们叫它Elektron,是一个金融的一个高速的、高性能的一个数据网络,我们比喻成一个高速公路。这个高速公路,它实际上是一个基石,无论这个数据怎么去传递给使用它的一个机构,还是一个个人,还是一个智能终端,那这块我们全球大约应该有上千人去做这个,当然这里头会分很多个模块,比方说从端到端去看这个数据流,每个数据最开始是从交易市场那样获取的,当然我们自己也有一些外汇的撮合平台,我们可以自己获取。像上交所这种交易所,我有四百多个,我可能每个交易所的数据格式,这个网络的接入都需要我去覆盖,然后数据收集来以后在整个的一个每个采集结点,这种一个骨干网之间我有些软件的一个设计和实现,再一个这个数据的另一端,我要把它去投放到,每一个使用它的全球可能有几十万个用户,或者是几万个这种自动化应用来说,这种数据的分布,我也需要一些软件的架构设计,大约全球超过一千人在做这个系统开发。
17. 那相当于汤森路透去替他做了很多适配这样接口的这个事情,然后他们的这个工作简化了?我的问题是,那汤森路透是怎么做这个事情的?就是你要管理成百上千个这个不同,不一样的这个数据源,这里头肯定是有很多这个非常变化非常多的各种各样的需求在这里面?你们是怎么应对的?
刘相峰:没错,你这个问题问的就很深刻了,它就涉及到汤森路透作为金融信息服务商的它的商业模式。金融信息服务里头最关键的一个商品就是金融信息,按照信息来去收费。那金融信息本身这个内容本身很多是交易市场是所有者,比方说上交所,它的报价应该都是上交所的知识产权。那汤森路透在这里扮演什么脚色呢?我是把上交所的数据我去接入,通过我的这个处理平台,把它去规范 或者统一到我刚才讲的开放、统一的一个开放的开发接口平台,这样是对一个交易所来去看,这种汤森路透这种金融信息服务商,好像没什么太多的优势,客户他可以直接从交易所那边拿到。那我们相当于是一个类似于分发者,但是你要去想到全球的市场是割裂的,或者是很多的,刚才讲可能几百个交易所,不同的资产类型,不同的产品。那汤森路透作为一个金融信息服务商,所以全球覆盖的信息服务商,他相当于他在几百个交易市场,他在这个系统上有接入,在网络上,然后在数据上有一个开发的一个整合,到我们统一的一个数据处理平台,更重要的可能还是在商务上每个市场都有其商务规则,我们是被授权去在我们的系统中分发,我们有这个商务的许可、控制,我们类似于是一个数据权限管理这种概念,所有这一切呢,也就是让汤森路透能在这种金融信息服务领域呢,有一定的竞争优势,就是全球的覆盖对各个市场的,从技术、服务到商务上的一个覆盖。
18. 比如说还是上交所那个例子,他提供信息给这个汤森路透,那么他需要对自己的接口适应汤森路透那个接口还是,整个事情都是汤森路透来做得?
刘相峰:是这样的,上交所他是,首先是一个交易市场了,他是用撮合的,很多我们的个人投资者比方你我,或者是一些经济公司券商他们去发交易指令,它形成价格,它会把它做一个行情信息。开始可能不知道,觉得这个信息就免费给会员了,或者我们在网站上都可以看到免费的数据,当然一般是延时的数据,后来发现这是一个金矿,因为他可以卖给交易商,或者其他客户。那这样的话,这些信息会是交易所的一个产品,所以他这个接口呢,他会自主去开发,也许用工业界的一些通用的协议,无论是文件格式,或者是一些,像FIX协议等等。他这个接口,对他的客户,比方说他的会员券商,或者基金公司,跟汤森路透来都是一样的一个接口,这个接口是交易所自己去定义的。那我们在这个层面上来说,是跟他的直接用户是在一个起跑线上,只不过是我们去做了一些增值的服务,刚才讲,我们在覆盖上有很多个市场。在开发上,可能我们的数据的质量会更好,这个开发接口会更加的整合或者更加的开放。这个是我们在交易所,从这个层面上,我们跟交易所是非常有意思的一个关系。有时候我们是它的一个分发者,我们是一个合作伙伴的关系。但有时候如果纯粹对一个交易所的数据,比如说上交所的数据来说,可能在某种程度上来说,可能是让客户有一个选择,可以直接从交易所去获得数据,或者从汤森路透这边去获得数据,相当于给客户我们市场提供多了一个选择和可能性。
19. 那它是一个非常非常庞大的项目?
刘相峰:它应该是我们全球最有战略性的一个项目,或者最有战略性的一个平台。因为这个数据就是一个基础,那我们至于怎么去把它展示跟投放给我们的用户,可能是一个交易员,或者是分析师,他会用一个我们的一个终端界面去看,或者是一个高速的一个交易系统,或者是一个盒子去看,或者是其他的形式,那都是都需要依赖于这个基石。
20. 你刚讲到的就说有这么多人去开发这个系统,然后做了很长时间这个实施,从05年开始,那这个系统现在已经完全实施完了吗?
刘相峰:它是分阶段实施的,因为有两个方面,第一个是全球几百个交易所的市场,我们要分布的迁移,从数据的,我们叫采集或获取这个领域,我们要一个一个的把交易所,把它接入到一个高速的这个公路上去;另一端,我们需要把我们的客户,因为全球我们有几十万个终端的客户,我们的机构客户可能也是有几万个这种客户,我要慢慢的一个一个的做迁移。那我们也是根据市场的需求,根据业务的需求和客户的需求,主要也是先从发达市场,那就是纽约、伦敦,像日本、香港,再逐步去做,有些地区应该已经完全做完。中国也是在部署过程中,应该也是从今年开始,所以其实这个项目从架构设计和实现到部署,它是一个整体。
21. 那就是您讲到的这是一个非常复杂的一个金融系统的这么一个软件,我不知道这种金融系统的软件是不是跟我们其他的这个软件有很大的不同,就是在设计上是从其他地方借鉴的一些东西,还是金融系统是完全另一套的东西?
刘相峰:这个问题就是会比较这个宽泛一些了,那我觉得可以更具体一点去讲,金融里头的有很多应用,我们就谈到了交易,那其他行业应用,我们就看现在比较热门的像互联网,我们今天这个QCon我看有很多的这个发言者也来自于像类似于腾讯、阿里,或者是百度这种互联网。那么我们来去看,在今天,金融交易系统,它使用的对象,或者它服务的对象,跟互联网的产品,或者服务提供商面对的对象是不一样的。而交易,一般来说,会用一个专属的网络,而不是用互联网,因为这里头它对数据的私密性,对数据的性能会有一个无尽止的要求。因为数据在这里意味着直接的利益,数据的性能如果有一点的优势,因为哪怕是毫秒、微秒级的优势,都会带来一些超额的利益,所以在这方面,互联网在目前来说,可能还不能在数据的安全性、准确性和它的延时或者性能方面是有一个有那么好的一个支撑,所以这是我觉得是最关键的一个方面。但是实际上,汤森路透主要是一个公对公的商业模式,也就是B2B的一个业务模式,主要的客户我们不会定位为大量的个人投资者。但是慢慢来看,我们的很多信息的发布平台也会去考虑到移动终端和互联网,包括我们的战略终端,我们叫Eikon,类似于是基于Elektron的一个UI,当然非常专业的一个分析工具,有很多图表、新闻等等,那个以前我们要求都是去用专线来去部署的。现在因为互联网的技术,网络的技术,也是网络传输的这个条件也都得到了很大的改善。更重要的一点呢,还是提到那个延时的要求,因为终端客户是以人的感知来去衡量它的性能的,比方我们打开一个界面,如果一秒钟之内它能弹出看到一个报价和新闻就足够了,当然比一秒钟更快,比如一毫秒对我来说,我也感知不到,可能也没有什么商业价值,所以在这个人机界面这个层面上,我们已经做到了一些在开发上、设计上、部署上,也可以实现一些互联网的传输,乃至到移动终端,像苹果,我们的Eikon也可以在苹果手机上去跑。但是对那些刚才讲的一些算法交易,或者高频交易,目前我不觉得这个互联网这种架构和技术能够支撑,或者至少它还能得到这些交易技术使用者的金融机构的一个认可。
22. 实际上在这一块还是有一定的这个技术上的壁垒和差距的?
刘相峰:对,应用场景和它关注的系统特性,我相信还是有比较深刻的区别的。
InfoQ:非常感谢相峰接受我们的采访。