个人简介 许志强,容联云通讯CTO/副总经理,负责容联云通讯的技术和研发工作。在此之前在电信行业有十几年的研发经验,从研发工程师一直做到研发负责人,对于如何构建电信级、大容量、高可用性的平台有相当丰富的经验。在项目管理领域,获得过PMP 认证,熟悉CMMI的开发流程,曾经在印度Infosys总部全程参与CMMI5的项目研发整个过程。
QCon是由InfoQ主办的全球顶级技术盛会,每年在伦敦、北京、东京、纽约、圣保罗、杭州、旧金山召开。自2007年3月份首次举办以来,已经有包括传统制造、金融、电信、互联网、航空航天等领域的近万名架构师、项目经理、团队领导者和高级开发人员参加过QCon大会。
1. 各位网友大家好,我正在QCon北京的现场,现在进行专访的是容联运通讯的CTO兼副总经理许志强先生。许总,我的第一个问题是在您做了十几年电信行业的研发后,看传统电信行业与容联云通讯在研发方面有哪些不同?这两者在容量和可用性方面分别有什么特点?
许志强:以前我们给运营商做系统,这个系统一般是在一个区域内的,比如在广州市或者广东省建立的一个系统。对于运营商的网络来说,首先就是地域限制,全国各地可能都是由本地的系统来提供服务的。而我们现在做这个PS平台是面向全球用户的,全球都能访问你的服务。这两者在用户的并发数量上完全不是一个数量级,互联网的PS平台的流量可能是以前传统电信流量的十倍百倍。单纯从并发角度来讲,它比传统IT技术要高许多。其次从可靠性保证来说,它对数据一致性的要求非常高,不允许出错。但在云通讯行业,对一致性的要求没那么高,更多的是偏向于可用性。在非核心数据,非交易数据中,有些数据是不需要立刻达到一致的,这种情况下应该首先保证服务可用。就如之前所说的这种高并发情况,云通讯能够持续提供服务,这是与传统运营商相比存在的较大差异。还有一个区别是,运营商系统是封闭的,不会有太多安全性问题,而一旦加入云以后,就需要考虑各方面的安全性问题。
2. 在系统耦合性方面传统电信与云通讯存在什么差异呢?
许志强:系统耦合性跟刚才说到的并发性有关。系统耦合越紧,容量越容易达到瓶颈。从传统的行业转到互联网云方式,首要任务就是解耦,使之能够拆分,做到水平或者垂直扩展。
3. 我们上学的时的IP电话,是不是普通大众接触到的最早的云通讯?那种能称为云通讯吗?
许志强:IP电话不能称之为云通讯。
4. 云通讯跟传统的通讯模式相比有哪些优点?
许志强:传统的通讯行业是一个封闭的体系。比如打电话需要通过特定运营商的网络,上网需要购买特定运营商的流量,手机发短信也是如此,你要使用的服务只能够在运营商服务范围内使用。云通讯则是打破了传统电信运营商的封闭的体系,它可以把运营商的功能封装出来,通过接口的方式给各个需要通讯能力的服务提供商使用。举个例子,我们有个很典型的客户——“好大夫”,它是做远程医疗会诊的。“好大夫”以前提供远程会诊时,需要找运营商拉一堆的线路,再找做会议服务的设备提供商买一大堆设备,然后才能够提供服务。现在它转到我们云服务里,不需要之前的任何投入,直接把我们的功能集成到他的内部的EIP系统里去就可以了。购买的会议系统还存在一个系统集成的问题,比如使用某一套电话会议系统,它会有自己的操作界面,你必须在这个界面上使用。而云通讯完全改变了这种模式,它可以把所需资源集成到他自身的操作系统里,在一个界面上就能完成所有的业务操作,也不需要担心网络高峰时购买的设备容量不够。云是资源池的意思,是弹性的,这就是传统的通讯和云通讯的差别。国外有个著名的云通讯服务公司,叫Twilio,在它之前很多商家无法发送网络通知。Twilio首先是提供了运营商的短信功能,商家的通知、验证码能够通过短信收发。而国内有移动梦网,网络服务商可以通过它提供这类短信发送。云通讯的概念就是把通讯功能集成为一个管道,好让你在各地打开水龙头就能使用。
5. 也就是说云通讯可以把以前专属运营商的功能剥离出来,并且可以定制和按需付费,提供了很多便利。那么就目前看来云通讯与传统运营商相比有什么缺点呢?
许志强:与传统运营商相比,缺点主要我们受制于运营商。国内的运营商还没有开放,如果要提供服务,就需要运营商方面的允许。虽然管道化趋势会越来越明显,但是他们现在并不愿意这么做。
6. 目前你们的客户使用较多的产品的功能是什么?
许志强:有两大类比较多。一类是客户群体较多的IM类,只要有通讯,包括APP,基本上都有IM需求。另一类是语音的服务,如大家最近使用较多的阿里钉钉,他提供的电话会议、语音通知这些服务有很大一部分就在我们的服务内。
7. 您指的语音服务是语音通话而不包括语音留言信箱是吗?
许志强:包括,还有语音验证码都包含在这类服务中。
8. 您在电信行业是个做了十几年研发的老兵,在您看来传统电信运营商如果入云的话,他会面临什么哪些技术问题?
许志强:实际上我们现在做的所谓PS平台,并不是只针对于技术,更重要的是在于服务。当用户反馈问题后你要给出合理的解释,从技术层面回答或者实地解决问题。就刚才好大夫的医患沟通作为例子,企业通过购买运营商的系统搭建自己的平台,当通话出现问题时它会无从解决。现在通过我们的服务,只要有问题就可以找我们,我们会有给出详细的分析报告。比如为什么通话不行,为什么用户无法接通,为什么用户突然断线,我们会调查出类似因为手机开了免提,他的信号质量不高,或者是用户不小心碰到了按键。我们会针对用户的信息反馈,及时响应,这很关键,一般运营商不具备这种服务能力。
9. 也就是说传统IP架构在入云方面存在的技术问题不像外界猜测的那么严重。那么容联云通讯的云平台是如何搭建的,你们又是怎么做的?
许志强:在我们搭建之前已经有Twilio作为成功的范例。我们首先确定好需要提供哪些功能,然后再去考虑基于提供的功能我们可以依靠哪些技术去解决其中的问题。比如之前所说的,入云之后用户并发量暴增,我们需要分析当前技术构架是否经受得住,采用何种技术方案。在语音服务的情况下,我们更多的是希望服务自助化,而这种自助化的流程所需的技术能否使用户轻松地接入系统。我们最开始花费了很长的时间进行调研,其中包括技术可行性,技术选型等等,然后再入云。入云之后还要根据用户的反馈去调整,我今天在QCon上也讲过,我们当时如何去演进,考虑如何使用户体验获得极致,如何改造架构,并通过技术去满足用户的需求。
10. 刚才您提到了安全问题,通讯上这一直都是一个比较复杂的问题,你们在传输加密或者信息安全方面做了哪些工作?
许志强:安全性方面是分两种情况,一种是绝对安全。在斯诺登事件后,国家对整个信息安全体系非常重视,其中就包括通话安全这部分。之前有个项目是中科院的信息化所需要做一套安全的通话系统,我们在这套系统的通话方面是主要技术提供商。因为有专业的厂家提供加密算法的技术,所以需要我们跟他做一个紧密的集成。他通过硬件对语音通话的数据流进行一个加解密过程,使整个过程中的通话被任何系统截获后都不能解密。这是中科院专家研究很久的方案,属于绝对安全的情况,而在一般的公有云上我们没有提供这种服务。第二种是相对安全,作为服务提供商,我们有时是需要还原你的通话的信息的。很多厂家用我们的通讯功能建立客服,客服需要有录音的功能,比如在跟用户发生矛盾时就必须要有我们的通讯还原,这部分就是所谓的相对安全的。我们还提供另一种方案,就是通过我们的平台接口,把通话数据在两端间传输,中间的数据由你们加密控制。比如客户说一段话,我们的STK会将采集的数据进行编码传送你,你通过自己的加密算法再回传给我,我帮你把它传到对端,之后如何把数据还原由你决定,在这种情况下我们是无法得知你客户的通话情况的。
11. 类似国内那么复杂的网络环境,在通讯过程中由于网络运营商缘故会有网络抖动,你们有什么优化技术吗?
许志强:网络抖动的优化方法一般来说是尽可能的靠近用户群,因为基础网络的建设不是你能控制的,只能去适应它。如果用户在北京,你直接接入位于北京的服务器,这样网络延迟与网络抖动会减少到最小,但这只能起到一定程度上的作用。另一种是通过使用相应的技术达到优化的目的。今天我在台上也讲到了之前与信威集团的合作。它当时在柬埔寨采用我们这套系统来给柬埔寨的3G4G用户提供网络通话服务。当时他反馈给我们一个问题——通话质量比较差。我们通过分析发现从北京打电话到柬埔寨,网络抖动很大,两个包之间抖动超过了一秒。如果按照我做传统运营商时的概念,这通话已经无法接受了。用户反应通话质量很差,必须要改进。因为数据丢包率太高,我们就把BF设得比较大,通过超过抖动范围,就可以抑制还原。虽然这会带来一定的延时,但是从用户最终的使用效果来讲,这比之前的使用结果要理想。
12. 你们会不会对数据包进行一些压缩?
许志强:数据包都是要经过压缩的,而且最近我们还尝试使用了前向纠错的技术。在由于丢包的情况下,如果采用刚才的方案,只是把抖动的BF开得比较大的话那只会带来延时。在刚才会丢包的情况下,多发一些冗余包的方案就特别适用。但对于用户终端进行这种发包方式反倒不一定适用,因为有可能丢包是由于网络差,再发些冗余包会使用户的网络环境更差。碰到那种情况主要是国际出口区的网络环境导致的网络抖动。我们本身的通话流量只占国际互联网流量的很小一部分,假设在国际出口区有百分之十的丢包,那可能是因为超容量了。可能它原来设计的是1GB,现在跑了1.1GB的流量,于是就丢包了。语音通话的流量相对于其他视频音频的流量是很小的,所以即使我增大了流量也不会使丢包率增高,并且能使数据在远端很容易的补偿回来。
13. 根据目前虚拟运营商分成八个流派的情况,诸如互联网帮,电商帮,还有CDMA题材之类的。互联网帮与电商帮可能存在一些重合,不过业务范围会不太一样,您比较看好哪几派的发展?
许志强:第一个我会比较看好互联网帮派。因为运营商这块今后肯定是会放开的,从我们跟运营商的一些领导交流中能够得知,他们也明白服务运营商的管道化不可避免。像现在这些通讯的方案,比如微信,已经大到快把短信挤垮了。而现在的情况是因为运营商有很大一部分收入仍旧来源于类似通话这些传统的业务。要运营商革自己的命很难,这里面有许多利益上的冲突,虽然运营商领导也知道通讯管道化不可避免,但也不敢就这么放开了。随着技术网络环境越来越好,运营商绝对是要管道化的,而且我觉得管道化以后运营商是能够做好的,并且能够从中获得足够的利益来支撑今后的发展的。至于为什么会比较看好互联网或者是电商这些行业,是因为互联网的特性。由于他拥有海量的用户群体,使它能够做到免费。政策放开之后互联网公司绝对会把云通话运营成免费服务,并且他能够从其他的方面赚回本来的利益。用户免费使用运营商的服务没有关系,它能够通过海量用户的使用产生其他变现方式,这是传统的互联网或者电商最擅长做的事情。而让其他一些本身没有额外业务收入来源的需商去做,它具备的运作资本根本无法与这些传统巨头去相比。
14. 美国有一则新闻,是一家智能机器人公司与国家射电天文台在使用无线电波段上打起了官司,正在等着联邦通讯委员会的裁决。智能机器人公司的机器人是通过无线电远程控制的家用型机器人,主要用来打扫卫生,修剪花园。他们的无线电使用了平常不被使用的频率跟波段,但恰巧与美国国家射电天文台收集宇宙资料的一些波段发生交集,产生了一些干扰。而我们国家的无线电使用是通过发牌照,比如3G、4G、虚拟运营商牌照等来实现这种资源的配置。国家相关政策在未来会不会有所变动,您能谈谈对这个问题的看法吗?
许志强:在美国这类频谱是通过拍卖取得使用权的,而在国内一般是行政分配了。但是要让这些资源利用率达到最高,最后肯定还是依靠市场化的形式。国内运营商的很多业务没达成,就是因为政府在政策制定上的滞后。类似携号转移,在美国已经成为一个强制性的规则,它必须要支持本地的运营商。而国内携号转移的研发也已经四年之久,在技术上其实没有太大问题的。
15. 请您谈谈在我们粉丝QCon大会上的一些感受吧,给我们提提建议,还需要改进哪里。
许志强:QCon大会办得非常应景,特别是现在。这次许多的演讲主题我也去听了,觉得受益匪浅。如若技术人不进行交流,不去了解或者分享出来最新的信息,可能都只能在自己身边的小圈子里慢慢成长。过去各家技术公司对技术保密都当作头等大事,但这几年开源的世界很火,很多的开源项目,像类似谷歌这些大企业已经把很多系统开源了出来,在这里我发现很多讲师非常乐意分享,包括对公司内部一些机密技术。QCon这样的会议能给大家提供类似于开源的环境,让我们能够与其他厂商交流,相互学习。这能让整个软件的水平提高一个档次,只有这样,竞争才能有更高的起点,同时也提高了合作的起点。否则大家都只会在底层做一些很low的东西。通过分享大会,技术人提高了原本的视点,在接下去的时间里就会用更多的精力思考如何在未来做的更好,这是个非常积极大会。
InfoQ:好,谢谢您接受我们的采访。