9月21日上午,第三届实时互联网大会RTC 2017,在北京万豪酒店正式召开。此次峰会吸引了全球100+明星互联网企业的技术领袖,2000+RTC实时通信技术大咖,涵盖70+技术创新演讲和对话,是全国乃至全球范围内影响最大、最权威的实时通信技术盛会。
过去一年,RTC技术取得突破性进展,越来越多的智能终端、移动APP开始依赖于音视频技术,使得RTC技术深入渗透到移动互联网各行各业。其不仅在直播、游戏、社交等行业大受追捧,更是在远程医疗、教育、客服、金融、电商、IoT、AI、VR、AR等领域得到快速发展。
全栈RTC服务 实时互联网进化之路
全栈实时通信云服务商声网Agora.io (以下简称声网)创始人兼CEO赵斌做大会开场主题演讲,他表示,过去一年,行业的重大事件是苹果在其最新发布的Safari 11浏览器中开始支持WebRTC。这意味着未来WebRTC将出现在每一个苹果手机上,技术的应用空间将大大扩展。
声网创始人兼CEO赵斌做大会主题演讲
据声网观察,WebRTC最大的市场仍集中在北美、欧洲和亚太地区,但在南美、中东以及非洲地区其使用量正在快速增长,其实际表现与声网的全球实践是吻合的。赵斌表示,真正让实时互联网获得快速发展的原因是,越来越多以RTC技术为基础的行业创新场景成为最热的“爆款”。
在直播行业经历了爆涨之后,已经回归理性和稳定的增长。直播行业的发展也将呈现出互动性、实时性、垂直扩展性等特点。比如连麦技术成为所有直播平台的标配,比如与众多垂直行业跨界融合,如在线教育、社交、游戏、企业协作、人工智能、金融等领域。这些垂直行业的直播有着明显的增长,并且正在形成新的行业热点。
Slack视频组工程师参加RTC大会
在所有的垂直行业应用中,全息互动技术的应用使人眼前一亮,比如通过全息技术将霍金从牛津大学投射到世界任何一个地方进行演讲,并且通过RTC技术和当地的观众互动。但如果没有稳定、靠谱、高质量的互联网传输服务,是无法保障将远端的内容传送到会场并保证其质量。
行业的变化和发展,需要专业的全栈RTC服务,具备三个方面的能力构建,即深度技术、专业服务以及开放生态。
赵斌坦言,这三方面因素是构成全栈RTC服务的必备因素,如果缺少这些,客户应用的实时音视频服务有可能处于“靠天吃饭”的局面,其质量保障更是无从谈起。深度技术当中,需要一个稳定的虚拟通信网,需要有面向互联网应用的编解码,当然更需要有终端地域和规模的全覆盖能力。
实时互联网全栈RTC服务和生态
声网的联合创始人肖峰在会上解析了全栈RTC服务中,关于专业化服务和开放生态如何落地。肖峰认为,声音、视频和实时互动更多是一种能力的服务,是可以出现在任何app当中,而这些能力的应用需要与更多开发者互动沟通。
声网Agora.io联合创始人肖峰
在经过两年多的商业化运作之后,声网在全球服务了超过10万开发者,覆盖了10亿+终端,每天在平台上产生的流量已经超过亿级分钟。正是源于声网与客户及开发者之间不断的试错和打磨,随着经验和能力的积累,才逐渐形成全栈RTC服务这一理念。
肖峰认为RTC服务拥有5大特性:应用场景的实时性、应用类型的多样性、终端系统的复杂性、持续服务的可用性以及版本迭代的周期性。
正是源于这样的特性,又处于新技术试错阶段,通过数以万计的应用、数以亿计设备的覆盖、每天数以亿计流量的测试以及和开发者不断的讨论,结论是实时音视频服务能够让客户体验“所见即所得”,即所有质量可追溯。为此,需要一套专业的实时监控、分析和调查工具帮助客户清楚通话质量。
同时,实时互联网还在发展早期,RTC技术仍然是一个新兴技术,需要聚合更多的创新技术产品和服务,激发出更多想象力的创新场景,为开发者业务快速试错、迭代,最终也为生态伙伴们带来价值。因此,实时互联网生态需要所有合作伙伴一起共同建设。
实时互动技术重塑在线课堂
沪江CCtalk CEO 陆坚,发表了《实时互动技术重塑在线课堂》的主题演讲。陆坚表示,实时音视频通信比较适用于低延迟、高互动的应用场景,如视频聊天、视频会议等;而视频流媒体则是在另外的领域独立发展,更适合于弱互动,但能够容忍高延迟的应用,如视频网站。
但过去两年,这两者有着一定程度的融合,并且体现在各个领域。其中一个较为代表性的就是教育。
沪江CCtalk CEO 陆坚
陆坚表示,过去很长一段时间,在线教育一直在试图还原线下课堂,如真人授课、黑板、讲义、问答等环节。但通过RTC技术的应用,在线教育的某些方面已经超越了线下课堂,如不受地域和人数的限制,课堂的实时性测验等等。
陆坚表示,过去很长一段时间,在线教育一直在试图还原线下课堂,如真人授课、黑板、讲义、问答等环节。但通过RTC技术的应用,在线教育的某些方面已经超越了线下课堂,如不受地域和人数的限制,课堂的实时性测验等等。
人工智能——AI之梦的技术支撑
易联视讯董事长陈建文,发表了《人工智能——AI之梦的技术支撑》主题演讲,陈建文坦言,作为一位从事技术开发的工作者,时代总在不断变化,如何看待技术变迁过快,导致技术人员始终奋力追赶但仍然收获甚微的局面。
易联视讯董事长陈建文
陈建文坦言,无论何种技术浪潮来袭,首先需要技术人搞清楚自己在做什么,而通过近年来数次技术浪潮更迭,无非就是在处理人与人、物与物、人与物之间的连接问题,只要分辨清楚自己的目标,才不会受外在因素所左右,正如那句老话,不忘初心方得始终。
高峰对话——RTC 聆听与观看世界的新方式
大会还邀请到了花椒直播CTO 韩三普,熊猫互娱CTO 黄欢,V-cube CEO Naoaki Mashita,狼人杀CTO 蒋承,饭局狼人杀制作人胡天宇参加了圆桌论坛,探讨未来RTC是一种全新的互动的方式。
复盘直播下半场的一年 狼人杀的光环和危机
除了上午的主会外,下午的三个极具特色的分论坛也是火爆异常。在泛娱乐技术专场,来自猎豹移动的全球智库主编容荣率先开讲,她带来的是《泛娱乐社交白皮书——复盘直播下半场的一年 狼人杀的光环和危机》主题演讲。
容荣在演讲中表示,自去年猎豹移动发布直播行业数据至今,差不多刚好一年的时间,而借此盛会,猎豹移动再次复盘了直播行业在这一年的变化。经过一年的激烈角逐,其实大部分直播平台的发展是趋于平稳的,而其中有两家势头发展较猛的直播平台背后,都是拥有大量的资金和流量作为支撑。
而当直播走向新领域后,狼人杀这款社交游戏走进了大众视野。而狼人杀的火爆,容荣认为有两方面原因,其一,狼人杀游戏已经存在十多年,拥有广大的群众基础;其二,综艺节目的推波助澜,《饭局的诱惑》则是狼人杀游戏的直接推手。
而直播和狼人杀之间又有着怎样的联系?容荣认为,狼人杀是直播连麦技术的延伸,且绝大多数时间均是通过纯音频进行互动沟通,并在直播平台进行互动直播,因此狼人杀和直播是共存的关系,并且相互之间有着促进作用。
但随着巨头的涌入,狼人杀的市场格局正在发生变革,并且游戏与应用之间的距离越来越少,而最为重要的则是社交属性,所有的泛娱乐都离不开社交属性,因此把握好社交这一底层需求,从容应对即将到来的风口。
浅谈直播体系标准化的现状与未来
熊猫互CTO黄欢,发表了《浅谈直播体系标准化的现状与未来》的主题演讲。自2015年熊猫创业初期加入,创立之初最大的挑战来自于人手和时间的不够用,进而引发的是一些基础性的技术部分需要依赖于第三方。
而这其中需要面临的一大挑战,便是与各种SDK接口“打架”。为此,熊猫自身提出一个理念,即构建一个开放的平台,让各方实现自行接入。如将服务的接口统一、架构分层,总之就是将此前遇到各类不统一的接口问题进行标准化,简化开发工作,让开放平台内的所有合作伙伴便于协同、互联。
移动直播AR技术
花椒直播iOS技术总监唐赓,发表了《移动直播AR技术》的主题演讲。唐赓表示,在移动平台上面,花椒已经实现基于各种人脸识别加AR特效的例子。而最近苹果发布的iOS 11版本中,内置了ARKit的应用场景,并且是免费提供,降低了AR成本。
此外,苹果ARKit还提供一个非常有意思的功能——尺度估计,通过与真实的尺子对比,可以看到非常小的误差,在没有直尺的时候则可以通过该功能实现长度、宽度的测量。但同时,ARKit也面临一个比较大的问题,即ARKit只支持后置摄像头,而绝大多数主播均使用前置摄像头,好在最新发布的iPhone X中,其前置摄像头支持了AR功能,因此特别期待拿到真机进行实测。
此外,唐赓在现场还为在座的开发展进行了Coding展示,通过一些小技巧,仅用非常少的代码便实现了AR效果,让在场的听众受益匪浅。
泛娱乐场景下的实时音频技术解密
声网游戏产品负责人陈若非,带来了《泛娱乐场景下的实时音频技术解密》的主题演讲。陈若非表示,泛娱乐当前的特征和趋势主要表现为两方面,首先,内容从单向输出慢慢转变为更多的实时互动;其次,不同APP间的边界越来越模糊,社交直播与游戏融合越来越紧密。
而泛娱乐应用也有本质的需求,第一,真实性。即观看直播的群众希望近距离的接触偶像,并要求音视频对真实性有比较好的还原;第二,互动性。通过互动、连麦等交互增加用户粘性,更好的实现用户留存;第三,趣味性。希望在泛娱乐中添加一些有趣的东西以减少同质化的瓶颈。而这三方面诉求都对实时音视频技术提出了非常大的挑战。
对此,声网无论是在SDK层面还是底层的基础传输能力和设备处理能力都将继续提升,以便更好的应对泛娱乐时代对音视频实时通信的技术要求,为客户提供更专业的实时通信技术。
视频社交 开PA的实时视频技术应用
清风云科技 CEO清风,发表了《视频社交 开PA的实时视频技术应用》的主题演讲。清风详细介绍了自己的社交应用——开PA,这是一款非常强调朋友之间互动的应用。但清风坦言,社交属于你我,但最终是属于年轻人的,而开PA的成功离不开合作伙伴的倾力协助,如像声网这样的全栈RTC技术商,以及提供美颜、滤镜等技术的很多厂商,提供了非常多的基础能力,才让开PA在短时间内上线。
视频编码未来简史
北京大学 AVS视频组联合组长马思伟教授,发表了《视频编码未来简史》的主题演讲。马思伟表示,视频编码的起源于广播电脑室,并在很长一段时间内其变革主要源于广播电视。从计算革命到科学革命再到采集革命、认知革命,马思伟为我们分享了视频编码的前世今生。最后他总结道,4K正在普及,8K是未来趋势,下一代视频编码标注值得关注。
下一代开放视频编码标准AV1
Google总部软件工程师陈悦,发表了《下一代开放视频编码标准AV1》的主题演讲。陈悦表示,Google正在做开源视频编码标准方面的一些工作,而新一代编码器AV1预计将于2017年年底推出。在最好参数情况下,AV1将比VP9至少提升25%;在低延迟的时候是29%,Google的目标则是30%。而一些新的算法正在审核,估计在年底可实现这个目标。
面向不可靠传输网络的抗丢包编解码器
声网Agora.io首席音频工匠高泽华,发表了《面向不可靠传输网络的抗丢包编解码器》主题演讲。高泽华表示,当前最火的王者荣耀和狼人杀游戏,对直播提出了更高要求,即更低的迟延。
而丢包是低延时和高质量的一个拦路虎,声网Agora Solo™的技术优势在于很强的抗丢包特点,它不需要对当前网络的丢包状态进行统计,仅需要直播将抗丢包做到编解码内部,即实现了低延迟,因为这并不需要回传信道的特点,直接把包发出去即可。
全景声技术、标准及解决方案
全景声AVS音频组、测试组联合组长潘兴德,发表了《全景声技术、标准及解决方案》的主题演讲。潘兴德主要分为五个层面来介绍,首先,介绍了全景声的概念,这在当前是一种非常时髦的说法;其次,介绍了声道技术和声音对象技术,声道技术是传统技术,而声音对象技术是新技术;再次,是音视频编解码技术,主要分享了音视频方面的技术;第四,简单介绍了空间升学的新技术;最后,则是介绍了全景声技术,也叫做中国的全景声技术。
写在最后
经过一年的高速发展,RTC技术越来越受到开发者的关注,无论是技术成熟度还是市场的穿透性,实时互联网确实给行业带来的前所未有的突破,如果说去年实时互联网大会还是以技术布道为主,但今年给笔者最大的感受是实时通信技术的全面落地,无一不体现着行业的稳步前进。