9月22日,2018云栖大会音视频专场,作为阿里云的合作伙伴,即构科技CEO林友尧受邀参加,发表了“让实时音视频技术融于无形”主题演讲,跟大家分享了在行业深耕多年的思考。
演讲中,林友尧对音视频发展趋势进行了分析。他提到,随着行业应用的铺开,实时音视频新场景必定越来越多,市场规模越来越大,伴随而来的技术挑战越来越大。
随着发展的加快,未来,实时音视频将无形融于各行各业。
以下是演讲内容节选。
从直播连麦起家,到深入各行各业
说到即构科技,大家首先想到的是“直播”和“连麦”,为什么这么说呢?因为花椒、映客、一直播等国内过半的头部直播平台,用的都是即构的技术。
2016年,即构推出了全球首创的直播连麦技术,用自研的技术,在不改造基点网络、不改造任何场景的情况下,后台服务器和前端引擎做到1到1.5秒的低延迟,在极低延迟下支持更多主播连麦。技术推出后,吸引了国内过半大型的直播平台,引入连麦的方式来丰富直播场景,“直播”和“连麦”也自然而然成了即构的标签。
除了直播和连麦,“QQ”、“自研”、“18年”、“32路”也是即构的标签。
“QQ”是因为即构团队很多人来自QQ团队,在腾讯待了超过10年的人很多,包括我自己。我们当时在腾讯主要做两个事情,一是花了五年来重构整个QQ的客户端,二是花了五年做了QQ的音视频引擎,在这两个五年中,我们获得了亿万级用户通讯产品技术经验。
2015年,从腾讯出来后,我们成立了即构。一开始我们就选择了一条最难的路:基于公有云开放的架构,重新自研音视频引擎和后台服务,开放技术去帮助企业做业务产品的开发,而不是为了省事而采用开源的代码。
这样做成功率很低,花费的人力成本也很高。之所以这么硬气,是因为我们CTO金建忠和技术骨干,很多从大学开始就做音视频相关的技术,到现在有超过18年的技术积累。
因为我们自研的音视频引擎,用了比较好的架构设计,在软件层做到了同时支持多方通讯,2017年3月,即构推出了32路视频通话技术,在当时是业内首家,并且有了落地的应用,比今年6月苹果发布的FaceTime支持32路早了整整一年。
从创立以来,即构就专注做技术,事实证明,大家是愿意为好的技术买单的。
在成立三年多的时间里,即构得到了腾讯、花椒、映客、咪咕、好未来、喜马拉雅等500+家各行各业客户的信任,包括老东家腾讯。
音视频技术趋势:新场景层出不穷,玩法越来越多
随着接触到的客户越来越多,在行业里发展的越来越深,我们发现,音视频技术的应用场景远比想象中的多,应用规模也越来越大。
直播是音视频技术沉淀多年后得到的初步应用,也让大家意识到:音视频技术不仅局限用于会议系统这样的商业领域,也不仅仅是社交群聊,还能用在直播。而在直播中又延伸出如秀场直播、多主播连麦、直播相亲、直播答题、K歌合唱等泛娱乐直播场景。
泛娱乐直播无法忽视的是游戏直播,设备和网络的发展让游戏能支持更大的码率传输,音视频的介入,狼人杀、棋牌游戏等桌游线上化时更真实,玩MOWAA游戏、吃鸡、王者荣耀时语音沟通也让游戏更社交化,未来,音视频功能将会是游戏直播的标配,同时,越来越多游戏往社交化发展。
其中还延伸出彩票直播这种新奇的玩法,用户直接在线上购买彩票,即买即刮,直播兑奖,不再像以前一样需要到彩票点购买。
除了泛娱乐直播,音视频技术还能用在在线教育、金融、公检法、民生各种领域,还能跟各种硬件结合,实现不同的玩法。
在线教育不算是新场景,今年因为技术发展和环境的改善,还有教育机构的投入和运营,有很多种应用场景,如1对1、1对多的小班课堂,跨国小班、双师课堂、音乐陪练等。
有个可喜的改变就是体制内K12的中小学开始拥抱新技术,很多已经开始采用双师课堂的形式,实现了优质老师的共享。在学校推动和政府支持下,硬件发展也很快,像录播机、触控屏、黑板也改造成适应双师课堂的场景。
在线金融方面,视频开户、视频客服、视频投资顾问、视频双录很多证券公司和银行已经有在用了;企业级的又有企业直播、视频会议、呼叫中心、赛事直播等等,今年的世界杯和亚运会直播,咪咕直播就使用了即构的云导播台,不用专业的直播机器,就能快速地实现导播直播,融入更多互联网自由的元素。
公检法也可以接入音视频技术,实现可视化执法、远程接访、视频庭审。民生政务方面,可以通过小程序接入技术,实现视频办事。即构6月给海淀工商分局做的平台,就让用户在小程序上通过视频通话就能咨询和办理业务,以往来几趟才弄好的事情现在几分钟就能搞定。
除了单一线上的支持,音视频技术也可以跟软硬件结合,形成一站式解决方案。拿线上抓娃娃机为例,线上涉及到APP/H5,线下涉及到一系列的娃娃机硬件,娃娃机要对接到互联网有很大障碍。去年娃娃机风口时,很多客户折腾了几个月,都没做起来。为了方便客户,即构直接在线下还建立了娃娃机房,将技术、软件、硬件全链条串起来,形成了一站式抓娃娃软硬件解决方案,客户只管专心做线上用户运营,其他全部由即构搞定。
我们也能看到,越来越多的智能硬件产品开始接入音视频技术,像无人机、车联网、机器人、智能眼镜等,两者结合后又能应用到不同的行业。以智能眼镜为例,能应用在铁路、电力、水利的巡检,巡检过程中和在办公室的专家远程互动,指导操作;同样的场景可以用在汽修厂、公安执法、银行导购当中。
技术的本质,是要无形融于各行业
综合以上使用场景,可以看到,实时音视频技术已经融于各行各业。
然而,在接触客户的过程中,我们发现很多客户排斥接入一个新技术,觉得技术和新场景结合起来非常痛苦,需要开发团队需要对原有业务进行改造,而这个改造的动作,造成了产品业务体验的差异,后续开发新的产品就有可能返工重造,扩展很不平滑,用户感受也不愉快,这种其实就是有形的技术。
我们要做的是将技术无缝融合到业务场景中,通过业务与技术结合,推动产品的持续发展,来增强用户的体验,而不是让其变得更差,用户在体验的时候是感受不到技术的,能感受到的是产品越来越好,用起来很愉快。
要真正把一个技术无形融合到产品当中,必须要下苦功。即构在三方面做了努力,一是坚持以技术驱动,自研音视频引擎,将80%的精力放在技术研发上。二是将技术从点做到面,从提供标准化的SDK,到提供全栈式的解决方案。三是以用户体验为导向,配置1对1咨询顾问,通过和客户深入交流产品应用的细节,及时收集解决问题,来不断打磨技术服务。
目前,即构已经服务了500+企业用户,覆盖了100+国家和地区,链接全球5亿+的终端用户。技术无形融入各行各业后,线上方式还原线下沟通场景,将帮助企业实现之前无法实现的场景,提高用户体验,让产品有更大的创新空间,也推动了整个社会高效地工作,加速全球资源共享和技术共享。