几天时间里,“云蹦迪”直播多次登上各大直播平台的榜首,并且收到了各式各样的打赏。一边是专业的 DJ 在打碟,一边是居家“蹦迪”的网友们,5小时在线人数121万。
受疫情影响,原本门可罗雀的线下传统行业将商品卖进了直播间,直播卖化妆品、直播卖服装,还有直播卖房、直播卖车、直播卖农产品……
2月13日,三亚市市长现身淘宝直播间,亲自为三亚面临滞销的金煌芒果“带货”。虽然直播只有两分多钟,但吸引了超过2.5万人在线观看,卖出了六万斤海南金煌芒果,店铺当日销售额提升了60%。
金融行业,一些银行也快速在其应用内上线视频营业厅,用户不出家门,通过远程视频就可以与“云柜员”办理业务,避免疫情风险。
1 实时互动直播背后的神秘技术
实时音视频(RTC)技术,可以说就是以上这些场得以实现的基石。它是直播中主播与多位粉丝连麦时背后的技术;是多方视频会议中,每一方都要发言时背后的技术;也是在线课堂里,每位同学与老师互动时背后的技术。
之所以说 RTC 技术是基石,是由于 RTC 技术主要解决的是实时互动过程中的质量问题,包括延时、流畅度、清晰度等。而这些质量问题是影响终端用户互动体验最关键的因素,如果质量无法保证,出现卡顿,声音杂音大、有回声,视频画面模糊等情况,则根本无“体验”可谈。只有质量得到了保证,才能有好的体验,实时互动场景才能存在。
同样是面临疫情,面对“宅”家隔离,为什么2003年的 SARS 时期这些线上场景没有爆发?根本原因还是技术。技术成熟度是决定线下转线上用户体验以及能否大规模普及的关键,实时互动场景的实现,正是需要 RTC 技术来支撑。
说 RTC 技术,还需要弄清楚几个概念。
实时音视频(RTC)& 即时通讯(IM)
常见的 IM 场景包括文字聊天、语音消息发送、文件传输、音视频播放等,QQ、微信都是 IM 应用。而 RTC 的场景包括直播、视频会议、语音电话等。RTC 和 IM 最大的不同点,是对传递的时间规定。IM 允许发出的同时不用马上送达,可以接受有一定时间的延迟,而 RTC 则要求更加实时,从这一端用户说话到另一端用户听到声音,之间的延时需要控制在几百毫秒之内。
RTC 技术 & CDN 技术
事实上,视频直播有两类方案,一类应用 CDN 技术,一类是应用 RTC 技术。与 CDN 技术最大区别在于,更加强调“互动性”的场景,必须要用 RTC 技术去实现。
对 RTC 要求最高的就是紧急服务和医疗,其次是办公和教育,再是社交。一旦出现延迟、卡顿,那么办公、教育、直播这种非常强调员工之间、主播和用户之间、老师和学生之间实时互动交流的场景,体验就大受影响,甚至根本没有办法顺畅进行。
在解决问题的方法上,二者也不太一样。疫情中,大面积教育、办公应用的视频直播、视频会议纷纷“中枪”,面临卡顿、崩溃。而这些服务的崩溃通常来自两方面,一方面是平台本身过载或者 CDN 类直播的过载,这种问题是可以通过紧急扩容来解决的。另一方面是直播中视频会议、视频上课(也就是实时音视频 RTC)部分的过载,这部分则不是通过紧急扩容就能解决,具体我们在后面会解释。
WebRTC&声网
提到 RTC,还不得不说的是 WebRTC,WebRTC 是一个支持网页浏览器实时语音、视频对话的 API,也是 RTC 领域最知名的开源项目之一。基于浏览器,不需要装插件,只要调用就可以实现音视频互动功能。
2011年谷歌就免费开源了 WebRTC。但 WebRTC 目前在实际使用中还存在传输质量难以保证、移动端表现不佳等一系列问题。
因此,并不是直接使用 WebRTC,企业和开发者就可以在自己的应用中实现实时互动了,还需要解决服务端部署、网络传输、音视频 QoE 优化等一系列问题。
所以在 RTC 领域开始出现了一些开源项目和企业来帮助开发者解决这些问题,例如提供开发咨询服务的 WebRTC Ventures、提供实时音视频数据监控的 CallStats,还有通过提供 SDK,来让开发者能快速实现 RTC 功能的企业,最典型的就是声网 Agora。
声网是全球第一家将 RTC 技术作为一项专业能力提供给企业和开发者的云服务平台。在2014年,声网看到了移动互联网时代用户对实时互动的巨大需求,因此开始自研 RTC 技术,包括自研的软件定义实时网 SD-RTN、自研的编解码器,更专注于移动端体验且有 SLA 质量承诺保证,而不是仅仅依靠 WebRTC。
RTC PaaS和 RTC SaaS
RTC 是一项面向企业和开发者的技术,在这个领域有 SaaS 服务商,也有 PaaS 服务商。SaaS 功能相对完善,注册账户即可使用,不要求使用的企业具备技术研发能力,因此中小企业更多愿意选择 SaaS 服务,例如视频会议办公中很出圈的应用 Zoom 提供的就是 SaaS 服务,很多企业在疫情期间都会使用 Zoom 开视频会议。
而 PaaS 服务则要求企业或开发者具备一定的研发能力,通过接入 PaaS 服务商的 SDK 去设计功能。大企业更多愿意选择与 PaaS 进行合作,这样会对可用性有保证。除此之外,一些 SaaS 平台为了保证自己的质量,也会在某些更具专业性的技术上选择 PaaS 供应商。
2 做专业、可靠且低调的“基石”
前文在对比 CDN 和 RTC 技术时,我们提到,RTC 部分过载导致的服务崩溃,是无法通过紧急扩容解决的。这是因为 RTC 技术在保证质量的过程中有许多难点,突出的可以总结成三个:
一是实时音视频对质量要求近乎苛刻。每天高峰期数百万用户同时使用音视频服务,包括教育、社交、远程医疗、金融保险、远程办公等各个行业的用户。只要出现不到秒级的延迟用户都会有感受,百万分之一的用户或时间出现问题,都会带来不小的影响。
二是互联网中绝大多数组件不完全可靠。硬盘故障、服务器死机、交换机重启、机架断电、数据中心主干网故障,这些问题司空见惯。尤其在一个包含数万节点的大型分布式系统中,几乎每天都会有一批组件发生故障。基于不可靠的组件、在全球范围内构建出一套极致可靠的大型分布式系统,来满足客户、用户实时音视频通信需求,这是非常有挑战的。
三是用户的终端、操作系统、网络环境千变万化。可能最先进的 5G 终端正在与一个普通的 3G 终端进行视频会议,也可能坐在高铁上高速移动的用户与在万人演唱会现场的用户两人正在进行视频通话。这面临的是成堆的技术问题需要解决,比如终端适配、网络的“最后一公里”等等。
可以说,RTC 是一项对技术专业度要求极高的业务,可见其难度和挑战。声网在 RTC 领域深耕了六年,一直保持着行业领先者地位。说 RTC 技术是在线直播、视频会议、教育网课的基石,也可以说声网是这些场景的“基石”,原因有三:
其一,RTC 行业开创者,体量大
声网全球第一家提供实时音视频云服务的 PaaS 平台,使用量级非常大。截止到2019年末,声网日均通话分钟数超8亿。在此次疫情期间,声网日均通话分钟数较平时增长近一倍,达15.6亿,教育、在线办公等刚需行业的峰值达日常的7-10倍。
声网提供的 RTC 技术是 PaaS 服务,业务覆盖社交直播、视频会议、在线教育、医疗、金融等10余行业。声网客户中有企业应用,比如新东方、好未来、WPS、陌陌直播、抖音直播等,也有 SaaS 平台,比如教育行业中知名的保利威、百家云、希沃云课堂等。
声网 Agora 服务覆盖200+地区
图中标注城市为声网办公室所在地
其二,技术稳定、可靠,6年无全网故障
疫情期间声网的日均使用分钟数已有15.6亿之多,但声网却在流量的冲击中“扛住”了压力,续写了成立6年以来无全网事故的记录。这也是其稳定、可靠有质量保证的最有力证明。
声网成立之初就自建了软件定义实时网 SD-RTN,目前在全球拥有250多个核心节点,自定义并提供给客户通讯级的 SLA/QoS 质量保证,可用性99.99%,在架构演进设计上可应对 10X 以上负荷。
除此之外,声网面对10余行业的众多客户,其中不乏大量的上市公司、流量平台及爆红黑马。在此次疫情之前就已经有丰富的经验历练,且早已建立了用户应急响应机制,使得响应足够及时和有序。
其三,低调、务实,追求极致
RTC 技术是一个相对细分的领域,一度被认为是“冷门”技术,外界鲜有人知。而声网一直以来潜心研究技术,行事风格也很低调。
从2014年开始,声网就在专注做 RTC 技术,用声网 Agora 创始人&CEO 赵斌的话就是:“我们希望普及网络实时音视频互动能力,让它像空气和水一样无处不在,随时可用。”
声网并非喜欢低调,在赵斌看来,能够帮助客户和合作伙伴把实时音视频那部分的压力扛住是声网的本分。他认为,没有技术可以做到100%稳定,声网会始终保持诚惶诚恐、如履薄冰的心态,不断从技术、服务、机制、流程上加强,努力去追求这个100%。
这符合一个 To B 公司的优质气质。
从“冷门”到人人都在用,虽然可能还是有一部分人不知道 RTC、不知道声网,但随着线上化的普及,声网的用户将无处不在。也许对声网来说,是否被知道并不重要,而让使用其服务的用户遍布世界的各个角落才是最重要的。
业务线上化实战大讲堂