据第三方咨询公司iiMedia Research预测,2017-2020年,视频直播行业一直处于高速发展阶段。2020年,视频直播行业市场收入超1万亿元,累计覆盖用户5.26亿。
视频直播的应用范围已从视频娱乐、电子商务等泛互联网行业扩展到在线教育、视频安防、广电传媒、医疗服务等传统行业。“直播+”已成为新趋势。视频直播行业市场潜力巨大,是一个竞争激烈的行业,涉及众多参与者。为了吸引更多的用户,直播商必须能够细化直播内容,丰富直播场景,创新营销模式。为了实现这些,直播平台需要结合实时互动和短视频,从而达到更好的整体效果。
自建直播平台的直播提供商面临巨大挑战:
阿里云视频直播是基于领先技术的音视频直播平台,包括内容接入分发网络、大规模分布式实时视频处理等。具有接入方便、时延低、并发高等特点,提供高清流畅的音视频直播服务。
如上图所示,主播从采集设备采集直播内容,然后使用推流 SDK 进行直播。视频直播服务通过边缘推流的方式将直播推流到阿里云直播中心。然后,通过CDN边缘节点对视频流进行加速,保证上行传输的稳定性。视频流投递到直播中心后,主播可以根据您的需求对直播流进行处理。例如,播法者可以对流进行转码、执行时移、录制流或捕获流的一些快照。
处理后的流通过CDN节点下发到客户端设备进行播放。移动播放器可以通过集成阿里云提供的播放器SDK来开发。除了对直播进行转码和截取快照外,用户还可以通过直播到点播功能,将录制的直播流投递到视频点播。在视频点播中,用户可以将录制的直播流在线编辑为短视频,并将录制的直播流作为点播视频提供。这个过程将直播与短视频的制作和传播联系起来。
阿里云在全球拥有超过 2,800 个边缘云节点和 9 个直播中心。支持海外业务的无缝布局。依托阿里云音视频全球实时传输网络(GRTN),从最近点即可访问全球直播流,并通过高速通道快速传输到指定直播中心进行内容分发。
阿里云的窄带高清技术可以智能分析视频中的场景、动作、内容、纹理等细节。例如,针对足球比赛中的足球、球员、草地等不同内容,实现基于不同策略的编码优化。因此,在图像输出继续的同时,比特率降低,从而节省了 20% 到 40% 的带宽成本。
左图为正常转码,右图为窄带高清转码。当观众看到这张照片时,焦点会放在人脸上。通过智能分析,系统为人脸分配更多的码率,使细节更清晰,从而更好地识别整个人脸的纹理。现在,让我们看一下比特率分析。如果左侧的视频图像较复杂,则码率在1.5MB到2MB之间。
当视频图像中的细节较少时,例如,在足球比赛的中场休息期间,我们可以使用智能识别来减少码率的消耗。使用该技术,整体带宽平均减少 30% 至 40%。换句话说,在确保图像更清晰的同时节省了带宽。这就是阿里云的窄带高清2.0技术。
阿里云还开发了名为Ali S265的实时高性能视频编码器,支持H265 1080p高质量实时转码、视频增强算法和图像增强。视频直播场景的编码有一个关键的前提条件。也就是说,编码必须是实时的,这意味着一小时的视频必须在一小时内进行转码。更准确地说,比如每一秒的视频内容都需要在一秒内逐一转码,以保证实时转码。
阿里S265可以实现1080p高质量的视频实时转码,并采用图像增强算法来提升图像质量。在上面的例子中,你可以看到动物身后树上的雪花细节经过阿里S265处理后得到了增强。在保证实时转码和图像质量的基础上,通过增强算法对图像进行处理,使其更清晰、更有层次感。
RTS基于实时直播,优化了全流程时延监控、CDN协议转换、UDP等底层技术。通过与播放器SDK集成,在千万级并发请求的场景下,实现节点间毫秒级的时延。这减少了传统直播中 3 到 6 秒的延迟,保证了低延迟、少卡顿,最终实现快速接入和流畅的直播观看体验。RTS具有多重技术优势,可广泛应用于各种工业场景。凭借为数百名客户提供的实践经验,RTS为企业带来了巨大的价值。
阿里云的Production Studio服务基于视频直播和MTS,旨在改变传统的云上视频制作工具。通过集成视频AI识别、双语翻译和各种交互功能,创新了定向视频的效果。您可以按需使用 Production Studio 服务,而无需购买额外的硬件。生产工作室服务提供生产控制台、API 和 Web SDK。您可以根据需要访问它们,以方便二次开发或直接使用。控制台易于交互,可以降低学习成本。
除了直播和点播视频源外,还支持多种类型的内容源,如图片、文档和网页。最多可以同时混合和编码六个视频。提供多视图、实时图文打包组件、多语言字幕、视频AI等能力。他们随时帮助打包制作直播,一键在线同步,打造精彩、身临其境的直播体验。
多地点功能在活动不同地点的多个位置的多个流之间进行组合和切换。不同位置的视频通过视频帧级同步播放传输,使用户能够同时拥有多个视角,帮助他们欣赏所有精彩的场景。虚拟演播室采用基于深度算法的实时自动抠图技术实现,支持多设备、多地点、远程播出。通过云抠和合成能力,实现双屏、分屏、画中画等直播场景,打造沉浸式直播体验。
该功能用于汇聚多个视频节目,创建类似轮播演播室的直播间,实现直播场景和节目形式多样化。用户可以在剧集列表中添加、删除、修改和搜索节目,并修改节目内容。用户可以使用此功能以灵活、轻松、协作的方式实现业务场景。
Production Studio实时字幕,集成Production Studio、Damo Academy ASR、翻译服务,提供实时多语言语音转字幕直播服务。它支持在现场录制过程中长期存储翻译的字幕以及字体、背景、效果和显示时间等各种参数的设置。此外,还可以灵活使用中文、英文、法文、西班牙文、俄文等多种语言的模板。而且,在直播语音转文字的过程中,实现了字幕的实时叠加,翻译以字幕的形式融入到直播中进行展示。
Production Studio 还支持集成直播视频剪辑、点播视频剪辑、图片、文本、动态 H5 组件素材和 AI 能力。通过此,重构视频内容的制作流程,多维度展示数据信息,增强内容丰富度,扩大流量曝光,通过广告获得收益。
视频审核服务是基于海量标注数据和深度学习算法实现的。该服务可以从语音、文本、视觉展示等多个维度准确识别媒体文件中的违禁内容,包括色情、暴力、恐怖、广告、不健康场景等。该服务还支持对视频、图片和文件进行内容审核,以确保内容安全。
阿里云推流SDK是基于阿里云CDN(CDN)和音视频实时通信技术推出的一款功能强大的音视频广播服务。提供简单易用的开放API、流畅的网络自适应播放体验、基于多节点的低延时优化、实时修饰等。智能修饰是一种基于智能视觉算法的海量人脸检测识别技术。它提供了修饰、塑形和化妆美化以及拍摄滤镜和贴纸等功能。
面部关键位置独家定位技术,覆盖106个基本位置和280个高精度位置,使效果逼真。智能视觉算法和实时渲染技术定期优化,提供更好的用户体验。脸部修饰和塑形效果、滤镜、贴纸和材质不断升级和丰富,使图像更加有趣。全面的开发人员支持确保快速响应客户需求以及优质可靠的服务。
视频直播支持访问控制,如引用用户黑白名单、IP黑白名单等。它还支持播放中心身份验证和业务远程身份验证。播放中心身份验证包括用于流引入和播放的 URL 身份验证。安全 URL 身份验证支持自定义身份验证密钥和身份验证过期时间,以动态生成身份验证 URL。业务远程认证是指将业务请求信息传输到客户定制的认证中心进行有效性检查。
通过主备流切换,实现可靠稳定的直播。切换过程简单易操作。视频直播支持使用EdgeScript进行自定义认证。用户可以根据业务特点自定义认证脚本,从而实现快速部署和发布。用户可以在CDN边缘节点上编译EdgeScript进行直播,无需关注机器的硬件配置、区域部署、调度、自动扩缩容等。上传后,云视频直播的边缘云节点可以部署在全球。基于代码逻辑,可以在全球边缘节点上处理来自世界各地的请求。
视频直播加密是一种云设备集成的视频加密解决方案,采用专有的加密算法,确保视频流传输的安全性。支持通用DRM加密,支持多终端、多平台、全方位的版权保护。这种加密方案使用独立的加密密钥,避免了单个密钥泄露导致的广泛安全问题。它支持加密、转码和解密播放。通过动态密钥管理,为视频资源提供更好的保护,有效防止视频泄露和热链接。通过数字水印技术在视频直播中的应用,可以获取证据,追根溯源,追究重大体育赛事直播侵犯著作权的责任人。
视频直播提供实时监控直播推流质量、观看次数、错误状态、观看次数、播放流量带宽、播放质量等秒级监控。用户可以及时发现直播过程中的异常,超低时延。实时日志投递是指将直播中域名的日志投递到日志服务。用户还可以通过对日志进行分析,发现和识别推流相关的问题,或者根据对直播受众的分析制定运营策略。
从应用来看,典型的视频直播场景包括大型体育赛事直播、泛娱乐(节目、游戏、社交媒体)、电子商务、晚会活动、在线教育、企业等。