每周一期,纵览音视频技术领域的干货。
新闻投稿:[email protected]。
内容推荐
京东智联云分布式低延时RTC系统
本文由京东智联云的魏伟在LiveVideoStackCon2020线上峰会的演讲内容整理而成,他会从逻辑结构、系统业务流程和弱网增强等方面介绍京东智联云在RTC方面所做的工作。
https://mp.weixin.qq.com/s/75Ccf0tndxMTjIxkX-P-og
Janus网关的集成与优化
本文由学霸君音视频架构师李桥平在LiveVideoStackCon 2020 线上峰会的演讲内容整理而成,内容主要包括Janus网关的集成过程以及集成过程中遇到的一些问题。
https://mp.weixin.qq.com/s/D1ZruKHYuJ7hSIzZksAPPA
淘宝直播窄带高清技术
本文来自阿里巴巴淘系技术部 高级算法专家王立波在LiveVideoStackCon 2020线上峰会的分享,从直播背景、直播痛点分析、窄带高清、云视频技术趋势几方面详细介绍了如何在确保用户体验QOS不变的前提下,实现淘宝直播的技术架构升级和成本大幅缩减。
https://mp.weixin.qq.com/s/goVRIi4OE0kjLaB5GnsqcQ
架构
基于 WebRTC 开发 Android Messenger:第3部分
请首先阅读第 1 + 2 部分(并欢迎您参加网络研讨会)
https://googleprojectzero.blogspot.com/2020/08/exploiting-android-messengers-part-3.html
三个月时间,需求量增长30倍:在 COVID-19 疫情期间Google Meet如何做到高速增长
随着COVID-19将我们的世界变成一个距离更远的世界,许多人开始寻求在线视频会议来保持社交,教育和工作场所的联系,这种转变吸引了更多的用户使用Google Meet。
https://cloud.google.com/blog/products/g-suite/keeping-google-meet-ahead-of-usage-demand-during-covid-19
WebRTC 产品中第一个 HEVC(H.265)支持和 v2.1 中的改进
Ant Media 在其 WebRTC streaming 功能中增加了 HEVC 支持。
https://antmedia.io/the-first-hevc-h265-support-in-webrtc/
传输网络
通过IP传输音频元数据
这是AIMS和VSF带来的一期夏季会议,会议主讲人是Kent Terry,他是杜比实验室声音技术的高级经理,他将与我们讨论IP音频及元数据的内容。
https://mp.weixin.qq.com/s/ZJLOOGVLtxFipMFqtZzsrg
HESP及其联盟的介绍
HESP联盟将流媒体视频供应商和媒体公司聚集在一起,通过标准化和推进HESP(High Efficiency Streaming Protocol 高效流媒体协议)和HESP市场化解决方案,以更低的成本提供卓越的在线视频质量体验。
https://mp.weixin.qq.com/s/JEslKft4zKMfXU72hBcriA
表白失败后,我明白了TCP实现原理
面向连接、可靠、基于字节流、传输层、协议、端到端,理解了这些关键字也就理解了 TCP 的实现原理,本文将从这些关键字开始进行分析。
https://mp.weixin.qq.com/s/0zU_Qc1zMXdy-RQzKUBdkw
编解码
从编解码、传输到基础架构 详解Bigo多媒体技术栈
本文来自Bigo多媒体技术团队的投稿,详细介绍了Bigo多媒体技术的前生今世,通过何种技术手段支撑起了BigoLive、Likee和imo三大业务。技术栈具体涉及编解码、传输、全球基础设施架构等三方面。如果你也有独到的经验与思考,欢迎通过[email protected]投稿给我们。
https://mp.weixin.qq.com/s/INALBMInYD18AFtCDZCPjQ
LCEVC绕开编解码器战争的9个原因
对于希望通过4K UHD和其他新兴的高比特率视频格式来解决带宽和延迟挑战的人们,而不必解决下一代编解码器带来的所有问题,这是一个好消息:看来您的愿望已经成真。今年年初,运动图像专家组(MPEG)朝着最终批准MPEG-5第1部分和第2部分迈出了重要一步,分别称为基本视频编码(EVC)和低复杂度增强视频编码(LCEVC),以及H.266,也称为多功能视频编码(VVC)。
https://www.red5pro.com/blog/9-reasons-why-lcevc-circumvents-the-codec-wars/
音视频技术
视频码控:CBR、VBR和ABR
本文介绍下常见视频编码器码率控制方案,具体的编码器可能在实现和使用上有所差异,具体在调用API和阅读源码时需要进行进一步分析和了解。
https://mp.weixin.qq.com/s/6VPT_35BNPMAwFSs8KsJdQ
Dropbox评估了CUBIC,BBR和BBR v2三种拥塞控制算法
在本文中,我们研究了在Dropbox Edge Network上收集的实验数据。我们将BBRv2与BBRv1和CUBIC进行了比较,表明BBRv2是对它们两者的绝对改进。我们还显示BBRv2实验结果与其理论设计原理相符。
https://arxiv.org/abs/2008.07699
视频质量评估
无参考评估在云信的视频测试实践
在实时音视频领域,如何实现视频的全自动化评估是一个业界共同的难题。无参考(NR)技术不需要关于参考视频的任何信息,无疑是视频全自动化评估的曙光。本篇文章将介绍云信测试组最近在使用的一种视频无参考评估方法,及其自动化应用方案。
https://mp.weixin.qq.com/s/eaAGxhvP9FAczwzwMP1vgw
AI智能
使用MediaPipe BlazePose进行设备上实时身体姿势跟踪
视频姿势估计起着至关重要的作用,可以在增强现实,手语识别,全身手势控制甚至量化体育锻炼中将数字内容和信息叠加在物理世界的顶部,从而构成瑜伽的基础,舞蹈和健身应用。由于各种可能的姿势(例如,数百个瑜伽体式),许多自由度,闭塞(例如,身体或其他物体遮挡从摄像机看到的四肢),用于健身应用的姿势估计尤其具有挑战性外观或服装。
https://ai.googleblog.com/2020/08/on-device-real-time-body-pose-tracking.html
图像
谷歌新研究:用2D网图就能合成3D地图模型
通常根据真实场景重建精准逼真的3D地图模型并不容易,谷歌科研人员为了简化这一流程,训练了一个基于NeRF(神经辐射场)的学习算法,可通过同一场景的几张网络照片合成多个视角,实现3D效果。
https://mp.weixin.qq.com/s/ImLW2XXu7Sav3f1D_mV5qg
资源推荐
前端音视频的那些名词(入门)
适合音视频初学者收藏。
https://juejin.im/post/6861941219938418702
资讯速览
Android“ Nearby Share” 文件共享功能上线
Scener 与 Agora 合作,见证了100倍增长的 Watch Party 平台
AVCtechnologies 宣布达成收购 Ribbon 的 Kandy Communications 业务的协议
活动推荐
【线上分享】互动协作白板与音视频实时同步技术实践
在线教育行业中白板技术占据了不可或缺的位置,逐渐成为各大教学场景的标配功能。但由于网络环境参差不齐、教学手段各有特色,如何实现白板实时协作、攻破白板与音视频不同步成为关键。8月27日19:30-20:30,即构科技互动白板技术负责人陈晓聪将通过对齐音视频流与白板信令以及冲突判定算法实现音画同步和百人实时互动协作。
访问下方链接或点击【阅读原文】预约直播:
http://livevideostack.mikecrm.com/DaOkXQf