每周一期,纵览音视频技术领域的干货和新闻投稿:[email protected]。
架构
伊隆·马斯克(Elon Musk):视频会议应用“肯定”会出现在特斯拉汽车上
使用 WebRTC 和 Chromium?
https://techcrunch.com/2020/05/06/elon-musk-video-conferencing-is-definitely-coming-to-tesla-vehicles/
Google Duo 使用新方法让我们的相处时间更特别
白板,AR,组视频布局,Web 浏览器支持。
https://www.blog.google/products/duo/family-mode/
传输网络
实时传输控制协议RTCP【基础】
讲师首先介绍了用于实时应用的协议栈,然后介绍了RTP和RTCP的区别和联系,接着概述了RTCP的功能,然后详细介绍了RTCP的头格式,包类型,RTT计算,抖动计算,流同步,占用带宽。最后讲了复合RTCP。
https://mp.weixin.qq.com/s/yDyHCoUWelEDS8NiAsDHtA
WebRTC 拥塞控制 | Transport-CC 之 RTP 头部扩展与 RTCP Feedback 报文
在 WebRTC 的 Send-side BWE 中,大多数拥塞控制逻辑被放到了发送端,这样做除了方便维护,也增加了相关算法的灵活性,而这一切正是基于 Transport-CC(Transport-wide Congestion Control)。
https://mp.weixin.qq.com/s/DPurcS6HSGGV5S4-440Oeg
编解码
VVC最新进展
本段视频来自微软研究院,担任VVC发展联合主席的GarySullivan介绍了新一代视频编码标准VVC的最新进展。
VVC作为一个联合项目,是由ITU-T VCEG和ISO/IECMPEG两个专家组联合制定的。类似的在以往的视频编码标准中也有很多次,例如:MPEG-2、H.264/AVC、HEVC以及现在的VVC是下一代视频编码标准。
https://mp.weixin.qq.com/s/fjll3CyIfOU1gkNBX4ap0w
力破 H.265 藩篱,大华联合中星加码 SVAC
近日,大华股份与中星科技签署战略合作协议。双方将在SVAC国家标准建设上发挥各自优势,为用户提供视频安全软硬件产品和解决方案,社会治安防控体系下各细分场景落地。
https://www.leiphone.com/news/202005/6WrV4RY1ecXovnTH.html
WebRTC VP8 编解码器,Data Chnnel 和 4K 60FPS 的支持在 Ant Media Server 2.0 发布
Ant Media 随附了其媒体服务器的 v2 版本。
https://antmedia.io/scale-10k-ultra-low-latency-viewers-quickly/
与编解码专家Pankaj Topiwala回顾视频编码发展
本段采访来自The Video Insiders。Video Insiders与业内最重要的编解码器专家之一,FastVDO的首席执行官Pankaj Topiwala讨论了小波压缩以及AVC,HEVC和VVC的发展。
https://mp.weixin.qq.com/s/EJ9TUEMWVqOvQDWI36Reew
视频技术
在线流媒体入门【基础】
这段视频由IET Media制作,IETMedia是IET内部的一个技术网络,它为广播行业的网络和教育举办活动、讲座和网络研讨会。
https://mp.weixin.qq.com/s/0fD4fOwdpq3U8olPli3Hlg
杜比(Dolby)推出了 Dolby.io,一个面向开发人员的新媒体和交互平台
一个新的 CPaaS 平台,在音频质量领域具有令人兴奋的差异化特性。
https://news.dolby.com/en-WW/188636-dolby-introduces-dolby-io-a-new-media-and-interactivity-platform-for-developers
智慧城市交通的要素:路口监管可视化系统的解决方案
随着信息时代的发展变迁,荧幕里呈现的 智慧城市 慢慢出现了在现实生活中,很大程度上便利了日常的管理和维护。在智慧城市的大背景下,智慧交通监管可视化系统 是其重要的组成部分,通过一条条道路监控的串联,引申出一座智慧城市的管控,而在众多数据的维护中,实时数据 、设备状态 以及 视频监控 是极为重要的。
https://juejin.im/post/5ebe6244e51d454dd05b2647#heading-10
视频播放器的极致体验优化
视频体验由开始的视频清晰流畅,演变到现在的视频快速响应、即点即放、快速切换等等。基于这些优化林勇平将介绍播放器的一些技巧,使得视频体验在较少改动的情况下就能达到极致体验的效果。
https://mp.weixin.qq.com/s/3ngL-qvuAkFqD-AXbjY9OQ
人物专访
码代码,到白头|专访SRS创始作者&阿里云RTC服务器团队负责人杨成立
人会说谎,或多或少,或有意或无意,但好的代码不会说谎。屏幕上的一行行字符给人兴奋感,给人贴心感,给人世俗意义的快乐,也给人世俗之外的领悟。
https://mp.weixin.qq.com/s/cRFbd7A0bDN4hbKqsFV4bQ
坚守音视频领域多年:是偶然,也是必然
十几年持续专注于音视频领域的在国内确实不多,我能坚守是偶然也是必然。早期的坚持是兴趣加上偶然因素,现在看到能够通过技术来极大的提升人类在各方面应用的效率时,更多的则是必然。网易云音乐音视频实验室负责人刘华平在采访中说到。
https://mp.weixin.qq.com/s/LBRnW10JWp8SRuJ8pxyahg
AI智能
在 NVIDIA Jetson 平台上构建用于 AI 可处理的多摄像机媒体服务器
如今,在 WebRTC的 物联网用例中,越来越多地涉足 NVIDIA Jetson 平台。
https://devblogs.nvidia.com/building-multi-camera-media-server-ai-processing-jetson/
NLP中数据增强技术的可视化综述
在计算机视觉中,使用图像数据增强是比较常规的做法,而在NLP中对文本数据进行增强则非常罕见。这是因为对图像做一些微不足道的操作(例如将图像旋转几度或将其转换为灰度图像)并不会改变其原来的内容。这种特性使数据增强成为CV研究中必不可少的步骤。
https://juejin.im/post/5ec24c73f265da7bea2c6a5d
换脸新潮流:BIGO风靡全球的人脸风格迁移技术
BIGO的算法团队经过探索,提出了基于风格迁移+ID注入的FaceMagic方案,在生成高清自然人脸的同时能够保持人脸姿态、属性一致。目前FaceMagic已在线上运营,每日用户使用量过百万级。
https://36kr.com/p/712705841125892
资源推荐
图解机器学习(图书)
本书用丰富的图示,从最小二乘法出发,对基于最小二乘法实现的各种机器学习算法进行了详细的介绍。
https://www.yanxishe.com/resourceDetail/1492?from=leiphonecolumn_res0519
点击“阅读原文”可查看更多详细信息,请大家科学上网。