每周一期,纵览音视频技术领域的干货和新闻投稿:[email protected]。
架构
一种基于广播的模块化架构简单实现
架构是软件开发的基础,直接影响着软件运行效率、代码的可维护性、可扩展性以及可读性。开始新项目时,先设计一个好的架构往往会让往后的开发事半功倍。
https://mp.weixin.qq.com/s/BU1q0_srtzsta6IlOUZeNw
Jitsi:一个开源的Web会议解决方案
Jitsi是使用JavaScript构建的开源Web会议应用程序。如果您正在寻找可在远程工作中帮助您和您的团队的工具,那么您可能会发现这很有用。
https://dev.to/aws/running-your-own-open-source-web-conferencing-application-5aa2
传输网络
低延迟视频流的6种方法:哪种方法最有效?
本文将介绍基于HTTP的实时流协议更新的最新进展,这些协议包括CMAF,社区构建的低延迟HLS(LHLS)和Apple的低延迟HLS(ALHLS),以及Wowza使用的WebSockets + MSE方法他们的超低延迟解决方案;所有这些都会导致两到三秒的延迟不足。
https://www.red5pro.com/blog/6-approaches-to-low-latency-video-streaming-which-is-most-effective/
多播ABR,打开了DVB新时代的大门
本文是来自DVB World 2020线上会议的演讲,演讲者一位是Guillaume Bichot,他是Principal Engineer, Head of Exploration at Broadpeak。另一位是Richard Bradbury,他是Lead R&D Engineer, BBC,他们是DVB TM-MCAST小组的联合主席。演讲题目是“Multicast ABR opens the door to a new DVB era”。
https://mp.weixin.qq.com/s/SE45a3_W1l3bzY8u0de7gw
聊聊OkHttp实现WebSocket细节,包括鉴权和长连接保活及其原理!
OkHttp 应该算是 Android 中使用最广泛的网络库了,我们通常会利用它来实现 HTTP 请求,但是实际上它还可以支持 WebSocket,并且使用起来还非常的便捷。那本文就来聊聊,利用 OkHttp 实现 WebSocket 的一些细节,包括对 WebSocket 的介绍,以及在传输前如何做到鉴权、长连接保活及其原理。
https://juejin.im/post/5e782acd51882548fe2938b0
DVB-I规范简介
本次网络研讨会探讨了DVB-I规范。DVB-I旨在确保通过互联网传送的线性电视与传统广播电视体验一样,具有用户友好性和健壮性。它提供了将线性电视服务传送到电视机、智能手机、平板电脑等能够连接互联网并拥有媒体播放器的设备的可能性。演讲者一位是Peter Lanigan,他是DVB CM-I小组主席,另一位是Paul Higgs,他是DVB TM-IPI小组主席。
https://mp.weixin.qq.com/s/b9qOqCJGFjlsqmLKrG2kZA
广播网关——ATSC3.0分发网络的核心
本文是来自SMPTE 2019的演讲,演讲者是Eric Pinsonr,是来自ENENSYS Technologies的Terrestrial Market Director。演讲题目是“广播网关,ATSC3.0分发网络的心脏”。
https://mp.weixin.qq.com/s/EJY6ZkC1-uhu55xtS5y_yQ
利用云端服务实现太空直播
演讲者表示经过了两年的发展,AWS有着更稳定强大的云端服务,可以自动化的设定延时与视频分辨率,并可快速部署且有着较低的带宽需求。
https://mp.weixin.qq.com/s/x9M27e2Bv7wZGkjPf0komg
编解码
AVS2 超高清编码实践
本文内容来自杭州当虹科技股份有限公司谢亚光在LiveVideoStackCon2019北京站上的精彩分享,他将简单介绍AVS2视频编码标准的特点和优势,同时分享在研发4K超高清过程中探索的高效视频算法,包含各种快速模式决策策略以及获得的速度增益和对压缩效率的影响。同时还将介绍当虹科技在使用GPU来加速编码的一些探索,以及获得的速度增益。
https://mp.weixin.qq.com/s/WsssCmVJCf_curvEayC3GA
容积捕获 —— 高水准的现实主义
5G、AI、VR、MR每每被提起,但距离真正的成熟落地仍需假以时日。Intel Studios的领头人Diego Prilusky 2月在Ted进行了有关容积拍摄技术(Volumetric Video)如何改变电影制作的演讲,将容积捕获(Volumetric capturing)又带入了普通大众的视野当中。
https://mp.weixin.qq.com/s/4RzRNKBhW1C62WaX9_DOnQ
音视频技术
在冠状病毒爆发期间,电话会议应用程序与之对应的新技术需求激增
真正的问题是,一旦这一波浪潮过后,这种趋势会消失吗?还是会让我们陷入另一种现实困境?
https://www.reuters.com/article/us-health-coronavirus-teleconference/teleconference-apps-and-new-tech-surge-in-demand-amid-coronavirus-outbreak-idUSKBN21033K
广色域给电影制作带来的价值
本文是来自SMPTE 2019的演讲,演讲者是来自杜比实验室的Jake Zuena,演讲主要介绍了广色域给电影制作带来的价值。
https://mp.weixin.qq.com/s/U90YceO-WtBpnHzzDMkf8g
使用 OpenGL ES 实现全景播放器
全景视频在播放的时候,可以自由地旋转视角。如果结合手机的陀螺仪,全景视频在移动端可以具备更好的浏览体验。本文主要介绍如何基于 AVPlayer 实现一个全景播放器。
https://juejin.im/post/5e778c2c518825494905eb54
AI智能
深度学习在花椒直播中的应用—推荐系统冷启动算法
推荐系统是依据用户的个人喜好尽可能推荐用户喜爱的物品(视频、新闻、商品、直播等),而用户的兴趣偏好则通过过往的行为数据体现出来。当没有历史记录可循时,就存在推荐冷启动问题。本文在接下来的篇幅首先讲述冷启动的相关概念,然后介绍一些业界常规的解决方法,最后会着重阐述花椒直播在解决用户冷启动方面的实践。
https://mp.weixin.qq.com/s/70FuX6qyDPa47qGiDvI-7Q
YouTube深度学习推荐模型最全总结
去年我曾写过多篇文章分析 YouTube 的深度学习推荐系统论文 Deep Neural Networks for YouTube Recommenders,在此一并总结,给大家进行一个完整版的解读。
https://mp.weixin.qq.com/s/CWaOevhtampxIBZKl09m9w
数据增广之详细理解
数据增广是深度学习中常用的技巧之一,主要用于增加训练数据集,让数据集尽可能的多样化,使得训练的模型具有更强的泛化能力。现有的各大深度学习框架都已经自带了数据增广,但是平时在用的使用只是直接调用了对应的接口函数,而没有进行详细的分析。在实际应用中,并非所有的增广方式都适用当前的训练数据,你需要根据自己的数据集特征来确定应该使用哪几种数据增广方式。
https://zhuanlan.zhihu.com/p/43665254
图像
漫谈视频目标跟踪与分割
本文整理记录了旷视研究院Detection组针对视频目标跟踪与分割问题的探讨和收获,并从喜闻乐见的图像处理出发,以期更好阐述视频目标跟踪的意义。
https://mp.weixin.qq.com/s/Rz9vEXFV2sLB03fJtptrVw
资源推荐
VideoAnalyst
包含对视频理解有用的基本算法的实现:单对象跟踪(SOT)、视频对象分段(VOS)等。
https://github.com/MegviiDetection/video_analyst
活动推荐
LiveVideoStackCon 2020上海 6月见
LiveVideoStackCon 2020上海,4月5日前邀请你的好友一同参与“3人拼团”,在8折基础上还可享受额外每人200元优惠。
https://mp.weixin.qq.com/s/-lvUXn4y714LIosc1R1sGA
点击“阅读原文”可查看更多详细信息,请大家科学上网。