每周一期,纵览音视频技术领域的干货。
新闻投稿:[email protected]。
HYPER: 充满挑战和成就的十年
自从Flash Player和Adobe Media Server多年以来一直跟随我的人知道,在过去的15年中,我一直在忙于开发编码器,播放器以及通用软件体系结构,以实现,增强和优化大规模的视频流。特别是在2021年,我要庆祝Hyper成立10周年,它也是这些成就之一,但让我们从头开始。
https://sonnati.wordpress.com/2021/03/30/hyper-a-decade-of-challenges-and-achievements/
Chrome 91新特性:手写识别,WebXR平面检测等
除非另有说明,否则以下描述的更改适用于Android,Chrome OS,Linux,macOS和Windows的最新Chrome beta通道版本。通过提供的链接或ChromeStatus.com上的列表,详细了解此处列出的功能。Chrome 91将于2021年4月22日发布Beta版。
https://blog.chromium.org/2021/04/chrome-91-handwriting-recognition-webxr.html
华为云薛浩:走进视频“新时代”
随着社会发展,视频产业的发展也在迅速加快。视频“新时代”带来了新的机遇、也有新的挑战。本次分享我们邀请到了华为云的薛浩先生,他向我们分享了华为云在面对视频“新时代”的想法、投入及对产业界的看法。
淘系音视频技术的演进之路
随着社会的发展,音视频技术在电商运营中占据的位置越来越重要。不仅时代在进步,音视频技术也在前进。本次LiveVideoStackCon 2021 上海站中,我们邀请到了淘系技术的陈颖老师为我们分享淘系内容电商技术的过去、现在及其未来展望。
音视频技术在云会议场景的拓展和未来
音视频技术不断发展,云会议场景在人们生活中也越来越常见。那么如何将云会议场景中的音视频技术不断提升改善?本次分享会我们邀请到了来自腾讯会议的商世东先生,他将与我们分享云视频技术在腾讯会议里面的一些领域使用情况和他们对未来的一些思考。
阿里云窄带高清的演进与思考
窄带高清实际上是一套以人眼的主观感受最优为基准的视频编码技术,研究的是在带宽受限的情况下,如何追求最佳的视觉感受。今天我们请到了来自阿里云智能视频云的王豪老师,他将与我们分享窄带高清是什么、现在的窄带高清主要关注哪些内容、以及未来的布局是什么。
目标检测,FFmpeg中第一个基于深度学习模型的视频分析功能
2021年4月,终于把目标检测(object detection)加到FFmpeg upstream了,有maintainer身份加持,还是交互了将近100封邮件,花了两个多月才完成upstream,这还不包括前面的开发时间,当然,这么多的交流也对最后的代码有很大的提升。
遮挡视频实例分割,牛津阿里最新开源OVIS数据集!
当场景中存在严重的遮挡时,作者的视频理解系统能感知对象吗?为了回答这个问题,作者收集了一个名为OVIS的大规模数据集,用于遮挡视频实例分割,即同时检测、分割和跟踪遮挡场景中的实例。OVIS由来自25个语义类别的296k高质量实例掩码组成,对象遮挡通常发生在这些类别中。
5G+边缘计算,对于VR移动电竞游戏来说意味着什么?
这是一个5G+边缘计算意义的问题。其实对VR游戏(特别是电竞游戏)这类大流量/低延迟的应用服务来说,大多数人第一时间想到的优点会是高达1Gbps/s的数据传输速度,虽然事实确实如此,但并不是全部。
从WinZips到Cat GIF,Jacob Ziv的算法提供了数十年的压缩能力
无损压缩的先驱者获得了2021年IEEE荣誉勋章。
https://spectrum.ieee.org/geek-life/profiles/from-winzips-to-cat-gifs-jacob-zivs-algorithms-have-powered-decades-of-compression
会议更流畅,表情更生动!视频生成编码 VS 国际最新 VVC 标准
阿里云视频云的标准与实现团队与香港城市大学联合开发了基于 AI 生成的人脸视频压缩体系,相比于 VVC 标准,两者质量相当时可以取得 40%-65% 的码率节省,旨在用最前沿的技术,普惠视频通话、视频会议、在线教育等重要应用领域。
评估使用SL-HDR1压缩HDR的比特率
本文是来自VidTrans 21的演讲,演讲者是来自Cobalt Digital的Ciro Noronha,演讲的主要内容是评估使用SL-HDR1压缩HDR的比特率。
评估广播工作流程中视频质量的一个新范例
本次演讲来源于2021年3月1日视频服务论坛(VSF)的年度会议VidTrans,演讲者Margaret H Pinson来自国家电信和信息管理局(NTIA)。
Facebook基于Transformer的目标检测 (DETR)的详细指南
DEtection TRansformer (DETR)是Facebook研究团队巧妙地利用了Transformer 架构开发的一个目标检测模型。在这篇文章中,我将通过分析DETR架构的内部工作方式来帮助提供一些关于它的直觉。
Twitter在Android和iOS上推出4K图像支持
在公司于3月进行测试之后,iOS和Android上的Twitter用户现在都可以以4K上传和查看图像。为此,你所需要做的就是导航到设置菜单的“数据使用情况”部分,并更新高品质图像选项上的选择。
https://www.engadget.com/twitter-4k-image-uploads-mobile-171149369.html
VR/AR/MR/XR 概念辨析
虚拟现实(Virtual Reality,VR)、增强现实(Augmented Reality,AR)等业务以其三维化、自然交互、空间计算等完全不同于当前移动互联网的特性,被认为将是下一代通用计算平台。
LiveVideoStack主编观察03 /大会见闻&思考
时隔两年,4月16-17日,LiveVideoStackCon再次来到上海。也许是疫情让大家彼此疏离了太久,因此,本次LiveVideoStackCon是有史以来上海站参会者数量最多的一次,本周我就来聊聊在这次大会上的见闻与思考。
后疫情时代音视频行业思考LVSCon2021SH
作为一个参与了3次LVSCon大会的从业者(2020年因疫情原因,遗憾未能参与),对于本次在上海举办的LVSCon,感受到了与以往完全不一样的氛围。
2021上海LVS音视频大会观感和思考
其实音视频这个领域非常的窄,很长一段时间都没有属于自己专一和垂直的社区。最近几年,随着国外的FFmpeg和WebRTC的普及,国内SRS和LVS在这个领域也变得越来越活跃。从2017年LVS组织第一次线下大型活动到现在已经五个年头了,感谢LVS提供的平台和机会,让大家每年有一两次线下面对面交流机会,也感谢这个时代对音视频技术的持续推动。
一个 RTC 开发者在 LVS 音视频技术大会的见闻与思考
两天的大会,全程一场紧接着一场的听下来,不知道其他参会者感觉如何,反正我是挺累的。当然,不能白累,收获是必须的。下面我就分享下自己在 LVS 音视频技术大会的一些收获。
小提示:链接跳转仅支持公众号相关链接
插图源自Pexels