音视频技术开发周刊(第119期)

每周一期,纵览音视频技术领域的干货和新闻投稿:[email protected]



架构

快手高性能移动端多媒体引擎架构
当前,越来越多的用户选择使用手机进行视频创作,随着视频UGC时代的到来,用户不再满足于简单地视频拍摄,更希望一些专业的剪辑功能在移动端实现。 在计算性能非常有限的情况,要实现这些高负载的功能,面临着非常多技术的挑战。 本文来自于陈彬在LiveVideoStackCon2019北京站上的精彩分享。

5 分钟学会 WebRTC
Stats Basics 对 WebRTC Stats 的简要介绍。

在云联络中心监控 WebRTC 端点的秘密
概述如何处理对 WebRTC 的监视。


传输网络

快就是正确: 对低延迟流媒体的需求很多
毫无关系的。 剧透的。 实时的。 您认为 WebRTC 在本文中属于哪一种?

基于内容的自适应视频传输算法及其应用
本文内容来自LiveVideoStack线上分享第四季第二期,由湖北经济学院副教授,胡胜红博士为大家介绍如何基于内容分析技术,从用户需求角度标注视频流重要性级别,构建自适应流传输策略,实现语义级QoE优化目标。

机上娱乐市场 IFE 
本文是来自MHV(Mile High Video)2019的演讲,演讲者是来自汉莎系统公司的内容与媒体策略首席顾问Michael Childers,同时Michael也是航空公司乘客体验协会(APEX)的董事会成员。 本次演讲主要讲述未来基于云的内容交付在机上娱乐市场的应用。

编解码

如何编写 FFmpeg 自动化测试用例(一)
本文详细介绍了如何编写 FFmpeg 的自动化测试用例。

Mac OS上使用FFmpeg的“血泪”总结
本文列举几个在我的机器上面不适用的场景,若有其他人也遇到了,可以参照一下,有时候可以根据命令的执行错误信息去Google或者百度到解决办法,有时候也可能会被带到沟里面去。

AOM/AV1的机器学习及其在RTC中的应用
关于 ML 如何适用于编码器的调查。

基于FPGA异构计算快速构建高性能图像处理解决方案
FPGA与CPU相比进一步强化了算力,尤其适合各类并行化计算; 而与GPU相比,其更细粒度及灵活的并行化及流水线控制天然的对复杂算法有更强的适应性,能够充分发挥出算力优势,从而带来计算效率的提升。 针对数据中心算力不断增强,算法不断细分、复杂化的大背景下,FPGA具有更好的发展前景。

通过SRT Hub和Microsoft Azure在云中的广播制作
为了将内容从远程位置返回到广播中心,传统上,我们需要预定回传通道。 随着专业音频和视频实时IP连接的出现,这一切都发生了变化。 通过IP基础设施来形成体育和现场娱乐新闻,它不再需要专门的链接,并且可以在任何具有足够带宽的载波上作为数据进行传送。 本文旨在介绍由Haivision,Microsoft与其他成员合作,通过SRT Hub和Microsoft Azure在云中广播制作的投资组合中获得经验,挑战,技术和成果。

生物智能启发的压缩技术
本文是收录于London Video Technology(LVT)的演讲,演讲者是Deep Render公司的CEO,Chri Besenbruch。 本次演讲主要介绍了图像/视频编码技术的现状以及由Deep Render公司创建的一种基于AI的新型压缩方法。

视频技术

视频监控摄像头的互联网化实践思路
本文介绍了视频监控摄像头的互联网化实践思路,本篇就抛砖引玉说下视频监控设备上云的一些实践和思考。 文章核心内容大致分为下面几个部分,为什么监控摄像头要上云? 互联网化? 要上云怎么实践? 有哪些大坑需要填? 未来这块还有哪些改进空间和期待?

视频体验质量指标的标准
本文是来自MHV(Mile High Video)2019的演讲,演讲者是来自于Mux的Steve Heffernan。 本次演讲主要接受了CTA标准工作组R04 WG20 在视频体验质量指标标准上的近期工作。

Hangouts Meet 中的语音识别
关于谷歌 Meet 中语音识别工作原理的有趣分析 (涉及 data channel)

人物专访

金山云樊鸿飞: 集智高清+AV1云转码,唤醒5G时代超高清应用
本次采访我们邀请到了金山云的算法架构师樊鸿飞,主要负责金山云视频编解码、集智高清、图像增强、图像压缩等产品的研发,在采访中樊博士回顾了自己多年技术研究的心得,也针对AV1当前的生态发表了自己的看法,对于即将到来的5G时代,我们有理由相信金山云已经做好的充足的准备。

网易易盾李雨珂: 服务性能+算法确定性优化
人工智能取代人类的言论一直甚嚣尘上,而深度学习算法通过大量的样本数据也能帮助人工对图像、视频、音频中的信息做出识别,本次采访邀请到网易易盾的资深算法专家李雨珂,他将会为大家解答深度学习在实际应用中的样本攻防问题以及短期内人工审核在内容安全领域的不可替代性。

AI智能

轻松搭建图像分类 AI 服务(实战)
图像分类,其实是对图像中主要目标的识别和归类。 例如在很多张随机图片中分辨出哪一张中有直升飞机、哪一张中有狗。 或者给定一张图片,让计算机分辨图像中主要目标的类别。

边缘深度学习设备基准评测
边缘计算对势头正盛的物联网的发展至关重要。 近日,机器学习和数据科学咨询公司 Tryolabs 发布了一篇基准评测报告,测试比较了英伟达 Jetson Nano、谷歌 Coral 开发板(内置 Edge TPU)、英特尔神经计算棒这三款针对机器学习设计的边缘计算设备以及与不同的机器学习模型的组合。 结果表明,无论是在推理时间还是准确度方面,英伟达的 Jetson Nano 都是当之无愧的赢家。 另外他们也给出了在树莓派 3B 与英伟达 2080ti GPU 上的结果以供参考。

图像

NeurIPS 2019 | DetNAS: 首个搜索物体检测Backbone的方法
物体检测器通常使用图像分类网络的Backbone,由于和检测任务存在一定差异,这些Backbone往往不是最优的。 本文中,旷视研究院提出DetNAS,这是首个用于设计更好的物体检测器Backbone的神经网络搜索方法; 由DetNAS搜索出的框架在COCO上的性能超越了ResNet-50与ResNet-101,且模型计算量更低。 本文已收录于神经信息处理系统大会NeurIPS 2019。


资源推荐

SRS多进程
SRS定位是运营级的互联网直播服务器集群,追求更好的概念完整性和最简单实现的代码。

Python小工具: 利用ffmpy3库3秒钟将视频转换为音频
ffmpy3 是 ffmpy 的一个分支,它是一个简单的 FFmpeg 命令行包装程序。ffmpy 实现了一个 Pythonic 接口,用于通过命令行执行 FFmpeg,并使用 Python 的子进程模块进行同步执行。使用 Python 的 asyncio.subprocess 模块也支持异步执行。

活动推荐

硬派多媒体技术方案沙龙·2019深圳
从WebRTC、低延迟直播到边缘计算,从编解码Codec到AI加速,从全景视频到沉浸式音频,从5G到超高清,从金融、教育、制造等行业应用场景优化到QoE用户体验......硬派多媒体技术方案沙龙(Impact of Multimedia Technology Solution Meetup)旨在甄选技术领先、成熟的方案与案例,推动技术传播,连接多媒体技术生态上下游。

Xilinx视频加速技术专场
从AI到编码、转码,硬件加速方案正在扮演越来越重要的角色。本专题,将展现基于FPGA的硬件加速特性,在视频、图片编码与转码以及AI计算方面带来的收益。

点击“阅读原文”可查看更多详细信息,请大家科学上网。

你可能感兴趣的:(音视频技术开发周刊)