『音视频技术开发周刊』由LiveVideoStack团队出品,专注在音视频技术领域,纵览相关技术领域的干货和新闻投稿,每周一期。点击『阅读原文』,浏览第94期内容,祝您阅读愉快。
架构
衡量视频质量有哪些指标和工具?
视频质量指标是用于预测观众对视频质量的实际评估结果的算法,涉及包括比较编解码器和不同的编码配置,协助生产和实时体验质量(QoE)监控在内的诸多视频处理与制作环节。本文从编解码器与编码配置角度而非用户体验与质量监控出发,描述了最常用的客观质量指标与部署工具。
OpenCV中那些深度学习模块
OpenCV是计算机视觉领域使用最为广泛的开源库,以功能全面使用方便著称。自3.3版本开始,OpenCV加入了对深度神经网络(DNN)推理运算的支持。在LiveVideoStack线上交流分享中英特尔亚太研发有限公司开源技术中心软件工程师 吴至文详细介绍了OpenCV DNN模块的现状,架构,以及加速技术。
NETINT刘伟:ASIC才是未来
摩尔定律落幕,云平台兴起,5G带动将让互联网上流转更多高清视频,边缘计算也成为海量数据下的必然产物。海量流媒体数据需要编码、转码,ASIC将扮演越来越重要的角色。本文由LiveVideoStack对NETINT Co-founder & COO刘伟的采访整理而成。
传输网络
三十年TCP与七年QUIC 谁才是未来?
本文为LiveVideoStack对来自Akamai网络协议优化组的高级工程经理Darren Ng的采访整理而成,Darren Ng早年供职于TCP优化明星公司FastSoft。十年间,Darren Ng一直专注于网络优化。在文中,他给出了如何正确的使用TCP和QUIC的建议。
基于ARINC818视频传输系统的设计
为了满足新一代航空电子系统大容量数字视频信息传输和共享的目标,提高航空电子系统模块化、集成化程度,采用ARINC818标准,对视频传输系统进行的详细研究,并详细阐述了ADVB接收器、ADVB发送器以及显示终端的设计方法和原理。
音频/视频技术
干货来袭丨音视频质量评估绿皮书
网络技术的升级使得市场上音视频类的产品形态越来越多,直播、短视频你方唱罢我登场。公司内也有多个专注于音视频技术、音视频产品服务的团队。音视频产品需要关注哪些质量控制点,如何评估音视频质量,笔者就在音视频实验室的几年工作经验进行介绍。欢迎相关团队同学互相探讨,共同成长。
如何利用深度学习提升视频转码效率与视觉质量?
视频处理平台的核心功能是视频转码,而转码压缩的过程势必会造成视频质量的损失。腾讯音视频实验室技术专家高孟平在LiveVideoStackCon 线上交流分享中根据腾讯丽影平台的开发实践经验,详细介绍了如何利用深度学习在提升视频转码压缩效率的同时提供更高的人眼视觉质量。
超高清论坛(UHD Forum)技术指南V2.0
这份指南发布的目的是对超高清内容的创建和向消费者的内容传输提供一种一致的方法。 本文提供的“超高清”指南的范围包括互联网、卫星、地面广播和有线传输方法。而不包括通过存储媒体(如蓝光®光盘、硬盘驱动器、SCSA设备等)对内容进行编码和传输,也不包括对数字电影内容进行编码和传输。
编解码
Netflix与英特尔共同发布开源编解码器SVT-AV1
在NAB 2019上,英特尔与Netflix共同发布了开源编解码器SVT-AV1。资深编解码技术专家Jan Ozer撰文进行了报道,LiveVideoStack对原文进行了摘译。
Intel可扩展视频技术(SVT)
英特尔和Netflix共同正式发布了SVT-AV1编解码器,该编解码器在英特尔至强可扩展处理器和英特尔至强D处理器上运行时能够进行实时4K / 60p 10 bit编码。
MSU高清/极慢档Codec对比:AV1压缩效率第一 速度慢
4月4日,MSU公布了2018视频编码压缩报告的补充部分——高清/极慢速度档的Codec压缩效率对比,AV1再次成为压缩效率最高的Codec。同时,报告显示AV1与其他Codec相比,编码耗时为10-50倍,还需对编码速度进行优化。
MSU高质量编码对比报告2018
4月4日,MSU图形与媒体实验室(视频组)发布了高质量编码对比报告2018[1],用于进行各个编码器在ultra slow/high quality的预设下对全高清视频的编码性能对比。
视频编码标准大混战
优化编码器使视频能以更高的比特率传输的压力变得越来越大,传统的十年一次的压缩标准飞跃正处于崩溃的边缘。这并不是说编解码器的开发进度变慢了;相反,在IP视频爆炸式增长的推动下,这一领域取得的进步正在形成激烈的竞争和一个分散的市场。
MPEG中的数据压缩综述
提起MPEG,大多数人更关心的是MPEG的音视频标准。不太为人所知但可能非常重要的是,MPEG已经开发了一些用于压缩各种其他数据类型的标准,例如压缩点云数据等。
AI智能
语音交互时代的来临是NLP技术无限可能的开始!!
随着目前人工智能产业的高速发展,人工智能技术也呈现出百家争鸣的态势。在经历了关键词搜索时代到语音交互时代的转变,作为人工智能领域「皇冠上的明珠」NLP 技术显然已经面临着一个最好的时代。
腾讯优图开源人脸检测算法DSFD,刷新两项数据集纪录
不久之前,腾讯优图开源了人脸检测算法 DSFD(Dual Shot Face Detector),该算法相关论文已经被计算机视觉顶级会议 CVPR 2019 接收,刷新了人脸检测数据集 WIDER FACE 和 FDDB 新纪录。
FoveaBox:目标检测新纪元,无Anchor时代来临!
目标检测的任务是“分类”并从图像中“定位”出物体,但长久以来,该领域的工作大多是这样:生成可能包含目标的区域,然后在该区域提取特征并分类。
图像
使用深度学习的单一图像超分辨率
本示例演示如何训练甚深超分辨率(vdsr)神经网络,然后使用vdsr网络从单个低分辨率图像估计高分辨率图像。
开源一个 Android 图片压缩框架
在本文中,我们主要介绍图片压缩优化,后续我们会介绍如何对 Android 的相机进行封装和优化。本项目主要基于 Android 自带的图片压缩 API 进行封装,结合了 Luban 和 Compressor 的优点,同时提供了用户自定义压缩策略的接口。