2019-05-21

超分:
深度学习超分辨率最新综述:一文道尽技术分类与效果评测
详解爱奇艺ZoomAI视频增强技术的应用
使用深度学习的单一图像超分辨率
ESRGAN-进击的超分辨率复原

音视频增强:
以“用户播放行为与体验”为核心的视频服务质量优化
运动模糊滤镜
关于HDR,你想知道的全在这
AI新领地—打通图像增强和视觉识别的“任督二脉”

协议:
三十年TCP与七年QUIC 谁才是未来?
HLS仍为自适应码率流媒体主导标准
范醒哲:5G时代是时候全面解决TCP的效率问题了
熊猫直播P2P分享率优化(下):ASN组网
Hulu:如何实现大型比赛直播系统自动扩容
基于SRT传输协议的直播服务
SRT协议

编解码:
透过 Top 500 美拍短视频看 AV1 性能
H.265在花椒直播中的应用与优化
MediaCodeC解码视频指定帧,迅捷、精确
使用MediaExtractor及MediaCodec解码音视频
Netflix与英特尔共同发布开源编解码器SVT-AV1
Intel可扩展视频技术(SVT)
MSU高清/极慢档Codec对比:AV1压缩效率第一 速度慢
MSU高质量编码对比报告2018
视频编码标准大混战
Sisvel的VP9/AV1专利池将对视频行业带来哪些影响?
CAE+VBR如何提升用户体验?
Versatile Video Coding(VVC)总结
H.265与H.264的差异详解
H.264/AVC视频编解码技术详解:宏块的帧间预测解码
H.264/AVC视频编解码技术详解:参考帧列表
MediaCodec API笔记
H264码流结构
音视频编码技术基础
AV1编码时间下降,接近使用水平
H264视频--x264编解码原理详解
安卓硬解码H264播放器的实现
小视频app开发过程中的两种编码标准
压缩效率比H.265更高,揭秘腾讯无线投屏背后的屏幕编码技术
iOS硬解码H264视频流
H.264 中的 NAL 技术

音频:
音频采样及编解码——LPCM 、ADPCM、G711、G726、AAC
ADPCM音频编解码
SoundTouch与Rubber Band Library变声算法对比与ASR结果分析
从若琪,今天杭州的天气为例。让你全面了解什么是语音交互

语音识别:
语音识别
谷歌用新的语音数据扩增技术大幅提升语音识别准确率
语音交互时代的来临是NLP技术无限可能的开始!!
语音识别传统方法(GMM+HMM+NGRAM)概述
语音相似度打分技术说明

视频分割与理解:
视频目标分割与跟踪
FoveaBox:目标检测新纪元,无Anchor时代来临!
移动端70+fps!谷歌新出高效实时视频目标检测
视频检测(Video Detection)资源列表
滑动窗口也能用于实例分割,陈鑫磊、何恺明等人提出图像分割新范式
视频分割在移动端的算法进展综述

深度学习
如何利用深度学习提升视频转码效率与视觉质量?
机器学习在网络拥塞控制中的应用
腾讯优图开源人脸检测算法DSFD,刷新两项数据集纪录
医学影像:MIT 利用学习图像变换进行数据增强
全网最大机器学习数据集,视觉、NLP、音频都在这了
深度学习的图像修复
清华&美图开源大规模视频分析数据集:含11827条视频,共476个小时 | CVPR 19
纯Deep Learning干货 | 快慢网络用于视频识别
机器学习中的编码器-解码器结构哲学
face.evoLVe:高性能人脸识别开源库,内附高能模型

开源库:

  1. ffmpeg
    MPEG中的数据压缩综述
    MPEG系统层回顾
    FFmpeg 编译支持AV1编解码器libaom-av1
    FFmpeg结构与API摘要
    MPEG工作回顾和展望
    MPEG标准概览
  1. webrtc
    BBR在实时音视频领域的应用
    Nodejs+socket.io搭建WebRTC信令服务器
    Google BBR拥塞控制算法背后的数学解释
    Chromium 视频流请求与传递过程分析
    WebRTC的视频解码原理简析
    从通信到AI FreeSWITCH与WebRTC
    WebRTC 之ICE浅谈
    拥塞控制(Congestion Control)算法汇总+ 大牛
    WebRTC Android H264编解码适配
    基于OBS的WebRTC H264编码器
    WebRTC音频降噪使用
    WebRTC代码走读十(视频端到端时延分析)
    Smooth Delivery:如何减少网络拥塞?
    Google WebRtc Android 使用详解
    How Zoom’s web client avoids using WebRTC (DataChannel Update
    Google WebRtc Android 使用详解
  1. opencv
    OpenCV中那些深度学习模块

  2. x264
    X264代码走读二(ABR算法码控)

  3. ZLMediaKit
    ZLMediaKit高并发实现原理

  4. Netty
    Netty解决粘包和拆包问题的四种方案

  5. SRS
    SRS-开源流媒体服务器

音视频质量:
干货来袭丨音视频质量评估绿皮书
衡量视频质量有哪些指标和工具?
EBU超高清视频主观测试结果
以“用户播放行为与体验”为核心的视频服务质量优化
音视频分析工具StreamEye介绍
通过端到端的数据侦测提升QoS
质量三维论如何持续推进腾讯视频播放体验提升
语音质量评价方法-【音频质量专题】
Intel视频处理与分析技术栈和架构纵览

3D/VR/AR/5G:
VRIF最新技术指南
冼牛:5G的低延迟特性将给多媒体应用带来变革
3D目标检测新框架VoteNet,两大数据集刷新最高精度
超高清论坛(UHD Forum)技术指南V2.0
蔡锐涛:CG内容互动与5G的碰撞
三体云周思进:在红海中寻找蓝海
MWC2019最全AR/VR汇总:HoloLens 2来袭,5G云VR火爆
5G Americas白皮书—5G开源现状
AI+AR如何提升花椒直播的体验?

DRM:
如何利用免版税视频流技术构建优质视频体验?

Web:
Web 实时推送技术的总结
通过WebAssembly在移动端解码H.265

业界动态:
思科:2022年视频将占移动通信流量79%

你可能感兴趣的:(2019-05-21)