每周一期,纵览音视频技术领域的干货。
新闻投稿:[email protected]。
从体验出发构建以增长为目标的视频服务体系
增长一直是业务的诉求,和增长相关的因素很多,内容、人群、创意玩法、性能体验等等,本次LiveVideoStackCon 2021 音视频技术大会 北京站 我们邀请到了火山引擎点播技术研发负责人——浩铭老师。本次分享聚焦在字节跳动视频通过性能体验优化促进业务增长的实践。包括在分析方法上的探讨,如何衡量和预估体验优化对业务增长的贡献,以及具体的体验优化实践分享。
互动云渲染——云原生渲染的初步探索
随着游戏及软件云端化运行能力的支持,大型游戏和软件可以在浏览器、轻客户端以及小程序中运行,在扩展了使用场景边界的同时,也为游戏和软件探索云原生实现提供了基础。腾讯云云渲染 PaaS 提供了基于 WebRTC 的万人级互动交互的云原生能力,包括操作权限转移管理、多人语音会话等,在本次LiveVideoStackCon 2021北京站,腾讯云专家工程师 云渲染技术负责人——王超向我们分享了互动新玩法上的技术实现。
基于 SVT-AV1 的高效视频点播应用解决方案
本次演讲介绍了 SVT-AV1 编码器针对 VOD 的高延迟恒定比特率编码(CRF)编码和可变比特率(VBR)编码的最新改进。在对比实验部分,进行了 SVT-AV1 与其他开源编码器的复杂度与压缩性能对比,SVT-AV1 新增的 VBR 模式 与 CRF 模式的性能对比, 以及 SVT-AV1 fast encoding 对比这 3 个对比实验。
视频通信中的码率控制算法
码率控制技术RC(Rate Control)是视频编码中一个非常重要的技术模块。不同的应用场景对视频编码的码率控制有不同的需求,离线编码通常采用可变码率(VBR),实时视频系统通常采用恒定码率(CBR)。本篇技术干货将深度剖析视频编码中的码率控制算法,分析其背后的数学模型及理论,希望能帮助大家更好地理解视频通信中的码率控制算法。
聊聊QUIC协议的发展
QUIC(Quick UDP Internet Connections,快速UDP互联网连接)是一种新的“更快”的通用网络传输协议。相比于TCP和TLS,QUIC提供了许多改进来提升网络传输的性能。随着QUIC协议的标准化,QUIC之上的HTTP/3协议已经被众多浏览器所支持,其中包括Chrome、Microsoft Edge(Chrome内核版本)、Firefox和Safari,除了浏览器,也有不少客户端App也开始支持和使用HTTP/3。本篇文章就和大家一起聊聊QUIC协议的发展历程,和我认为的QUIC未来发展趋势。
腾讯视频云直播推流再升级,支持多路径传输
腾讯云音视频云直播推出的多链路传输方案,通过多个链路层同时传输,提高整体端到端的传输可靠性和质量,进一步提升上行推流和最终的播放端体验。
DirectX 12 发布新功能——视频编解码
如今,DirectX 12 提供 API 以支持多个视频应用程序的 GPU 加速,例如Direct3D 12 视频概述 中详述的视频解码、视频处理和运动估计。我们很高兴地宣布,D3D12 为现有的视频 API 系列添加了新的视频编码功能,并带有一组新的接口,允许开发人员使用 GPU 加速视频引擎执行视频编码。此功能为应用程序提供了一种新的方式来实现符合 DirectX 12 原则和风格的视频编码。
https://devblogs.microsoft.com/directx/announcing-new-directx-12-feature-video-encoding/
Spin Digital发布新SDK,支持多功能视频编码(VVC)和增强型HEVC直播
Spin Digital 宣布推出新版本的 Media SDK ( Spin SDK v4.0 )。此版本包括新功能和增强功能,例如超高分辨率视频的 VVC/H.266 解码,包括 8K、实时应用程序的 HEVC 播放、未压缩播放、自定义分辨率的 SDI 捕获、HEVC 实时编码器的质量优化和完整的支持日本 8K 广播标准 (ARIB STD-B32)。Spin SDK 包含一组用于视频和音频捕获、编码、流媒体、处理和播放的优化库,有助于创建广播、沉浸式媒体和大屏幕可视化领域的尖端媒体应用程序。
https://spin-digital.com/announcements/spin-sdk-v4-0/
视频超分技术实践与应用
视频超分是通过深度学习技术,针对视频画面和场景进行分析,结合视频降噪、去模糊、锐化、去抖动等画质增强等处理,为视频场景带来更好的画质观看体验,同时有效的降低视频的制作和传输成本。基于在视频编解码技术、算法、汇编优化等方面的技术积累,京东云视频云近期正式推出移动端超分SDK产品,包括Android和IOS等主流端,并实际应用在京东商城APP中,经过长期数据迭代和数据监测的验证,开启超分后用户平均播放时长提升80%,同时流量带宽成本降低30%,有效提升了用户体验和GMV转化。
流媒体播放的数学原理
当我们抛开繁杂的业务代码,从纯数学的角度去理解流媒体传输\播放的过程,会有全新的体会。首先,无论是传统的渐进式下载(progressive download)还是现在流行的自适应传输(adaptive streaming),我们认为二者都是基于块(chunk)的下载模式。
微信图片翻译技术优化之路
微信(WeChat)作为 12 亿+用户交流的平台,覆盖全球各个地区、不同语言的用户,而微信翻译作为桥梁为用户间的跨语言信息交流提供了便利。目前微信翻译每天为千万用户提供数亿次的翻译服务,且团队技术持续钻研,累计发表数十篇顶会论文、夺得多项 WMT 冠军。随着翻译质量的提升,微信翻译的应用形态从文本逐步扩展到图片、语音、网页、文档、视频等众多场景。本文以微信图片翻译为例介绍近一年的技术优化。
视觉摄像头vs激光雷达,高阶自动驾驶的路线将倾向哪边?
本文希望从技术角度客观分析和回答以下问题:自动驾驶等级提升需要解决什么关键问题?怎样的自动驾驶方案更加具有实现大规模无人驾驶的可能性?自动驾驶作为现实世界的AI问题,难点在哪里?以上问题促使我们理性客观地思考该如何去实现自动驾驶——这一承载了太多期望、不断挑拨大众神经的技术生产力变革,从而推动行业冷静且务实地向前发展。
阅读推荐
什么是CDN?
CDN(Content Delivery Networks,内容分发网络)是分布在世界各地的服务器,它们是视频直播和点播中至关重要的基础设施。CDN位于视频播放器和源服务器之间,负责跨地理区域分发视频内容,并有效保障客户端流畅的观看体验。在本文中,我们将学习CDN是如何工作的,如果不使用CDN会发生什么,并了解什么是Cache-Hit和Cache-Miss。让我们开始吧!
活动推荐
【城市沙龙】LiveVideoStack Meet | 南京:
互联网沙漠的音视频发展
2021年LiveVideoStack Meet已成功在北京、苏州、杭州、成都、西安、合肥与上海落地。这一路我们分享对于行业内卷的看法,探讨技术发展方向,也了解到更多二线城市的音视频环境。2022年第一站,将于1月8日在南京与大家见面,本次分享内容涵盖人工智能、实时音视频、直播全链路监控、云游戏实践等多方面,快来现场与嘉宾面对面交流吧。
活动时间:2022.01.08 14:00-16:00
活动地点:南京市雨花台区凤信路6号 南京金证科技园3栋1楼路演厅
报名地址:
https://8392623630544.huodongxing.com/event/5628086056100
即刻了解:
https://campaign.tencent.com/audiovideo/?c=30Kjpxdi
插图源自Pexels