LiveVideoStack_

百度视频质量评测的实践之路

视频编解码技术日新月异，新的编解码技术赋予视频业务新的应用场景和新的用户视听体验。同时，视频作为带宽消耗大户，如何在视听体验和视频带宽之间取得最优的平衡是一个永恒的话题。视频质量评测主要用来回答：体验是否改善、带宽是否合理等问题。

然而，在实际中，受限于各种因素，视频质量评测在实践中存在着诸多问题：主观评估的置信度如何保证？如何进行规模化的主观评估？LiveVideoStackCon 2022北京站邀请来自百度的王伟老师为大家介绍百度视频质量评测的发展之路。

文/王伟

编辑/LiveVideoStack

大家好，我是来自百度的王伟，近几年我一直在开展视频质量评估方面的工作，并经历了百度视频质量评估从无到有，从不置信到置信，从小规模到大规模的整个过程。

目前来看，我们的视频质量评测服务为百度内部所有视频相关业务提供了基础支撑，2022年整体视频评估量级达到了十几万以上。回顾整个发展历程，我们遇到了很多问题，也进行了很多探索。今天很高兴可以与大家分享我们对视频评估的认知与实践。

整体会从四个方面进行介绍，首先介绍视频质量评估的重要性，其次是面临的问题和挑战，接下来介绍面对问题我们的解决方案，最后会介绍在百度业务线的实践情况。

-01-

视频质量评测的重要性

判断一件事的重要性，确定它是否值得去做，我总结了两点，首先是确认该事物的流行度和趋势。

针对视频质量评估，我整理了两项数据，一是谷歌搜索近二十年来关于视频质量关键词的搜索趋势。整体来看，从2022年至今搜索热度持续走高，未来也可能持续受到重视。二是LiveVideoStackCon自2017年至今关于视频质量评测的议题也呈逐年上升趋势。从趋势和流行度角度分析，视频质量评测已成为一项比较重要的工作。

其次是分析视频质量评测工作在视频业务中的地位。视频质量评测体系是画质增强、编解码器优化和QoE工作的基石，可以说它是视频行业这片红海中的一块蓝岛，值得我们进行研究。对于TO B厂商，视频质量评测工作更是大有可为，拥有成熟的视频质量评测体系可以协助对各类增强算法和HDR等技术的优劣进行判断。相信该项工作后续在行业内会越加重要。

-02-

面临的问题和挑战

接下来介绍在视频质量评测工作中我们面临的问题和挑战。具体将从四个角度来分析，首先介绍视频质量评测体系，其次是传统算法在实践中遇到的问题，第三是主观评测在实践中存在的问题，最后是业务所面临的问题。

大家对视频质量评测体系中的主观评测和客观评测比较了解，工程师出身的从业者可能会更重视算法，轻视主客观评测。

但实际上，经过实践分析发现，主观评测是视频质量评测体系中不可或缺的重要组成部分，例如在HDR/SDR评估场景下，视频质量和设备以及屏幕亮度等因素都有直接关系，难以仅从算法角度来衡量。另外如果涉及编解码器采购，无论销售方提供的算法跑分有多高，我们依然无法轻易信任，视频质量的好坏最终还是要通过主观评估的方式来判断。

检测&分析是我们结合实践在体系中加入的环节，因为很多编解码器不仅针对CODEC，也可能会对帧序列等方面进行优化。例如，在某次CODEC上线后，我们发现虽然视频画质得到了提升，但因为视频帧的间隔序列被调整，导致视频卡顿率暴增。所以，我们在主客观评测的基础上额外增加了检测&分析环节，形成了目前的视频质量评测体系。

接下来介绍传统算法在实践中遇到的问题。我们认为传统算法是一把双刃剑，使用不当会导致各种错误结论。以PSNR为例，由于它是在信号级别进行计算，并且是在整帧的范围内计算折损，导致它和主观感知的差异非常大。

从上图右侧的图像中可以发现，B视频中天空和云朵的位置发生了较大折损，但它的PSNR值达到了38，对应的MOS分几乎到4，评价结果反而不错，这明显不符合人眼的主观感知。

其次，如果两个视频的PSNR值一致，该如何处理？针对4K等高清晰度视频，在全局空间上计算PSNR值很可能会出现两个视频结果一致的情况。上图中左侧的图像，两个视频的PSNR值都为42，仅依据PSNR的结果难以判断哪个视频质量更优。

SSIM存在什么问题呢？SSIM解决了区块的问题，并且引入了亮度、对比度和结构信息，它总体要优于PSNR。但在实际使用过程中，我们发现了两个问题，一是SSIM的实现版本有多个，版本不同可能导致结果不同，在使用前必须要注意确定好版本。

第二是FFmpeg的SSIM滤镜存在BUG，我们对滤镜算法进行了逆向分析，对照公式审核代码实现，可以发现代码在亮度因素的计算上存在问题。上图右侧为对比结果，其中绿线为正常结果，红线为少乘64后的结果，虽然对整体结果没有太大影响，但还是要加以注意。

VMAF的情况更加复杂，整体计算过程如上所示。首先，业务视频类型和模型训练数据存在较大差异，VMAF的默认模型是基于Netflix的HDTV数据训练而来，这和我们目前的UGC场景不符，这会导致视频质量打分和主观评测结果差异较大。我们使用该标准模型在自己的数据集上进行了试验，打分一致性仅有60%，需要引起大家重视。

第二个问题是目前消费场景以手机居多，而VMAF的手机侧打分是利用二次函数来拟合HDTV的结果，这点也要特别注意。

最后是传统算法在增强场景中的问题，在增强场景下很多传统算法会失效。以上图为例，我们将左侧图中的视频对比度提升一倍，并观察各种质量指标，结果如右图。从VIF数值上可以看出视频质量得到了增强，虽然PSNR和SSIM数值都较差，但并不代表视频质量差。VMAF数值虽然达到100，但与MOS分中5代表的含义是不同的，以上问题也要引起重视。

接下来介绍主观评测在实践中存在的问题，目前的主流方法是基于ITU-R BT.500的图像质量评价方法，但该方法存在成本高、评测效率低、不符合移动端体验等问题。

因此我们设计了一种网页版评测方法，但在使用过程中也存在较多问题，例如浏览器的观看体验和移动端体验之间也存在差异，上图分别为浏览器以及手机端的视频截图，可以发现图中蓝色的偏差较大。第二个问题是无法随时随地评测；第三是网页版无法对HDR和端超分等场景进行评测。最后是关于BT.500置信度筛选算法的问题，由于它的置信度是基于统计意义的置信度，针对部分特殊不具备统计意义的非随机场景会出现异常，假如针对一批质量较差的视频进行评测，算法会忽略用户打分的置信度。

综上，在业务发展初期，百度的视频质量评测面临如下问题：

首先是评不准，其次是针对HDR等场景评不了，最终导致评不快。

-03-

解决问题的实践之路

基于刚才提到的问题，接下来介绍我们解决问题的实践之路。具体将分为四部分，首先是工具优化，其次是工具整合，接下来是评测体系服务化，引入更多人参与，最后介绍当前的效果。

首先看工具优化，刚才提到了算法工具的正确使用是评测工作的关键，在优化算法和优化结果可分析两种思路中，我们最终采用了优化结果可分析的方案。

在优化过程中，我们尽可能将其嵌入到FFmpeg滤镜中，无法嵌入的则构建单独工具包，整体算子见上图，后面会详细进行介绍。

PSNR可视化解决了两个视频PSNR一致时如何选择的问题。我们采取了PSNR分块单独计算的优化方式。由于这将导致PSNR数据较多不好分析，于是将分块后的PSNR值进行灰度分级，把PSNR值所在的0～60这一区间映射为8位灰度图，并以视频的形式呈现出来，效果如上图所示，可以看到PSNR在每个像素点上的折损。

关于视觉信息，刚才提到PSNR值低不代表视频效果不好，于是我们另行关注了如HSL、对比度、色彩度、纹理度等指标。HSL中色调、饱和度这个点比较有意思，当时我们和UE开展项目合作，UE希望寻找一些badcase来分析色调、饱和度对画质的影响，我们提交了使用FFmpeg滤镜计算的结果后，UE反馈结果有误。

经过逆向分析发现，FFmpeg滤镜的色调、饱和度是在YUV的基础上计算，和真实的HSL空间计算差距相当大。

我们研究并重写了计算色调、饱和度的算法，上图为实际效果。对于上图中的色值，使用signalstats滤镜计算，它的色调和饱和度分别是130和77，实际上使用ColorSlurp工具计算，它的色调为30，饱和度为95%。使用我们的visualstats滤镜，可以看到结果和ColorSlurp工具的结果基本一致。

关于对比度的计算，目前相关算法很多，我们借鉴了SSIM算法中的对比度评估方案，采用像素邻域内的标准差进行对比度估计，于是我们通过计算4x4局部空间的标准差并将其作为图像对比度，最终效果不错。

关于纹理计算我们设计了两种方式，第一种是使用颜色直方图的方法，这与Matlab的方法一致，第二种是先进行Sobel滤波，滤波后进行双阈值过滤，然后计算非黑像素占比。两种方案的计算结果差距并不大，所以建议使用更加简单的直方图计算方法。

对于色彩丰富度，即判断画面色彩的艳丽和丰富程度。我们采用了上图中论文的思路来进行计算，它的思想是先将色彩空间转为RGB，而后采用图中的公式来计算画面丰富度。

我们将以上指标的算法全部集成到FFmpeg滤镜中，采用之前提升一倍对比度的视频来计算各类指标，可以看到：对比度的计算结果符合实际情况，对比度提升带来的其他指标变化也基本符合人眼感知。

接下来介绍主观评测工具的优化过程。基于百度强大的视频技术基建，我们自研了支持多端的主观质量评测APP，我们称其为灵镜（度知了）。通过将视频评测移动化，做到更符合用户消费场景，并且随时随地都可评。该工具的能力可以从几个方面来简单介绍，首先是支持PC、iOS和Android三大主要平台的评测设备，其次是支持全部的评测方法和评测方式，最后是支持SDR/HDR、端超分等各种媒体形态。

灵镜APP的实机效果如上，其中左侧为单帧模式效果，从事编解码器优化的同仁可能会比较关注。中间为较常用的普通全屏模式，为了加强对比我们还设计了支持拖拽的横版同屏全屏模式。针对小视频，我们设计了右侧的竖版同屏全屏模式，同时支持对视频从不同维度进行专业化打分。灵镜已经正式上线，大家可以搜索“度知了”下载来体验其他功能。

上面主要介绍了主观评估工具方面的问题，接下来是关于流程的问题。我们发现：在评估过程中人们存在惯性意识，评估者对评估序列中前面视频的打分会影响到对后续视频的质量判断，导致评测结果不准。

针对这个问题，我们调整了评测流程中的用户交互，首先是将评测方式转变为双盲评估，把视频顺序随机交换，混淆评测者对评测顺序的印象。其次是自建控制视频库，通过将控制视频随机插入到评测任务中来控制用户置信度。第三是进行打分信息上报，包括机型、屏幕亮度、全屏方式、打分时间等。

整体流程如上图所示，需要评测的视频在整合控制视频后形成测评任务，任务通过PC、iOS和Android端分发给评测者进行打分，完成置信筛选后，形成最终的视频MOS分。右下角为一个评测结果实例，是多位评测者对一个视频的打分情况，可以通过分析各类信息来综合判断打分置信度。

在算法工具和评估流程完善后，我们迎来了大量的视频评测需求。按照原流程，每次评测均需手工拆分任务列表，按需创建评测任务并分发，最终手工合并任务结果，该流程无法满足大量评测需求。

于是我们考虑对算法工具进行平台化整合，将评测过程划分为多个不同的评测场景（它的作用类似于模板），并将场景具体拆分为任务类型、调度算子和结果分析三部分。具体结构如中间图所示，针对不同的任务类型由调度器来调度该类型下所有的算子，最后对应不同的结果聚合和解读方式，该方法极大提高了工作效率。

从整体架构上看，我们利用评测场景这一概念将优化后的客观算法和主观评估工具进行整合，在服务化的基础上对下层能力进行调度，最终达成任务自动拆分和结果智能分析的效果，运用该方式可以实现处理大量视频评测的需求。

整合后的视频评测流程如上所示，在接收评测需求后，首先选择合适的评测场景，然后由调度器调度相应的主观评估、SITI、客观算子、分析算子等进行计算，其中客观算子部署在百度内部的FaaS平台上并通过API接口暴露出来，主观评测通过内部工具或通知等方式进行用户招募，而后完成用户打分。同时另有调度算子实时检测各算子的工作进度，待全部计算结束后调动分析算子形成最终的测试报告。

接下来举一个应用实例，上图中左侧为平时使用的一个评测场景，在选择对应的视频比例并上传视频后即可等待视频评测结果。结果如右图所示，它会按照百度的内部要求显示各类结论，例如右图中的主观分析结果显示了两个编解码器的GSB分布，正向（good）32%代表A编码器32%的视频质量优于B编码器，持平（same）代表A 66%的视频质量和B基本一致，负向（bad）为2%，由此可知A的此次优化是成功的，可以尽快上线。

除了解析结果外，评测结果还会提供很多可供分析的质量指标，包括码率分布和该场景对应所有算子的计算结果，以主观为主，客观为辅的机制协助业务侧进行分析。

随着算法工具优化和平台化整合完成，百度的视频质量主观评测任务量从22年开始飞速增长，于是评测人员数量成为了制约的主要瓶颈。

为了满足评测需求，我们计划从外部引入更多的评测人员，主要有三点理由。首先评测平台有完善的置信判断能力，其次公司内部用户的参与度和置信度有保障，第三是视觉和听觉是人类与生俱来的能力，大众对视频质量的好坏有天生的判断能力，这与需要后天养成的艺术鉴赏力不同。

因此我们构筑了组成评测人员的三级火箭模式，第一级由度知了团队内部人员组成，可以消化少量评测需求。如果评测量较大，达到300～500条/天，会以公司系统内部人员解决。如果任务量超过1000条/天，则采用外聘众包团队的方式解决。成本方面，在公司系统内由7人评测单条视频，其成本为0.2元。外聘方式成本较高，单条视频成本在1～2元左右。

在实践过程中，我们发现单条视频评测人数和对应的评测结果准确性也有关联，人数越多，评测结果和专业结论越一致，根据我们的实践，建议人数为17到19人，以上方法在实际工作中可以综合考虑成本、工期和质量等方面因素来运用。

以上是百度视频评测体系当前的运行效果，它目前支持80种以上的评测场景，内部评测效率可达到500条/天，如果使用外聘人员效率会更高，置信度达到了90%。

以上是视频评测体系服务化后承担的评测任务量趋势图，可以看到整体数量呈指数级增长。

-04-

灵镜（度知了）的业务实践

接下来介绍灵镜（度知了）的业务实践。主要分三部分，第一是灵镜（度知了）的运营模式实践，第二是云转码阶段的实践，最终是用户播放阶段的实践。

相较于前面提到的视频评测体系，我们在运营阶段整合了众测用户运营，形成了度知了的服务体系，该体系对外仅有一个接口，用户付费，平台反馈视频评测结果。

该模式被运用在百度视频业务的三个阶段中。第一是云转码，在编码阶段，目前百度所有编解码器的引入均由度知了判断准入标准，如昆仑芯、BD265、超分算法和第三方编解码等等。其次是审核阶段，度知了主要负责向策略提供模型训练的标注数据。第三是用户播放阶段，主要负责提供一些播放/转码优化策略。

它整体上的技术价值为，将视频质量评测的算法、工具、人员整合为适用于多场景、高效、置信的视频质量评估服务。业务价值即有效控制成本，让业务线的每一分钱都花得值。

接下来介绍度知了在云转码阶段的业务实践，首先以刚才提到的两个PSNR相近的视频优化结果为例，右图为运用优化算法得出的PSNR可视化分析图。可以发现，A编码器在边缘上折损比较大，B编码的稳定性较好，可视化分析给出了更直观的结论。

在转码过程中我们发现，图片在颜色空间转换后亮度和对比度发生了很大变化，PSNR的可视化效果也较差。在进行编解码时可以将优化算法的计算结果作为依据来对原图进行调优，使优化后的视频质量转好。

在用户播放阶段，我们利用度知了的视频质量评测体系对视频源进行特征分析，选择合适的转码策略，协助针对相应策略进行AB实验。

这种思路可以提升AB实验效率，例如：为了在保证用户观看体验的同时，合理控制视频的音频码率和需要画质增强的视频数量，节约公司成本。通过前置引入度知了视频评测体系，协助业务线开展小规模实验，可以为策略制定和AB实验策略提供有效决策支持。

百度现行的AB实验流程如上所示，首先进行团队内部策略验证，之后进行公司内部的主观众测评估，将样本扩大，最后将样本推至线上进行AB实验，整个流程所需的时间较短，一个编解码器的实验目前可在10日左右完成，其中新编码的评估时间仅需1天。百度的视频评测已经彻底逆转了从前“评不快、评不准、评不了”的历史形势。

这就是我今天的分享，谢谢大家！

▲扫描图中二维码或点击“阅读原文” ▲

查看更多LiveVideoStackCon 2023上海站精彩话题

WebRTC：构建实时通信应用的利器 Hello-ZHE webrtc
都已无处不在。而WebRTC（WebReal-TimeCommunication）则为开发者提供了一种简便的方式，来在浏览器中实现实时的音视频通信和数据传输。本文将介绍WebRTC的基本概念、工作原理，以及如何利用WebRTC构建实时通信应用。什么是WebRTC？WebRTC（WebReal-TimeCommunication）是一种开放的网络技术标准，它允许浏览器与浏览器之间进行实时音视频通话、
深入浅出 WebRTC 通信原理：从点对点到多人会议的全方位解析 ADFVBM webrtc
随着远程办公和在线协作的普及，音视频通信的需求日益增长。无论是两点之间的通信还是多人会议，WebRTC（WebReal-TimeCommunication）作为一种开源技术，提供了低延迟的实时通信能力。它允许浏览器或移动设备通过直接的点对点（P2P）连接进行音频、视频和数据的实时传输。它使得不依赖中间服务器的实时通信成为可能，尤其适用于视频聊天、文件共享、音频会议等场景。在本文中，我们将深入介绍从
抖音视频数据获取实战：从API调用到热门内容挖掘爱搞技术的猫猫 API 音视频
在短视频流量为王的时代，掌握抖音热门视频数据已成为内容运营、竞品分析及营销决策的关键。本文将手把手教你通过抖音开放平台API获取视频详情数据，并提供完整的代码实现及商业化应用思路。一、抖音API权限申请与核心接口抖音API需企业资质认证，个人开发者权限受限。以下是接入流程：企业开发者认证•登录开放平台，选择注册，提交信息等材料。•完成认证后，创建应用（如“视频数据分析工具”），获取ClientKe
C++基础系列【26】排序和查找算法程序喵大人 C++基础系列 c语言算法开发语言 c++
博主介绍：程序喵大人35-资深C/C++/Rust/Android/iOS客户端开发10年大厂工作经验嵌入式/人工智能/自动驾驶/音视频/游戏开发入门级选手《C++20高级编程》《C++23高级编程》等多本书籍著译者更多原创精品文章，首发gzh，见文末记得订阅专栏，以防走丢C++基础系列专栏C语言基础系列专栏C++大佬养成攻略专栏C++训练营排序与查找算法的重要性不用过多介绍了吧，面试也经常考察。
211 本硕研三，已拿 C++ 桌面应用研发 offer，计划转音视频或嵌入式如何规划学习路线？程序员yt c++音视频学习
今天给大家分享的是一位粉丝的提问，211本硕研三，已拿C++桌面应用研发offer，计划转音视频或嵌入式如何规划学习路线？接下来把粉丝的具体提问和我的回复分享给大家，希望也能给一些类似情况的小伙伴一些启发和帮助。同学提问：前辈您好，我是211本硕，目前研三，秋招拿到C++桌面应用研发的offer，但计划的这个岗位最多干3-4年左右，后续企业规划上想往音视频开发或嵌入式上转；个人感觉C++八股，算法
RTSP协议规范与SmartMediaKit播放器技术解析音视频牛哥 RTSP播放器轻量级RTSP服务大牛直播SDK 音视频机器视觉人工智能 rtsp播放器 python rtsp播放器 rtsp player 大牛直播SDK
在实时流媒体传输领域，RTSP（Real-TimeStreamingProtocol）协议作为标准规范，为音视频数据的高效传输提供了坚实基础。而大牛直播SDK的rtsp播放器，则是在此基础上构建的高性能解决方案，广泛应用于多种场景，如安防监控、远程教学、直播互动等。本文将深入探讨RTSP协议规范，并结合大牛直播SDK的rtsp播放器，剖析其技术细节与优势。RTSP协议规范概述RTSP协议是一种用于
使用Python下载抖音短视频：完整教程与代码解析 cnh6070 短视频 python 音视频开发语言
抖音作为全球领先的短视频平台，拥有海量的优质内容。然而，抖音官方并未提供直接下载视频的功能，这给一些用户带来了不便。幸运的是，通过Python编程，我们可以实现抖音视频的下载。本文将详细介绍如何使用Python下载抖音短视频，并解析一个完整的代码示例。一、准备工作在开始之前，你需要确保已经安装了Python环境，并且安装了以下必要的Python库：requests：用于发送网络请求，获取网页内容或
Qt 多线程设计：死循环与信号槽的权衡吃面不喝汤66 qt 开发语言
在开发音视频播放器时，多线程设计是不可避免的挑战。音频和视频的解码、播放需要高效运行，同时还要与主线程或其他线程同步，例如通过信号通知播放进度。本文基于一个实际案例，分析了两种线程设计在死循环和信号槽使用中的表现，探讨其原因，并给出选择建议。问题表现我在实现音频播放线程时，遇到了一个问题：主线程通过QMetaObject::invokeMethod调用terminateDecode无法终止音频线程
ffmpeg+ubuntu16.04编译ffmpeg库小gpt& QT+FFMPEG实战 ffmpeg linux
个人使用环境：ubuntudesktop16.04+ffmpeg4.2.1以下的库进行完整编译ffmpeg介绍FFmpeg是一个开源的多媒体框架，广泛用于处理音频、视频、字幕等多媒体数据。它包含了丰富的工具和库，能够进行音视频的编解码、转码、流媒体处理、滤镜应用等操作。FFmpeg是许多多媒体应用程序和工具的核心引擎，功能强大且灵活，支持几乎所有常见的音视频格式。FFmpeg的主要组成部分ffmp
从零实现B站视频下载器：Python自动化实战教程木觞清 #编程语言自动化运维
一、项目背景与实现原理1.1B站视频分发机制Bilibili的视频采用音视频分离技术，通过以下方式提升用户体验：动态码率适配（1080P/4K/HDR）分段加载技术（基于M4S格式）内容保护机制（防盗链/签名验证）1.2技术实现路线graphTDA[模拟浏览器请求]-->B[获取加密播放信息]B-->C[解析音视频地址]C-->D[多线程下载]D-->E[FFmpeg合并]二、代码逐层解析2.1请
实现音视频播放功能鸿蒙示例代码
本文原创发布在华为开发者社区。介绍本示例基于Avplayer构建了一个音视频播放器，包括音视频的播放、暂停、全屏播放、倍速播放、快进等基本操作。实现音视频播放功能源码链接效果预览使用说明打开应用，展示视频播放器，选择不同按钮进行不同操作。切换音频，展示音频播放器，选择不同按钮进行不同操作。实现思路AVPlayer播放主流程播放的全流程包含：创建AVPlayer，设置播放资源，设置播放参数（音量/倍
WebRTC、WebSocket、EasyRTC嵌入式音视频SDK：技术差异与应用场景详细对比 EasyCVR RTC webrtc websocket 音视频 javascript 网络开发语言
WebRTC和WebSocket是两种常用于实时通信的技术，尽管它们都支持实时数据传输，但在设计目标、技术实现和应用场景上存在显著差异。一、概述1）WebRTCWebRTC是一个开源项目，旨在通过简单的API实现浏览器之间的实时音视频通信和数据传输。它支持点对点（P2P）通信，主要应用于音视频通话、屏幕共享、文件传输等场景。2）WebSocketWebSocket是一种基于TCP的通信协议，提供了
实现音视频录制功能鸿蒙示例代码
本文原创发布在华为开发者社区。介绍本示例基于AVRecorder实现音视频录制，包括开始录制、暂停、结束、上一个等几乎所有录制音视频的基本操作。实现音视频录制功能源码链接效果预览使用说明打开应用，展示视频录制和音频录制两个按钮。点击视频录制即可录制视频，并会保存视频。点击音频录制按钮即可开始录制音频，并会保留音频文件，点击文件可以进行播放。实现思路构建音频录制页面构造setAudioRecorde
实现音视频录制功能鸿蒙示例代码
本文原创发布在华为开发者社区。介绍本示例基于AVRecorder实现音视频录制，包括开始录制、暂停、结束、上一个等几乎所有录制音视频的基本操作。实现音视频录制功能源码链接效果预览使用说明打开应用，展示视频录制和音频录制两个按钮。点击视频录制即可录制视频，并会保存视频。点击音频录制按钮即可开始录制音频，并会保留音频文件，点击文件可以进行播放。实现思路构建音频录制页面构造setAudioRecorde
WebRTC 介绍 KillFuckBugs webrtc
WebRTC简介WebRTC（WebRealTimeCommunication，网页实时通信）是一个开源项目和技术标准，旨在为浏览器和应用程序提供实时通信功能，无需额外的插件或第三方软件。它最初由Google在2011年发起，现由W3C（万维网联盟）和IETF（互联网工程任务组）共同维护和标准化。WebRTC的核心目标是实现低延迟、高质量的音视频通信以及点对点数据传输，广泛应用于视频会议、实时聊天
从 0 到 1 掌握鸿蒙 AudioRenderer 音频渲染：我的自学笔记与踩坑实录（API 14）李游Leo harmonyos-next harmonyos 鸿蒙音视频笔记
最近我在研究HarmonyOS音频开发。在音视频领域，鸿蒙的AudioKit框架提供了AVPlayer和AudioRenderer两种方案。AVPlayer适合快速实现播放功能，而AudioRenderer允许更底层的音频处理，适合定制化需求。本文将以一个开发者的自学视角，详细记录使用AudioRenderer开发音频播放功能的完整过程，包含代码实现、状态管理、最佳实践及踩坑总结。一、环境准备与核
HarmonyNext实战：基于ArkTS的高性能实时音视频通信系统开发 harmonyos-next
HarmonyNext实战：基于ArkTS的高性能实时音视频通信系统开发引言在HarmonyNext生态系统中，实时音视频通信是一个复杂且关键的技术领域，广泛应用于视频会议、在线教育、远程医疗等场景。本文将深入探讨如何基于ArkTS设计和实现一个高性能实时音视频通信系统，适配HarmonyNext，并满足实际工程中的低延迟、高清晰度和高可靠性需求。本文面向有一定开发经验的读者，假设您已经熟悉Har
Bluetooth Profile Specification之（AVRCP篇）5.0 AVRCP简介心跳包蓝牙篇之蓝牙协议规范蓝牙
蓝牙篇之BluetoothProfileSpecification深入详解汇总目录1.什么是AVRCP？2.协议栈模型关注文末微信公众号，回复【蓝牙规范】，即可获取AVRCP英文版协议。1.什么是AVRCP？字面意思音频/视频远程控制协议。AVRCP定义的命令和信息是通过AVCTP通过传输出去的。AVRCP协议不处理音视频流，支持这个协议的设备可以通过A2DP来分发流媒体数据。1.5版本到1.6版
音视频缓存数学模型锋风Fengfeng 安卓Android应用开发相关音视频缓存
2024年8月的笔记音视频缓存数学模型-Wesley’sBlog播放器作为消费者，缓存作为生产者。进入缓冲一次设消费者速率为v1，生产者为v2，视频长度为l，x为生产者至少距离消费者多远才能保证在播完视频前两者重合。实际上就是一个追及问题。v1t=v2t+x，即l=v2*l/v1+x，因为播放器速度是1，继续简化得x=l(1-v2)如果v2大于1，即满足消费者需求时，可以流畅播放。设l是一部45分
Agora-Uniapp-SDK 使用指南章瑗笛
Agora-Uniapp-SDK使用指南Agora-Uniapp-SDK项目地址:https://gitcode.com/gh_mirrors/ag/Agora-Uniapp-SDK1.项目目录结构及介绍Agora-Uniapp-SDK是一个基于Uni-app与AgoraAndroid和iOS视频SDK实现的集成库，它专门设计用于简化在uni-app项目中集成Agora音视频功能的过程。以下是其主
GDPU unity游戏开发一天速成孑么 #三维游戏开发 unity 游戏引擎 c#动画图形渲染技术美术游戏程序
目录复习提纲拿住一．游戏引擎入门二．引擎基础知识三．界面交互设计四．物理引擎五．光照材质地形系统六．音视频动画特效系统七．寻路系统小题简答题名词解释程序填空“我游戏都玩不明白，还让我做游戏o(≧口≦)o”还在为课程烦恼嘛，本文重点在于，一学期摸鱼必过指南。复习提纲拿住注：该栏目转载请写明出处。温馨提示：代码题gameObject类跟transform类是内置的，其它实例调用均需初始化操作。然后一定
WebRTC中音视频服务质量QoS之RTT衡量网络往返时延的加权平均RTT计算机制‌详解 chen_song_ WebRTC源码探秘 webrtc 音视频网络
WebRTC中音视频服务质量QoS之RTT衡量网络往返时延加权平均RTT计算机制‌的详解WebRTC中音视频服务质量QoS之RTT衡量网络往返时延加权平均RTT计算机制‌的详解WebRTC中音视频服务质量QoS之RTT衡量网络往返时延加权平均RTT计算机制‌的详解前言一、RTT网络往返时延的原理‌1、基于发送端（SR/RR模式）①.‌基本定义‌②.‌计算RTT网络往返时延的原理‌③发送Sender
【音视频】ffmpeg中AVpacket解析NALU总结 gma999 音视频 ffmpeg
概述项目中涉及到一些向国标平台推送视频流的逻辑，因之前没有接触过该方面的知识，所以开始走了很多错误的路线，本文主要总结H265视频中解析出NALU方法代码实现输出[tcp@0x55842b7e60]Nodefaultwhitelistset[tcp@0x55842b7e60]Originallistofaddresses:[tcp@0x55842b7e60]Address192.168.1.181
HarmonyNext实战：基于ArkTS的高性能实时音视频通信应用开发 harmonyos-next
HarmonyNext实战：基于ArkTS的高性能实时音视频通信应用开发引言在HarmonyNext生态系统中，实时音视频通信是一个极具挑战性和实用价值的领域。本文将深入探讨如何利用ArkTS语言开发一个高性能的实时音视频通信应用，涵盖从基础概念到高级优化的完整流程。我们将通过一个实际的案例——实时视频会议应用，来展示如何在HarmonyNext平台上实现高效的音视频通信。1.项目概述1.1目标开
音视频入门基础：RTP专题（18）——FFmpeg源码中，获取RTP的音频信息的实现（上）崔杰城音视频技术 FFmpeg源码分析音视频 ffmpeg
由于本文篇幅较长，分为上、下两篇。一、引言通过FFmpeg命令可以获取到SDP描述的RTP流的的音频压缩编码格式、音频压缩编码格式的profile、音频采样率、通道数信息：ffmpeg-protocol_whitelist"file,rtp,udp"-iXXX.sdp而由《音视频入门基础：RTP专题（17）——音频的SDP媒体描述》可以知道，SDP协议中，a=rtpmap属性和a=fmtp属性中的
HarmonyNext实战：基于ArkTS的高性能音视频处理应用开发 harmonyos-next
HarmonyNext实战：基于ArkTS的高性能音视频处理应用开发引言在音视频处理领域，实时性和性能是关键。随着HarmonyNext生态系统的不断发展，开发者可以利用ArkTS语言构建高性能的音视频处理应用。本文将深入探讨如何利用ArkTS开发一个音视频处理应用，重点介绍音频处理、视频编解码以及实时流媒体传输的实现。我们将从理论基础出发，逐步构建一个完整的应用，并通过优化技巧提升性能。1.音视
Qt+ffmpeg环境搭建技术不支持 qt ffmpeg 开发语言
Qt+ffmpeg环境搭建各平台常见视频开发库举例:iOS：AVFoundationAudioUnitAndroid：MediaPlayer，MediaCodecWindows：DirectShowLinux：GStreamerFFmpeg库是一个跨平台的视频开发库,还有libVLC也是一个跨平台的视频开发库掌握了其中一个库,也能很快上手其它库,因为音视频解码的原理类似引入FFmpeg库有两种方式
阿里云国际站代理商：怎样量化虚拟世界的QoE体验指标？ linglideman 阿里云
1.沉浸体验质量（QImE）沉浸体验质量主要衡量虚拟世界中视觉和听觉的沉浸感，包括以下几个关键指标：视频质量（QP）：考虑视频的平均码率（Brv）、帧率（FR）、分辨率（Rh、Rv）、视场角（FoVh）以及编码标准（Codecv）等因素。音频质量（QA）：涉及音频的平均码率（Bra）、声道数（NAC）、采样率（Sra）和编码标准（Codeca）。音视频同步时延（Tasyn）：衡量音视频的同步性，影
三分钟掌握音视频信息查询 | 在 Rust 中优雅地集成 FFmpeg Yeauty 音视频 rust ffmpeg
前言在音视频处理领域，开发者常常需要获取媒体文件的详细信息，如时长、格式、元数据，以及音视频流的编码参数等。这些信息对于媒体管理、转码调度、播放控制等场景至关重要。然而，直接使用FFmpeg命令行工具或其原生API存在以下挑战：命令行工具的复杂性：FFmpeg的命令行参数众多且复杂，使用不当可能导致错误。例如，处理包含空格的文件名时，需要特别注意正确的转义和引用方式，否则可能导致无法识别文件名的问
809政府平台H5无插件播放1078URL 毛三仙视频播放 vue.js
809政府平台视频播放器接入指南背景政府平台播放JT/T1078-20166.2音视频流URL大都是通过Flex开发一个播放器完成，但Flash支持已经被大多数浏览器移除或阻止，需要一个新的方案来解决播放问题。我们开发了一个播放器，引用一个js即可简单实现H5无插件播放此URL，最少仅需3行代码。控件地址https://lib.cvtsp.com/video/CVNetVideoJs/1.3.0/
开发者关心的那些事圣子足道 ios 游戏编程 apple 支付
我要在app里添加IAP，必须要注册自己的产品标识符（product identifiers）。产品标识符是什么？产品标识符（Product Identifiers）是一串字符串，它用来识别你在应用内贩卖的每件商品。App Store用产品标识符来检索产品信息，标识符只能包含大小写字母（A-Z）、数字（0-9）、下划线（-）、以及圆点(.)。你可以任意排列这些元素，但我们建议你创建标识符时使用
负载均衡器技术Nginx和F5的优缺点对比 bijian1013 nginx F5
对于数据流量过大的网络中，往往单一设备无法承担，需要多台设备进行数据分流，而负载均衡器就是用来将数据分流到多台设备的一个转发器。目前有许多不同的负载均衡技术用以满足不同的应用需求，如软/硬件负载均衡、本地/全局负载均衡、更高
LeetCode[Math] - #9 Palindrome Number Cwind java Algorithm 题解 LeetCode Math
原题链接：#9 Palindrome Number 要求：判断一个整数是否是回文数，不要使用额外的存储空间难度：简单分析：题目限制不允许使用额外的存储空间应指不允许使用O(n)的内存空间，O(1)的内存用于存储中间结果是可以接受的。于是考虑将该整型数反转，然后与原数字进行比较。注：没有看到有关负数是否可以是回文数的明确结论，例如
画图板的基本实现 15700786134 画图板
要实现画图板的基本功能，除了在qq登陆界面中用到的组件和方法外，还需要添加鼠标监听器，和接口实现。首先，需要显示一个JFrame界面： public class DrameFrame extends JFrame { //显示
linux的ps命令被触发 linux
Linux中的ps命令是Process Status的缩写。ps命令用来列出系统中当前运行的那些进程。ps命令列出的是当前那些进程的快照，就是执行ps命令的那个时刻的那些进程，如果想要动态的显示进程信息，就可以使用top命令。要对进程进行监测和控制，首先必须要了解当前进程的情况，也就是需要查看当前进程，而 ps 命令就是最基本同时也是非常强大的进程查看命令。使用该命令可以确定有哪些进程正在运行
Android 音乐播放器下一曲连续跳几首歌肆无忌惮_ android
最近在写安卓音乐播放器的时候遇到个问题。在MediaPlayer播放结束时会回调 player.setOnCompletionListener(new OnCompletionListener() { @Override public void onCompletion(MediaPlayer mp) { mp.reset(); Log.i("H
java导出txt文件的例子知了ing java servlet
代码很简单就一个servlet,如下： package com.eastcom.servlet; import java.io.BufferedOutputStream; import java.io.IOException; import java.net.URLEncoder; import java.sql.Connection; import java.sql.Resu
Scala stack试玩, 提高第三方依赖下载速度矮蛋蛋 scala sbt
原文地址： http://segmentfault.com/a/1190000002894524 sbt下载速度实在是惨不忍睹, 需要做些配置优化下载typesafe离线包, 保存为ivy本地库 wget http://downloads.typesafe.com/typesafe-activator/1.3.4/typesafe-activator-1.3.4.zip 解压r
phantomjs安装(linux，附带环境变量设置) ，以及casperjs安装。 alleni123 linux spider
1. 首先从官网 http://phantomjs.org/下载phantomjs压缩包，解压缩到/root/phantomjs文件夹。 2. 安装依赖 sudo yum install fontconfig freetype libfreetype.so.6 libfontconfig.so.1 libstdc++.so.6 3. 配置环境变量 vi /etc/profil
JAVA IO FileInputStream和FileOutputStream，字节流的打包输出百合不是茶 java核心思想 JAVA IO操作字节流
在程序设计语言中，数据的保存是基本，如果某程序语言不能保存数据那么该语言是不可能存在的，JAVA是当今最流行的面向对象设计语言之一，在保存数据中也有自己独特的一面，字节流和字符流 1，字节流是由字节构成的，字符流是由字符构成的字节流和字符流都是继承的InputStream和OutPutStream ,java中两种最基本的就是字节流和字符流类 FileInputStream
Spring基础实例（依赖注入和控制反转） bijian1013 spring
前提条件：在http://www.springsource.org/download网站上下载Spring框架，并将spring.jar、log4j-1.2.15.jar、commons-logging.jar加载至工程1.武器接口 package com.bijian.spring.base3; public interface Weapon { void kil
HR看重的十大技能 bijian1013 提升能力 HR 成长
一个人掌握何种技能取决于他的兴趣、能力和聪明程度，也取决于他所能支配的资源以及制定的事业目标，拥有过硬技能的人有更多的工作机会。但是，由于经济发展前景不确定，掌握对你的事业有所帮助的技能显得尤为重要。以下是最受雇主欢迎的十种技能。　　一、解决问题的能力　　每天，我们都要在生活和工作中解决一些综合性的问题。那些能够发现问题、解决问题并迅速作出有效决
【Thrift一】Thrift编译安装 bit1129 thrift
什么是Thrift The Apache Thrift software framework, for scalable cross-language services development, combines a software stack with a code generation engine to build services that work efficiently and s
【Avro三】Hadoop MapReduce读写Avro文件 bit1129 mapreduce
Avro是Doug Cutting(此人绝对是神一般的存在）牵头开发的。开发之初就是围绕着完善Hadoop生态系统的数据处理而开展的（使用Avro作为Hadoop MapReduce需要处理数据序列化和反序列化的场景）,因此Hadoop MapReduce集成Avro也就是自然而然的事情。这个例子是一个简单的Hadoop MapReduce读取Avro格式的源文件进行计数统计，然后将计算结果
nginx定制500，502，503，504页面 ronin47 nginx　错误显示
server { listen 80; error_page 500/500.html; error_page 502/502.html; error_page 503/503.html; error_page 504/504.html; location /test {return502;}} 配置很简单，和配
java-1.二叉查找树转为双向链表 bylijinnan 二叉查找树
import java.util.ArrayList; import java.util.List; public class BSTreeToLinkedList { /* 把二元查找树转变成排序的双向链表题目：输入一棵二元查找树，将该二元查找树转换成一个排序的双向链表。要求不能创建任何新的结点，只调整指针的指向。 10 / \ 6 14 / \
Netty源码学习-HTTP-tunnel bylijinnan java netty
Netty关于HTTP tunnel的说明： http://docs.jboss.org/netty/3.2/api/org/jboss/netty/channel/socket/http/package-summary.html#package_description 这个说明有点太简略了一个完整的例子在这里： https://github.com/bylijinnan
JSONUtil.serialize(map)和JSON.toJSONString(map)的区别 coder_xpf jquery json map val()
JSONUtil.serialize(map)和JSON.toJSONString(map)的区别数据库查询出来的map有一个字段为空通过System.out.println()输出 JSONUtil.serialize(map)： {"one":"1","two":"nul
Hibernate缓存总结 cuishikuan 开源 ssh javaweb hibernate缓存三大框架
一、为什么要用Hibernate缓存？ Hibernate是一个持久层框架，经常访问物理数据库。为了降低应用程序对物理数据源访问的频次，从而提高应用程序的运行性能。缓存内的数据是对物理数据源中的数据的复制，应用程序在运行时从缓存读写数据，在特定的时刻或事件会同步缓存和物理数据源的数据。二、Hibernate缓存原理是怎样的？ Hibernate缓存包括两大类：Hib
CentOs6 dalan_123 centos
首先su - 切换到root下面1、首先要先安装GCC GCC-C++ Openssl等以来模块：yum -y install make gcc gcc-c++ kernel-devel m4 ncurses-devel openssl-devel2、再安装ncurses模块yum -y install ncurses-develyum install ncurses-devel3、下载Erang
10款用 jquery 实现滚动条至页面底端自动加载数据效果 dcj3sjt126com JavaScript
无限滚动自动翻页可以说是web2.0时代的一项堪称伟大的技术，它让我们在浏览页面的时候只需要把滚动条拉到网页底部就能自动显示下一页的结果，改变了一直以来只能通过点击下一页来翻页这种常规做法。无限滚动自动翻页技术的鼻祖是微博的先驱：推特(twitter)，后来必应图片搜索、谷歌图片搜索、google reader、箱包批发网等纷纷抄袭了这一项技术，于是靠滚动浏览器滚动条
ImageButton去边框&Button或者ImageButton的背景透明 dcj3sjt126com imagebutton
在ImageButton中载入图片后，很多人会觉得有图片周围的白边会影响到美观，其实解决这个问题有两种方法一种方法是将ImageButton的背景改为所需要的图片。如：android:background="@drawable/XXX" 第二种方法就是将ImageButton背景改为透明，这个方法更常用在XML里； <ImageBut
JSP之c:foreach eksliang jsp forearch
原文出自：http://www.cnblogs.com/draem0507/archive/2012/09/24/2699745.html <c:forEach>标签用于通用数据循环，它有以下属性属性描述是否必须缺省值 items 进行循环的项目否无 begin 开始条件否 0 end 结束条件否集合中的最后一个项目 step 步长否 1
Android实现主动连接蓝牙耳机 gqdy365 android
在Android程序中可以实现自动扫描蓝牙、配对蓝牙、建立数据通道。蓝牙分不同类型，这篇文字只讨论如何与蓝牙耳机连接。大致可以分三步：一、扫描蓝牙设备： 1、注册并监听广播： BluetoothAdapter.ACTION_DISCOVERY_STARTED BluetoothDevice.ACTION_FOUND BluetoothAdapter.ACTION_DIS
android学习轨迹之四：org.json.JSONException: No value for hyz301 json
org.json.JSONException: No value for items 在JSON解析中会遇到一种错误，很常见的错误 06-21 12:19:08.714 2098-2127/com.jikexueyuan.secret I/System.out﹕ Result:{"status":1,"page":1,&
干货分享：从零开始学编程系列汇总 justjavac 编程
程序员总爱重新发明轮子，于是做了要给轮子汇总。从零开始写个编译器吧系列 (知乎专栏) 从零开始写一个简单的操作系统 (伯乐在线) 从零开始写JavaScript框架 (图灵社区) 从零开始写jQuery框架 (蓝色理想 ) 从零开始nodejs系列文章 (粉丝日志) 从零开始编写网络游戏
jquery-autocomplete 使用手册 macroli jquery Ajax 脚本
jquery-autocomplete学习一、用前必备官方网站：http://bassistance.de/jquery-plugins/jquery-plugin-autocomplete/ 当前版本：1.1 需要JQuery版本：1.2.6 二、使用 <script src="./jquery-1.3.2.js" type="text/ja
PLSQL-Developer或者Navicat等工具连接远程oracle数据库的详细配置以及数据库编码的修改超声波 oracle plsql
　　在服务器上将Oracle安装好之后接下来要做的就是通过本地机器来远程连接服务器端的oracle数据库，常用的客户端连接工具就是PLSQL-Developer或者Navicat这些工具了。刚开始也是各种报错，什么TNS:no listener;TNS:lost connection;TNS:target hosts...花了一天的时间终于让PLSQL-Developer和Navicat等这些客户
数据仓库数据模型之：极限存储--历史拉链表 superlxw1234 极限存储数据仓库数据模型拉链历史表
在数据仓库的数据模型设计过程中，经常会遇到这样的需求： 1. 数据量比较大; 2. 表中的部分字段会被update,如用户的地址，产品的描述信息，订单的状态等等; 3. 需要查看某一个时间点或者时间段的历史快照信息，比如，查看某一个订单在历史某一个时间点的状态，比如，查看某一个用户在过去某一段时间内，更新过几次等等; 4. 变化的比例和频率不是很大，比如，总共有10
10点睛Spring MVC4.1-全局异常处理 wiselyman spring mvc
10.1 全局异常处理使用@ControllerAdvice注解来实现全局异常处理; 使用@ControllerAdvice的属性缩小处理范围 10.2 演示演示控制器 package com.wisely.web; import org.springframework.stereotype.Controller; import org.spring

百度视频质量评测的实践之路

你可能感兴趣的:(音视频)