网易智企

RTC 音频质量评价和保障

导读：随着 5G 网络的普及以及疫情带来的影响，人们对实时音视频技术的应用场景会越来越多，包括会议、连麦、音视频通话、在线教育、远程医疗等，这些实时互动场景对 RTC 音频的质量提出了越来越高的要求。如何对 RTC 音频的效果开展测试，通过构建客观、标准、可重复的评价体系来保证好的音频传输质量，也成为目前比较紧急和重要的课题。

文｜马建立网易云信资深音视频测试工程师

理想的沟通模型

日常沟通中面对面的交流一般有比较好的效果，如果在一个安静的实验室内，减少环境的干扰和影响，会得到理想的沟通效果。我们再把这个模型抽象一下，大体可以看出有以下的特点：

环境安静：NR15 的底噪，相当于在极其安静的夜晚，人耳能不受到其他影响的干扰，集中注意力听目标人声。

适宜听音的混响环境：混响通常会影响听音者的理解程度，混响越大，语音的拖尾越长，可懂度也就越低。比如在混响较大的演唱厅，对于乐器和歌声来说，会有一定的美化效果，但是对于人的沟通交流是不利的。

语音清晰、自然：讲话者心理和生理都处在极佳的状态，发音清楚，频率均衡，语音流畅，语速适中。

声音大小适中：研究表明，音量对音质的影响是显著的，在其他条件一致的情况下，音量越大，主观听感越好。讲话者说话声音洪亮，在一定程度上能提升听音者的可懂度。

响应及时、沟通顺畅：在 RTC 的实时沟通中，延时也是一个非常重要的指标，一般来说，200ms 以内人的延时人的主观感觉无明显的障碍和迟滞感，200ms-400ms 能正常沟通，超过 400ms 就会有的迟滞感，更严重时会出现抢话的现象，直接影响通话的体验。在面对面的沟通场景下，时延只有 3ms 左右。

RTC 音量链路

上图是通过 RTC 实时沟通的两个人，从图上可以看出，讲话者 A 开始说话，声音经过空气传播、麦克风采集、A/D 转换、增强处理（降噪、回声消除、音量控制、去混响）、编码、打包传输、接收端解码、NetEQ、D/A 转换到下行播放，然后 B 听到声音。这是单工状态下的完整的声音传输的路径。

与理想的沟通模型相比，实际的 RTC 链路中存在多种类型的干扰和影响，比如环境影响、硬件影响、链路影响和网络影响，每个环节都有可能引入音频质量的下降。这些影响综合下来，会导致如下几个方面的声音的问题。

音量问题：无声、音量小、声音大导致的削波、刺耳等、忽大忽小。
回声类问题：漏回声、回声残留、语音损伤如压制、剪切、断续。
噪声类问题：噪声残留不平稳。
系统引入问题：杂音、电流音、popo音。
狭义的音质问题：语音模糊、语音失真、语音发闷、语音尖锐、机械音。
网络问题：卡顿、断续、快放、慢放、机械音。

主观测试方法

最早的主观测试以两个人通话为主，A 和 B 建立起 RTC 的链接，通过分别或者同时讲话，还原真实场景的用户使用场景，主要关注的以下 3 个维度。

Listening Quality：听音者的音质，是单工的使用场景，比如 A 在讲话，B 听到的声音的质量，就是 Listening Quality，Listening Quality 描述了大部分情况下的语音质量，也是最基础的部分，目前业界已有的客观评价方法和手段基本上都是基于 Listening Quality。

Talking Quality：讲话者的音质，是讲话人自己听到的声音质量，与回声、侧音掩蔽、本地的环境都有一定的关系。

Conversation Quality：对话音质，除了包含 A/B 两个人的 Listening Quality 和 Talking Quality，还跟双工通话有关系，主要的影响因素有回声双讲和端到端延时。

主观测试关注的维度

主观测试要关注的点如上图所示，分为音质、音色、音量、延时、回声、降噪等几个大的方面。

音色

音色又称之为音品，是听觉感到的声音的特色，音色主要决定于声音的频谱。在 RTC 的链路中，影响声音的频率响应主要是麦克风的频率特性、中间处理如 EQ、高低通滤波、以及音量控制的算法（DRC/AGC)、扬声器/耳机得到频响等。不同人的发声频率分布也有差异，一般来说男性声音低频多，声音浑厚或者偏闷，女性或者小孩有更多的高频成分，声音明亮甚至有些尖锐。

音质：音质分为 3 个维度，清晰度、流畅度和自然度。

清晰度在音频领域也叫可懂度。表示对语义内容的理解程度，影响可懂度的方面有很多，比如：语音中混入噪声使得语音听不清楚，导致可懂度下降；语音中有大混响，导致语音拖尾，听不清楚。
流畅度表示语音的连续程度。直接影响的因素有：网络环境差导致语音断续、卡顿、丢字等；QoS 调整导致的声音快放、慢放；回声和降噪等算法导致的语音损伤。
自然度表示与原始语音的相似程度。影响自然度的典型问题有：算法处理引入的失真；扬声器的非线性失真；声音放大过多造成的削波、过载等。

音量

对于 RTC 的 SDK 供应商来说，面临的最大挑战是设备多样性，不同的平台（Mac、Windows、Android、iOS、Web），以及不同机型和不同的外接设备，不同的机型或者设备采集、播放音量差异大。音量控制的策略在于能够保证不同平台设备之间的一致性，保证用户能够听到足够大小的声音，且不会显性的带来音质损伤和下降。

噪声

降噪算法的目的在于去除环境或者设备引入的噪声干扰，尽可能多的还原人声，提升信噪比。实际的降噪算法在处理噪声的过程中，都不可避免的、或多或少的损伤音质。因此评价降噪主要从两个方面考虑:

噪声的抑制水平。包括收敛时间、抑制力度、残留平稳性等。
语音的损伤程度。好的降噪算法总是能够在这两者之间达到一个相对的平衡，既能有效的抑制噪声，又没有明显的损伤语音。

回声

回声消除是 RTC 链路中比较重要的一个模块，目的是消除设备的回声，保证顺畅的通话体验。评价回声也主要从两个点出发：

回声的抑制力度。回声是否有残留。
对近端语音的损伤情况。在 RTC 的应用场景，回声也与设备、平台、机型和外接设备关系很大，因此回声的测试需要覆盖 TOP 机型。

延时

网络传输中音频对抗丢包的算法如 FEC、RED、ARQ，以及对抗丢包的算法如 Jitter Buffer 等，都会产生额外的延时，导致端到端的延时增大，对于实时沟通交流带来负面的影响和体验下降。尤其是对于一些低时延的场景来说，端到端延时是一个衡量弱网对抗性能的重要指标。

主观测试的痛点

目前 RTC 音频的主流评价方式主要依靠主观测试和听音，这种方式对于人的专业能力要求比较高，而且效率比较低。主要有以下几个方面的痛点：

可重复性差：主观测试很难保证两次测试的一致，比如声场环境的变化、说话人发音变化、音量大小变化、与设备之间的距离差异等等，不可控因素太多，没办法得到准确的对比测试结果。
测试效率低：主观测试需要两个人全程参与，长时间的测试无论听音还是发声，都会产生疲劳和懈怠感，且需要根据用例切换场景，测试效率非常低。
测试覆盖率低：因为效率的问题，实测只能覆盖有限的场景和有限的链路组合，通常来说只能保证重点场景。且测试人员本身的声音有局限性，没有办法覆盖更多种类的人声。
主观因素影响大：声音是很主观的东西，同一段声音在不同人的听感不尽相同，单个人的测试结果有可能会导致结论有失偏颇。且人的发声和听音，与生理和心理的状态有着极大的关系，同一个人在不同时间段会给出截然不同的判断和结论。

针对以上的痛点问题，网易云信目前在音频效果的评价和测试上，打造了一套从实验室构建、环境模拟、采集播放、评价方法端到端的客观评价方法。

标准实验室

上图是网易云信的声学实验室，主要的设备和硬件配置如下所示：

头肩模拟器：内置嘴部模拟器和经过较准的耳部模拟器（符合 IEC 60318–4/ITU‐T Rec. P.57 Type 3.3 标准）的人体模型，可以真实再现普通成年人头部和躯干的声学特性，进行精准的双耳声学信号采集和嘴部发声。
4* 高保真音响：构造均匀的散射声场，在线模拟并回放不同场景和信噪比的噪声环境。
多路声卡：支持同时8入8出的声音采集和播放，满足多种音频测试的场景设置。
4路电信号接口：支持多人语音测试和回声单双讲测试。

通过构建专业的音频测试实验室，满足音频自动化测试/竞品分析评测/版本间基线效果快速对比测试的需求，获得可重复的客观测试结果，同时能够满足研发音频算法仿真和原型验证的需求。还可以一人完成 3A 主观测试：降噪、音质、回声单双讲测试。目前 AI 算法越来越多，数据是 AI 类算法的关键，有了声学实验室和噪声模拟系统，通过编写自动化脚本的方式，可以实现 AI 数据自动采集和标注，大大降低数据购买和标记成本。目前云信的声学实验室组网如上图所示，实验室的引入提升了开发和测试的专业度，主要有以下方面的应用：

自动化测试：客观的 3A 自动化测试，如回声测试、噪声测试，可模拟多人入会场景。
AI 数据自动化采集：开源的语音、目标噪声分别通过人头和噪声回放系统播放，在目标端或者平台上回录，录制的过程中可以打标签，同时解决序列采集和标记的问题。
主观测试：定量的播放环境和安静的听音环境。
其它：机型覆盖测试、机型适配、算法原型优化验证。

客观测试标准

实验室主要是提供了客观可重复的测试环境，硬件设备支持自定义的采集和播放，除此之外，目前网易云信的音频实验室还引入了客观的测试标准，作为最终数据的评价方法。音频测试标准按照不同维度有不同的划分。

主观/客观

主观是基于人类的主观评价，客观方法是用模型来计算和评估语音质量。典型的主观评测标准如P.800,客观的语音质量评测方法如 PESQ。

有参考/无参考

完全参考/无参考 (FR/NR) 描述所用测量算法的类型。FR 算法有两个信号：原始信号和失真信号。NR 算法只需要一个失真信号。典型的 FR 算法是例如 PESQ。典型的 NR 测量是 P.563，NR 方法也常被称为“单端”测试。

感知/非感知

通常，此类测量算法会尝试对人类感知进行建模。感知建模不仅用于质量的评估。其他著名的感知算法例如使用感知模型的 MP3 或 AAC 用于压缩音乐。非感知指标是一般的物理或技术指标，例如电平或信噪比。

基于感知模型的客观标准

基于感知模型的客观指标最经典也是应用最广泛的是有源客观语音质量测试标准 p.86x 系列，也是就常说的 PESQ/POLQA，是一种典型的有参考的语音评价标准， PESQ/POLQA 总的思路是：对原始信号（参考信号）和通过测试系统的信号进行电平调整到标准听觉电平，再用输入滤波器模拟标准电话听筒进行滤波。

对通过电平调整和滤波后的两个信号在时间上对准，并进行听觉变换，这个变换包括对系统中线性滤波和增益变化的补偿和均衡。两个听觉变换后的信号之间的不同作为扰动（即差值），分析扰动曲面提取出两个失真参数，在频率和时间上累积起来，映射到对主观平均意见分的预测值。POLQA 相对于 PESQ 做了大量精度的优化，使得客观测试结果与主观测试结果的一致性更高，在语音评测方面有个非常广泛的应用。

自动化测试

POLQA 自动化测试

网络测试中，为减少硬件采集播放和声学链路的影响采用电信号链路的测试。发送端和接受端的两台设备使用 3.5mm 的音频线与声卡连接。此外，有一套 TC 系统来提供网损环境，被测试的两台设备接入 TC 的 Router，通过脚本控制两端设备的丢包、延时、抖动和带宽。

如上图所示，测试主机通过声卡将信号发送给测试设备 A，测试设备经过本端的 RTC 音频处理后，经过网络传输发送到接收端设备 B，在这个过程中，通过弱网系统实时添加不同类型和程度的网损。声卡接收到测试设备 B 的信号，通过与原始信号的比对和分析，来衡量 RTC 对于弱网对抗模块的性能。

支持 Android 端、iOS 端、Windows 端、Mac 端、Web 端的互通测试；
使用 TC 脚本自动化控制网络环境；
使用 API 自动化控制入会、切换 profile、参数控制、离开会议；
自动化获取测试过程中的码率、丢包、卡顿等打点信息作为辅助标准；
一键执行，生成版本基线报告；

3A 客观自动化

网易云信目前基于实验室搭建了端到端的 3A 自动化测试，架构框图如上图所示，主要分为用例管理层、API/UI 控制层、采集和播放、自动校准、分析与计算、数据和报告几个大的模块。主要用于回声、噪声和音量控制的综合评价，目前在版本基线测试、版本迭代对比、竞品对比等测试环节中应用。

作者介绍

马建立，网易云信资深音视频测试工程师，网易云信音视频媒体实验室核心成员，负责音频测试质量体系建设和音视频质量保障工作。

zlmediakit webrtc搭建使用 iummature webrtc
webrtc编译与使用|ZLMediaKit官方文档参考编译机器：centos7.6gcc版本10.1.0(GCC)cmakeversion3.23.0web播放rtsp流视频，使用webrtc毫秒级延迟_webrtc播放rtsp流-CSDN博客依赖准备openssl安装(openssl版本要求1.1以上)我的安装目录在/opt/projects/open/openssllibsrtp安装对于一些
WebRTC（九）：JitterBuffer 却道天凉_好个秋 WebRTC webrtc
JitterBufferJitter“Jitter”指的是连续到达的媒体包之间时间间隔的变化。在网络传输中，由于：网络拥塞路由路径变化队列排队不同链路带宽差异导致包之间的接收时间不一致，这就是网络“抖动”。作用**JitterBuffer（抖动缓冲区）**的作用是：缓冲网络传输过来的数据包重新排序乱序的包缓冲一定时间再输出实现稳定的音视频帧输出，避免播放中出现卡顿、跳帧、音频破音工作流程图网络接收
AWS WebRTC：通过shell实现多进程启动viewer Jasper张 AWS WebRTC aws webrtc 云计算服务器 linux 运维
前面总结了awswebrtcsdk-c项目中多进程启动master的shell脚本，具体参考：https://blog.csdn.net/zhang_jiamin/article/details/148616899这次总结一下多进程启动viewer的shell脚本，以及过程中遇到的问题和解决方法。实现说明：1、获取sid和uid（用于认证）2、获取ak/sk/token（多个SN共用一组密钥）3、
B站视频下载技术揭秘：从浏览器抓包到FFmpeg音视频合成 soonlyai 音视频 ffmpeg
摘要本文旨在深入探讨B站（哔哩哔哩）视频的实际加载与分发机制，并通过Python脚本实现一个功能性的视频下载器。我们将从使用浏览器开发者工具分析B站播放页的网络请求入手，定位获取视频流地址的关键API。在此基础上，本文将详细讲解如何利用Python的requests库模拟API请求、通过携带Cookie获取登录后才能访问的4K高清视频流，并最终调用ffmpeg工具将B站特有的音、视频分离流合并为完
《从0到1：C/C++音视频开发自学指南》空云风语机器视觉 Opencv QT c语言 c++音视频
开启自学之旅：为何选择C/C++音视频开发在当今数字化时代，音视频开发的应用场景极为广泛，深刻融入了我们生活与工作的方方面面。从火爆的直播行业，无论是电商直播中主播与观众的实时互动，还是游戏直播里精彩赛事的实时呈现；到备受欢迎的短视频平台，各种创意短视频的制作与分享；再到便捷的视频会议，让远程办公、在线教育成为可能，实现了跨地域的高效沟通与协作。这些丰富多样的应用场景，都离不开音视频开发技术的有力
抖音的视频怎么下载下来——下载狗解析工具 Java搬砖组长音视频
如果你想下载抖音视频，可以使用「下载狗解析工具」来获取抖音无水印高清视频。以下是详细的操作步骤，适用于电脑端和手机端。方法1：电脑端下载（无水印高清）步骤1：获取抖音视频链接打开抖音官网或手机APP，找到要下载的视频。点击视频右下角的「分享」按钮，选择「复制链接」。步骤2：使用「下载狗解析工具」解析在浏览器中打开「下载狗解析工具」官网（www.xiazaitool.com）。将复制的抖音链接粘贴到
调试HDMI音频能8通道播放声音 hxHardway Android/Linux 功能实现文档音视频 linux
一、使用场景我们是通过rk主控的hdmi接口播放音视频给到ite68051芯片解析出8声道数据，分别通过4路i2s的数据脚给给到fpga去解析调试步骤：1.根据相关手册配置hdmi输出，hdmi声卡注册，如下:hdmi0_sound:hdmi0-sound{ status="disabled"; compatible="rockchip,hdmi"; rockchip,mclk-
【GStreamer】减小延时的参数设置、从RTP中获取时间戳郭老二视频 GStreamer
1、问题描述在使用GStreamer实现RTSP转RTMP时，延时很大，2～5秒，这是为了应对网络抖动、丢包重传、音视频同步等问题，建立了一些缓冲区。2、解决方法在可以损失流畅度、画面质量的前提下，可以使用如下参数来减小延时1）rtspsrc参数：buffer-mode=auto：自动调整缓冲区大小drop-on-latency=true：缓冲区满时丢弃旧数据latency=0：最小化RTSP接收
C# WinForms局域网即时通讯系统设计与实现深刻如此
本文还有配套的精品资源，点击获取简介：本项目是一个使用C#WinForms技术开发的局域网内即时通讯工具，支持文字、文件传输和音视频通信。它旨在为学生毕业答辩提供一个本地网络通信平台，展示开发者在.NET环境下的网络编程和GUI设计能力。项目不仅要求掌握C#基础和WinForms控件开发，还需实现网络通信、多线程处理、数据安全等高级功能。通过项目开发，学生能深入理解软件开发的各个方面，提升软件工程
SVC相关介绍 itzilong 视频会议
https://www.cnblogs.com/huxiaopeng/p/5653310.htmlhttps://janus.conf.meetecho.com/vp9svctest.htmlhttps://w3c.github.io/webrtc-svc/#intro开源框架Janushttps://blog.csdn.net/sonysuqin/article/details/84988120
WebRTC 语音激活检测(VAD)算法 u013250861 Audio webrtc 算法语音识别
语音激活检测最早应用于电话传输和检测系统当中，用于通信信道的时间分配，提高传输线路的利用效率。激活检测属于语音处理系统的前端操作，在语音检测领域意义重大。但是目前的语音激活检测，尤其是检测人声开始和结束的端点始终是属于技术难点，各家公司始终处于能判断，但是不敢保证判别准确性的阶段。通常搭建机器人聊天系统主要包括以下三个方面:语音转文字(ASR/STT)语义内容(NLU/NLP)文字转语音(TTS)
STUN (Session Traversal Utilities for NAT) 服务器是一种网络协议
STUN(SessionTraversalUtilitiesforNAT)服务器是一种网络协议，主要用于帮助位于网络地址转换(NAT)设备（如路由器）后面的客户端发现自己的公共IP地址和端口号。这对于建立点对点(P2P)通信至关重要，尤其是在VoIP（网络电话）和WebRTC（Web实时通信）等实时通信应用中。为什么需要STUN服务器？当设备位于NAT后面时，它会拥有一个私有IP地址，这个地址在本
WebRTC（七）：媒体能力协商却道天凉_好个秋 WebRTC webrtc
目的在WebRTC中，每个浏览器或终端支持的音视频编解码器、分辨率、码率、帧率等可能不同。媒体能力协商的目的就是：确保双方能“听得懂”对方发的媒体流；明确谁发送、谁接收、怎么发送；保障连接的互操作性和兼容性。P2P的基本流程参与角色角色说明peerA发起连接的端（通常是主叫）peerB接收连接的端（通常是被叫）signal信令服务器，用于中转SDP和ICE信息，但不参与媒体传输stun/turnS
【libyuv】windows cmake 构建 for webrtc 等风来不如迎风去 WebRTC入门与实战 windows git bash libyuv
使用vs直接构建webrtc的部分源码，发现libyuv是webrtc源码的依赖库，会有链接错误官方说明https://github.com/frankpapenmeier/libyuv/blob/master/docs/getting_started.md看起来官方灭有推荐windows用cmake构建实测，用cmake也是可以的。deptoolsYou’llneedtohavedepottoo
SRS(Simple Realtime Server) 开源直播/双录服务器 @井九开源服务器运维
一、SRS是什么？SRS（SimpleRealtimeServer）是一个纯C++编写的高性能开源流媒体服务器，目标是打造简单、高效、易用、支持多协议的直播服务系统。自2013年开源以来，已成为国内外广泛使用的RTMP/WebRTC服务端方案之一。核心特性：支持主流直播协议：RTMP、HTTP-FLV、HLS、WebRTC、SRT、GB28181⚡支持亚秒级延迟：特别是WebRTC和HTTP-FL
webRTC源码配置和编译 + Vscode Intelligence配置 TransPlus webrtc vscode ide
Google官方的WebRTC源码并不托管在GitHub上，而是使用Chromium的代码管理工具（depot_tools）。以下是完整的源码下载、编译和学习指南：1.获取WebRTC源码(1)安装depot_tools（必须）WebRTC使用Chromium的构建系统，需先安装depot_tools：#Linux/macOSgitclonehttps://chromium.googlesourc
【Fargo】mediasoup发送2：码率分配、传输基类设计及WebRtcTransport原理等风来不如迎风去传输探索实践 werbtc mediasoup c++流媒体 sfu
Fargo使用了mediasoup的代码，搬运了他的架构架构精妙，但是似乎是为了sfu而生，【Fargo】mediasoup发送1：控制与数据分离的分层设计和原理我本地用来发送测试，因此需要进一步梳理：通过分析这段代码，我来详细解释：一、sfu需要码率级别的分配控制1.DistributeAvailableOutgoingBitrate()做了什么核心功能：分层码率分配算法//第一步：获取可用带宽
ESP FOURCC 编码介绍乐鑫科技 Espressif 乐鑫科技多媒体编码
FOURCC（FourCharacterCode，四字符编码）是一种在多媒体领域被广泛使用的标识符，常用于快速识别音视频编码格式、封装格式、像素格式等。乐鑫科技定义了一套完整的FOURCC编码标准，称为ESPFOURCC，该标准可在开源项目ESP-GMF中的esp_fourcc.h头文件中找到，涵盖了音视频编解码、图像、封装格式和各种像素格式。本文将深入介绍ESPFOURCC的背景意义、定义原则、
MX_Player_Pro_专业精简版AC3/DTS/EAC3 By.SOLDIER-就要应用网91apps.cn syx594
MX_Player_Pro1.32.8_专业精简版_AC3/DTS/EAC3MXPlayer是安卓市场功能最强大的视频播放器支持几乎所有的音视频文件，强力的硬件加速和多种字幕支持。优化说明：不需要Root或LuckyPatcher或GooglePlayModded；禁用/删除不需要的权限及服务；优化和压缩对齐的图形以及清理不必要的资源，以实现快速加载；从Android.manifest中删除了广告
请编写一个sip Android音视频客户端又可乐 android android studio ide
编写一个SIP客户端需要以下步骤：了解SIP协议:SIP(SessionInitiationProtocol)是一种通信协议，用于建立、维护和终止多媒体会话(如语音和视频通话)。选择开发工具:可以使用Java语言和AndroidStudio开发安卓应用程序。获取SIP栈:可以使用现有的SIP栈库，如pjsip，或开发自己的SIP栈。设计界面:可以使用Android的XML语言设计用户界面，包括呼叫
音视频及H264/H256编码相关原理 Everbrilliant89 音视频开发音视频视频编解码 H264编码 H265编码音视频编解码
一、音视频封装格式原理：我们播放的视频文件一般都是用一种封装格式封装起来的，封装格式的作用是什么呢？一般视频文件里不光有视频，还有音频，封装格式的作用就是把视频和音频打包起来。所以我们先要解封装格式，看有哪些视频流和哪些音频流，此时的音频流和视频流都还是压缩数据，不能直接用于显示的，这就需要解码。如FFmpeg视频文件就是一个容器(视频流（H264）音频流(aac))。1、视频文件封装格式：封装格
【音视频】PJSIP库——pjsua命令使用详解郭老二视频音视频
1、源码编译1）安装依赖库sudoaptinstalllibsrtp2-devsudoaptinstalllibopus-devalsa-toolslibalsaplayer-devffmpeglibalsa*pulseaudio-module-jacksudoaptinstalljackdlibjack-jackd2-devlibjack-devlibsdl2-devlibv4l-devliba
【音视频】SIP基础、搭建服务器和客户端郭老二视频音视频
1、概念SIP（SessionInitiationProtocol，会话初始协议）是一种用于创建、修改和终止实时通信会话（如语音、视频通话）的应用层协议。1.1架构SIP架构分为客户端和服务器端1）客户端：发起或接收会话请求，例如：手机上的VoIP应用、pjsua程序2）服务端：存储客户端注册的信息，比如IP、端口等注册服务器（RegistrarServer）：存储用户的当前位置信息（IP+端口）
FFmpeg 的算法体系 lianghu666 音视频硬件 Linux ffmpeg 算法 linux
️一、FFmpeg核心算法体系与作用1.编解码算法编解码是FFmpeg的核心能力，通过libavcodec实现音视频的压缩与还原。视频编码算法帧间预测：通过运动估计（菱形搜索、全搜索法）减少时间冗余，支持P帧（前向预测）和B帧（双向预测）变换与量化：采用整数离散余弦变换（DCT）将空域信号转为频域，再通过量化舍弃高频信息（H.264/H.265使用）熵编码：对残差数据采用CABAC（上下文自适应二
jquery获取本机内网IP ipipv4
在jquery中获取本机内网IP地址可以通过WebRTCAPI来收集本地候选IP地址，并通过正则表达式筛选出内网IP一：实现思路WebRTC获取IP：通过创建RTCPeerConnection实例，浏览器会自动收集本地网络接口的IP地址作为ICE候选。筛选内网IP：从收集到的候选IP中过滤出符合IP地址二：浏览器支持需在支持WebRTC的现代浏览器（如Chrome、Firefox）中运行三：代码实
ZLMediaKit2023-10-15master分支编译版下载：实时音视频传输解决方案昌焘同
ZLMediaKit2023-10-15master分支编译版下载：实时音视频传输解决方案去发现同类优质开源项目:https://gitcode.com/项目介绍ZLMediaKit是一款开源的实时音视频传输框架，专为流媒体传输而设计。2023年10月15日基于master分支编译完成的版本，为广大开发者提供了Windows平台下的便捷使用体验。该版本集成最新的功能特性，无需复杂编译过程，下载即可
Permute 3.5 最好用的苹果电脑视频压缩转换工具 blank_t Permute Permute mac 视频压缩视频处理
类别：视频版本：3.5大小：19.2MBMB语言：简体中文标签：视频转换视频编辑兼容性：OSX10.11或更高版本更新：2020年07月23日软件介绍Permute3.5强大易用的视频格式转换已通过小编安装运行测试100%可以使用。Permute3.5是Mac系统最容易使用的视频格式转换器，它很容易使用，无需配置，你只需将文件拖放进界面窗口，对所有的媒体进行转换。支持丰富的音视频文件格式（甚至还支
Mac电脑-媒体文件格式转换-Permute 2401_88856700 媒体 mac macos 格式转换
Permute是一款功能强大的媒体文件格式转换工具。支持多种音视频和图像格式，包括但不限于MP4、AVI、MOV、MKV、MP3、WAV、FLAC、JPEG、PNG等。操作界面简洁明了，只需拖拽文件或点击添加按钮来选择需要转换的文件。转换设置区域，可自由选择输出格式、输出路径、输出参数等，实现个性化转换。原文地址：Permute媒体文件格式转换工具
XMOS将在CES 2025上展出多款由边缘AI驱动的创新音效、音频、识别和处理解决方案电子科技圈 XMOS 人工智能音视频嵌入式硬件科技物联网 mcu iot
全球智能物联网技术领导者暨匠心独到的半导体科技企业XMOS宣布：该公司将再次参加2025年国际消费电子展（CES2025），并将在本届CES上展出一系列由人工智能（AI）驱动的全新空间音效、语音捕获与降噪、音视频多模态AI处理等多种全新音频技术与应用解决方案。它们皆由XMOS在单一器件中集成了高性能AI、DSP、I/O和控制功能的xcore.ai系列多核控制器支持，将边缘AI技术与音频和话音媒介特
音视频面经_音视频知识解析：第三章FFMPEG编写视频解码 2301_79125642 java
小调查一次小调查，各位javaer除了用springboot写过项目，还用过啥框架写项目？有没有牛友来指点一二，真的好纠结本人位于湖南某民办二本(在湖南民办二本里算好的)，目前大三下，准备找工作干java后端，跟着b站的黑勇攀高峰6月12日举行的毕业典礼，一周的时间很快就过去了。回想起整个春招，机会确实很少，大概只有字节美团快手#和牛牛一起刷题打卡(51733)##和牛牛一起刷题打卡#简历求指导投
多线程编程之join()方法周凡杨 java JOIN 多线程编程线程
现实生活中，有些工作是需要团队中成员依次完成的，这就涉及到了一个顺序问题。现在有T1、T2、T3三个工人，如何保证T2在T1执行完后执行，T3在T2执行完后执行？问题分析：首先问题中有三个实体，T1、T2、T3，因为是多线程编程，所以都要设计成线程类。关键是怎么保证线程能依次执行完呢？ Java实现过程如下： public class T1 implements Runnabl
java中switch的使用 bingyingao java enum break continue
java中的switch仅支持case条件仅支持int、enum两种类型。用enum的时候，不能直接写下列形式。 switch (timeType) { case ProdtransTimeTypeEnum.DAILY: break; default: br
hive having count 不能去重 daizj hive 去重 having count 计数
hive在使用having count()是，不支持去重计数 hive (default)> select imei from t_test_phonenum where ds=20150701 group by imei having count(distinct phone_num)>1 limit 10; FAILED: SemanticExcep
WebSphere对JSP的缓存周凡杨 WAS JSP 缓存
对于线网上的工程，更新JSP到WebSphere后，有时会出现修改的jsp没有起作用，特别是改变了某jsp的样式后，在页面中没看到效果，这主要就是由于websphere中缓存的缘故，这就要清除WebSphere中jsp缓存。要清除WebSphere中JSP的缓存，就要找到WAS安装后的根目录。现服务
设计模式总结朱辉辉33 java 设计模式
1.工厂模式 1.1 工厂方法模式 (由一个工厂类管理构造方法) 1.1.1普通工厂模式(一个工厂类中只有一个方法) 1.1.2多工厂模式(一个工厂类中有多个方法) 1.1.3静态工厂模式(将工厂类中的方法变成静态方法) &n
实例：供应商管理报表需求调研报告老A不折腾 finereport 报表系统报表软件信息化选型
引言随着企业集团的生产规模扩张，为支撑全球供应链管理，对于供应商的管理和采购过程的监控已经不局限于简单的交付以及价格的管理，目前采购及供应商管理各个环节的操作分别在不同的系统下进行，而各个数据源都独立存在，无法提供统一的数据支持；因此，为了实现对于数据分析以提供采购决策，建立报表体系成为必须。业务目标 1、通过报表为采购决策提供数据分析与支撑 2、对供应商进行综合评估以及管理，合理管理和
mysql 林鹤霄
转载源：http://blog.sina.com.cn/s/blog_4f925fc30100rx5l.html mysql -uroot -p ERROR 1045 (28000): Access denied for user 'root'@'localhost' (using password: YES) [root@centos var]# service mysql
Linux下多线程堆栈查看工具(pstree、ps、pstack) aigo linux
原文：http://blog.csdn.net/yfkiss/article/details/6729364 1. pstree pstree以树结构显示进程$ pstree -p work | grep adsshd(22669)---bash(22670)---ad_preprocess(4551)-+-{ad_preprocess}(4552) &n
html input与textarea 值改变事件 alxw4616 JavaScript
// 文本输入框(input) 文本域(textarea)值改变事件 // onpropertychange(IE) oninput(w3c) $('input,textarea').on('propertychange input', function(event) { console.log($(this).val()) });
String类的基本用法百合不是茶 String
字符串的用法; // 根据字节数组创建字符串 byte[] by = { 'a', 'b', 'c', 'd' }; String newByteString = new String(by); 1,length() 获取字符串的长度 &nbs
JDK1.5 Semaphore实例 bijian1013 java thread java多线程 Semaphore
Semaphore类一个计数信号量。从概念上讲，信号量维护了一个许可集合。如有必要，在许可可用前会阻塞每一个 acquire()，然后再获取该许可。每个 release() 添加一个许可，从而可能释放一个正在阻塞的获取者。但是，不使用实际的许可对象，Semaphore 只对可用许可的号码进行计数，并采取相应的行动。 S
使用GZip来压缩传输量 bijian1013 java GZip
启动GZip压缩要用到一个开源的Filter：PJL Compressing Filter。这个Filter自1.5.0开始该工程开始构建于JDK5.0，因此在JDK1.4环境下只能使用1.4.6。 PJL Compressi
【Java范型三】Java范型详解之范型类型通配符 bit1129 java
定义如下一个简单的范型类， package com.tom.lang.generics; public class Generics<T> { private T value; public Generics(T value) { this.value = value; } }
【Hadoop十二】HDFS常用命令 bit1129 hadoop
1. 修改日志文件查看器 hdfs oev -i edits_0000000000000000081-0000000000000000089 -o edits.xml cat edits.xml 修改日志文件转储为xml格式的edits.xml文件，其中每条RECORD就是一个操作事务日志 2. fsimage查看HDFS中的块信息等 &nb
怎样区别nginx中rewrite时break和last ronin47
在使用nginx配置rewrite中经常会遇到有的地方用last并不能工作，换成break就可以，其中的原理是对于根目录的理解有所区别，按我的测试结果大致是这样的。 location / { proxy_pass http://test;
java-21.中兴面试题输入两个整数 n 和 m ，从数列 1 ， 2 ， 3.......n 中随意取几个数 , 使其和等于 m bylijinnan java
import java.util.ArrayList; import java.util.List; import java.util.Stack; public class CombinationToSum { /* 第21 题 2010 年中兴面试题编程求解：输入两个整数 n 和 m ，从数列 1 ， 2 ， 3.......n 中随意取几个数 , 使其和等
eclipse svn 帐号密码修改问题开窍的石头 eclipse SVN svn帐号密码修改
问题描述： Eclipse的SVN插件Subclipse做得很好，在svn操作方面提供了很强大丰富的功能。但到目前为止，该插件对svn用户的概念极为淡薄，不但不能方便地切换用户，而且一旦用户的帐号、密码保存之后，就无法再变更了。解决思路：删除subclipse记录的帐号、密码信息，重新输入
[电子商务]传统商务活动与互联网的结合 comsci 电子商务
某一个传统名牌产品，过去销售的地点就在某些特定的地区和阶层，现在进入互联网之后，用户的数量群突然扩大了无数倍，但是，这种产品潜在的劣势也被放大了无数倍，这种销售利润与经营风险同步放大的效应，在最近几年将会频繁出现。。。。如何避免销售量和利润率增加的
java 解析 properties-使用 Properties-可以指定配置文件路径 cuityang java properties
#mq xdr.mq.url=tcp://192.168.100.15:61618; import java.io.IOException; import java.util.Properties; public class Test { String conf = "log4j.properties"; private static final
Java核心问题集锦 darrenzhu java 基础核心难点
注意，这里的参考文章基本来自Effective Java和jdk源码 1)ConcurrentModificationException 当你用for each遍历一个list时，如果你在循环主体代码中修改list中的元素，将会得到这个Exception，解决的办法是： 1)用listIterator, 它支持在遍历的过程中修改元素， 2)不用listIterator, new一个
1分钟学会Markdown语法 dcj3sjt126com markdown
markdown 简明语法基本符号 *,-,+ 3个符号效果都一样，这3个符号被称为 Markdown符号空白行表示另起一个段落 `是表示inline代码，tab是用来标记代码段，分别对应html的code，pre标签换行单一段落( <p>) 用一个空白行连续两个空格会变成一个 <br> 连续3个符号，然后是空行
Gson使用二（GsonBuilder） eksliang json gson GsonBuilder
转载请出自出处：http://eksliang.iteye.com/blog/2175473 一.概述 GsonBuilder用来定制java跟json之间的转换格式二.基本使用实体测试类：温馨提示：默认情况下@Expose注解是不起作用的,除非你用GsonBuilder创建Gson的时候调用了GsonBuilder.excludeField
报ClassNotFoundException: Didn't find class "...Activity" on path: DexPathList gundumw100 android
有一个工程，本来运行是正常的，我想把它移植到另一台PC上，结果报： java.lang.RuntimeException: Unable to instantiate activity ComponentInfo{com.mobovip.bgr/com.mobovip.bgr.MainActivity}: java.lang.ClassNotFoundException: Didn't f
JavaWeb之JSP指令 ihuning javaweb
要点 JSP指令简介 page指令 include指令 JSP指令简介 JSP指令（directive）是为JSP引擎而设计的，它们并不直接产生任何可见输出，而只是告诉引擎如何处理JSP页面中的其余部分。 JSP指令的基本语法格式： <%@ 指令属性名="
mac上编译FFmpeg跑ios 啸笑天 ffmpeg
1、下载文件：https://github.com/libav/gas-preprocessor，复制gas-preprocessor.pl到/usr/local/bin/下，修改文件权限：chmod 777 /usr/local/bin/gas-preprocessor.pl 2、安装yasm-1.2.0 curl http://www.tortall.net/projects/yasm
sql mysql oracle中字符串连接 macroli oracle sql mysql SQL Server
有的时候，我们有需要将由不同栏位获得的资料串连在一起。每一种资料库都有提供方法来达到这个目的： MySQL: CONCAT() Oracle: CONCAT(), || SQL Server: + CONCAT() 的语法如下： Mysql 中 CONCAT(字串1, 字串2, 字串3, ...): 将字串1、字串2、字串3，等字串连在一起。请注意，Oracle的CON
Git fatal: unab SSL certificate problem: unable to get local issuer ce rtificate qiaolevip 学习永无止境每天进步一点点 git 纵观千象
// 报错如下： $ git pull origin master fatal: unable to access 'https://git.xxx.com/': SSL certificate problem: unable to get local issuer ce rtificate // 原因：由于git最新版默认使用ssl安全验证，但是我们是使用的git未设
windows命令行设置wifi surfingll windows wifi 笔记本wifi
还没有讨厌无线wifi的无尽广告么，还在耐心等待它慢慢启动么教你命令行设置笔记本电脑wifi： 1、开启wifi命令 netsh wlan set hostednetwork mode=allow ssid=surf8 key=bb123456 netsh wlan start hostednetwork pause 其中pause是等待输入，可以去掉 2、
Linux（Ubuntu）下安装sysv-rc-conf wmlJava linux ubuntu sysv-rc-conf
安装：sudo apt-get install sysv-rc-conf 使用：sudo sysv-rc-conf 操作界面十分简洁，你可以用鼠标点击，也可以用键盘方向键定位，用空格键选择，用Ctrl+N翻下一页，用Ctrl+P翻上一页，用Q退出。背景知识 sysv-rc-conf是一个强大的服务管理程序，群众的意见是sysv-rc-conf比chkconf
svn切换环境，重发布应用多了javaee标签前缀 zengshaotao javaee
更换了开发环境，从杭州，改变到了上海。svn的地址肯定要切换的，切换之前需要将原svn自带的.svn文件信息删除，可手动删除，也可通过废弃原来的svn位置提示删除.svn时删除。然后就是按照最新的svn地址和规范建立相关的目录信息，再将原来的纯代码信息上传到新的环境。然后再重新检出，这样每次修改后就可以看到哪些文件被修改过，这对于增量发布的规范特别有用。检出

RTC 音频质量评价和保障

你可能感兴趣的:(WebRTC,音视频)