konishi5202

音频技术基础知识

文章目录

一、音频编码调制技术
二、脉冲编码调制相关术语

2.1 采样和采样频率
2.2 采样位数
2.3 通道数
2.4 比特率
2.5 编解码
2.6 有损和无损

三、常见音频压缩标准
四、PCM音频前后处理
五、PCM音频传输
六、常见音频格式

6.1 WAV格式
6.2 MP3格式
6.3 OGG格式
6.4 MPC格式
6.5 WMA格式
6.6 MP3PRO格式
6.7 APE格式
6.8 MIDI格式

七、常用音频处理开源库

7.1 OpenAL
7.2 speex
7.3 ffmpeg
7.4 Opus

一、音频编码调制技术

根据编码方式的不同，音频编码技术分为三种：波形编码、参数编码和混合编码。一般来说，波形编码的话音质量高，但编码速率也很高；参数编码的编码速率很低，产生的合成语音的音质不高；混合编码使用参数编码技术和波形编码技术，编码速率和音质介于它们之间。

实际应用中，我们通常采用的是脉冲编码调制（即PCM编码）。PCM通过抽样、量化、编码三个步骤将连续变化的模拟信号转换为数字编码。

脉冲编码调制（Pulse Code Modulation）的处理过程如下：

模拟信号 >> [ 抽样 -> 量化 -> 编码 ] >> 数字信号

二、脉冲编码调制相关术语

上述PCM过程，会用到如下相关技术和术语。

2.1 采样和采样频率

在音频处理时要先把音频的模拟信号变成数字信号，这叫A/D转换。要把音频的模拟信号变成数字信号，就需要采样，或者叫抽样。当要把音频播放出来时则需要把数字信号转换成模拟信号，这叫D/A转换。一秒钟内采样的次数称为采样频率。

根据Nyquist采样定理，要想重建原始信号，采样频率必须大于信号中最高频率的两倍。采样频率越高，越接近原始信号，但是也加大了运算处理的复杂度。

人能感受到的频率范围为20HZ–20kHZ，一般音乐的采样频率为44.1kHZ(根据Nyquist采样定理，采样频率大于信号中最高频率的两倍得出)。更高音乐的采样率可以是48kHZ和96kHZ，不过一般人用耳听感觉不出差别了。

语音主要是以沟通为主，不需要像音乐那样清晰。语音分窄带和宽带：窄带频率范围为300Hz–3400Hz，对应的采样频率为8000Hz；宽带频率范围为50Hz–7000Hz，相应的采样频率为16000Hz，用16k采样的语音就称为高清语音了。现在主流的语音采样频率为16kHz。其中语音识别技术所使用的采样率基本都是16KHz。

以下是数字音频最常用的采样率：

采样率	品质级别	频率范围
11025Hz	较差的AM电台（低端多媒体）	0~5512Hz
22050Hz	接近FM电台（高端多媒体）	0~11025Hz
32000Hz	好于FM电台（标准广播采样率）	0~16000Hz
44100Hz	CD	0~22050Hz
48000Hz	标准DVD	0~24000Hz
96000Hz	蓝光DVD	0~48000Hz

2.2 采样位数

数字信号是用0和1来表示的，采样位数就是采样值用多少位0和1来表示，也叫采样精度。用的位数越多就越接近真实声音。如用8位表示，采样值取值范围就是-128–127，如用16位表示，采样值取值范围就是-32768–32767。

2.3 通道数

通常语音只用一个声道。而对于音乐来说，既可以是单声道（mono），也可以是双声道（即左声道右声道，叫立体声stereo），还可以是多声道，叫环绕立体声，多用于影院中。

2.4 比特率

也叫码率，表示每秒音频数据量的大小。计算公司：比特率=采样率采样精度声道数，单位是kbps。

2.5 编解码

如果把采样值直接保存或者发送，会占用很大的存储空间或者很大的流量。以16kHz采样率16位采样位数单声道为例，一秒钟就有1600016bit1/8bit=32000bytes字节。通常需要把采样后的数字信号压缩后才保存或者发送。把采样值压缩叫编码（encode），形成比特流（bitstream）. 把比特流还原出采样值叫解码（decode），统称编解码（codec）。

通常我们把音频采样过程叫脉冲编码调制编码，即PCM（Pulse Code Modulation）编码，采样值也叫PCM值，为了节省保存空间或者发送流量，会对PCM值压缩。

2.6 有损和无损

根据采样和量化的过程可知，音频编码最多只能做到无限接近自然界的信号，至少目前的技术还不可能将其完全一样。这是因为自然界的信号是连续的，而音频编码后的值是离散的。因此，任何数字音频编码方案都是有损的，这也就意味着任何的音频都不可能完全还原出自然界的声音。

不过我们常说的有损和无损是指PCM数据压缩（编码）的过程：把PCM数据压缩后无任何损伤叫无损压缩，不过压缩程度不高；把PCM数据压缩后有损伤叫有损压缩，最多可以压到几十分之一，不过音频质量差些。

三、常见音频压缩标准

目前主要有三大技术标准组织制定压缩标准：

ITU，主要制定有线语音的压缩标准（g系列），有711/g722/g726/g729等。
3GPP，主要制定无线语音的压缩标准（amr系列等），有amr-nb/amr-wb。后来ITU吸纳了amr-wb，形成了g722.2。
MPEG，主要制定音乐的压缩标准，有11172-3，13818-3/7，14496-3等。

一些大公司或者组织也制定压缩标准，比如iLBC，OPUS。

四、PCM音频前后处理

音频处理是指对PCM数据（也叫线性数据）进行处理，从而达到想要的效果，如回声消除。

对音频编码前的PCM数据进行处理叫音频前处理，主要用于语音中，来去除各种干扰，使声音更清晰，主要有回声消除、噪声抑制、增益控制等。

对音频解码后的PCM数据进行处理叫音频后处理，主要用于音乐中，来产生各种音效，使音乐更动听，主要有均衡器、混响等。

五、PCM音频传输

这里主要是指网络传输，通过网络把音频数据传给对方。语音和音乐两种场景下有明显的区别：

对于语音来说，实时性要求很高，主要用RTP/UDP做承载，由于UDP是不可靠传输，会丢包乱序等，影响语音质量，所以要采取相应的措施，主要有PLC(丢包补偿)、FEC(前向纠错)、重传、jitter buffer等。
对于音乐来说，以前是播放本地音乐文件，近些年随着网络带宽的加大，可以播放云端的音乐文件了。播放时要把音乐文件传给播放器，一般是边播放边下载，播放音乐对实时性要求不高，一般用HTTP/TCP做承载，也就不存在丢包乱序等问题了。

六、常见音频格式

6.1 WAV格式

WAV格式，是微软公司开发的一种声音文件格式，也叫波形声音文件，是最早的数字音频格式。

特点：音质非常好，被大量软件所支持。

适用于：多媒体开发、保存音乐和音效素材。

6.2 MP3格式

MP3具有不错的压缩比，使用LAME编码的中高码率的mp3，听感上已经非常接近源WAV文件。使用合适的参数，LAME编码的MP3很适合于音乐欣赏。由于mp3编码是有损的，因此多次编辑后，音质会急剧下降，mp3并不适合保存素材，但作为作品的demo确实相当优秀的。MP3也具有流媒体的基本特征，可以做到在线播放。

特点：音质好，压缩比比较高，被大量软件和硬件支持，应用广泛。

适用于：适合用于比较高要求的音乐欣赏。

6.3 OGG格式

Ogg是一种非常有潜力的编码，在各种码率下都有比较惊人的表现，尤其中低码率下。Ogg除了音质好之外，她还是一个完全免费的编码，这对ogg被更多支持打好了基础。Ogg有着非常出色的算法，可以用更小的码率达到更好的音质，128kbps的Ogg比192kbps甚至更高码率的mp3还要出色。Ogg的高音具有一定的金属味道，因此在编码一些高频要求很高的乐器独奏时，Ogg的这个缺陷会暴露出来。OGG具有流媒体的基本特征，但现在还没有媒体服务软件支持，因此基于ogg的数字广播还无法实现。

特点：可以用比mp3更小的码率实现比mp3更好的音质，高中低码率下均具有良好的表现。

适用于：用更小的存储空间获得更好的音质（相对MP3）。

6.4 MPC格式

和OGG一样，MPC的竞争对手也是mp3，在中高码率下，MPC可以做到比竞争对手更好音质，在中等码率下，MPC的表现不逊色于Ogg，在高码率下，MPC的表现更是独孤求败，MPC的音质优势主要表现在高频部分，MPC的高频要比MP3细腻不少，也没有Ogg那种金属味道，是目前最适合用于音乐欣赏的有损编码。MPC有不错的编码效率，编码时间要比OGG和LAME短不少。

特点：中高码率下，具有有损编码中最佳的音质表现，高码率下，高频表现极佳

适用于：在节省大量空间的前提下获得最佳音质的音乐欣赏。

6.5 WMA格式

微软开发的WMA同样也是不少朋友所喜爱的，在低码率下，有着好过mp3很多的音质表现，WMA的出现，立刻淘汰了曾经风靡一时的VQF编码。

特点：低码率下的音质表现难有对手

适用于：数字电台架设、在线试听、低要求下的音乐欣赏

6.6 MP3PRO格式

作为mp3的改良版本的mp3PRO表现出了相当不错的素质，高音丰满，虽然mp3PRO是通过SBR技术在播放过程中插入的，但实际听感相当不错，虽然显得有点单薄，但在64kbps的世界里已经没有对手了，甚至超过了128kbps的mp3，但很遗憾的是，mp3PRO的低频表现也象mp3一样的破，所幸的是，SBR的高频插值可以或多或少的掩盖掉这个缺陷，因此mp3PRO的低频弱势反而不如WMA那么明显。整体而言，64kbps的mp3PRO达到了128kbps的mp3的音质水平，在高频部分还略有胜出。

特点：低码率下的音质之王。

适用于：低要求下的音乐欣赏。

6.7 APE格式

一种新兴的无损音频编码，可以提供50-70%的压缩比，虽然比起有损编码来太不值得一提了，但对于追求完美注意的朋友简直是天大的福音。APE可以做到真正的无损，而不是听起来无损，压缩比也要比类似的无损格式要好。

特点：音质非常好。

适用于：最高品质的音乐欣赏及收藏。

6.8 MIDI格式

MIDI是Musical InstrumentDigital Interface的缩写，又称作乐器数字接口，是数字音乐/电子合成乐器的统一国际标准。它定义了计算机音乐程序、数字合成器及其它电子设备交换音乐信号的方式，规定了不同厂家的电子乐器与计算机连接的电缆和硬件及设备间数据传输的协议，可以模拟多种乐器的声音。MIDI文件就是MIDI格式的文件，在MIDI文件中存储的是一些指令。把这些指令发送给声卡，由声卡按照指令将声音合成出来。

七、常用音频处理开源库

7.1 OpenAL

OpenAL是自由软件界的跨平台音效API。OpenAL最初是由LokiSoftware所开发，是为了将Windows商业游戏移植到Linux上。Loki倒闭以后，这个项目由自由软件/开放源始码社群继续维护。
http://www.openal.org/

7.2 speex

Speex提供一个可以替代高性能语音编解码来降低语音应用输入门槛。另外，相对于其它编解码器，Speex也很适合网络应用，在网络应用上有着自己独特的优势。
https://www.speex.org/

最后，推荐一个免费的音频处理软件Audacity，在Windows和Linux都有对应的软件，非常好用。
https://www.audacityteam.org/

7.3 ffmpeg

FFmpeg是一套可以用来记录、转换数字音频、视频，并能将其转化为流的开源计算机程序。采用LGPL或GPL许可证。它提供了录制、转换以及流化音视频的完整解决方案。
http://ffmpeg.org/

7.4 Opus

opus是一种声音编码格式，Opus的前身是celt编码器。是由IETF开发，适用于网络上的实时声音传输，标准格式为RFC 6716。
http://opus-codec.org/

另外，对于Android系统常用的VoIP相关的开源应用有：imsdroid，sipdroid，csipsimple，linphone，WebRTC等等。

“晚节不保”与“浪子回头” 锦瑟_db50
今天听音频，听到这两个熟悉的词——晚节不保、浪子回头。认真思量，对这两种情况，我们一般的认知中是缺乏公允的。我们听到“晚节不保”时，通常是痛惜不已，甚至感觉对方重要露出狐狸尾巴，有大快人心之感。很多人对古今名人，特别是对古今伟人的“背后的故事”很感兴趣，一方面是猎奇，一方面不能不说是一种险恶的用心——看看他也不过如此，和我们也没什么不同。这个“毁神”的过程，实际上是为自己的堕落找理由的方式。而“晚
pyhon+ffmpeg 常用音视频处理命令不再游移 ffmpeg 音视频 python
FFmpeg是多媒体领域的万能工具。只要涉及音视频领域的处理，基本上没有它做不了的事情！通俗点讲，从视频录制、视频编辑再到播放，它都能做！前段时间做了个短视频自动化脚本项目，需要自动处理音视频（包括一些合成、拼接、转场、调色等等），当时做的时候找各种命令还是很痛苦的，因此对用到的所有处理命令做了个汇总，方便以后使用。目录一、获取音频时长二、获取视频信息三、获取视频时长四、多个视频合并五、视频提取视
丹青医姐：吐字归音丹青医姐
对于朗读者来说，吐字清晰，珠圆玉润，听起来温柔而坚定，也格外暖心。这就要靠唇舌力度和正确的吐字归音。唇舌力度可以靠口部操和绕口令来练习。而正确的吐字归音应该是叼住字头，字腹立起，字尾弱收，枣核形的吐字流程。字腹立起，这个知道，将口腔打开。而字头如何叼，字尾如何弱收，一直不明白，以致于怀疑自己的声音不能达到温柔而坚定。当我听了一个音频，老师示范了一下，才知道，字头应该有力饱满，字尾变弱收音，听起来字
我们一起成长感悟郑珍容
我们一起成长7感悟感恩姚老师的分享，非常的荣幸作为义工让我又机会听到这么好的音频。今天的主题，相对于生命的困境，你现在所做的义工或者帮助他人遇到的困难简直就是小巫见大巫。今天的音频，让我反思，我是否有在帮助他人的时候，遇到一点困难我就会感觉到痛苦，难受、想放弃？过去一定有的，但是从学习金刚智慧开始，我很开心，我很享受帮助他人的善行。一个终极的问题，曾经思考了很久，一直不见清晰的回答，今天从老师的音
音视频知识图谱 2022.04 关键帧Keyframe
前些时间，我在知识星球上创建了一个音视频技术社群：关键帧的音视频开发圈，在这里群友们会一起做一些打卡任务。比如：周期性地整理音视频相关的面试题，汇集一份音视频面试题集锦，你可以看看《音视频面试题集锦2022.04》。再比如：循序渐进地归纳总结音视频技术知识，绘制一幅音视频知识图谱。下面是2022.04月知识图谱新增的内容节选：1）图谱路径：**采集/音频采集/声音三要素/响度******主观计量响
使用ffmpeg将pcm格式音频转化为mp3格式音频布丁小站 ffmpeg pcm 音视频
voidAudioCode::ENcode(AVCodecContext*cdc_ctx,AVFrame*frame,AVPacket*pkt){intret=0;/*sendtheframeforencoding*/ret=avcodec_send_frame(cdc_ctx,frame);if(ret=0){ret=avcodec_receive_packet(cdc_ctx,pkt);if(
【人工智能】多模态AI：如何通过融合文本、图像与音频重塑智能系统未来 2的n次方_ 小水文人工智能图像处理
我的主页：2的n次方_随着人工智能技术的飞速发展，多模态AI逐渐成为构建智能系统的重要方向。传统的AI系统通常依赖于单一模态的数据，如文本、图像或音频。而多模态AI通过结合多种数据类型，能够在更复杂的场景下提供更智能的解决方案。本文将深入探讨多模态AI的原理、应用场景及其未来发展，并通过代码示例展示如何构建一个多模态AI系统。1.多模态AI的基本原理多模态AI的核心在于融合来自不同模态（如文本、图
什么是AIGC？有哪些免费工具？ chent_某位 AIGC
AIGC（AIGeneratedContent），即“人工智能生成内容”，是指通过人工智能技术自动生成各种类型的数字内容。AIGC让机器能够根据输入的信息或数据生成符合人类需求的文本、图像、音频、视频等内容，极大提高了内容创作的效率。AIGC的背景与起源随着深度学习和自然语言处理技术的快速发展，人工智能已经不再局限于简单的任务，如分类、预测和数据分析，而是具备了生成内容的能力。生成式AI模型，如O
基于深度学习的多模态信息检索 SEU-WYL 深度学习dnn 深度学习人工智能
基于深度学习的多模态信息检索（MultimodalInformationRetrieval,MMIR）是指利用深度学习技术，从包含多种模态（如文本、图像、视频、音频等）的数据集中检索出满足用户查询意图的相关信息。这种方法不仅可以处理单一模态的数据，还可以在多种模态之间建立关联，从而更准确地满足用户需求。1.多模态信息检索的挑战异构数据表示：多模态数据通常具有不同的特征和表示形式（如文本的词嵌入与图
谷歌将把那些冗长的文档变成你下一个最喜欢的播客 AI研报人工智能
如果你有很多学校或工作的阅读任务，但更喜欢听播客，谷歌全新的AI驱动的AudioOverview工具可以满足你的需求。这项工具首次在今年的GoogleI/O大会上展示，AudioOverviews可以让你将文档、幻灯片和其他文本转换为一个AI主持的音频节目，讨论相关主题。谷歌将这项功能作为一种帮助那些通过听比读更容易理解复杂信息的人消化这些信息的方式。如果你更喜欢听别人讨论一个话题而不是阅读报告，
GB28181应急救援行业视音频解决方案探究和技术实现音视频牛哥 GB28181接入 SmartGBD 实时音视频 GB28181客户端 GB28181应急救援 GB28181设备 GB28181平台 GB28181安卓端大牛直播SDK
技术背景应急救援是一项针对突发、具有破坏力的紧急事件采取预防、预备、响应和恢复的活动与计划。这些紧急事件可能包括自然灾害（如地震、洪水、台风）、事故灾难（如火灾、爆炸、交通事故）、公共卫生事件（如疫情、食物中毒）等。应急救援工作的有效实施对于保障公众的生命安全、减轻灾害损失、维护社会稳定具有重要意义。GB28181应急救援技术优势GB28181在应急救援行业的应用解决方案主要体现了其在视频监控、数
课时目标浪漫的巴布亚企鹅
人教版八年级上册unitthree，I'mmoreoutgoingthanmysister.主题范畴，人与社会主题下的社会服务与人际沟通良好的人际关系与人际交往。本单元共分为两部分，结合两部分的语篇，制定学习目标。通过本单元的学习，1.学生能够结合图片，通过含有比较级句式的音频分辨出不同的人物。2.能够通过例句模仿、使用含有比较级的句式，从外貌特征和性情方面对比谈论人与人的不同之处。3.通过对比自
sox处理mp3_sox :音频文件转换命令 weixin_39615741 sox处理mp3
在开发呼叫中心的过程中要播放语音，要把自己录制的语音的wav格式转换为gsm格式，asterisk中也支持wav格式，但是不清楚为什么wav文件大一些就无法播放，所以只有转换为gsm格式。命令：sox00.wav-r8000-c100.gsmresample-ql下面的是在网上找到的一篇文章文章来源Sox是最为著名的OpenSource声音文件格式转换工具。已经被广泛移植到Dos、windows、
递归处理文件夹内所有音频的范例 shawncheer 语音算法
1、Python脚本功能：另有介绍可以参考：https://rollingstarky.github.io/2018/12/18/processing-audio-with-sox/该python脚本功能为递归处理文件夹下所有文件的，并递归输出到另一个文件夹，这里是格式转换，用sox把格式同样转换为单通道，8k16bit数据。#!/usr/bin/pythonimportosimportsysim
FFmpeg安装与使用教程 vvvae1234 ffmpeg
FFmpeg是一个强大且灵活的命令行工具，用于处理音频和视频文件。无论是视频格式转换、音频提取还是视频编辑，FFmpeg都能够轻松完成。掌握FFmpeg，将为你的视频处理工作提供极大的便利。在本教程中，我们将详细介绍FFmpeg的安装和使用，包括一些实用的操作案例，帮助你更好地理解如何使用这个强大的工具。2.FFmpeg简介2.1什么是FFmpegFFmpeg是一个开源的音视频处理库，提供了丰富的
晨间日记2021-4-04 蚊蚊幸福妈妈联盟
活在当下，少说多做，知行合一早睡早起5：30～10：30英语+家庭+经络【今日青蛙】点亮自己的明灯早上:大礼拜上午：增城中午:午休下午:增城晚上:跳舞【优秀是一种习惯，让开心成为一种习惯】事业～录音频听课文字稿健康～跑步跳舞家庭～和先生跑步心灵～经络大礼拜159
老A爷爷幸福父母音频宅萌姊
亲子问答与孩子意见有分歧原来要这样说本期音频感悟现在有一个怪现象，我们以为最容易沟通的家人，反而越不好沟通！以为很了解对方，而真实的感受是，我们往往只看到了表相，对方内心的恐惧、怀疑、渴望和很多念头，我们无法感受到。失去了想去了解的好奇心，只是按自己以为的觉得！孩子出了问题，家长第一反应是到处找解决办法，不停的想帮他们解决。而事实上，就我家里，不停的折腾觉得有很多问题的姐姐，效果并没有我所期待的转
第二单元复盘 - 草稿徐胜鑫
1，从本单元中我学到的最重要的概念（精读和视听说分别总结）精读:喜欢以前互相信任的年代，电子锁，锁的不是安全，是心与心的交流视听说:表情比文字更能表达情绪2，我在本片文章／音频／视频中学到的怦然心动的单词（精读和视听说分别总结）精读∶vulnerable，tranquil，private，premises，paste，barricade，error，devise，civilize，departur
想学配音可以去哪个学校，想学配音怎么自学配音就业圈
一、如何选择学配音的学校选择学配音的学校需要考虑以下几个因素：兼职副业推荐公众号，配音新手圈，声优配音圈，新配音兼职圈，配音就业圈，鼎音副业，有声新手圈，每天更新各种远程工作与在线兼职，职位包括：写手、程序开发、剪辑、设计、翻译、配音、无门槛、插画、翻译、等等。。。每日更新兼职。声音设备和录音室的质量：学校是否提供先进的音频设备和专业的录音室，这是学习配音必备的条件。教师团队的专业素质：学校的教师
大模型中的多模态概念指的是什么张3蜂计算机视觉人工智能深度学习
大模型中的多模态（Multimodal）概念是指模型能够同时处理和理解来自多种类型的数据或信息模式（modalities），如文本、图像、音频、视频等。这种模型不仅可以从单一模态（如仅文本或仅图像）中学习，还能够结合多种模态的数据，从而增强模型的理解能力和表现。以下是一些与多模态相关的核心概念：模态（Modalities）：指的是数据的不同形式或类型。常见的模态包括：文本（Text）：自然语言文本
肥高眼系列之五十一 —— 就事论事暖暖客厅工作室
事情就是事情，当我们不加任何的好恶的时候，我回到了事情的本身。昨天晚上失眠，我不加任何的评判在失眠这件事情的时候，于是就拿起来书去看，也找到了喜欢的音频来听，四点多困了就睡了，早上一样七点十五开始来公司，七点半之前到公司，冥想。在这件事情上面，不加任何的失眠带来的坏处等等想法。当我早上起来头晕晕的时候，我知道我需要中午补补觉，想到这里没有继续思想。当自己在昨天看书的一瞬间，突然忘记了书里主人公的名
音视频入门基础：WAV专题（11）——FFmpeg源码中计算WAV音频文件每个packet的pts_time、dts_time的实现 cuijiecheng2018 FFmpeg源码分析音视频技术音视频 ffmpeg
=================================================================音视频入门基础：WAV专题系列文章：音视频入门基础：WAV专题（1）——使用FFmpeg命令生成WAV音频文件音视频入门基础：WAV专题（2）——WAV格式简介音视频入门基础：WAV专题（3）——FFmpeg源码中，判断某文件是否为WAV音频文件的实现音视频入门基础：W
QT进行音频录制金博客 Qt qt 音视频 c++
文章目录QT使用`AudioRecorder`进行音频录制首先，确保你的项目文件`.pro`包含多媒体模块：然后，在Qt应用程序中，创建Widget类：小结QT使用AudioRecorder进行音频录制使用Qt框架的AudioRecorder类进行音频录制，可以通过Qt的MultimediaWidgets模块实现。‌首先，确保你的Qt项目中包含了MultimediaWidgets模块‌。这通常在项
Android音频路由策略 zhuyong006 Android-Audio
Android音频路由策略1.分析音频的默认路由在之前的文章音频输出设备是如何决定的中，我们知道AudioTrack的创建过程会调用到getOutputForAttrstatus_tAudioPolicyManager::getOutputForAttr(constaudio_attributes_t*attr,audio_io_handle_t*output,audio_session_tses
Android10 音频架构之耳麦插拔 @OuYang 车载系统
xref:/frameworks/base/core/res/res/values/config.xml29 30 @string/status_bar_alarm_clock31 @string/status_bar_rotate32 @string/status_bar_headset33 @string/status_bar_da
景联文科技：专业数据标注公司，推动AI技术革新景联文科技人工智能
数据标注作为AI技术发展的重要支撑，对于训练高质量的机器学习模型以及推动应用领域的创新具有不可替代的作用。景联文科技作为专业的数据标注公司，致力于提供专业的数据标注服务，帮助客户解决AI链条中的数据处理难题，共同推动人工智能技术的进步与发展。一站式数据标注服务景联文科技提供一站式的数据标注服务，涵盖从图像、视频、音频到文本等多种数据类型。•图像标注：对象检测、语义分割、关键点标注、多边形标注等。•
android音频切换到蓝牙耳机,在Android上将音频路由到蓝牙耳机(非A2DP) weixin_39710594
我有一个非A2DP单耳BT耳机(Plantronics510)，并希望使用它与我的AndroidHTCMagic听低质量的音频，如播客/有声书。经过多次谷歌搜索，我发现只有电话音频可以路由到非A2DP蓝牙耳机。(我想知道，如果你已经找到一个现成的解决方案来路由各种音频到非A2DP蓝牙耳机)所以我想，无论如何，以编程方式，我可以将音频传输到携带电话通话音频的流。这样我会愚弄手机携带我的mp3音频到我
Android AudioPolicy策略的实现过程分析（二）：CarAudioService和自定义音频焦点策略神奇海螺666 Android学习 Android音频 android java 安卓
摘要：Android系统中与Automotive相关的代码会被编译成一个名为CarService的apk存在于车机中，CarService中包括了众多和Car功能相关的Service，其中就包括CarAudioService。CarAudioService在初始化时会获取系统的音频策略配置参数并试图构造并注册AudioPolicy类，AudioPolicy.java是Java层音频策略的总设计图，
Android10 车载音频架构之动态路由的配置 @OuYang 车载系统
启用AAOS路由xref:/packages/services/Car/service/res/values/config.xmltrue如果设为false，路由和大部分CarAudioService将被停用，并且AAOS会回退到AudioService的默认行为。xref:/packages/services/Car/service/src/com/android/car/audio/CarAu
感赏涂小倩
感赏自己坚持听音频，上班路上下班路上，认真听音频，听了锦明老师的音频，让我的心渐渐的平静下来，对表扬又深入理解，反复听表扬要及时，要重复，要有感而发。特别是有感而发我感触很深，感觉顺位，自己确实有时候没做到位，对孩子，对自己，没有打心底感赏，平时自己感觉基调过于匮乏，这就是我学习了这么久进步很慢的原因。我一定要勤于练习，做一个每天喜悦开心的妈妈。感赏自己晚上回来坚持第一个小时的书，对白天的音频我开
异常的核心类Throwable 无量 java 源码异常处理 exception
java异常的核心是Throwable，其他的如Error和Exception都是继承的这个类里面有个核心参数是detailMessage，记录异常信息，getMessage核心方法，获取这个参数的值，我们可以自己定义自己的异常类，去继承这个Exception就可以了，方法基本上，用父类的构造方法就OK，所以这么看异常是不是很easy package com.natsu;
mongoDB 游标（cursor）实现分页迭代开窍的石头 mongodb
上篇中我们讲了mongoDB 中的查询函数，现在我们讲mongo中如何做分页查询如何声明一个游标 var mycursor = db.user.find({_id:{$lte:5}}); 迭代显示游标数
MySQL数据库INNODB 表损坏修复处理过程 0624chenhong tomcat mysql
最近mysql数据库经常死掉，用命令net stop mysql命令也无法停掉，关闭Tomcat的时候，出现Waiting for N instance(s) to be deallocated 信息。查了下，大概就是程序没有对数据库连接释放，导致Connection泄露了。因为用的是开元集成的平台，内部程序也不可能一下子给改掉的，就验证一下咯。启动Tomcat,用户登录系统，用netstat -
剖析如何与设计人员沟通不懂事的小屁孩工作
最近做图烦死了，不停的改图，改图……。烦，倒不是因为改，而是反反复复的改，人都会死。很多需求人员不知该如何与设计人员沟通，不明白如何使设计人员知道他所要的效果，结果只能是沟通变成了扯淡，改图变成了应付。那应该如何与设计人员沟通呢？我认为设计人员与需求人员先天就存在语言障碍。对一个合格的设计人员来说，整天玩的都是点、线、面、配色，哪种构图看起来协调；哪种配色看起来合理心里跟明镜似的，
qq空间刷评论工具换个号韩国红果果 JavaScript
var a=document.getElementsByClassName('textinput'); var b=[]; for(var m=0;m<a.length;m++){ if(a[m].getAttribute('placeholder')!=null) b.push(a[m]) } var l
S2SH整合之session 灵静志远 spring AOP struts session
错误信息： Caused by: org.springframework.beans.factory.BeanCreationException: Error creating bean with name 'cartService': Scope 'session' is not active for the current thread; consider defining a scoped
xmp标签 a-john 标签
今天在处理数据的显示上遇到一个问题： var html = '<li><div class="pl-nr"><span class="user-name">' + user + '</span>' + text + '</div></li>'; ulComme
Ajax的常用技巧（2）---实现Web页面中的级联菜单 aijuans Ajax
在网络上显示数据，往往只显示数据中的一部分信息，如文章标题，产品名称等。如果浏览器要查看所有信息，只需点击相关链接即可。在web技术中，可以采用级联菜单完成上述操作。根据用户的选择，动态展开，并显示出对应选项子菜单的内容。在传统的web实现方式中，一般是在页面初始化时动态获取到服务端数据库中对应的所有子菜单中的信息，放置到页面中对应的位置，然后再结合CSS层叠样式表动态控制对应子菜单的显示或者隐
天-安-门，好高 atongyeye 情感
我是85后，北漂一族，之前房租1100，因为租房合同到期，再续，房租就要涨150。最近网上新闻，地铁也要涨价。算了一下，涨价之后，每次坐地铁由原来2块变成6块。仅坐地铁费用，一个月就要涨200。内心苦痛。晚上躺在床上一个人想了很久，很久。我生在农
android 动画百合不是茶 android 透明度平移缩放旋转
android的动画有两种 tween动画和Frame动画 tween动画;,透明度,缩放,旋转,平移效果 Animation 动画 AlphaAnimation 渐变透明度 RotateAnimation 画面旋转 ScaleAnimation 渐变尺寸缩放 TranslateAnimation 位置移动 Animation
查看本机网络信息的cmd脚本 bijian1013 cmd
@echo 您的用户名是：%USERDOMAIN%\%username%>"%userprofile%\网络参数.txt" @echo 您的机器名是：%COMPUTERNAME%>>"%userprofile%\网络参数.txt" @echo ___________________>>"%userprofile%\
plsql 清除登录过的用户征客丶 plsql
tools---preferences----logon history---history 把你想要删除的删除 -------------------------------------------------------------------- 若有其他凝问或文中有错误，请及时向我指出，我好及时改正，同时也让我们一起进步。 email ： binary_spac
【Pig一】Pig入门 bit1129 pig
Pig安装 1.下载pig wget http://mirror.bit.edu.cn/apache/pig/pig-0.14.0/pig-0.14.0.tar.gz 2. 解压配置环境变量如果Pig使用Map/Reduce模式，那么需要在环境变量中，配置HADOOP_HOME环境变量 expor
Java 线程同步几种方式 BlueSkator volatile synchronized ThredLocal ReenTranLock Concurrent
为何要使用同步？ java允许多线程并发控制，当多个线程同时操作一个可共享的资源变量时（如数据的增删改查），将会导致数据不准确，相互之间产生冲突，因此加入同步锁以避免在该线程没有完成操作之前，被其他线程的调用，从而保证了该变量的唯一性和准确性。 1.同步方法&
StringUtils判断字符串是否为空的方法（转帖） BreakingBad null StringUtils “”
转帖地址：http://www.cnblogs.com/shangxiaofei/p/4313111.html public static boolean isEmpty(String str) 　　判断某字符串是否为空，为空的标准是 str== null 或 str.length()== 0
编程之美-分层遍历二叉树 bylijinnan java 数据结构算法编程之美
import java.util.ArrayList; import java.util.LinkedList; import java.util.List; public class LevelTraverseBinaryTree { /** * 编程之美分层遍历二叉树 * 之前已经用队列实现过二叉树的层次遍历，但这次要求输出换行，因此要
jquery取值和ajax提交复习记录 chengxuyuancsdn jquery取值 ajax提交
// 取值 // alert($("input[name='username']").val()); // alert($("input[name='password']").val()); // alert($("input[name='sex']:checked").val()); // alert($("
推荐国产工作流引擎嵌入式公式语法解析器-IK Expression comsci java 应用服务器工作 Excel 嵌入式
这个开源软件包是国内的一位高手自行研制开发的，正如他所说的一样，我觉得它可以使一个工作流引擎上一个台阶。。。。。。欢迎大家使用，并提出意见和建议。。。 ----------转帖--------------------------------------------------- IK Expression是一个开源的（OpenSource），可扩展的（Extensible），基于java语言
关于系统中使用多个PropertyPlaceholderConfigurer的配置及PropertyOverrideConfigurer daizj spring
1、PropertyPlaceholderConfigurer Spring中PropertyPlaceholderConfigurer这个类，它是用来解析Java Properties属性文件值，并提供在spring配置期间替换使用属性值。接下来让我们逐渐的深入其配置。基本的使用方法是：(1) <bean id="propertyConfigurerForWZ&q
二叉树:二叉搜索树 dieslrae 二叉树
所谓二叉树,就是一个节点最多只能有两个子节点,而二叉搜索树就是一个经典并简单的二叉树.规则是一个节点的左子节点一定比自己小,右子节点一定大于等于自己(当然也可以反过来).在树基本平衡的时候插入,搜索和删除速度都很快,时间复杂度为O(logN).但是,如果插入的是有序的数据,那效率就会变成O(N),在这个时候,树其实变成了一个链表. tree代码:
C语言字符串函数大全 dcj3sjt126com c function
C语言字符串函数大全函数名: stpcpy 功能: 拷贝一个字符串到另一个用法: char *stpcpy(char *destin, char *source); 程序例: #include <stdio.h> #include <string.h> int main
友盟统计页面技巧 dcj3sjt126com 技巧
在基类调用就可以了, 基类ViewController示例代码 -(void)viewWillAppear:(BOOL)animated { [super viewWillAppear:animated]; [MobClick beginLogPageView:[NSString stringWithFormat:@"%@",self.class]];
window下在同一台机器上安装多个版本jdk，修改环境变量不生效问题处理办法 flyvszhb java jdk
window下在同一台机器上安装多个版本jdk，修改环境变量不生效问题处理办法本机已经安装了jdk1.7，而比较早期的项目需要依赖jdk1.6，于是同时在本机安装了jdk1.6和jdk1.7. 安装jdk1.6前，执行java -version得到 C:\Users\liuxiang2>java -version java version "1.7.0_21&quo
Java在创建子类对象的同时会不会创建父类对象 happyqing java 创建子类对象父类对象
1.在thingking in java 的第四版第六章中明确的说了，子类对象中封装了父类对象， 2."When you create an object of the derived class, it contains within it a subobject of the base class. This subobject is the sam
跟我学spring3 目录贴及电子书下载 jinnianshilongnian spring
一、《跟我学spring3》电子书下载地址：《跟我学spring3》（1-7 和 8-13） http://jinnianshilongnian.iteye.com/blog/pdf 跟我学spring3系列 word原版下载二、源代码下载最新依
第12章 Ajax（上） onestopweb Ajax
index.html <!DOCTYPE html PUBLIC "-//W3C//DTD XHTML 1.0 Transitional//EN" "http://www.w3.org/TR/xhtml1/DTD/xhtml1-transitional.dtd"> <html xmlns="http://www.w3.org/
BI and EIM 4.0 at a glance blueoxygen BO
http://www.sap.com/corporate-en/press.epx?PressID=14787 有机会研究下EIM家族的两个新产品~~~~ New features of the 4.0 releases of BI and EIM solutions include: Real-time in-memory computing –
Java线程中yield与join方法的区别 tomcat_oracle java
长期以来，多线程问题颇为受到面试官的青睐。虽然我个人认为我们当中很少有人能真正获得机会开发复杂的多线程应用(在过去的七年中，我得到了一个机会)，但是理解多线程对增加你的信心很有用。之前，我讨论了一个wait()和sleep()方法区别的问题，这一次，我将会讨论join()和yield()方法的区别。坦白的说，实际上我并没有用过其中任何一个方法，所以，如果你感觉有不恰当的地方，请提出讨论。 &nb
android Manifest.xml选项阿尔萨斯 Manifest
结构继承关系 public final class Manifest extends Objectjava.lang.Objectandroid.Manifest 内部类 class Manifest.permission权限 class Manifest.permission_group权限组构造函数 public Manifest () 详细 androi
Oracle实现类split函数的方 zhaoshijie oracle
关键字：Oracle实现类split函数的方项目里需要保存结构数据，批量传到后他进行保存，为了减小数据量，子集拼装的格式，使用存储过程进行保存。保存的过程中需要对数据解析。但是oracle没有Java中split类似的函数。从网上找了一个，也补全了一下。 CREATE OR REPLACE TYPE t_split_100 IS TABLE OF VARCHAR2(100); cr