Raylu

SoundTouch音频处理库源码分析及算法提取(6)

TDStretch类的实现

SoundTouch类成员函数putSamples(const SAMPLETYPE *samples, uint nSamples)实现如下，根据上篇的分析rate是一个比率，大于1表示速度加快，小于1表示速度减慢，对于播放速度减慢这种情况。

……

#ifndef PREVENT_CLICK_AT_RATE_CROSSOVER

else if (rate <= 1.0f)

{

// transpose the rate down, output the transposed sound to tempo changer buffer

assert(output == pTDStretch);

pRateTransposer->putSamples(samples, nSamples);

pTDStretch->moveSamples(*pRateTransposer);

}

else

#endif

{

// evaluate the tempo changer, then transpose the rate up,

assert(output == pRateTransposer);

pTDStretch->putSamples(samples, nSamples);

pRateTransposer->moveSamples(*pTDStretch);

}

……

先通过pRateTransposer->putSamples(samples, nSamples);对声音进行了重采样，采用的是线性插值法，然后调用pTDStretch->moveSamples(*pRateTransposer);pTDStretch是TDStretch类的实例。TDStretch类定义如下：

/// Class that does the time-stretch (tempo change) effect for the processed

/// sound.

class TDStretch : public FIFOProcessor

{

protected:

int channels;

int sampleReq;

float tempo;

SAMPLETYPE *pMidBuffer;

SAMPLETYPE *pRefMidBuffer;

SAMPLETYPE *pRefMidBufferUnaligned;

int overlapLength;

int seekLength;

int seekWindowLength;

int overlapDividerBits;

int slopingDivider;

float nominalSkip;

float skipFract;

FIFOSampleBuffer outputBuffer;

FIFOSampleBuffer inputBuffer;

BOOL bQuickSeek;

// int outDebt;

// BOOL bMidBufferDirty;

int sampleRate;

int sequenceMs;

int seekWindowMs;

int overlapMs;

BOOL bAutoSeqSetting;

BOOL bAutoSeekSetting;

void acceptNewOverlapLength(int newOverlapLength);

virtual void clearCrossCorrState();

void calculateOverlapLength(int overlapMs);

virtual LONG_SAMPLETYPE calcCrossCorrStereo(const SAMPLETYPE *mixingPos, const SAMPLETYPE *compare) const;

virtual LONG_SAMPLETYPE calcCrossCorrMono(const SAMPLETYPE *mixingPos, const SAMPLETYPE *compare) const;

virtual int seekBestOverlapPositionStereo(const SAMPLETYPE *refPos);

virtual int seekBestOverlapPositionStereoQuick(const SAMPLETYPE *refPos);

virtual int seekBestOverlapPositionMono(const SAMPLETYPE *refPos);

virtual int seekBestOverlapPositionMonoQuick(const SAMPLETYPE *refPos);

int seekBestOverlapPosition(const SAMPLETYPE *refPos);

virtual void overlapStereo(SAMPLETYPE *output, const SAMPLETYPE *input) const;

virtual void overlapMono(SAMPLETYPE *output, const SAMPLETYPE *input) const;

void clearMidBuffer();

void overlap(SAMPLETYPE *output, const SAMPLETYPE *input, uint ovlPos) const;

void precalcCorrReferenceMono();

void precalcCorrReferenceStereo();

void calcSeqParameters();

/// Changes the tempo of the given sound samples.

/// Returns amount of samples returned in the "output" buffer.

/// The maximum amount of samples that can be returned at a time is set by

/// the 'set_returnBuffer_size' function.

void processSamples();

public:

TDStretch();

virtual ~TDStretch();

/// Operator 'new' is overloaded so that it automatically creates a suitable instance

/// depending on if we've a MMX/SSE/etc-capable CPU available or not.

static void *operator new(size_t s);

/// Use this function instead of "new" operator to create a new instance of this class.

/// This function automatically chooses a correct feature set depending on if the CPU

/// supports MMX/SSE/etc extensions.

static TDStretch *newInstance();

/// Returns the output buffer object

FIFOSamplePipe *getOutput() { return &outputBuffer; };

/// Returns the input buffer object

FIFOSamplePipe *getInput() { return &inputBuffer; };

/// Sets new target tempo. Normal tempo = 'SCALE', smaller values represent slower

/// tempo, larger faster tempo.

void setTempo(float newTempo);

/// Returns nonzero if there aren't any samples available for outputting.

virtual void clear();

/// Clears the input buffer

void clearInput();

/// Sets the number of channels, 1 = mono, 2 = stereo

void setChannels(int numChannels);

/// Enables/disables the quick position seeking algorithm. Zero to disable,

/// nonzero to enable

void enableQuickSeek(BOOL enable);

/// Returns nonzero if the quick seeking algorithm is enabled.

BOOL isQuickSeekEnabled() const;

/// Sets routine control parameters. These control are certain time constants

/// defining how the sound is stretched to the desired duration.

/// 'sampleRate' = sample rate of the sound

/// 'sequenceMS' = one processing sequence length in milliseconds

/// 'seekwindowMS' = seeking window length for scanning the best overlapping

/// position

/// 'overlapMS' = overlapping length

void setParameters(int sampleRate, ///< Samplerate of sound being processed (Hz)

int sequenceMS = -1, ///< Single processing sequence length (ms)

int seekwindowMS = -1, ///< Offset seeking window length (ms)

int overlapMS = -1 ///< Sequence overlapping length (ms)

);

/// Get routine control parameters, see setParameters() function.

/// Any of the parameters to this function can be NULL, in such case corresponding parameter

/// value isn't returned.

void getParameters(int *pSampleRate, int *pSequenceMs, int *pSeekWindowMs, int *pOverlapMs) const;

/// Adds 'numsamples' pcs of samples from the 'samples' memory position into

/// the input of the object.

virtual void putSamples(

const SAMPLETYPE *samples, ///< Input sample data

uint numSamples ///< Number of samples in 'samples' so that one sample

///< contains both channels if stereo

);

};

TDStretch类和基类的派生关系

FIFOSamplePipe-> FIFOProcessor->TDStretch

我们先看看他的构造函数

TDStretch::TDStretch() : FIFOProcessor(&outputBuffer)

{

bQuickSeek = FALSE;

channels = 2;

pMidBuffer = NULL;

pRefMidBufferUnaligned = NULL;

overlapLength = 0;

bAutoSeqSetting = TRUE;

bAutoSeekSetting = TRUE;

// outDebt = 0;

skipFract = 0;

tempo = 1.0f;

setParameters(44100, DEFAULT_SEQUENCE_MS, DEFAULT_SEEKWINDOW_MS, DEFAULT_OVERLAP_MS);

setTempo(1.0f);

clear();

}

一些参数的初始化。

先看看在源代码TDStretch.cpp中实现的类成员函数setParameters()

// Sets routine control parameters. These control are certain time constants

// defining how the sound is stretched to the desired duration.

// 'sampleRate' = sample rate of the sound

// 'sequenceMS' = one processing sequence length in milliseconds (default = 82 ms)

// 'seekwindowMS' = seeking window length for scanning the best overlapping

// position (default = 28 ms)

// 'overlapMS' = overlapping length (default = 12 ms)

void TDStretch::setParameters(int aSampleRate, int aSequenceMS,

int aSeekWindowMS, int aOverlapMS)

{

// accept only positive parameter values - if zero or negative, use old values instead

if (aSampleRate > 0) this->sampleRate = aSampleRate;

if (aOverlapMS > 0) this->overlapMs = aOverlapMS;

if (aSequenceMS > 0)

{

this->sequenceMs = aSequenceMS;

bAutoSeqSetting = FALSE;

}

else if (aSequenceMS == 0)

{

// if zero, use automatic setting

bAutoSeqSetting = TRUE;

}

if (aSeekWindowMS > 0)

{

this->seekWindowMs = aSeekWindowMS;

bAutoSeekSetting = FALSE;

}

else if (aSeekWindowMS == 0)

{

// if zero, use automatic setting

bAutoSeekSetting = TRUE;

}

calcSeqParameters();

calculateOverlapLength(overlapMs);

// set tempo to recalculate 'sampleReq'

setTempo(tempo);

}

其中主要参数的计算通过以下三个类成员函数来完成：

calcSeqParameters();

calculateOverlapLength(overlapMs);// set tempo to calculate 'sampleReq'

setTempo(tempo);

通过代码中类成员函数的实现，我们可以知道calcSeqParameters()用来计算seekWindowLength，还有seekLength，都是通过一个简单的换算公式Length = (sampleRate * sequenceMs) / 1000;毫秒换算到多少个Sample。

/// Calculates processing sequence length according to tempo setting

void TDStretch::calcSeqParameters()

{

// Adjust tempo param according to tempo, so that variating processing sequence length is used

// at varius tempo settings, between the given low...top limits

#define AUTOSEQ_TEMPO_LOW 0.5 // auto setting low tempo range (-50%)

#define AUTOSEQ_TEMPO_TOP 2.0 // auto setting top tempo range (+100%)

// sequence-ms setting values at above low & top tempo

#define AUTOSEQ_AT_MIN 125.0

#define AUTOSEQ_AT_MAX 50.0

#define AUTOSEQ_K ((AUTOSEQ_AT_MAX - AUTOSEQ_AT_MIN) / (AUTOSEQ_TEMPO_TOP - AUTOSEQ_TEMPO_LOW))

#define AUTOSEQ_C (AUTOSEQ_AT_MIN - (AUTOSEQ_K) * (AUTOSEQ_TEMPO_LOW))

// seek-window-ms setting values at above low & top tempo

#define AUTOSEEK_AT_MIN 25.0

#define AUTOSEEK_AT_MAX 15.0

#define AUTOSEEK_K ((AUTOSEEK_AT_MAX - AUTOSEEK_AT_MIN) / (AUTOSEQ_TEMPO_TOP - AUTOSEQ_TEMPO_LOW))

#define AUTOSEEK_C (AUTOSEEK_AT_MIN - (AUTOSEEK_K) * (AUTOSEQ_TEMPO_LOW))

#define CHECK_LIMITS(x, mi, ma) (((x) < (mi)) ? (mi) : (((x) > (ma)) ? (ma) : (x)))

double seq, seek;

if (bAutoSeqSetting)

{

seq = AUTOSEQ_C + AUTOSEQ_K * tempo;

seq = CHECK_LIMITS(seq, AUTOSEQ_AT_MAX, AUTOSEQ_AT_MIN);

sequenceMs = (int)(seq + 0.5);

}

if (bAutoSeekSetting)

{

seek = AUTOSEEK_C + AUTOSEEK_K * tempo;

seek = CHECK_LIMITS(seek, AUTOSEEK_AT_MAX, AUTOSEEK_AT_MIN);

seekWindowMs = (int)(seek + 0.5);

}

// Update seek window lengths

seekWindowLength = (sampleRate * sequenceMs) / 1000;

if (seekWindowLength < 2 * overlapLength)

{

seekWindowLength = 2 * overlapLength;

}

seekLength = (sampleRate * seekWindowMs) / 1000;

}

类成员函数calculateOverlapLength()计算重叠的长度，

/// Calculates overlapInMsec period length in samples.

void TDStretch::calculateOverlapLength(int overlapInMsec)

{

int newOvl;

assert(overlapInMsec >= 0);

newOvl = (sampleRate * overlapInMsec) / 1000;

if (newOvl < 16) newOvl = 16;

// must be divisible by 8

newOvl -= newOvl % 8;

acceptNewOverlapLength(newOvl);

}

类成员函数acceptNewOverlapLength()分配重叠部分需要占用的内存空间.

/// Set new overlap length parameter & reallocate RefMidBuffer if necessary.

void TDStretch::acceptNewOverlapLength(int newOverlapLength)

{

int prevOvl;

assert(newOverlapLength >= 0);

prevOvl = overlapLength;

overlapLength = newOverlapLength;

if (overlapLength > prevOvl)

{

delete[] pMidBuffer;

delete[] pRefMidBufferUnaligned;

pMidBuffer = new SAMPLETYPE[overlapLength * 2];

clearMidBuffer();

pRefMidBufferUnaligned = new SAMPLETYPE[2 * overlapLength + 16 / sizeof(SAMPLETYPE)];

// ensure that 'pRefMidBuffer' is aligned to 16 byte boundary for efficiency

pRefMidBuffer = (SAMPLETYPE *)((((ulong)pRefMidBufferUnaligned) + 15) & (ulong)-16);

}

类成员函数setTempo()重新设置了音频的伸缩.

// Sets new target tempo. Normal tempo = 'SCALE', smaller values represent slower

// tempo, larger faster tempo.

void TDStretch::setTempo(float newTempo)

{

int intskip;

tempo = newTempo;

// Calculate new sequence duration

calcSeqParameters();

// Calculate ideal skip length (according to tempo value)

nominalSkip = tempo * (seekWindowLength - overlapLength);

intskip = (int)(nominalSkip + 0.5f);

// Calculate how many samples are needed in the 'inputBuffer' to

// process another batch of samples

//sampleReq = max(intskip + overlapLength, seekWindowLength) + seekLength / 2;

sampleReq = max(intskip + overlapLength, seekWindowLength) + seekLength;

}

先记下Stretch用到的参数,现在我们来看看这些参数的实际物理意义。

音频的伸缩一般采用Sola的算法来实现。如下图所示：

算法大致如下：

从原始声音数据的开头处取出一定大小的数据，假如取7个sample，放在一个新的Buffer，如上图所示，然后在原始数据再往后面的数据中取9个sample，与前面的7个sample做一个叠加，叠加的范围我们假设为2，那么(7-2) /9 =0.555，这就意味着声音的持续时间和原来相比减少了约44.5%，同时注意到一点，时间的间隔(采样频率)并没有改变，也就是说声音的频率(音调)没有发生改变。至于为什么要叠加一部分，就是为了抑制这种由不连续的抽取声音信号造成的数据丢失所引发的噪音或者声音过度不自然。这个图对照上面TDStretch三个类成员函数，就理解了那些函数初始化的定义。同时变调不变调的处理过程更为清晰。就和SoundTouch类成员函数putSamples条件判断中的一致，无非就是先伸缩后重采样，或者先重采样再伸缩的问题。

Sola的具体流程，TDStretch类成员函数processSamples十分清晰的表达，先拷贝一个序列到开头，接着找到最佳的叠加位置，通过计算归一化互相关系数来比较得到，主要实现是通过类成员函数seekBestOverlapPosition(const SAMPLETYPE *refPos)判断是单声道和双声道，分别调用不同的 TDStretch::seekBestOverlapPositionXXXX(const SAMPLETYPE *refPos)；有浮点和定点两个版本，同样以单声道浮点版本为例：

int TDStretch::seekBestOverlapPositionMono(const SAMPLETYPE *refPos)

{

int bestOffs;

double bestCorr, corr;

int tempOffset;

const SAMPLETYPE *compare;

// Slopes the amplitude of the 'midBuffer' samples

precalcCorrReferenceMono();

bestCorr = FLT_MIN;

bestOffs = 0;

// Scans for the best correlation value by testing each possible position

// over the permitted range.

for (tempOffset = 0; tempOffset < seekLength; tempOffset ++)

{

compare = refPos + tempOffset;

// Calculates correlation value for the mixing position corresponding

// to 'tempOffset'

corr = (double)calcCrossCorrMono(pRefMidBuffer, compare);

// heuristic rule to slightly favour values close to mid of the range

double tmp = (double)(2 * tempOffset - seekLength) / seekLength;

corr = ((corr + 0.1) * (1.0 - 0.25 * tmp * tmp));

// Checks for the highest correlation value

if (corr > bestCorr)

{

bestCorr = corr;

bestOffs = tempOffset;

}

// clear cross correlation routine state if necessary (is so e.g. in MMX routines).

clearCrossCorrState();

return bestOffs;

}

类成员函数seekBestOverlapPositionMono调用了类成员函数calcCrossCorrMono()

double TDStretch::calcCrossCorrMono(const float *mixingPos, const float *compare) const

{

double corr;

double norm;

int i;

corr = norm = 0;

for (i = 1; i < overlapLength; i ++)

{

corr += mixingPos[i] * compare[i];

norm += mixingPos[i] * mixingPos[i];

}

if (norm < 1e-9) norm = 1.0; // to avoid div by zero

return corr / sqrt(norm);

}

根据互相关系数的计算公式corr = x(n)*h(-n);*为卷积。和我们的形式有点不一样。下次再慢慢分析。最后把后面一个序列拷贝到叠加的位置，叠加部分的幅值通过TDStretch类成员函数overlap来计算，具体代码如下，通过判断声道调用一个单声道或者双声道的类成员函数来处理。以单声道为例，主要考虑到比较好理解。其实双声道也差不多。就是注意处理数据循环的增量，和在循环处理中每次多一个右声道或者左声道的数据处理。

// Overlaps samples in 'midBuffer' with the samples in 'pInputBuffer' at position

// of 'ovlPos'.

inline void TDStretch::overlap(SAMPLETYPE *pOutput, const SAMPLETYPE *pInput, uint ovlPos) const

{

if (channels == 2)

{

// stereo sound

overlapStereo(pOutput, pInput + 2 * ovlPos);

} else {

// mono sound.

overlapMono(pOutput, pInput + ovlPos);

}

类成员函数overlapMono的具体实现如下：

// Overlaps samples in 'midBuffer' with the samples in 'pInput'

void TDStretch::overlapMono(SAMPLETYPE *pOutput, const SAMPLETYPE *pInput) const

{

int i, itemp;

for (i = 0; i < overlapLength ; i ++)

{

itemp = overlapLength - i;

pOutput[i] = (pInput[i] * i + pMidBuffer[i] * itemp ) / overlapLength; // >> overlapDividerBits;

}

pMidBuffer与pInput重叠，重叠长度为 overlapLength。

留意到核心的算法仅仅是一行代码pOutput[i] = (pInput[i] * i + pMidBuffer[i] * itemp ) / overlapLength;设a = i;b = itemp;k = overlapLength;x = pInput[i],y = pMidBuffer[i], z = pOutPut[i]把这行代码用下面两行伪代码替代：x,y分别作为系统的两个输入，z作为输出。

a + b = k;

ax + by = kz;

很眼熟，但是一会半刻又说不上来是什么。暂时记下吧。以后再搞明白这个算法叫什么。

本文来自CSDN博客，转载请标明出处：http://blog.csdn.net/suhetao/archive/2010/09/04/5863477.aspx

你可能感兴趣的:(音频处理)

轻松检测麦克风功能：使用Python的sounddevice和soundfile库 dongab_9 #脚本工具 1024程序员节 python
轻松检测麦克风功能在进行音频处理或开发需要使用麦克风的应用程序时，确保麦克风功能正常是非常重要的。本文将介绍一个简单的Python脚本，它能够帮助我们检测本地麦克风的功能，确保我们的设备能够正常录音。文章目录轻松检测麦克风功能脚本介绍一、Python环境准备二、代码解析三、使用方法脚本介绍下面是一个名为sound_check.py的Python脚本，它使用sounddevice库来检测和测试麦克风
使用Java播放MP3或Wav音频 Java编程乐园 Java音视频播放音视频 java
JavaSound是一个小巧的低层应用程序接口（API），它支持数字音频和乐器数字接口（MIDI）数据的记录和回放。在JDK1.3.0之前，JavaSound是一个标准的Java扩展API，但从Java2的1.3.0版开始，JavaSound就被包含到JDK之中。由于Java有着跨平台（操作系统、硬件平台）的特点，基于JavaSound的音频处理程序能够在任何实现了Java1.3以上版本的系统上运
中文绿色版，吊打付费！永久免费至2999年！ Ag大雨 windows
今天分享给大家一款吾爱大佬开发的神级软件美蛋工具箱美蛋多功能工具箱是一款综合性的电脑工具箱软件，它集成了多种实用工具，覆盖了图片、视频、文档、音频处理以及办公辅助等多个方面。软件界面简洁直观，易于操作，即使是电脑新手也能快速上手。软件功能图片处理：提供图片编辑、格式转换、图片压缩、批量转换等功能。此外，还有图片转ICO功能，大家可以将普通图片转换成图标文件，用于软件或网站的图标设计。视频处理：支持
socket多线程和Ringbuffer详解走别人不走的路 linux c语言 android
关注微信公众号：【快乐程序猿】查看更多篇章相信很多读者都知道多线程是什么，那RingBuffer可能就不太清楚了，那我们先来介绍下什么是RingBuffer。RingBuffer，也称为循环缓冲区，是一种固定大小的缓冲区，用于在生产者和消费者之间传递数据。它是一种数据结构，常用于需要缓冲数据流的场合，如音频处理、数据通信等。1.结构缓冲区大小:RingBuffer有一个固定的容量，即可以容纳的数据
python librosa音频处理库 Core IO and DSP（翻译文档） FQ_G 音频 librosa python
英文文档地址：http://librosa.github.io/librosa/core.html由于本人才疏学浅，如有翻译错误，请指出，谢谢！一、Audioprocessing1.1librosa.core.load加载音频，audioread这种方式能加载的音频格式，我一般都把音频处理成wav格式然后通过该函数加载。参数为：path:音频路径sr:音频频率（你可以不用原始的音频频率，他有重采样
librosa，一个很有趣的 Python 库！陈序不懂程序 python 开发语言
大家好，今天为大家分享一个很有趣的Python库-librosa。Github地址：https://github.com/librosa/librosa音频处理在现代科技和娱乐领域中起着越来越重要的作用。Python的Librosa库是一种强大的工具，用于音频分析和处理。本文将详细介绍Librosa库的各种功能和用法，以及提供丰富的示例代码，帮助大家更好地理解如何使用这个库来处理音频数据。什么是L
游戏系统开发红匣子实力推荐
游戏系统开发是指设计和构建一个游戏的底层框架和机制，以支持游戏的各种功能和玩法。它是游戏开发过程中至关重要的一部分，涉及到多个方面，包括游戏引擎、图形渲染、物理模拟、音频处理、网络通信等等。下面是一篇关于游戏系统开发的文章：开发-联系电话：13642679953（微信同号）游戏系统开发是游戏制作的核心环节之一，它涉及到游戏的整体架构和各个组件的设计。一个成功的游戏系统开发需要考虑到游戏的性能、可扩
什么是奈奎斯特采样定理达西西66 奈奎斯特采样定理
奈奎斯特采样定理，也被称为奈奎斯特定理或奈氏定理，是信号处理领域中至关重要的原理之一。它揭示了在数字信号处理中如何正确地采样模拟信号，以避免信息丢失和混叠现象。本文将深入探讨奈奎斯特采样定理的原理、应用和实例，以及其在通信、音频处理和图像处理等领域的重要性。奈奎斯特采样定理的基本原理奈奎斯特采样定理是由美国工程师哈里·S·奈奎斯特（HarryNyquist）在20世纪20年代提出的。该定理的核心思
YeAudio音频工具的介绍和使用夜雨飘零1 语音音视频语音识别 python ffmpeg
夜雨飘零音频工具这款Python音频处理工具功能强大，支持读取多种格式的音频文件。它不仅能够对音频进行裁剪、添加混响、添加噪声等多种处理操作，还广泛应用于语音识别、语音合成、声音分类以及声纹识别等多个项目领域。安装使用pip安装。pipinstallyeaudio-U-ihttps://pypi.tuna.tsinghua.edu.cn/simple（推荐）使用源码安装。gitclonehttps
iZotope Ozone 11 Advanced：专业音频制作与母带处理的巅峰之作平安喜乐616 音视频 iZotope Ozone 顶级音频后期制作软件
iZotopeOzone11Advanced是一款专为音频工程师、制作人和音乐人设计的顶级音频后期制作软件，无论是Mac还是Windows平台，都能为用户提供无与伦比的音频处理体验。该软件集成了最先进的人工智能技术和一系列精密的音频处理工具，让音频作品的最终声音效果达到广播级甚至更高水准。智能化音频处理：Ozone11Advanced的核心优势在于其智能化的音频处理技术。通过AIMasterAss
AMBA协议中的AXI-Stream：协议信号与设计实践嵌入式杂谈 fpga开发
在高性能嵌入式系统设计中，AMBA（AdvancedMicrocontrollerBusArchitecture）协议扮演着重要角色。其中，AXI-Stream协议是AMBA4.x规范的一部分，专为高吞吐量数据传输而设计，广泛应用于视频处理、音频处理、网络通信等领域。本文将探讨AXI-Stream协议的信号、设计原则和实践。1.AXI-Stream协议概述AXI-Stream是一种基于FIFO的单
USB音频 Tracy973 人工智能实时音视频音视频音频
现在越来越多的音频设备做成USB接口的，让用户能够通过USB接口连接音频设备到计算机或其他数字设备上，实现音频的输入和输出功能。音频USB接口有下面这些好处。便捷性和易用性：USB接口普及广泛，用户可以轻松地将音频设备连接到电脑、笔记本、平板电脑等设备上，无需专门的音频接口或扩展卡。数字音频传输：USB接口可以传输数字音频信号，允许音频设备直接与数字音频处理系统进行通信，提供更高的音频质量和清晰度
音频处理3_时域频域迪三 #NN_Audio 音频
本节主要讲音频的时域到频域的变换和理解我们以两个正弦波的组合信号为例，生成代码如下：#生成信号t=np.linspace(0,1,1000,endpoint=False)#时间轴freq1=5#5Hzfreq2=20#20Hzsignal=np.sin(2*np.pi*freq1*t)+0.5*np.sin(2*np.pi*freq2*t)#合成信号第1幅图是时域图，第2-3幅图是频率图，分别记录
Python标准库、第三方库和外部工具汇总 weixin_30650039 python 人工智能开发工具
导读：Python数据工具箱涵盖从数据源到数据可视化的完整流程中涉及到的常用库、函数和外部工具。其中既有Python内置函数和标准库，又有第三方库和工具。这些库可用于文件读写、网络抓取和解析、数据连接、数清洗转换、数据计算和统计分析、图像和视频处理、音频处理、数据挖掘/机器学习/深度学习、数据可视化、交互学习和集成开发以及其他Python协同数据工作工具。为了区分不同对象的来源和类型，本文将在描述
[转载] 140种Python标准库、第三方库和外部工具 ey_snail
参考链接：Python|使用openpyxl在Excel文件中进行算术运算这些库可用于文件读写、网络抓取和解析、数据连接、数清洗转换、数据计算和统计分析、图像和视频处理、音频处理、数据挖掘/机器学习/深度学习、数据可视化、交互学习和集成开发以及其他Python协同数据工作工具。为了区分不同对象的来源和类型，本文将在描述中通过以下方法进行标识：**Python内置函数：**Python自带的内置函数
Qt第十六章多媒体Multimedia yerennuo qt 开发语言
文章目录多媒体音频播放音频录制音频低延迟音效低级音频播放和录制推送和拉取解码压缩音频到内存与音频处理相关的类视频播放视频处理低级视频帧录制视频与视频处理相关的类支持的媒体格式多媒体cmakelist添加Multimedia模块设备信息查询#include#include#include#includevoidshowDevs(){QListinAudios=QMediaDevices::audio
掌握音频核心：Swift 中 Core Audio 的深度应用与实践杨哥带你写代码音视频 swift 开发语言
标题：掌握音频核心：Swift中CoreAudio的深度应用与实践在数字时代，音频处理已成为应用开发中不可或缺的一部分。无论是音乐播放、声音录制还是复杂的音频分析，CoreAudio作为Apple提供的一个强大的音频处理框架，它为开发者提供了丰富的API来处理各种音频任务。本文将带领读者深入了解如何在Swift中使用CoreAudio，通过实际代码示例，探索音频处理的奥秘。1.CoreAudio概
pr2024 Premiere Pro 2024 mac v24.2.1中文激活版 macw_q 程序人生
PremierePro2024forMac是Adobe公司推出的一款强大的视频编辑软件，专为Mac操作系统优化。它提供了丰富的剪辑工具、特效和音频处理选项，帮助用户轻松创建专业级的影视作品。软件下载：pr2024PremierePro2024macv24.2.1中文激活版无论是剪辑短片、制作广告还是处理长篇电影，PremierePro2024都能提供出色的性能和稳定性。其简洁直观的界面和强大的功能
FL Studio 21.2.3.4004 All Plugins Edition Win/Mac音乐软件 yanling2023 FL Studio21 mac软件热门软件 macos fl studio FL Studio 21
FLStudio21.2.3.4004AllPluginsEdition是一款功能强大的音乐制作软件，提供了丰富的音频处理工具和插件，适用于专业音乐制作人和爱好者。该软件具有直观的用户界面，支持多轨道录音、混音和编辑，以及各种音频效果和虚拟乐器。它还包含了大量预设和样本，可以帮助用户轻松地创建各种风格和类型的音乐作品。FLStudioAllPluginsEdition还提供了与其他软件和硬件设备的
C语言常见面试题：C语言中如何进行音频处理编程？广寒舞雪 C语言音视频
在C语言中进行音频处理编程通常涉及几个关键步骤：读取音频文件、处理音频数据、以及可能的音频输出。这需要使用一些专门的库来处理音频数据。以下是一个简单的概述：选择音频处理库：libsndfile：这是一个用于读取、写入和处理音频文件的库。它支持许多不同的音频格式。PortAudio：这是一个跨平台的音频I/O库。FFmpeg：这是一个非常强大的多媒体框架，可以用来处理音频、视频等。安装和设置库：根据
YY调音台：低延时直播机架 momo_studio 音频
在音频制作和直播行业中，YY调音台凭借其独特的功能和卓越性能，成为了专业人士的首选。这款软件不仅提供了一流的音频处理能力，还针对用户的实际需求进行了精心优化，从而提供了无与伦比的使用体验。以下是YY调音台的三大特色功能，这些功能共同构成了它在行业中的独特优势。1.低时延音频输出到YY应用首先，YY调音台在实现与YY生态内其他软件的互动方面表现出色，特别是在提供低时延音频输出方面。用户可以直接将音频
【Java万花筒】编织数字音符：Java多媒体魔法 friklogff Java万花筒 java 开发语言
Java多媒体处理大全：解锁音视频领域的绝佳工具库前言在当今数字化时代，多媒体处理已经成为Java开发者必不可少的一项技能。无论是开发多媒体应用、实时流媒体处理，还是进行视频编辑、音频转码，Java提供了丰富的库和工具。本文将介绍几个主要的Java多媒体处理库，涵盖视频编码、解码、音频处理等方面，为开发者提供全面的了解和实际应用指导。欢迎订阅专栏：Java万花筒文章目录Java多媒体处理大全：解锁
播放器 Audirvana Mac lx53mac Mac软件 macos
Audirvana是一款高品质的无损音乐播放器，支持多种无损音频格式，如FLAC、ALAC、WAV、AIFF等，能够以高解析度播放音乐，甚至支持DSD音频格式，提供最大限度的音频保真度。它还具有强大的音频处理功能，包括音量调节、均衡器、声道平衡、重播增益控制等，允许用户根据自己的需求调整音频效果，实现音频的最佳播放效果。此外，Audirvana还具有易于使用的音频库管理功能，用户可以轻松组织和浏览
【⭐AI工具⭐】实用工具推荐 STARBLOCKSHADOW 智能工具笔记奇招妙计人工智能 AI 实用工具
目录壹实用工具工具合集TinyWowHiPDF公式处理SimpleTex公式中常用的希腊字母符号公式在论文中的格式图像处理BgRemoverPixFix像素蒸发Photopea音频处理啦啦爱笔记整理飞书妙记素材整理Eagle其它一次性临时电子邮件近邻词汇检索据意查句诗三百能不能好好说话？这是什么动漫AIShort壹实用工具工具合集TinyWowTinyWow包含了处理PDF、图片、视频、文件以及A
QNX声音架构（QSA）入门指南 chuanpeng0130 linux
简介QNX声音架构（QSA）是QNX操作系统中用于处理音频输入和输出的高级、多功能音频框架。它提供了灵活的音频处理功能，包括音频捕获、播放、混音，以及与多种音频硬件的接口支持。QSA的设计旨在满足高性能和低延迟音频处理的需求。核心组件1.io-audioio-audio是QSA的核心守护进程，负责管理音频驱动和硬件。它支持动态加载音频驱动，并与硬件通信来执行音频操作。2.PCM设备PCM（脉冲编码
【自然语言处理】P2 PyTorch 基础 - 张量脚踏实地的大梦想家 #自然语言处理自然语言处理 pytorch 人工智能
目录安装PyTorch张量创建张量操作张量索引、切片、联合操作CUDA张量本系列博文我们将使用PyTorch来实现深度学习模型等。PyTorch是一个开源的、社区驱动的深度学习框架。拥有强大的工具和库生态系统，包含TorchVision（用于图像处理）、TorchText（用于文本处理）、TorchAudio（用于音频处理）等。安装PyTorch网址：https://pytorch.org/根据系
centOS安装音频处理软件Sox 飞扬々岁月服务器 centos
Sox不能直接处理音频，需要其他依赖包。yuminstallgcc-c++libmadlibmad-devellibid3taglibid3tag-devellamelame-develflac-devellibvorbis-develmake如果报错需要root权限，加sudo：sudoyuminstallgcc-c++libmadlibmad-devellibid3taglibid3tag-d
常用iOS、Mac框架和库及常用中文开发博客红枫1225 iOS
目录UI下拉刷新模糊效果AutoLayout富文本图表表相关隐藏与显示HUD与Toast对话框其他UI动画侧滑与右滑返回手势其他动画网络相关网络连接网络测试图像获取网络聊天网络测试WebViewModel其他数据库缓存处理PDF图像浏览及处理摄像照相视频音频处理响应式框架消息相关消息推送客户端消息推送服务器端通知相关版本新API的Demo代码安全与密码测试及调试AppleWatch完整项目VPNX
Android Media API 使用介绍大飞飞鱼 WebRTC 视频直播技术移动直播技术 Android多媒体接口
从事多媒体开发的同学，在对Android系统开发时，Android系统已经给我们提供了对视音频的强大支持，本文介绍Android的几个和视音频相关的类，通过这几个类的组合使用，其实是能变换出许多视音频处理的相关功能，下面就对这几个类进行简单介绍。MediaMetadataRetriever:用来获取视频的相关信息，例如视频宽高、时长、旋转角度、码率等等。MediaExtractor:：视音频分离器
[离散时间信号处理学习笔记] 13. 重采样资源分享吧1
重采样常用于音频处理。在用麦克风对音频进行采集的时候，常见的采样率有8k（电话）、44.1k（CD）、48k（视频音轨）、96k/192k（Hi-Res），而某些系统会有默认固定的输出采样率（如Android的默认输出采样率为44.1k），此时就需要对输入音频数据进行重采样。重采样的源样本序列为x[n]x[n]=xc(nT)重采样的目标序列为x′[n]x′[n]=xc(nT′)如何通过x[n]得到
redis学习笔记——不仅仅是存取数据 Everyday都不同 returnSource expire/del incr/lpush 数据库分区 redis
最近项目中用到比较多redis，感觉之前对它一直局限于get/set数据的层面。其实作为一个强大的NoSql数据库产品，如果好好利用它，会带来很多意想不到的效果。（因为我搞java，所以就从jedis的角度来补充一点东西吧。PS：不一定全，只是个人理解，不喜勿喷） 1、关于JedisPool.returnSource(Jedis jeids) 这个方法是从red
SQL性能优化-持续更新中。。。。。。 atongyeye oracle sql
1 通过ROWID访问表--索引你可以采用基于ROWID的访问方式情况,提高访问表的效率, , ROWID包含了表中记录的物理位置信息..ORACLE采用索引(INDEX)实现了数据和存放数据的物理位置(ROWID)之间的联系. 通常索引提供了快速访问ROWID的方法,因此那些基于索引列的查询就可以得到性能上的提高. 2 共享SQL语句--相同的sql放入缓存 3 选择最有效率的表
[JAVA语言]JAVA虚拟机对底层硬件的操控还不完善 comsci JAVA虚拟机
如果我们用汇编语言编写一个直接读写CPU寄存器的代码段，然后利用这个代码段去控制被操作系统屏蔽的硬件资源，这对于JVM虚拟机显然是不合法的，对操作系统来讲，这样也是不合法的，但是如果是一个工程项目的确需要这样做，合同已经签了，我们又不能够这样做，怎么办呢？那么一个精通汇编语言的那种X客，是否在这个时候就会发生某种至关重要的作用呢？ &n
lvs- real 男人50 LVS
#!/bin/bash # # Script to start LVS DR real server. # description: LVS DR real server # #. /etc/rc.d/init.d/functions VIP=10.10.6.252 host='/bin/hostname' case "$1" in sta
生成公钥和私钥 oloz DSA 安全加密
package com.msserver.core.util; import java.security.KeyPair; import java.security.PrivateKey; import java.security.PublicKey; import java.security.SecureRandom; public class SecurityUtil {
UIView 中加入的cocos2d，背景透明 374016526 cocos2d glClearColor
要点是首先pixelFormat:kEAGLColorFormatRGBA8，必须有alpha层才能透明。然后view设置为透明glView.opaque = NO;[director setOpenGLView:glView];[self.viewController.view setBackgroundColor:[UIColor clearColor]];[self.viewControll
mysql常用命令香水浓 mysql
连接数据库 mysql -u troy -ptroy 备份表 mysqldump -u troy -ptroy mm_database mm_user_tbl > user.sql 恢复表（与恢复数据库命令相同） mysql -u troy -ptroy mm_database < user.sql 备份数据库 mysqldump -u troy -ptroy
我的架构经验系列文章 - 后端架构 - 系统层面 agevs JavaScript jquery css html5
系统层面：高可用性所谓高可用性也就是通过避免单独故障加上快速故障转移实现一旦某台物理服务器出现故障能实现故障快速恢复。一般来说，可以采用两种方式，如果可以做业务可以做负载均衡则通过负载均衡实现集群，然后针对每一台服务器进行监控，一旦发生故障则从集群中移除；如果业务只能有单点入口那么可以通过实现Standby机加上虚拟IP机制，实现Active机在出现故障之后虚拟IP转移到Standby的快速
利用ant进行远程tomcat部署 aijuans tomcat
在javaEE项目中，需要将工程部署到远程服务器上，如果部署的频率比较高，手动部署的方式就比较麻烦，可以利用Ant工具实现快捷的部署。这篇博文详细介绍了ant配置的步骤（http://www.cnblogs.com/GloriousOnion/archive/2012/12/18/2822817.html），但是在tomcat7以上不适用，需要修改配置，具体如下： 1.配置tomcat的用户角色
获取复利总收入 baalwolf 获取
public static void main(String args[]){ int money=200; int year=1; double rate=0.1; &
eclipse.ini解释 BigBird2012 eclipse
大多数java开发者使用的都是eclipse，今天感兴趣去eclipse官网搜了一下eclipse.ini的配置，供大家参考，我会把关键的部分给大家用中文解释一下。还是推荐有问题不会直接搜谷歌，看官方文档，这样我们会知道问题的真面目是什么，对问题也有一个全面清晰的认识。 Overview 1、Eclipse.ini的作用 Eclipse startup is controlled by th
AngularJS实现分页功能 bijian1013 JavaScript AngularJS 分页
对于大多数web应用来说显示项目列表是一种很常见的任务。通常情况下，我们的数据会比较多，无法很好地显示在单个页面中。在这种情况下，我们需要把数据以页的方式来展示，同时带有转到上一页和下一页的功能。既然在整个应用中这是一种很常见的需求，那么把这一功能抽象成一个通用的、可复用的分页（Paginator）服务是很有意义的。 &nbs
[Maven学习笔记三]Maven archetype bit1129 ArcheType
archetype的英文意思是原型，Maven archetype表示创建Maven模块的模版，比如创建web项目，创建Spring项目等等. mvn archetype提供了一种命令行交互式创建Maven项目或者模块的方式， mvn archetype 1.在LearnMaven-ch03目录下，执行命令mvn archetype:gener
【Java命令三】jps bit1129 Java命令
jps很简单，用于显示当前运行的Java进程，也可以连接到远程服务器去查看 [hadoop@hadoop bin]$ jps -help usage: jps [-help] jps [-q] [-mlvV] [<hostid>] Definitions: <hostid>: <hostname>[:
ZABBIX2.2 2.4 等各版本之间的兼容性 ronin47
zabbix更新很快，从2009年到现在已经更新多个版本，为了使用更多zabbix的新特性，随之而来的便是升级版本，zabbix版本兼容性是必须优先考虑的一点客户端AGENT兼容 zabbix1.x到zabbix2.x的所有agent都兼容zabbix server2.4：如果你升级zabbix server，客户端是可以不做任何改变，除非你想使用agent的一些新特性。 Zabbix代理（p
unity 3d还是cocos2dx哪个适合游戏？ brotherlamp unity自学 unity教程 unity视频 unity资料 unity
unity 3d还是cocos2dx哪个适合游戏？问：unity 3d还是cocos2dx哪个适合游戏？答：首先目前来看unity视频教程因为是3d引擎，目前对2d支持并不完善，unity 3d 目前做2d普遍两种思路，一种是正交相机，3d画面2d视角，另一种是通过一些插件，动态创建mesh来绘制图形单元目前用的较多的是2d toolkit，ex2d，smooth moves，sm2，
百度笔试题：一个已经排序好的很大的数组，现在给它划分成m段，每段长度不定，段长最长为k，然后段内打乱顺序，请设计一个算法对其进行重新排序 bylijinnan java 算法面试百度招聘
import java.util.Arrays; /** * 最早是在陈利人老师的微博看到这道题： * #面试题#An array with n elements which is K most sorted，就是每个element的初始位置和它最终的排序后的位置的距离不超过常数K * 设计一个排序算法。It should be faster than O(n*lgn)。
获取checkbox复选框的值 chiangfai checkbox
<title>CheckBox</title> <script type = "text/javascript"> doGetVal: function doGetVal() { //var fruitName = document.getElementById("apple").value;//根据
MySQLdb用户指南 chenchao051 mysqldb
原网页被墙，放这里备用。 MySQLdb User's Guide Contents Introduction Installation _mysql MySQL C API translation MySQL C API function mapping Some _mysql examples MySQLdb
HIVE 窗口及分析函数 daizj hive 窗口函数分析函数
窗口函数应用场景：（1）用于分区排序（2）动态Group By （3）Top N （4）累计计算（5）层次查询一、分析函数用于等级、百分点、n分片等。函数说明 RANK() &nbs
PHP ZipArchive 实现压缩解压Zip文件 dcj3sjt126com PHP zip
PHP ZipArchive 是PHP自带的扩展类，可以轻松实现ZIP文件的压缩和解压，使用前首先要确保PHP ZIP 扩展已经开启，具体开启方法就不说了，不同的平台开启PHP扩增的方法网上都有，如有疑问欢迎交流。这里整理一下常用的示例供参考。一、解压缩zip文件 01 02 03 04 05 06 07 08 09 10 11
精彩英语贺词 dcj3sjt126com 英语
I'm always here 我会一直在这里支持你 &nb
基于Java注解的Spring的IoC功能 e200702084 java spring bean IOC Office
java模拟post请求 geeksun java
一般API接收客户端（比如网页、APP或其他应用服务）的请求，但在测试时需要模拟来自外界的请求，经探索，使用HttpComponentshttpClient可模拟Post提交请求。此处用HttpComponents的httpclient来完成使命。 import org.apache.http.HttpEntity ; import org.apache.http.HttpRespon
Swift语法之 ---- ?和!区别 hongtoushizi ?swift !
转载自： http://blog.sina.com.cn/s/blog_71715bf80102ux3v.html Swift语言使用var定义变量，但和别的语言不同，Swift里不会自动给变量赋初始值，也就是说变量不会有默认值，所以要求使用变量之前必须要对其初始化。如果在使用变量之前不进行初始化就会报错： var stringValue : String //
centos7安装jdk1.7 jisonami jdk centos
安装JDK1.7 步骤1、解压tar包在当前目录 [root@localhost usr]#tar -xzvf jdk-7u75-linux-x64.tar.gz 步骤2：配置环境变量在etc/profile文件下添加 export JAVA_HOME=/usr/java/jdk1.7.0_75 export CLASSPATH=/usr/java/jdk1.7.0_75/lib
数据源架构模式之数据映射器 home198979 PHP 架构数据映射器 datamapper
前面分别介绍了数据源架构模式之表数据入口、数据源架构模式之行和数据入口数据源架构模式之活动记录，相较于这三种数据源架构模式，数据映射器显得更加“高大上”。一、概念数据映射器（Data Mapper）：在保持对象和数据库（以及映射器本身）彼此独立的情况下，在二者之间移动数据的一个映射器层。概念永远都是抽象的，简单的说，数据映射器就是一个负责将数据映射到对象的类数据。 &nb
在Python中使用MYSQL pda158 mysql python
缘由　　近期在折腾一个小东西须要抓取网上的页面。然后进行解析。将结果放到数据库中。　　了解到 Python在这方面有优势，便选用之。　　由于我有台 server上面安装有 mysql，自然使用之。在进行数据库的这个操作过程中遇到了不少问题，这里记录一下，大家共勉。　　 python中mysql的调用　　百度之后能够通过MySQLdb进行数据库操作。
单例模式 hxl1988_0311 java 单例设计模式单件
package com.sosop.designpattern.singleton; /* * 单件模式：保证一个类必须只有一个实例，并提供全局的访问点 * * 所以单例模式必须有私有的构造器，没有私有构造器根本不用谈单件 * * 必须考虑到并发情况下创建了多个实例对象 * */ /** * 虽然有锁，但是只在第一次创建对象的时候加锁，并发时不会存在效率
27种迹象显示你应该辞掉程序员的工作 vipshichg 工作
1、你仍然在等待老板在2010年答应的要提拔你的暗示。 2、你的上级近10年没有开发过任何代码。 3、老板假装懂你说的这些技术，但实际上他完全不知道你在说什么。 4、你干完的项目6个月后才部署到现场服务器上。 5、时不时的，老板在检查你刚刚完成的工作时，要求按新想法重新开发。 6、而最终这个软件只有12个用户。 7、时间全浪费在办公室政治中，而不是用在开发好的软件上。 8、部署前5分钟才开始测试。