suhetao

SoundTouch音频处理库源码分析及算法提取(7)

上一节说到TDStretch类成员函数processSamples，粗略分析了一下大概。至于流程是通过TDStretch类成员函数putsamples调用processSamples进行处理，我们不难联想到前面对于SoundTouch类成员函数putSamples的分析。TDStretch类成员函数putSamples实现如下：
// Adds 'numsamples' pcs of samples from the 'samples' memory position into
// the input of the object.
void TDStretch::putSamples(const SAMPLETYPE *samples, uint nSamples)
{
    // Add the samples into the input buffer
    inputBuffer.putSamples(samples, nSamples);
    // Process the samples in input buffer
    processSamples();
}
先拷贝长度为nSamples的samples数据到inputbuffer，然后调用processSamples进行处理。TDStretch类的核心就是这个成员函数的实现，以下将详细分析一下这个类成员函数的实现。// Processes as many processing frames of the samples 'inputBuffer', store
// the result into 'outputBuffer'
void TDStretch::processSamples()
{
    int ovlSkip, offset;
    int temp;

    while ((int)inputBuffer.numSamples() >= sampleReq)
    {
        // If tempo differs from the normal ('SCALE'), scan for the best overlapping
        // position
        offset = seekBestOverlapPosition(inputBuffer.ptrBegin());

        // Mix the samples in the 'inputBuffer' at position of 'offset' with the
        // samples in 'midBuffer' using sliding overlapping
        // ... first partially overlap with the end of the previous sequence
        // (that's in 'midBuffer')
        overlap(outputBuffer.ptrEnd((uint)overlapLength), inputBuffer.ptrBegin(), (uint)offset);
        outputBuffer.putSamples((uint)overlapLength);

// ... then copy sequence samples from 'inputBuffer' to output:
temp = (seekLength / 2 - offset);

// length of sequence
temp = (seekWindowLength - 2 * overlapLength);

        // crosscheck that we don't have buffer overflow...
        if ((int)inputBuffer.numSamples() < (offset + temp + overlapLength * 2))
        {
            continue;    // just in case, shouldn't really happen
        }

outputBuffer.putSamples(inputBuffer.ptrBegin() + channels * (offset + overlapLength), (uint)temp);

        // Copies the end of the current sequence from 'inputBuffer' to
        // 'midBuffer' for being mixed with the beginning of the next
        // processing sequence and so on
        assert((offset + temp + overlapLength * 2) <= (int)inputBuffer.numSamples());
        memcpy(pMidBuffer, inputBuffer.ptrBegin() + channels * (offset + temp +
overlapLength),
            channels * sizeof(SAMPLETYPE) * overlapLength);

        // Remove the processed samples from the input buffer. Update
        // the difference between integer & nominal skip step to 'skipFract'
        // in order to prevent the error from accumulating over time.
        skipFract += nominalSkip;   // real skip size
        ovlSkip = (int)skipFract;   // rounded to integer skip
        skipFract -= ovlSkip;       // maintain the fraction part, i.e. real vs.
integer skip
        inputBuffer.receiveSamples((uint)ovlSkip);
    }
}
首先，sampleReq就是上一节提到的计算得到的参数，音频伸缩的长度。先判断一下inputBuffer的长度是否达到sampleReq的长度，如果达到。则通过调用类成员函数seekBestOverlapPosition(inputBuffer.ptrBegin());从输入的buffer中找一个最相似的点。我们看看类成员函数seekBestOverlapPosition的实现：
// Seeks for the optimal overlap-mixing position.
int TDStretch::seekBestOverlapPosition(const SAMPLETYPE *refPos)
{
    if (channels == 2)
    {
        // stereo sound
        if (bQuickSeek)
        {
            return seekBestOverlapPositionStereoQuick(refPos);
        }
        else
        {
            return seekBestOverlapPositionStereo(refPos);
        }
    }
    else
    {
        // mono sound
        if (bQuickSeek)
        {
            return seekBestOverlapPositionMonoQuick(refPos);
        }
        else
        {
            return seekBestOverlapPositionMono(refPos);
        }
    }
}
同样以单声道为例，便于理解，通过判断bQuickSeek这个条件变量，分情况调用seekBestOverlapPositionMonoQuick和seekBestOverlapPositionMono。
// Seeks for the optimal overlap-mixing position. The 'mono' version of the
// routine
//
// The best position is determined as the position where the two overlapped
// sample sequences are 'most alike', in terms of the highest cross-correlation
// value over the overlapping period
int TDStretch::seekBestOverlapPositionMonoQuick(const SAMPLETYPE *refPos)
{
    int j;
    int bestOffs;
    double bestCorr, corr;
    int scanCount, corrOffset, tempOffset;

// Slopes the amplitude of the 'midBuffer' samples
precalcCorrReferenceMono();

    bestCorr = FLT_MIN;
    bestOffs = _scanOffsets[0][0];
    corrOffset = 0;
    tempOffset = 0;

    // Scans for the best correlation value using four-pass hierarchical search.
    //
    // The look-up table 'scans' has hierarchical position adjusting steps.
    // In first pass the routine searhes for the highest correlation with
    // relatively coarse steps, then rescans the neighbourhood of the highest
    // correlation with better resolution and so on.
    for (scanCount = 0;scanCount < 4; scanCount ++)
    {
        j = 0;
        while (_scanOffsets[scanCount][j])
        {
            tempOffset = corrOffset + _scanOffsets[scanCount][j];
            if (tempOffset >= seekLength) break;

            // Calculates correlation value for the mixing position corresponding
            // to 'tempOffset'
            corr = (double)calcCrossCorrMono(refPos + tempOffset, pRefMidBuffer);
            // heuristic rule to slightly favour values close to mid of the range
            double tmp = (double)(2 * tempOffset - seekLength) / seekLength;
            corr = ((corr + 0.1) * (1.0 - 0.25 * tmp * tmp));

            // Checks for the highest correlation value
            if (corr > bestCorr)
            {
                bestCorr = corr;
                bestOffs = tempOffset;
            }
            j ++;
        }
        corrOffset = bestOffs;
    }
    // clear cross correlation routine state if necessary (is so e.g. in MMX
routines).
    clearCrossCorrState();

    return bestOffs;
}
和
// Seeks for the optimal overlap-mixing position. The 'mono' version of the
// routine
//
// The best position is determined as the position where the two overlapped
// sample sequences are 'most alike', in terms of the highest cross-correlation
// value over the overlapping period
int TDStretch::seekBestOverlapPositionMono(const SAMPLETYPE *refPos)
{
    int bestOffs;
    double bestCorr, corr;
    int tempOffset;
    const SAMPLETYPE *compare;

// Slopes the amplitude of the 'midBuffer' samples
precalcCorrReferenceMono();

bestCorr = FLT_MIN;
bestOffs = 0;

    // Scans for the best correlation value by testing each possible position
    // over the permitted range.
    for (tempOffset = 0; tempOffset < seekLength; tempOffset ++)
    {
        compare = refPos + tempOffset;

        // Calculates correlation value for the mixing position corresponding
        // to 'tempOffset'
        corr = (double)calcCrossCorrMono(pRefMidBuffer, compare);
        // heuristic rule to slightly favour values close to mid of the range
        double tmp = (double)(2 * tempOffset - seekLength) / seekLength;
        corr = ((corr + 0.1) * (1.0 - 0.25 * tmp * tmp));

        // Checks for the highest correlation value
        if (corr > bestCorr)
        {
            bestCorr = corr;
            bestOffs = tempOffset;
        }
    }
    // clear cross correlation routine state if necessary (is so e.g. in MMX
routines).
    clearCrossCorrState();
    return bestOffs;
}
可以看出这两个函数大大的不同，其实却是大同小异，先分析一下TDStretch::seekBestOverlapPositionMono，这是一个中规中矩的实现，同样以浮点为例。留意到函数中有这么一个函数precalcCorrReferenceMono()，函数实现如下：
// Slopes the amplitude of the 'midBuffer' samples so that cross correlation
// is faster to calculate
void TDStretch::precalcCorrReferenceMono()
{
    int i;
    float temp;

    for (i=0 ; i < (int)overlapLength ;i ++)
    {
        temp = (float)i * (float)(overlapLength - i);
        pRefMidBuffer[i] = (float)(pMidBuffer[i] * temp);
    }
}
这个可以理解为一个新的窗函数W[i]，i=[0,overlapLength];temp是顶点在(overlapLength/2,overlapLength^2/4)，与x轴相交于(0,0),(overlapLength,0)的二次函数，一个具有对称性的二次函数。pRefMidBuffer[i] = pMidBuffer[i]*W[i]再往下看calcCrossCorrMono计算互相关系数这个函数的实现：
double TDStretch::calcCrossCorrMono(const float *mixingPos, const float *compare) const
{
    double corr;
    double norm;
    int i;

    corr = norm = 0;
    for (i = 1; i < overlapLength; i ++)
    {
        corr += mixingPos[i] * compare[i];
        norm += mixingPos[i] * mixingPos[i];
    }

    if (norm < 1e-9) norm = 1.0;    // to avoid div by zero
    return corr / sqrt(norm);
}
想一下归一化互相关系数计算公式
E为累加，L=0,正负1,正负2,...
Rxy = E(x(n)y(n-L)) = E(x(n+L)y(n))
Ryx = E(y(n)x(n-L)) = E(y(n+L)x(n))
Pxy = Rxy / Sqrt(Rxy(0)Ryx(0))
Pxy的值在[-1,1]之间
可以看出他的计算方法和传统的互相关系数计算有着形式上的不同。我个人是这么理解的。pMidBuffer就是两个离散信号叠加的中间部分，两个信号叠加为了使叠加部分的更平滑一般的做法就是
          .______________                      .
|.          .           |                    . |
| .          . -y[n] |                  .   |
|    .          .       |                .     |
|      .          .     |     ->       .       |
|        .          .   |            .         |
| x[n]     .          . |          .    y[n]   |
_____________.          .        .______________
y[n]的和x[n]叠加的部分应该满足以上这种情况以得到比较好的平滑质量。TDStretch::seekBestOverlapPositionMono类函数实现了这样的叠加过程，只不过做了相当的优化工作，所以在void TDStretch::processSamples()类成员函数中：
memcpy(pMidBuffer, inputBuffer.ptrBegin() + channels * (offset + temp + overlapLength),channels * sizeof(SAMPLETYPE) * overlapLength);
pMidBuffer直接先从x[n]取值，compare就是x[n+overlapLength]，把seekBestOverlapPositionMono做以下变形，方便理解：
int i=0,j=0,bestcorr=0;
double crosscorr = 0,norm = 0,tmp = 0;
   for (i = 0; i < seekLength;i++)
   {
      for (j = 0; j < overlapLength;j++)
      {
         mixingPos[j] = inputBuffer[j] * (overlapLength - j);
         compare[j] = inputBuffer[i + j] * j;
         corr += compare[j] * mixingPos[j];
         norm += mixingPos[j]*mixingPos[j];
      }
      corr = corr / sqrt(norm);
      tmp = (double)(2 * i - seekLength) / seekLength;
      corr = ((corr + 0.1) * (1.0 - 0.25 * tmp * tmp));
      if corr > bestcorr)
      {
         // found new best offset candidate
         bestcorr = corr;
         bestoffset = i;
      }
   }
注意到在j的循环里面，mixingPos[j]* (overlapLength - j)和j的值和i值无关，为了提升性能，可以在i的循环外先算出mixingPos[j]* j*(overlapLength - j)的值，seekBestOverlapPositionMono函数就是优化后的算法结构。
这样子就可以理解为y[m] = x[m]*w[m]*w[N-m],w[m]的镜像函数是w[N-m]然后和x[n]通过互相关系数计算出最相似的位置作为叠加的位置。
tmp = (double)(2 * i - seekLength) / seekLength;
corr = ((corr + 0.1) * (1.0 - 0.25 * tmp * tmp));
画出(1.0 - 0.25 * tmp * tmp))的图形就很好理解，可以认为人为的对corr进行修正，越靠近叠加区域中点，corr可以取得更大的相关性，把最相似点的位置尽量往中间靠。
    至此，ST的大部分源码已经分析完毕，将在下一节中提取算法改良，无非就是一个总结。

socket多线程和Ringbuffer详解走别人不走的路 linux c语言 android
关注微信公众号：【快乐程序猿】查看更多篇章相信很多读者都知道多线程是什么，那RingBuffer可能就不太清楚了，那我们先来介绍下什么是RingBuffer。RingBuffer，也称为循环缓冲区，是一种固定大小的缓冲区，用于在生产者和消费者之间传递数据。它是一种数据结构，常用于需要缓冲数据流的场合，如音频处理、数据通信等。1.结构缓冲区大小:RingBuffer有一个固定的容量，即可以容纳的数据
python librosa音频处理库 Core IO and DSP（翻译文档） FQ_G 音频 librosa python
英文文档地址：http://librosa.github.io/librosa/core.html由于本人才疏学浅，如有翻译错误，请指出，谢谢！一、Audioprocessing1.1librosa.core.load加载音频，audioread这种方式能加载的音频格式，我一般都把音频处理成wav格式然后通过该函数加载。参数为：path:音频路径sr:音频频率（你可以不用原始的音频频率，他有重采样
librosa，一个很有趣的 Python 库！陈序不懂程序 python 开发语言
大家好，今天为大家分享一个很有趣的Python库-librosa。Github地址：https://github.com/librosa/librosa音频处理在现代科技和娱乐领域中起着越来越重要的作用。Python的Librosa库是一种强大的工具，用于音频分析和处理。本文将详细介绍Librosa库的各种功能和用法，以及提供丰富的示例代码，帮助大家更好地理解如何使用这个库来处理音频数据。什么是L
游戏系统开发红匣子实力推荐
游戏系统开发是指设计和构建一个游戏的底层框架和机制，以支持游戏的各种功能和玩法。它是游戏开发过程中至关重要的一部分，涉及到多个方面，包括游戏引擎、图形渲染、物理模拟、音频处理、网络通信等等。下面是一篇关于游戏系统开发的文章：开发-联系电话：13642679953（微信同号）游戏系统开发是游戏制作的核心环节之一，它涉及到游戏的整体架构和各个组件的设计。一个成功的游戏系统开发需要考虑到游戏的性能、可扩
什么是奈奎斯特采样定理达西西66 奈奎斯特采样定理
奈奎斯特采样定理，也被称为奈奎斯特定理或奈氏定理，是信号处理领域中至关重要的原理之一。它揭示了在数字信号处理中如何正确地采样模拟信号，以避免信息丢失和混叠现象。本文将深入探讨奈奎斯特采样定理的原理、应用和实例，以及其在通信、音频处理和图像处理等领域的重要性。奈奎斯特采样定理的基本原理奈奎斯特采样定理是由美国工程师哈里·S·奈奎斯特（HarryNyquist）在20世纪20年代提出的。该定理的核心思
YeAudio音频工具的介绍和使用夜雨飘零1 语音音视频语音识别 python ffmpeg
夜雨飘零音频工具这款Python音频处理工具功能强大，支持读取多种格式的音频文件。它不仅能够对音频进行裁剪、添加混响、添加噪声等多种处理操作，还广泛应用于语音识别、语音合成、声音分类以及声纹识别等多个项目领域。安装使用pip安装。pipinstallyeaudio-U-ihttps://pypi.tuna.tsinghua.edu.cn/simple（推荐）使用源码安装。gitclonehttps
iZotope Ozone 11 Advanced：专业音频制作与母带处理的巅峰之作平安喜乐616 音视频 iZotope Ozone 顶级音频后期制作软件
iZotopeOzone11Advanced是一款专为音频工程师、制作人和音乐人设计的顶级音频后期制作软件，无论是Mac还是Windows平台，都能为用户提供无与伦比的音频处理体验。该软件集成了最先进的人工智能技术和一系列精密的音频处理工具，让音频作品的最终声音效果达到广播级甚至更高水准。智能化音频处理：Ozone11Advanced的核心优势在于其智能化的音频处理技术。通过AIMasterAss
AMBA协议中的AXI-Stream：协议信号与设计实践嵌入式杂谈 fpga开发
在高性能嵌入式系统设计中，AMBA（AdvancedMicrocontrollerBusArchitecture）协议扮演着重要角色。其中，AXI-Stream协议是AMBA4.x规范的一部分，专为高吞吐量数据传输而设计，广泛应用于视频处理、音频处理、网络通信等领域。本文将探讨AXI-Stream协议的信号、设计原则和实践。1.AXI-Stream协议概述AXI-Stream是一种基于FIFO的单
USB音频 Tracy973 人工智能实时音视频音视频音频
现在越来越多的音频设备做成USB接口的，让用户能够通过USB接口连接音频设备到计算机或其他数字设备上，实现音频的输入和输出功能。音频USB接口有下面这些好处。便捷性和易用性：USB接口普及广泛，用户可以轻松地将音频设备连接到电脑、笔记本、平板电脑等设备上，无需专门的音频接口或扩展卡。数字音频传输：USB接口可以传输数字音频信号，允许音频设备直接与数字音频处理系统进行通信，提供更高的音频质量和清晰度
音频处理3_时域频域迪三 #NN_Audio 音频
本节主要讲音频的时域到频域的变换和理解我们以两个正弦波的组合信号为例，生成代码如下：#生成信号t=np.linspace(0,1,1000,endpoint=False)#时间轴freq1=5#5Hzfreq2=20#20Hzsignal=np.sin(2*np.pi*freq1*t)+0.5*np.sin(2*np.pi*freq2*t)#合成信号第1幅图是时域图，第2-3幅图是频率图，分别记录
Python标准库、第三方库和外部工具汇总 weixin_30650039 python 人工智能开发工具
导读：Python数据工具箱涵盖从数据源到数据可视化的完整流程中涉及到的常用库、函数和外部工具。其中既有Python内置函数和标准库，又有第三方库和工具。这些库可用于文件读写、网络抓取和解析、数据连接、数清洗转换、数据计算和统计分析、图像和视频处理、音频处理、数据挖掘/机器学习/深度学习、数据可视化、交互学习和集成开发以及其他Python协同数据工作工具。为了区分不同对象的来源和类型，本文将在描述
[转载] 140种Python标准库、第三方库和外部工具 ey_snail
参考链接：Python|使用openpyxl在Excel文件中进行算术运算这些库可用于文件读写、网络抓取和解析、数据连接、数清洗转换、数据计算和统计分析、图像和视频处理、音频处理、数据挖掘/机器学习/深度学习、数据可视化、交互学习和集成开发以及其他Python协同数据工作工具。为了区分不同对象的来源和类型，本文将在描述中通过以下方法进行标识：**Python内置函数：**Python自带的内置函数
Qt第十六章多媒体Multimedia yerennuo qt 开发语言
文章目录多媒体音频播放音频录制音频低延迟音效低级音频播放和录制推送和拉取解码压缩音频到内存与音频处理相关的类视频播放视频处理低级视频帧录制视频与视频处理相关的类支持的媒体格式多媒体cmakelist添加Multimedia模块设备信息查询#include#include#include#includevoidshowDevs(){QListinAudios=QMediaDevices::audio
掌握音频核心：Swift 中 Core Audio 的深度应用与实践杨哥带你写代码音视频 swift 开发语言
标题：掌握音频核心：Swift中CoreAudio的深度应用与实践在数字时代，音频处理已成为应用开发中不可或缺的一部分。无论是音乐播放、声音录制还是复杂的音频分析，CoreAudio作为Apple提供的一个强大的音频处理框架，它为开发者提供了丰富的API来处理各种音频任务。本文将带领读者深入了解如何在Swift中使用CoreAudio，通过实际代码示例，探索音频处理的奥秘。1.CoreAudio概
pr2024 Premiere Pro 2024 mac v24.2.1中文激活版 macw_q 程序人生
PremierePro2024forMac是Adobe公司推出的一款强大的视频编辑软件，专为Mac操作系统优化。它提供了丰富的剪辑工具、特效和音频处理选项，帮助用户轻松创建专业级的影视作品。软件下载：pr2024PremierePro2024macv24.2.1中文激活版无论是剪辑短片、制作广告还是处理长篇电影，PremierePro2024都能提供出色的性能和稳定性。其简洁直观的界面和强大的功能
FL Studio 21.2.3.4004 All Plugins Edition Win/Mac音乐软件 yanling2023 FL Studio21 mac软件热门软件 macos fl studio FL Studio 21
FLStudio21.2.3.4004AllPluginsEdition是一款功能强大的音乐制作软件，提供了丰富的音频处理工具和插件，适用于专业音乐制作人和爱好者。该软件具有直观的用户界面，支持多轨道录音、混音和编辑，以及各种音频效果和虚拟乐器。它还包含了大量预设和样本，可以帮助用户轻松地创建各种风格和类型的音乐作品。FLStudioAllPluginsEdition还提供了与其他软件和硬件设备的
C语言常见面试题：C语言中如何进行音频处理编程？广寒舞雪 C语言音视频
在C语言中进行音频处理编程通常涉及几个关键步骤：读取音频文件、处理音频数据、以及可能的音频输出。这需要使用一些专门的库来处理音频数据。以下是一个简单的概述：选择音频处理库：libsndfile：这是一个用于读取、写入和处理音频文件的库。它支持许多不同的音频格式。PortAudio：这是一个跨平台的音频I/O库。FFmpeg：这是一个非常强大的多媒体框架，可以用来处理音频、视频等。安装和设置库：根据
YY调音台：低延时直播机架 momo_studio 音频
在音频制作和直播行业中，YY调音台凭借其独特的功能和卓越性能，成为了专业人士的首选。这款软件不仅提供了一流的音频处理能力，还针对用户的实际需求进行了精心优化，从而提供了无与伦比的使用体验。以下是YY调音台的三大特色功能，这些功能共同构成了它在行业中的独特优势。1.低时延音频输出到YY应用首先，YY调音台在实现与YY生态内其他软件的互动方面表现出色，特别是在提供低时延音频输出方面。用户可以直接将音频
【Java万花筒】编织数字音符：Java多媒体魔法 friklogff Java万花筒 java 开发语言
Java多媒体处理大全：解锁音视频领域的绝佳工具库前言在当今数字化时代，多媒体处理已经成为Java开发者必不可少的一项技能。无论是开发多媒体应用、实时流媒体处理，还是进行视频编辑、音频转码，Java提供了丰富的库和工具。本文将介绍几个主要的Java多媒体处理库，涵盖视频编码、解码、音频处理等方面，为开发者提供全面的了解和实际应用指导。欢迎订阅专栏：Java万花筒文章目录Java多媒体处理大全：解锁
播放器 Audirvana Mac lx53mac Mac软件 macos
Audirvana是一款高品质的无损音乐播放器，支持多种无损音频格式，如FLAC、ALAC、WAV、AIFF等，能够以高解析度播放音乐，甚至支持DSD音频格式，提供最大限度的音频保真度。它还具有强大的音频处理功能，包括音量调节、均衡器、声道平衡、重播增益控制等，允许用户根据自己的需求调整音频效果，实现音频的最佳播放效果。此外，Audirvana还具有易于使用的音频库管理功能，用户可以轻松组织和浏览
【⭐AI工具⭐】实用工具推荐 STARBLOCKSHADOW 智能工具笔记奇招妙计人工智能 AI 实用工具
目录壹实用工具工具合集TinyWowHiPDF公式处理SimpleTex公式中常用的希腊字母符号公式在论文中的格式图像处理BgRemoverPixFix像素蒸发Photopea音频处理啦啦爱笔记整理飞书妙记素材整理Eagle其它一次性临时电子邮件近邻词汇检索据意查句诗三百能不能好好说话？这是什么动漫AIShort壹实用工具工具合集TinyWowTinyWow包含了处理PDF、图片、视频、文件以及A
QNX声音架构（QSA）入门指南 chuanpeng0130 linux
简介QNX声音架构（QSA）是QNX操作系统中用于处理音频输入和输出的高级、多功能音频框架。它提供了灵活的音频处理功能，包括音频捕获、播放、混音，以及与多种音频硬件的接口支持。QSA的设计旨在满足高性能和低延迟音频处理的需求。核心组件1.io-audioio-audio是QSA的核心守护进程，负责管理音频驱动和硬件。它支持动态加载音频驱动，并与硬件通信来执行音频操作。2.PCM设备PCM（脉冲编码
【自然语言处理】P2 PyTorch 基础 - 张量脚踏实地的大梦想家 #自然语言处理自然语言处理 pytorch 人工智能
目录安装PyTorch张量创建张量操作张量索引、切片、联合操作CUDA张量本系列博文我们将使用PyTorch来实现深度学习模型等。PyTorch是一个开源的、社区驱动的深度学习框架。拥有强大的工具和库生态系统，包含TorchVision（用于图像处理）、TorchText（用于文本处理）、TorchAudio（用于音频处理）等。安装PyTorch网址：https://pytorch.org/根据系
centOS安装音频处理软件Sox 飞扬々岁月服务器 centos
Sox不能直接处理音频，需要其他依赖包。yuminstallgcc-c++libmadlibmad-devellibid3taglibid3tag-devellamelame-develflac-devellibvorbis-develmake如果报错需要root权限，加sudo：sudoyuminstallgcc-c++libmadlibmad-devellibid3taglibid3tag-d
常用iOS、Mac框架和库及常用中文开发博客红枫1225 iOS
目录UI下拉刷新模糊效果AutoLayout富文本图表表相关隐藏与显示HUD与Toast对话框其他UI动画侧滑与右滑返回手势其他动画网络相关网络连接网络测试图像获取网络聊天网络测试WebViewModel其他数据库缓存处理PDF图像浏览及处理摄像照相视频音频处理响应式框架消息相关消息推送客户端消息推送服务器端通知相关版本新API的Demo代码安全与密码测试及调试AppleWatch完整项目VPNX
Android Media API 使用介绍大飞飞鱼 WebRTC 视频直播技术移动直播技术 Android多媒体接口
从事多媒体开发的同学，在对Android系统开发时，Android系统已经给我们提供了对视音频的强大支持，本文介绍Android的几个和视音频相关的类，通过这几个类的组合使用，其实是能变换出许多视音频处理的相关功能，下面就对这几个类进行简单介绍。MediaMetadataRetriever:用来获取视频的相关信息，例如视频宽高、时长、旋转角度、码率等等。MediaExtractor:：视音频分离器
[离散时间信号处理学习笔记] 13. 重采样资源分享吧1
重采样常用于音频处理。在用麦克风对音频进行采集的时候，常见的采样率有8k（电话）、44.1k（CD）、48k（视频音轨）、96k/192k（Hi-Res），而某些系统会有默认固定的输出采样率（如Android的默认输出采样率为44.1k），此时就需要对输入音频数据进行重采样。重采样的源样本序列为x[n]x[n]=xc(nT)重采样的目标序列为x′[n]x′[n]=xc(nT′)如何通过x[n]得到
AIGC | AIGC工具库梳理（上）啦啦右一 AIGC AIGC
目录大杂烩工具包文本工具对话聊天写作生成营销文本图像工具图片生成背景移除无损放大优化修复物体抹除音频工具音频合成语音转文字、文字转语音变声工具音频处理大杂烩工具包HayoAI：主要是灵感库部分，有许多AI玩法合集。
音频分离软件有哪些？这些软件轻松分离职场小妙招音视频 ffmpeg
音频分离软件有哪些？随着音频处理需求的日益增长，音频分离软件成为了许多人的必备工具。为了满足这些需求，市面上涌现出了许多优秀的音频分离软件。本文将为您介绍5款知名的音频分离软件，让您轻松实现音频处理。1.口袋视频转换器口袋视频转换器时一款手机端应用软件，它的音频提取功能，无需繁琐的步骤，只需简单几步即可完成。无论你是需要从视频中提取背景音乐、人声，还是其他声音效果，这款应用都能满足你的需求。你只需
Final Cut Pro for Mac(fcpx视频剪辑)v10.7.1 中文版 macw_q 其他
FinalCutPro是由苹果公司开发的一款专业视频编辑软件，主要用于影片的后期剪辑、调色、特效、音频处理等方面。软件下载：FinalCutProforMacv10.7.1中文版以下是FinalCutPro的特点：高效的视频编辑功能：FinalCutPro提供了丰富的视频编辑工具，包括多轨道编辑、剪切、修剪、分割、组合等功能，可以快速高效地进行视频编辑。强大的调色功能：FinalCutPro内置了
HQL之投影查询归来朝歌 HQL Hibernate 查询语句投影查询
在HQL查询中，常常面临这样一个场景，对于多表查询，是要将一个表的对象查出来还是要只需要每个表中的几个字段，最后放在一起显示？针对上面的场景，如果需要将一个对象查出来： HQL语句写“from 对象”即可 Session session = HibernateUtil.openSession();
Spring整合redis bylijinnan redis
pom.xml <dependencies>  <dependency> <groupId>org.springframework.data</groupId> <artifactId>spring-data-redi
org.hibernate.NonUniqueResultException: query did not return a unique result: 2 0624chenhong Hibernate
参考：http://blog.csdn.net/qingfeilee/article/details/7052736 org.hibernate.NonUniqueResultException: query did not return a unique result: 2 在项目中出现了org.hiber
android动画效果不懂事的小屁孩 android动画
前几天弄alertdialog和popupwindow的时候，用到了android的动画效果，今天专门研究了一下关于android的动画效果，列出来，方便以后使用。 Android 平台提供了两类动画。一类是Tween动画，就是对场景里的对象不断的进行图像变化来产生动画效果（旋转、平移、放缩和渐变）。第二类就是 Frame动画，即顺序的播放事先做好的图像，与gif图片原理类似。
js delete 删除机理以及它的内存泄露问题的解决方案换个号韩国红果果 JavaScript
delete删除属性时只是解除了属性与对象的绑定，故当属性值为一个对象时，删除时会造成内存泄露（其实还未删除）举例： var person={name:{firstname:'bob'}} var p=person.name delete person.name p.firstname -->'bob' // 依然可以访问p.firstname，存在内存泄露
Oracle将零干预分析加入网络即服务计划蓝儿唯美 oracle
由Oracle通信技术部门主导的演示项目并没有在本月较早前法国南斯举行的行业集团TM论坛大会中获得嘉奖。但是，Oracle通信官员解雇致力于打造一个支持零干预分配和编制功能的网络即服务（NaaS）平台，帮助企业以更灵活和更适合云的方式实现通信服务提供商（CSP）的连接产品。这个Oracle主导的项目属于TM Forum Live!活动上展示的Catalyst计划的19个项目之一。Catalyst计
spring学习——springmvc（二） a-john springMVC
Spring MVC提供了非常方便的文件上传功能。 1，配置Spring支持文件上传： DispatcherServlet本身并不知道如何处理multipart的表单数据，需要一个multipart解析器把POST请求的multipart数据中抽取出来，这样DispatcherServlet就能将其传递给我们的控制器了。为了在Spring中注册multipart解析器，需要声明一个实现了Mul
POJ-2828-Buy Tickets aijuans ACM_POJ
POJ-2828-Buy Tickets http://poj.org/problem?id=2828 线段树，逆序插入 #include<iostream>#include<cstdio>#include<cstring>#include<cstdlib>using namespace std;#define N 200010struct
Java Ant build.xml详解 asia007 build.xml
1,什么是antant是构建工具2,什么是构建概念到处可查到，形象来说，你要把代码从某个地方拿来，编译，再拷贝到某个地方去等等操作，当然不仅与此，但是主要用来干这个3,ant的好处跨平台 --因为ant是使用java实现的，所以它跨平台使用简单--与ant的兄弟make比起来语法清晰--同样是和make相比功能强大--ant能做的事情很多，可能你用了很久，你仍然不知道它能有
android按钮监听器的四种技术百合不是茶 android xml配置监听器实现接口
android开发中经常会用到各种各样的监听器,android监听器的写法与java又有不同的地方; 1,activity中使用内部类实现接口 ,创建内部类实例使用add方法与java类似创建监听器的实例 myLis lis = new myLis(); 使用add方法给按钮添加监听器
软件架构师不等同于资深程序员 bijian1013 程序员架构师架构设计
本文的作者Armel Nene是ETAPIX Global公司的首席架构师，他居住在伦敦，他参与过的开源项目包括 Apache Lucene,，Apache Nutch， Liferay 和 Pentaho等。如今很多的公司
TeamForge Wiki Syntax & CollabNet User Information Center sunjing TeamForge How do Attachement Anchor Wiki Syntax
the CollabNet user information center http://help.collab.net/ How do I create a new Wiki page? A CollabNet TeamForge project can have any number of Wiki pages. All Wiki pages are linked, and
【Redis四】Redis数据类型 bit1129 redis
概述 Redis是一个高性能的数据结构服务器，称之为数据结构服务器的原因是，它提供了丰富的数据类型以满足不同的应用场景，本文对Redis的数据类型以及对这些类型可能的操作进行总结。 Redis常用的数据类型包括string、set、list、hash以及sorted set.Redis本身是K/V系统，这里的数据类型指的是value的类型，而不是key的类型，key的类型只有一种即string
SSH2整合-附源码白糖_ eclipse spring tomcat Hibernate Google
今天用eclipse终于整合出了struts2+hibernate+spring框架。我创建的是tomcat项目，需要有tomcat插件。导入项目以后，鼠标右键选择属性，然后再找到“tomcat”项，勾选一下“Is a tomcat project”即可。具体方法见源码里的jsp图片，sql也在源码里。补充1：项目中部分jar包不是最新版的，可能导
[转]开源项目代码的学习方法 braveCS 学习方法
转自： http://blog.sina.com.cn/s/blog_693458530100lk5m.html http://www.cnblogs.com/west-link/archive/2011/06/07/2074466.html 1）阅读features。以此来搞清楚该项目有哪些特性2）思考。想想如果自己来做有这些features的项目该如何构架3）下载并安装d
编程之美-子数组的最大和（二维） bylijinnan 编程之美
package beautyOfCoding; import java.util.Arrays; import java.util.Random; public class MaxSubArraySum2 { /** * 编程之美子数组之和的最大值（二维） */ private static final int ROW = 5; private stat
读书笔记-3 chengxuyuancsdn jquery笔记 resultMap配置 ibatis一对多配置
1、resultMap配置 2、ibatis一对多配置 3、jquery笔记 1、resultMap配置当<select resultMap="topic_data"> <resultMap id="topic_data">必须一一对应。 (1)<resultMap class="tblTopic&q
[物理与天文]物理学新进展 comsci
如果我们必须获得某种地球上没有的矿石,才能够进行某些能量输出装置的设计和建造,而要获得这种矿石,又必须首先进行深空探测,而要进行深空探测,又必须获得这种能量输出装置,这个矛盾的循环,会导致地球联盟在与宇宙文明建立关系的时候,陷入困境怎么办呢?
Oracle 11g新特性:Automatic Diagnostic Repository daizj oracle ADR
Oracle Database 11g的FDI（Fault Diagnosability Infrastructure）是自动化诊断方面的又一增强。 FDI的一个关键组件是自动诊断库（Automatic Diagnostic Repository-ADR）。在oracle 11g中，alert文件的信息是以xml的文件格式存在的，另外提供了普通文本格式的alert文件。这两份log文
简单排序:选择排序 dieslrae 选择排序
public void selectSort(int[] array){ int select; for(int i=0;i<array.length;i++){ select = i; for(int k=i+1;k<array.leng
C语言学习六指针的经典程序，互换两个数字 dcj3sjt126com c
示例程序，swap_1和swap_2都是错误的，推理从1开始推到2，2没完成，推到3就完成了 # include <stdio.h> void swap_1(int, int); void swap_2(int *, int *); void swap_3(int *, int *); int main(void) { int a = 3; int b =
php 5.4中php-fpm 的重启、终止操作命令 dcj3sjt126com PHP
php 5.4中php-fpm 的重启、终止操作命令: 查看php运行目录命令：which php/usr/bin/php 查看php-fpm进程数：ps aux | grep -c php-fpm 查看运行内存/usr/bin/php -i|grep mem 重启php-fpm/etc/init.d/php-fpm restart 在phpinfo()输出内容可以看到php
线程同步工具类 shuizhaosi888 同步工具类
同步工具类包括信号量（Semaphore）、栅栏（barrier）、闭锁（CountDownLatch）闭锁（CountDownLatch） public class RunMain { public long timeTasks(int nThreads, final Runnable task) throws InterruptedException { fin
bleeding edge是什么意思 haojinghua DI
不止一次，看到很多讲技术的文章里面出现过这个词语。今天终于弄懂了——通过朋友给的浏览软件，上了wiki。我再一次感到，没有辞典能像WiKi一样，给出这样体贴人心、一清二楚的解释了。为了表达我对WiKi的喜爱，只好在此一一中英对照，给大家上次课。 In computer science, bleeding edge is a term that
c中实现utf8和gbk的互转 jimmee c iconv utf8&gbk编码
#include <iconv.h> #include <stdlib.h> #include <stdio.h> #include <unistd.h> #include <fcntl.h> #include <string.h> #include <sys/stat.h> int code_c
大型分布式网站架构设计与实践 lilin530 应用服务器搜索引擎
1.大型网站软件系统的特点？ a.高并发，大流量。 b.高可用。 c.海量数据。 d.用户分布广泛，网络情况复杂。 e.安全环境恶劣。 f.需求快速变更，发布频繁。 g.渐进式发展。 2.大型网站架构演化发展历程？ a.初始阶段的网站架构。应用程序，数据库，文件等所有的资源都在一台服务器上。 b.应用服务器和数据服务器分离。 c.使用缓存改善网站性能。 d.使用应用
在代码中获取Android theme中的attr属性值 OliveExcel android theme
Android的Theme是由各种attr组合而成, 每个attr对应了这个属性的一个引用, 这个引用又可以是各种东西. 在某些情况下, 我们需要获取非自定义的主题下某个属性的内容 (比如拿到系统默认的配色colorAccent), 操作方式举例一则: int defaultColor = 0xFF000000; int[] attrsArray = { andorid.r.
基于Zookeeper的分布式共享锁 roadrunners zookeeper 分布式共享锁
首先，说说我们的场景，订单服务是做成集群的，当两个以上结点同时收到一个相同订单的创建指令，这时并发就产生了，系统就会重复创建订单。等等......场景。这时，分布式共享锁就闪亮登场了。共享锁在同一个进程中是很容易实现的，但在跨进程或者在不同Server之间就不好实现了。Zookeeper就很容易实现。具体的实现原理官网和其它网站也有翻译，这里就不在赘述了。官
两个容易被忽略的MySQL知识 tomcat_oracle mysql
1、varchar(5)可以存储多少个汉字，多少个字母数字？　　相信有好多人应该跟我一样，对这个已经很熟悉了，根据经验我们能很快的做出决定，比如说用varchar(200)去存储url等等，但是，即使你用了很多次也很熟悉了，也有可能对上面的问题做出错误的回答。　　这个问题我查了好多资料，有的人说是可以存储5个字符，2.5个汉字（每个汉字占用两个字节的话），有的人说这个要区分版本，5.0
zoj 3827 Information Entropy(水题) 阿尔萨斯 format
题目链接：zoj 3827 Information Entropy 题目大意：三种底，计算和。解题思路：调用库函数就可以直接算了，不过要注意Pi = 0的时候，不过它题目里居然也讲了。。。limp→0+plogb(p)=0，因为p是logp的高阶。 #include <cstdio> #include <cstring> #include <cmath&

SoundTouch音频处理库源码分析及算法提取(7)

你可能感兴趣的:(音频处理)