___Blue_H

LibROSA库提取MFCC特征的过程解析

源码解析

获取梅尔频谱

分帧

加窗

快速傅里叶变换

梅尔滤波器

取对数

离散余弦变换

总结

LibROSA（本文使用的版本是0.6.3）中的mfcc函数可以用来提取音频的梅尔频率倒谱系数（Mel-Frequency Cepstral Coefficients，MFCCs）特征，MFCC被广泛应用于语音识别。LibROSA的mfcc函数源码如下：

# -- Mel spectrogram and MFCCs -- #
def mfcc(y=None, sr=22050, S=None, n_mfcc=20, dct_type=2, norm='ortho', **kwargs):
    if S is None:
        S = power_to_db(melspectrogram(y=y, sr=sr, **kwargs))

    return scipy.fftpack.dct(S, axis=0, type=dct_type, norm=norm)[:n_mfcc]

对于音频，经典的MFCC提取过程分为预加重、分帧、加窗、快速傅里叶变换（FFT）、梅尔滤波器组过滤、取对数、离散余弦变换（DCT）这几个步骤。从mfcc函数的代码能发掘的信息有限，因此我们需要进一步查看调用的函数代码。以下将从函数调用链的底层往上分析，直到mfcc函数。

源码解析

获取梅尔频谱

分帧

LibROSA提取MFCC的过程没有预加重步骤，而是直接进行了分帧。分帧函数为librosa.util.frame()，源码如下：

def frame(y, frame_length=2048, hop_length=512):
    '''Slice a time series into overlapping frames.

    This implementation uses low-level stride manipulation to avoid
    redundant copies of the time series data.

    Parameters
    ----------
    y : np.ndarray [shape=(n,)]
        Time series to frame. Must be one-dimensional and contiguous
        in memory.

    frame_length : int > 0 [scalar]
        Length of the frame in samples

    hop_length : int > 0 [scalar]
        Number of samples to hop between frames

    Returns
    -------
    y_frames : np.ndarray [shape=(frame_length, N_FRAMES)]
        An array of frames sampled from `y`:
        `y_frames[i, j] == y[j * hop_length + i]`

    Raises
    ------
    ParameterError
        If `y` is not contiguous in memory, not an `np.ndarray`, or
        not one-dimensional.  See `np.ascontiguous()` for details.

        If `hop_length < 1`, frames cannot advance.

        If `len(y) < frame_length`.

    '''

    if not isinstance(y, np.ndarray):
        raise ParameterError('Input must be of type numpy.ndarray, '
                             'given type(y)={}'.format(type(y)))

    if y.ndim != 1:
        raise ParameterError('Input must be one-dimensional, '
                             'given y.ndim={}'.format(y.ndim))

    if len(y) < frame_length:
        raise ParameterError('Buffer is too short (n={:d})'
                             ' for frame_length={:d}'.format(len(y), frame_length))

    if hop_length < 1:
        raise ParameterError('Invalid hop_length: {:d}'.format(hop_length))

    if not y.flags['C_CONTIGUOUS']:
        raise ParameterError('Input buffer must be contiguous.')

    # Compute the number of frames that will fit. The end may get truncated.
    n_frames = 1 + int((len(y) - frame_length) / hop_length)

    # Vertical stride is one sample
    # Horizontal stride is `hop_length` samples
    y_frames = as_strided(y, shape=(frame_length, n_frames),
                          strides=(y.itemsize, hop_length * y.itemsize))
    return y_frames

可以看到，LibROSA实际上调用了scipy库中的numpy.lib.stride_tricks.as_strided函数进行分帧（若不指定，帧长默认为2048，帧移默认为512），as_strided函数的实现就不细究了。LibROSA的frame是将X*1的音频向量处理成N*M的矩阵，即将一个时间序列转化为元素部分重叠的帧序列，若帧数不能整除，则最后补零成完整的帧。举个例子，假设一个音频向量为：[0, 1, 2, 3, 4, 5]，若帧长为4，帧移为2，则分帧后得到的矩阵为：[[0, 2] , [1, 3], [2, 4], [3, 5]]，每一帧都有4个基本元素。

加窗

对分帧后得到的矩阵，下一步进行加窗（奇怪的是，LibROSA是先加窗后分帧的，在下一个步骤：STFT的代码中会体现）。加窗的目的是为了一定程度消除分帧后出现的帧与帧之间的不连续性。LibROSA的librosa.filters.get_window即为加窗函数，源码如下：

def get_window(window, Nx, fftbins=True):
    '''Compute a window function.

    This is a wrapper for `scipy.signal.get_window` that additionally
    supports callable or pre-computed windows.

    Parameters
    ----------
    window : string, tuple, number, callable, or list-like
        The window specification:

        - If string, it's the name of the window function (e.g., `'hann'`)
        - If tuple, it's the name of the window function and any parameters
          (e.g., `('kaiser', 4.0)`)
        - If numeric, it is treated as the beta parameter of the `'kaiser'`
          window, as in `scipy.signal.get_window`.
        - If callable, it's a function that accepts one integer argument
          (the window length)
        - If list-like, it's a pre-computed window of the correct length `Nx`

    Nx : int > 0
        The length of the window

    fftbins : bool, optional
        If True (default), create a periodic window for use with FFT
        If False, create a symmetric window for filter design applications.

    Returns
    -------
    get_window : np.ndarray
        A window of length `Nx` and type `window`

    See Also
    --------
    scipy.signal.get_window

    Notes
    -----
    This function caches at level 10.

    Raises
    ------
    ParameterError
        If `window` is supplied as a vector of length != `n_fft`,
        or is otherwise mis-specified.
    '''
    if six.callable(window):
        return window(Nx)

    elif (isinstance(window, (six.string_types, tuple)) or
          np.isscalar(window)):
        # TODO: if we add custom window functions in librosa, call them here

        return scipy.signal.get_window(window, Nx, fftbins=fftbins)

    elif isinstance(window, (np.ndarray, list)):
        if len(window) == Nx:
            return np.asarray(window)

        raise ParameterError('Window size mismatch: '
                             '{:d} != {:d}'.format(len(window), Nx))
    else:
        raise ParameterError('Invalid window specification: {}'.format(window))

从源码中可以看出，LibROSA实际调用了scipy.signal.windows.get_sindow()来进行加窗。scipy库中提供了多种窗函数，如汉明窗、汉宁窗、矩形窗、三角窗等等（想了解scipy库提供的窗函数请点击https://docs.scipy.org/doc/scipy/reference/signal.windows.html?highlight=scipy%20signal%20windows#module-scipy.signal.windows）。LibROSA默认使用汉宁窗，窗函数的详细步骤在此就不细说了。

快速傅里叶变换

经上一步处理后，得到的结果会逐帧进行快速傅里叶变换（fast Fourier transform，FFT）。逐帧进行快速傅里叶变换的过程被称为短时傅里叶变换（short-time Fourier transform 或 short-term Fourier transform，STFT）。LibROSA的librosa.core.stft()源码如下：

def stft(y, n_fft=2048, hop_length=None, win_length=None, window='hann',
         center=True, dtype=np.complex64, pad_mode='reflect'):
    """Short-time Fourier transform (STFT)
    Returns a complex-valued matrix D such that
        `np.abs(D[f, t])` is the magnitude of frequency bin `f`
        at frame `t`
        `np.angle(D[f, t])` is the phase of frequency bin `f`
        at frame `t`
    Parameters
    ----------
    y : np.ndarray [shape=(n,)], real-valued
        the input signal (audio time series)
    n_fft : int > 0 [scalar]
        FFT window size
    hop_length : int > 0 [scalar]
        number audio of frames between STFT columns.
        If unspecified, defaults `win_length / 4`.
    win_length : int <= n_fft [scalar]
        Each frame of audio is windowed by `window()`.
        The window will be of length `win_length` and then padded
        with zeros to match `n_fft`.
        If unspecified, defaults to ``win_length = n_fft``.
    window : string, tuple, number, function, or np.ndarray [shape=(n_fft,)]
        - a window specification (string, tuple, or number);
          see `scipy.signal.get_window`
        - a window function, such as `scipy.signal.hanning`
        - a vector or array of length `n_fft`
        .. see also:: `filters.get_window`
    center : boolean
        - If `True`, the signal `y` is padded so that frame
          `D[:, t]` is centered at `y[t * hop_length]`.
        - If `False`, then `D[:, t]` begins at `y[t * hop_length]`
    dtype : numeric type
        Complex numeric type for `D`.  Default is 64-bit complex.
    pad_mode : string
        If `center=True`, the padding mode to use at the edges of the signal.
        By default, STFT uses reflection padding.
    Returns
    -------
    D : np.ndarray [shape=(1 + n_fft/2, t), dtype=dtype]
        STFT matrix
    See Also
    --------
    istft : Inverse STFT
    ifgram : Instantaneous frequency spectrogram
    np.pad : array padding
    Notes
    -----
    This function caches at level 20.
    """

    # By default, use the entire frame
    if win_length is None:
        win_length = n_fft

    # Set the default hop, if it's not already specified
    if hop_length is None:
        hop_length = int(win_length // 4)

    fft_window = get_window(window, win_length, fftbins=True)

    # Pad the window out to n_fft size
    fft_window = util.pad_center(fft_window, n_fft)

    # Reshape so that the window can be broadcast
    fft_window = fft_window.reshape((-1, 1))

    # Check audio is valid
    util.valid_audio(y)

    # Pad the time series so that frames are centered
    if center:
        y = np.pad(y, int(n_fft // 2), mode=pad_mode)

    # Window the time series.
    y_frames = util.frame(y, frame_length=n_fft, hop_length=hop_length)

    # Pre-allocate the STFT matrix
    stft_matrix = np.empty((int(1 + n_fft // 2), y_frames.shape[1]),
                           dtype=dtype,
                           order='F')

    fft = get_fftlib()

    # how many columns can we fit within MAX_MEM_BLOCK?
    n_columns = int(util.MAX_MEM_BLOCK / (stft_matrix.shape[0] *
                                          stft_matrix.itemsize))

    for bl_s in range(0, stft_matrix.shape[1], n_columns):
        bl_t = min(bl_s + n_columns, stft_matrix.shape[1])

        stft_matrix[:, bl_s:bl_t] = fft.rfft(fft_window *
                                             y_frames[:, bl_s:bl_t],
                                             axis=0)
    return stft_matrix

从stft源码可以看到，LibROSA实际上是先加窗后分帧的，其中原因我也没有仔细研究，留待后续补充吧。源码中，变量fft的类型是一个numpy库的ndarray。逐帧进行快速傅里叶变换时，调用的是scipy或numpy的fft函数，rfft就是实数范围的fft。

经过短时傅里叶变换后，还需要取绝对值，再平方后才能得到能量谱图。这一步骤在librosa.core.spectrum._spectrogram()中：

def _spectrogram(y=None, S=None, n_fft=2048, hop_length=512, power=1,
                 win_length=None, window='hann', center=True, pad_mode='reflect'):
    '''Helper function to retrieve a magnitude spectrogram.
    This is primarily used in feature extraction functions that can operate on
    either audio time-series or spectrogram input.
    Parameters
    ----------
    y : None or np.ndarray [ndim=1]
        If provided, an audio time series
    S : None or np.ndarray
        Spectrogram input, optional
    n_fft : int > 0
        STFT window size
    hop_length : int > 0
        STFT hop length
    power : float > 0
        Exponent for the magnitude spectrogram,
        e.g., 1 for energy, 2 for power, etc.
    win_length : int <= n_fft [scalar]
        Each frame of audio is windowed by `window()`.
        The window will be of length `win_length` and then padded
        with zeros to match `n_fft`.
        If unspecified, defaults to ``win_length = n_fft``.
    window : string, tuple, number, function, or np.ndarray [shape=(n_fft,)]
        - a window specification (string, tuple, or number);
          see `scipy.signal.get_window`
        - a window function, such as `scipy.signal.hanning`
        - a vector or array of length `n_fft`
        .. see also:: `filters.get_window`
    center : boolean
        - If `True`, the signal `y` is padded so that frame
          `t` is centered at `y[t * hop_length]`.
        - If `False`, then frame `t` begins at `y[t * hop_length]`
    pad_mode : string
        If `center=True`, the padding mode to use at the edges of the signal.
        By default, STFT uses reflection padding.
    Returns
    -------
    S_out : np.ndarray [dtype=np.float32]
        - If `S` is provided as input, then `S_out == S`
        - Else, `S_out = |stft(y, ...)|**power`
    n_fft : int > 0
        - If `S` is provided, then `n_fft` is inferred from `S`
        - Else, copied from input
    '''

    if S is not None:
        # Infer n_fft from spectrogram shape
        n_fft = 2 * (S.shape[0] - 1)
    else:
        # Otherwise, compute a magnitude spectrogram from input
        S = np.abs(stft(y, n_fft=n_fft, hop_length=hop_length,
                        win_length=win_length, center=center,
                        window=window, pad_mode=pad_mode))**power

    return S, n_fft

_spectrogram函数的power虽然默认值为1，但被上层函数melspectrogram调用时传入的值为2（后面讲到）。

梅尔滤波器

在获得音频的能量谱的同时，还需要构造一个梅尔滤波器组，并与能量谱进行点积运算。梅尔滤波器的作用是将能量谱转换为更接近人耳机理的梅尔频率。LibROSA将其实现于librosa.filters.mel()中：

def mel(sr, n_fft, n_mels=128, fmin=0.0, fmax=None, htk=False,
        norm=1, dtype=np.float32):
    """Create a Filterbank matrix to combine FFT bins into Mel-frequency bins
    Parameters
    ----------
    sr        : number > 0 [scalar]
        sampling rate of the incoming signal
    n_fft     : int > 0 [scalar]
        number of FFT components
    n_mels    : int > 0 [scalar]
        number of Mel bands to generate
    fmin      : float >= 0 [scalar]
        lowest frequency (in Hz)
    fmax      : float >= 0 [scalar]
        highest frequency (in Hz).
        If `None`, use `fmax = sr / 2.0`
    htk       : bool [scalar]
        use HTK formula instead of Slaney
    norm : {None, 1, np.inf} [scalar]
        if 1, divide the triangular mel weights by the width of the mel band
        (area normalization).  Otherwise, leave all the triangles aiming for
        a peak value of 1.0
    dtype : np.dtype
        The data type of the output basis.
        By default, uses 32-bit (single-precision) floating point.
    Returns
    -------
    M         : np.ndarray [shape=(n_mels, 1 + n_fft/2)]
        Mel transform matrix
    Notes
    -----
    This function caches at level 10,
    """

    if fmax is None:
        fmax = float(sr) / 2

    if norm is not None and norm != 1 and norm != np.inf:
        raise ParameterError('Unsupported norm: {}'.format(repr(norm)))

    # Initialize the weights
    n_mels = int(n_mels)
    weights = np.zeros((n_mels, int(1 + n_fft // 2)), dtype=dtype)

    # Center freqs of each FFT bin
    fftfreqs = fft_frequencies(sr=sr, n_fft=n_fft)

    # 'Center freqs' of mel bands - uniformly spaced between limits
    mel_f = mel_frequencies(n_mels + 2, fmin=fmin, fmax=fmax, htk=htk)

    fdiff = np.diff(mel_f)
    ramps = np.subtract.outer(mel_f, fftfreqs)

    for i in range(n_mels):
        # lower and upper slopes for all bins
        lower = -ramps[i] / fdiff[i]
        upper = ramps[i+2] / fdiff[i+1]

        # .. then intersect them with each other and zero
        weights[i] = np.maximum(0, np.minimum(lower, upper))

    if norm == 1:
        # Slaney-style mel is scaled to be approx constant energy per channel
        enorm = 2.0 / (mel_f[2:n_mels+2] - mel_f[:n_mels])
        weights *= enorm[:, np.newaxis]

    # Only check weights if f_mel[0] is positive
    if not np.all((mel_f[:-2] == 0) | (weights.max(axis=1) > 0)):
        # This means we have an empty channel somewhere
        warnings.warn('Empty filters detected in mel frequency basis. '
                      'Some channels will produce empty responses. '
                      'Try increasing your sampling rate (and fmax) or '
                      'reducing n_mels.')

    return weights

在未指定时，LibROSA默认的梅尔滤波器个数为128。关于梅尔滤波器的知识将在另一篇博文中介绍。

点积运算后即可得到梅尔频谱图，这一步骤体现在librosa.feature.melspectrogram()中：

def melspectrogram(y=None, sr=22050, S=None, n_fft=2048, hop_length=512,
                   win_length=None, window='hann', center=True, pad_mode='reflect',
                   power=2.0, **kwargs):
    """Compute a mel-scaled spectrogram.
    If a spectrogram input `S` is provided, then it is mapped directly onto
    the mel basis `mel_f` by `mel_f.dot(S)`.
    If a time-series input `y, sr` is provided, then its magnitude spectrogram
    `S` is first computed, and then mapped onto the mel scale by
    `mel_f.dot(S**power)`.  By default, `power=2` operates on a power spectrum.
    Parameters
    ----------
    y : np.ndarray [shape=(n,)] or None
        audio time-series
    sr : number > 0 [scalar]
        sampling rate of `y`
    S : np.ndarray [shape=(d, t)]
        spectrogram
    n_fft : int > 0 [scalar]
        length of the FFT window
    hop_length : int > 0 [scalar]
        number of samples between successive frames.
        See `librosa.core.stft`
    win_length : int <= n_fft [scalar]
        Each frame of audio is windowed by `window()`.
        The window will be of length `win_length` and then padded
        with zeros to match `n_fft`.
        If unspecified, defaults to ``win_length = n_fft``.
    window : string, tuple, number, function, or np.ndarray [shape=(n_fft,)]
        - a window specification (string, tuple, or number);
          see `scipy.signal.get_window`
        - a window function, such as `scipy.signal.hanning`
        - a vector or array of length `n_fft`
        .. see also:: `filters.get_window`
    center : boolean
        - If `True`, the signal `y` is padded so that frame
          `t` is centered at `y[t * hop_length]`.
        - If `False`, then frame `t` begins at `y[t * hop_length]`
    pad_mode : string
        If `center=True`, the padding mode to use at the edges of the signal.
        By default, STFT uses reflection padding.
    power : float > 0 [scalar]
        Exponent for the magnitude melspectrogram.
        e.g., 1 for energy, 2 for power, etc.
    kwargs : additional keyword arguments
      Mel filter bank parameters.
      See `librosa.filters.mel` for details.
    Returns
    -------
    S : np.ndarray [shape=(n_mels, t)]
        Mel spectrogram
    See Also
    --------
    librosa.filters.mel
        Mel filter bank construction
    librosa.core.stft
        Short-time Fourier Transform
    
    """

    S, n_fft = _spectrogram(y=y, S=S, n_fft=n_fft, hop_length=hop_length, power=power,
                            win_length=win_length, window=window, center=center,
                            pad_mode=pad_mode)

    # Build a Mel filter
    mel_basis = filters.mel(sr, n_fft, **kwargs)

    return np.dot(mel_basis, S)

取对数

对微小的声音，只要响度稍有增加人耳即可感觉到，但是当声音响度已经大到一定程度后，即使再有较大的增加，人耳的感觉却无明显变化。我们把人耳对声音响度的这种听觉特性称为“对数式”特性。因此，对梅尔频谱图取对数的原因就是为了模拟人耳的“对数式”特性。

LibROSA将这一步骤实现在librosa.core.power_to_db()中：

def power_to_db(S, ref=1.0, amin=1e-10, top_db=80.0):
    """Convert a power spectrogram (amplitude squared) to decibel (dB) units
    This computes the scaling ``10 * log10(S / ref)`` in a numerically
    stable way.
    Parameters
    ----------
    S : np.ndarray
        input power
    ref : scalar or callable
        If scalar, the amplitude `abs(S)` is scaled relative to `ref`:
        `10 * log10(S / ref)`.
        Zeros in the output correspond to positions where `S == ref`.
        If callable, the reference value is computed as `ref(S)`.
    amin : float > 0 [scalar]
        minimum threshold for `abs(S)` and `ref`
    top_db : float >= 0 [scalar]
        threshold the output at `top_db` below the peak:
        ``max(10 * log10(S)) - top_db``
    Returns
    -------
    S_db : np.ndarray
        ``S_db ~= 10 * log10(S) - 10 * log10(ref)``
    See Also
    --------
    perceptual_weighting
    db_to_power
    amplitude_to_db
    db_to_amplitude
    Notes
    -----
    This function caches at level 30.

    """

    S = np.asarray(S)

    if amin <= 0:
        raise ParameterError('amin must be strictly positive')

    if np.issubdtype(S.dtype, np.complexfloating):
        warnings.warn('power_to_db was called on complex input so phase '
                      'information will be discarded. To suppress this warning, '
                      'call power_to_db(np.abs(D)**2) instead.')
        magnitude = np.abs(S)
    else:
        magnitude = S

    if six.callable(ref):
        # User supplied a function to calculate reference power
        ref_value = ref(magnitude)
    else:
        ref_value = np.abs(ref)

    log_spec = 10.0 * np.log10(np.maximum(amin, magnitude))
    log_spec -= 10.0 * np.log10(np.maximum(amin, ref_value))

    if top_db is not None:
        if top_db < 0:
            raise ParameterError('top_db must be non-negative')
        log_spec = np.maximum(log_spec, log_spec.max() - top_db)

    return log_spec

离散余弦变换

最后一步是离散余弦变换（Discrete Cosine Transform，DCT），这一步的目的是改变数据分布，将冗余数据分开。变换后，大部分信号数据将集中在低频区，因此我们通常只需要取变换后的前面一部分数据就可以了（LibROSA的mfcc函数默认取前20个）。

# -- Mel spectrogram and MFCCs -- #
def mfcc(y=None, sr=22050, S=None, n_mfcc=20, dct_type=2, norm='ortho', **kwargs):
    """Mel-frequency cepstral coefficients (MFCCs)
    Parameters
    ----------
    y : np.ndarray [shape=(n,)] or None
        audio time series
    sr : number > 0 [scalar]
        sampling rate of `y`
    S : np.ndarray [shape=(d, t)] or None
        log-power Mel spectrogram
    n_mfcc: int > 0 [scalar]
        number of MFCCs to return
    dct_type : None, or {1, 2, 3}
        Discrete cosine transform (DCT) type.
        By default, DCT type-2 is used.
    norm : None or 'ortho'
        If `dct_type` is `2 or 3`, setting `norm='ortho'` uses an ortho-normal
        DCT basis.
        Normalization is not supported for `dct_type=1`.
    kwargs : additional keyword arguments
        Arguments to `melspectrogram`, if operating
        on time series input
    Returns
    -------
    M : np.ndarray [shape=(n_mfcc, t)]
        MFCC sequence
    See Also
    --------
    melspectrogram
    scipy.fftpack.dct

    """

    if S is None:
        S = power_to_db(melspectrogram(y=y, sr=sr, **kwargs))

    return scipy.fftpack.dct(S, axis=0, type=dct_type, norm=norm)[:n_mfcc]

这一步中LibROSA调用了scipy.fftpack.dct()来做DCT，并取每一帧的前n_mfcc个元素值。

至此，MFCC的提取就完成了。

总结

LibROSA提取MFCC的函数调用链如下图所示：

LibROSA提取音频MFCC特征的函数调用链

前面按照MFCC提取的步骤，逆着调用链解析，发现LibROSA实现的两个特点：没有预加重的过程；不同于其他库从stft→mel就完成了数据降维，LibROSA是留到最后才进行降维。对于第二个特点，这么做的原因、对性能是否会有影响我还没有去深究。

本文的代码摘自LibROSA的官方GitHub：https://github.com/librosa/librosa

ok113i——交叉编译音视频动态库枪眼 linux 音视频 t113i 嵌入式Linux
提示：buildroot支持ffmpeg和SDL，但博主的ffmpeg是按下面方法编译通过，SDL使用buildroot直接编译也通过；1.下载ffmpeg源码下载链接：https://github.com/FFmpeg/FFmpeg/tags根据版本需要自行下载压缩包，这里下载的是n4.4.5版本；解压：tar-xvfFFmpeg-n4.4.5.tar.gz；解压后得到FFmpeg-n4.4.5
ok113i平台——多媒体播放器适配枪眼 linux 嵌入式Linux 音视频 t113i
1.视频播放支持1.1在Linux平台交叉编译ffmpeg动态库，详情查看《ok113i平台——交叉编译音视频动态库》提取如下动态库：libavcodec.so.58.134.100libavdevice.so.58.13.100libavfilter.so.7.110.100libavformat.so.58.76.100libavutil.so.56.70.100libswresample.s
【音视频】如何对wav音频文件进行opus编解码？川弥音视频 python 视频编解码 bash linux ffmpeg 音频数据分析
目录前言一、opus编码二、方法1.在Linux下，使用ffmpeg命令行首先，安装FFmpeg编码WAV文件为Opus解码Opus文件回WAV修改参数2.使用bash脚本3.使用Python库函数总结前言详细的opus编解码过程一、opus编码Opus是一种常用的开放源代码的音频压缩格式，由Internet工程任务组(IETF)制定。它旨在提供高质量的语音和音乐传输服务，特别是在网络带宽受限的情
嵌入式音视频开发（二）ffmpeg音视频同步云雨歇音视频 ffmpeg
系列文章目录嵌入式音视频开发（零）移植ffmpeg及推流测试嵌入式音视频开发（一）ffmpeg框架及内核解析嵌入式音视频开发（二）ffmpeg音视频同步嵌入式音视频开发（三）直播协议及编码器文章目录系列文章目录前言一、音视频同步1.1基础概念1.2三种同步方法二、音视频同步的实现2.1时间基的转换问题2.2音频为基准2.2.1实现思路2.2.2代码大纲2.3外部时钟同步2.3.1实现思路2.3.2
Coze扣子专业版计费规则调整一览落笔画忧愁e 扣子商店 Coze插件
就在今晚(2025-01-24)，扣子更新了专业版的计费规则更新时间：2025年2月中旬主要更新内容：新增扣子资源包，原智能体资源包、大模型资源包下架。专业版用户每日赠送500资源点（仅限当日有效），可抵扣智能体调用费用和模型调用费用语音识别API、语音合成API、实时音视频SDK全面开放，无需申请即可使用更新详解：智能体资源包、大模型资源包下架处理，剩余资源用量使用完毕后，不支持续费。新增扣子资
[总结] 音视频开发工程师之路二进制怪兽音视频音视频
前言音视频开发是一个涉及多个技术领域的复杂方向，涵盖了音频处理、视频渲染、编解码技术、流媒体传输等多个方面。以下是一个简要的学习路线指南，帮助你逐步掌握音视频开发的核心技能。基础知识计算机科学基础：掌握操作系统、计算机网络、数据结构和算法等基础知识。数学基础：了解傅里叶变换、线性代数、信号处理等数学知识，这些是音视频编-解码和处理的基石。编程语言：熟练掌握C/C++，这是音视频开发中最常用的语言；
如何高效使用Zoom视频会议软件：功能解析与操作指南 concisedistinct IT工具 zoom 视频软件视频会议
目录1.Zoom的基本功能介绍1.1视频会议1.2语音会议1.3屏幕共享1.4会议录制1.5聊天和文件共享1.6会议室和个人会议ID2.Zoom的使用方法2.1安装Zoom2.2创建和加入会议2.2.1创建会议2.2.2加入会议2.3会议管理2.3.1音视频控制2.3.2屏幕共享管理2.3.3分组讨论2.3.4录制管理3.Zoom的高级功能和技巧3.1虚拟背景3.2白板功能3.3多摄像头支持4.Z
iOS 中使用 FFmpeg 的高级功能 - 滤镜（Filters）陈皮话梅糖@ FFmpeg音视频高阶技术讲解 ios ffmpeg
FFmpeg提供了强大的滤镜功能，可以对音视频进行各种处理，例如裁剪、缩放、添加水印、调整颜色、添加特效等。1.FFmpeg滤镜基础知识1.1什么是滤镜（Filters）？滤镜是FFmpeg提供的一种功能，用于对音视频流进行处理。滤镜链（FilterChain）是多个滤镜的组合，按顺序对输入流进行处理。滤镜图（FilterGraph）是一个复杂的滤镜链，可以包含多个输入和输出。1.2常见的滤镜滤镜
ffmpeg 多路流处理在iOS的具体使用陈皮话梅糖@ FFmpeg音视频高阶技术讲解 ffmpeg ios
多路流处理可以用于操作音视频文件中的多个流（如视频流、音频流、字幕流等），实现流的提取、替换、合并等操作。1.什么是多路流处理？1.1多路流的概念一个多媒体文件（如MP4、MKV）通常包含多个流：视频流：存储视频数据。音频流：存储音频数据。字幕流：存储字幕数据。FFmpeg提供了强大的工具来操作这些流，例如提取、替换、合并等。1.2常见的多路流操作操作类型功能描述提取流从文件中提取特定的流（如音频
音视频合成功能
场景描述类似音视频配音功能，适用于给视频配音，配乐。场景1：输入一个视频文件和一个音频文件，将他们合成1个视频文件，要求音频文件合成到视频制定的时间范围。场景2：输入一个视频文件和多个音频文件，将他们合成1个视频文件，要求将多个音频文件合成到视频制定的时间范围。2.1多个音频文件串行合成。2.2多个音频文件并行合成。备注：多个音频文件编码类型要一致，还要确保封装格式是支持的。方案描述TS侧通过XC
FFmpeg源码分析：avformat_open_input chaisy971124568 WebRTC 音视频 FFmpeg ffmpeg
一、函数功能介绍当前支持的媒体解封装协议在libavformat/demuxer_list.c文件的demuxer_list变量中定义当前支持的音视频采集格式在libavdevice/indev_list.c文件的indev_list变量中定义用户可以自行查看av_find_input_format函数的具体逻辑，得知最新版本的ffmpeg支持情况。注意：若进行音视频采集之前，则必须执行avdev
WebRTC学习二：WebRTC音视频数据采集 m0_74823239 webrtc 学习音视频
系列文章目录第一篇基于SRS的WebRTC环境搭建第二篇基于SRS实现RTSP接入与WebRTC播放第三篇centos下基于ZLMediaKit的WebRTC环境搭建第四篇WebRTC学习一：获取音频和视频设备第五篇WebRTC学习二：WebRTC音视频数据采集文章目录系列文章目录前言一、获取音视频流1.设置请求的媒体流参数2.调用getUserMedia3.处理获取到的媒体流4.处理错误二、完整
【一文读懂】什么是RTSP协议？ Bl_a_ck 通讯协议 udp tcp/ip 网络网络协议 rtsp
RTSP协议（Real-TimeStreamingProtocol）RTSP（Real-TimeStreamingProtocol）是一个网络控制协议，用于在实时流媒体传输中管理多媒体数据的传输。RTSP并不传输数据本身，而是用于控制流媒体服务器，类似于HTTP协议，但它主要用于多媒体流的控制，比如音视频流的播放、暂停、停止等操作。工作原理RTSP协议本质上是一个客户端-服务器协议。客户端发起请求
开发美颜相机录制视频时，对于音频数据的处理陈皮话梅糖@ FFmpeg音视频高阶技术讲解 OpenGLES 连载数码相机音视频
在开发美颜相机并录制视频时，音频数据通常也是需要录制的。视频录制不仅包括视频数据，还需要同步录制音频数据，以生成一个完整的音视频文件。如果你只处理视频数据而忽略音频数据，录制出来的文件将没有声音，或者需要后期再合成音频，这会增加复杂性。因此，在录制美颜后的视频时，音频数据的录制和同步也是非常重要的。以下是如何在录制美颜后的视频时同时录制音频数据的完整实现思路。1.音频录制的基本原理使用AVCapt
WebP2P+自研回音消除：视频通话SDK嵌入式EasyRTC构建高交互性音视频应用 Likeadust 音视频 p2p WebP2P webrtc
随着移动互联网时代的到来，手机端的扬声器大多采用外置设计，且音量较大。在这种情况下，扬声器播放的声音更容易被麦克风捕捉，从而导致回声问题显著加剧。这种设计虽然方便用户在免提模式下使用，但也带来了更复杂的音频处理挑战。回音消除算法的核心在于从麦克风采集的混合信号中分离出原始语音信号和回声信号，并将回声信号从混合信号中移除。EasyRTC采用的自研算法基于以下几种技术：自适应滤波器：通过实时调整滤波器
RV1126解码（1）学习嵌入式的小羊~ rv1126解码音视频 ffmpeg
比如我们现在要拉一个流，拉一个rtmp或者拉一个rtsp的流，让它显示到显示屏上面去，此时就要用到我们这个解码模块了，把它个解出来并且发到其他模块去。主要功能是通过FFMPEG的API读取每一帧的音视频数据，并通过RV1126的解码，对每一帧的压缩数据进行解码操作，并最终把解码的数据打印出来。这里要注意的是，在本DEMO中我们重点讲解RV1126的视频解码，音频解码不会做过多的说，因为要涉及到音视
WebRTC与EasyRTC:开启智能硬件音视频通讯的全新旅程 EasyNVR EasyRTC webrtc 智能硬件音视频网络视频监控安全
在当今数字化时代，音视频通讯技术正以前所未有的速度革新着我们的生活与工作方式。WebRTC与EasyRTC作为这一领域的佼佼者，正携手为智能硬件的音视频通讯注入强大动力，开启全新的篇章。一、WebRTC与智能硬件融合的崭新趋势WebRTC技术，凭借其无需插件或额外软件即可实现点对点实时通信的卓越优势，已然成为视频会议、语音通话及文件共享等众多领域的宠儿。如今，它更是泛娱乐直播、在线教育及远程会议等
Android音视频开发实战系列教程 Stark T android 音视频
Android音视频开发实战系列教程指南在这篇文章中，我们将通过一个逐步流程，帮助刚入行的小白学习如何进行Android音视频开发。本教程会展示实施的步骤、所需的代码示例及其注释，最后还包括旅行图和类图来进一步帮助理解。开发流程我们可以将音视频开发的整个流程分为以下几个步骤。请看下表：步骤描述1.环境搭建安装所需的软件和开发工具2.项目创建创建Android项目并导入其他依赖库3.引入音视频SDK
Android平台FFmpeg多媒体处理实战雲明
本文还有配套的精品资源，点击获取简介：FFmpeg在Android平台为开发者提供强大的音视频处理能力，涵盖编解码、容器格式解析、软硬解码切换、音频重采样和视频转换等关键功能。本项目介绍如何集成FFmpeg到Android应用，包括编译库、解封装、解码、硬解支持、音频重采样、视频转换和测试代码的使用，为音视频应用开发提供完整流程的实践指南。1.Android平台上FFmpeg的应用和重要性1.1F
FFmpeg音视频编解码优化 AI天才研究院计算 AI大模型企业级应用开发实战 DeepSeek R1 &大数据AI人工智能大模型 java python javascript kotlin golang 架构人工智能大厂程序员硅基计算碳基计算认知计算生物计算深度学习神经网络大数据 AIGC AGI LLM 系统架构设计软件哲学 Agent 程序员实现财富自由
FFmpeg音视频编解码优化关键词FFmpeg音视频编解码优化策略性能测试实战案例摘要本文将围绕FFmpeg音视频编解码优化这一主题，详细介绍FFmpeg的基础知识、安装配置、音视频编解码原理、性能优化方法，以及实际应用中的实战案例。通过对FFmpeg的深入分析，读者将了解到如何高效地利用FFmpeg进行音视频处理，提升编解码性能，为音视频处理项目提供实用的优化方案。目录大纲第一部分：FFmpeg
音视频：11.Shell脚本-动手编译FFmpeg eastRiseWm 音视频
Shell脚本-动手编译FFmpeg1.Cmake交叉编译Android动态库2.配置NDK环境2.1NDK中交叉编译工具的变化2.1.1.交叉编译工具位置的变化:3.手写FFmpeg编译脚本4.编译遇到的问题5.如何适配so框架6.编译参数传递7.运行调试音频解码避坑指南1.Cmake交叉编译Android动态库交叉编译：Linux上编译Android的sondk16的以上版本自带交叉编译工具链
Linux 上使用 Rust、Golang 和 C++ 进行应用开发比较孽小倩 linux 开发语言 linux rust
作为一名前音视频编解码工程师，最常使用的语言是c/c++,但是永久了总想尝试下其他语言。rust一直被宣传为未来取代c++的语言，所以这次总结下golang，rust，与c++在linux开发应用时各自的优缺点，方便以后作出选择。这里从内存安全、性能、并发模型、生态系统、跨平台、开发体验这几个方面进行比较。1.内存安全语言内存安全Rust✅最安全（所有权&借用检查）Golang✅自动垃圾回收（GC
【音视频】ffmpeg android端调试指南 MooMLu 音视频 ffmpeg android
背景：本文旨在Android端导入和调试ffmpeg使用，作为工具文档简化初次入门使用难度。下载FFmpeg源码：gitclonehttps://github.com/FFmpeg/FFmpeg.git编译FFmpeg源码：创建Android端编译脚本：#!/bin/bashAPI=21NDK=/Users/admin/Downloads/android-ndk-r21ePREBUILT=$NDK
qt+ffmpeg 实现音视频播放（二）之音频播放码农客栈_V13427279549 ffmpeg 音视频 Qt qt ffmpeg 音视频
一、音频播放流程1、打开音频文件通过avformat_open_input()打开媒体文件并分配和初始化AVFormatContext结构体。函数原型如下：intavformat_open_input(AVFormatContext**ps,constchar*url,AVInputFormat*fmt,AVDictionary**options);参数说明：-`ps`：指向`AVFormatCo
【鸿蒙HarmonyOS Next实战开发】多媒体视频播放-GSYVideoPlayer 阿康2024 harmonyos 音视频华为
简介GSYVideoPlayer是一个视频播放器库，支持切换内核播放器（IJKPlayer、avplayer），并且支持视频截图能力、视频生成gif能力、边播边缓存能力、视频全屏能力等多种能力。效果展示：下载安装ohpminstall@ohos/gsyvideoplayerOpenHarmonyohpm环境配置等更多内容，请参考如何安装OpenHarmonyohpm包使用说明规格说明目前支持音视频
【鸿蒙HarmonyOS Next实战开发】mp4parser库-音视频裁剪、合成、取帧等操作阿康2024 鸿蒙应用开发 harmonyos
mp4parser简介一个读取、写入操作音视频文件编辑的工具。下载安装ohpminstall@ohos/mp4parserOpenHarmonyohpm环境配置等更多内容，请参考如何安装OpenHarmonyohpm包使用说明视频合成import{MP4Parser}from"@ohos/mp4parser";import{ICallBack}from"@ohos/mp4parser";/***视
工作笔记 | 音视频开发与学习提升军事研究员 25.音视频编解码笔记音视频学习
工作笔记|音视频开发与学习提升时间：2025年2月6日09:22:32文章目录工作笔记|[音视频开发与学习提升](https://blog.csdn.net/I_feige/article/details/145459448?sharetype=blogdetail&sharerId=145459448&sharerefer=PC&sharesource=I_feige&spm=1011.2480
【音视频】RTSP拉流: RTP协议头部详解(二) 自由柿音视频
此文为系列文章，此系列主要讲解RTSP客户端的拉流及播放，文章持续更新，会从rtsp的基本协议讲起，如何一步步实现音视频的拉流过程，包括一系列涉及到的协议，rtsp，sdp，rtp（本系列文章的核心内容会放在rtp协议，会重点介绍讲解rtp负载部分），rtcp，从rtp解析aac，h264数据帧，得到帧后如何交给解码库(ffmpeg,libVLC，live555等)进行解码，音视频同步并播放音
【Android 音视频开发打怪升级：音视频硬解码篇】二、音视频硬解码流程：封装基础解码框架(1) 2401_84132544 程序员 android 音视频
首先，这一系列文章均基于自己的理解和实践，可能有不对的地方，欢迎大家指正。其次，这是一个入门系列，涉及的知识也仅限于够用，深入的知识网上也有许许多多的博文供大家学习了。最后，写文章过程中，会借鉴参考其他人分享的文章，会在文章最后列出，感谢这些作者的分享。码字不易，转载请注明出处！教程代码：【Github传送门】目录一、Android音视频硬解码篇：1，音视频基础知识2，音视频硬解码流程：封装基础解
音视频小程序端常见问题 weixin_69626842 音视频小程序 android 腾讯云实时互动
小程序的环境要求是怎样的？微信AppiOS最低版本要求：7.0.9微信AppAndroid最低版本要求：7.0.8小程序基础库最低版本要求：2.10.0由于小程序测试号不具备和的使用权限，请使用企业小程序账号申请相关权限进行开发。由于微信开发者工具不支持原生组件（即和标签），需要在真机上进行运行体验。不支持uniapp开发环境，请使用原生小程序开发环境。更多详情请参见快速集成(小程序)。小程序端如
java数字签名三种方式知了ing java jdk
以下3钟数字签名都是基于jdk7的 1，RSA String password="test"; // 1.初始化密钥 KeyPairGenerator keyPairGenerator = KeyPairGenerator.getInstance("RSA"); keyPairGenerator.initialize(51
Hibernate学习笔记 caoyong Hibernate
1>、Hibernate是数据访问层框架，是一个ORM(Object Relation Mapping)框架，作者为:Gavin King 2>、搭建Hibernate的开发环境 a>、添加jar包: aa>、hibernatte开发包中/lib/required/所
设计模式之装饰器模式Decorator（结构型）漂泊一剑客 Decorator
1. 概述若你从事过面向对象开发，实现给一个类或对象增加行为，使用继承机制，这是所有面向对象语言的一个基本特性。如果已经存在的一个类缺少某些方法，或者须要给方法添加更多的功能（魅力），你也许会仅仅继承这个类来产生一个新类—这建立在额外的代码上。
读取磁盘文件txt，并输入String 一炮送你回车库 String
public static void main(String[] args) throws IOException { String fileContent = readFileContent("d:/aaa.txt"); System.out.println(fileContent);
js三级联动下拉框 3213213333332132 三级联动
//三级联动省/直辖市<select id="province"></select> 市/省直辖<select id="city"></select> 县/区 <select id="area"></select>
erlang之parse_transform编译选项的应用 616050468 parse_transform 游戏服务器属性同步 abstract_code
最近使用erlang重构了游戏服务器的所有代码，之前看过C++/lua写的服务器引擎代码，引擎实现了玩家属性自动同步给前端和增量更新玩家数据到数据库的功能，这也是现在很多游戏服务器的优化方向，在引擎层面去解决数据同步和数据持久化，数据发生变化了业务层不需要关心怎么去同步给前端。由于游戏过程中玩家每个业务中玩家数据更改的量其实是很少
JAVA JSON的解析 darkranger java
// { // “Total”：“条数”， // Code: 1, // // “PaymentItems”:[ // { // “PaymentItemID”:”支款单ID”, // “PaymentCode”:”支款单编号”, // “PaymentTime”:”支款日期”, // ”ContractNo”:”合同号”， //
POJ-1273-Drainage Ditches aijuans ACM_POJ
POJ-1273-Drainage Ditches http://poj.org/problem?id=1273 基本的最大流，按LRJ的白书写的 #include<iostream> #include<cstring> #include<queue> using namespace std; #define INF 0x7fffffff int ma
工作流Activiti5表的命名及含义 atongyeye 工作流 Activiti
activiti5 - http://activiti.org/designer/update在线插件安装 activiti5一共23张表 Activiti的表都以ACT_开头。第二部分是表示表的用途的两个字母标识。用途也和服务的API对应。 ACT_RE_*: 'RE'表示repository。这个前缀的表包含了流程定义和流程静态资源（图片，规则，等等）。 A
android的广播机制和广播的简单使用百合不是茶 android 广播机制广播的注册
Android广播机制简介在Android中，有一些操作完成以后，会发送广播，比如说发出一条短信，或打出一个电话，如果某个程序接收了这个广播，就会做相应的处理。这个广播跟我们传统意义中的电台广播有些相似之处。之所以叫做广播，就是因为它只负责“说”而不管你“听不听”，也就是不管你接收方如何处理。另外，广播可以被不只一个应用程序所接收，当然也可能不被任何应
Spring事务传播行为详解 bijian1013 java spring 事务传播行为
在service类前加上@Transactional，声明这个service所有方法需要事务管理。每一个业务方法开始时都会打开一个事务。 Spring默认情况下会对运行期例外(RunTimeException)进行事务回滚。这
eidtplus operate 征客丶 eidtplus
开启列模式: Alt+C 鼠标选择 OR Alt+鼠标左键拖动列模式替换或复制内容(多行): 右键-->格式-->填充所选内容-->选择相应操作 OR Ctrl+Shift+V(复制多行数据,必须行数一致) -------------------------------------------------------
【Kafka一】Kafka入门 bit1129 kafka
这篇文章来自Spark集成Kafka(http://bit1129.iteye.com/blog/2174765)，这里把它单独取出来，作为Kafka的入门吧下载Kafka http://mirror.bit.edu.cn/apache/kafka/0.8.1.1/kafka_2.10-0.8.1.1.tgz 2.10表示Scala的版本，而0.8.1.1表示Kafka
Spring 事务实现机制 BlueSkator spring 代理事务
Spring是以代理的方式实现对事务的管理。我们在Action中所使用的Service对象，其实是代理对象的实例，并不是我们所写的Service对象实例。既然是两个不同的对象，那为什么我们在Action中可以象使用Service对象一样的使用代理对象呢？为了说明问题，假设有个Service类叫AService，它的Spring事务代理类为AProxyService，AService实现了一个接口
bootstrap源码学习与示例：bootstrap-dropdown（转帖） BreakingBad bootstrap dropdown
bootstrap-dropdown组件是个烂东西，我读后的整体感觉。一个下拉开菜单的设计： <ul class="nav pull-right"> <li id="fat-menu" class="dropdown">
读《研磨设计模式》-代码笔记-中介者模式-Mediator bylijinnan java 设计模式
声明：本文只为方便我个人查阅和理解，详细的分析以及源代码请移步原作者的博客http://chjavach.iteye.com/ /* * 中介者模式（Mediator）：用一个中介对象来封装一系列的对象交互。 * 中介者使各对象不需要显式地相互引用，从而使其耦合松散，而且可以独立地改变它们之间的交互。 * * 在我看来，Mediator模式是把多个对象（
常用代码记录 chenjunt3 UI Excel J#
1、单据设置某行或某字段不能修改 //i是行号,"cash"是字段名称 getBillCardPanelWrapper().getBillCardPanel().getBillModel().setCellEditable(i, "cash", false); //取得单据表体所有项用以上语句做循环就能设置整行了 getBillC
搜索引擎与工作流引擎 comsci 算法工作搜索引擎网络应用
最近在公司做和搜索有关的工作，(只是简单的应用开源工具集成到自己的产品中)工作流系统的进一步设计暂时放在一边了，偶然看到谷歌的研究员吴军写的数学之美系列中的搜索引擎与图论这篇文章中的介绍，我发现这样一个关系(仅仅是猜想) -----搜索引擎和流程引擎的基础--都是图论，至少像在我在JWFD中引擎算法中用到的是自定义的广度优先
oracle Health Monitor daizj oracle Health Monitor
About Health Monitor Beginning with Release 11g, Oracle Database includes a framework called Health Monitor for running diagnostic checks on the database. About Health Monitor Checks Health M
JSON字符串转换为对象 dieslrae java json
作为前言,首先是要吐槽一下公司的脑残编译部署方式,web和core分开部署本来没什么问题,但是这丫居然不把json的包作为基础包而作为web的包,导致了core端不能使用,而且我们的core是可以当web来用的(不要在意这些细节),所以在core中处理json串就是个问题.没办法,跟编译那帮人也扯不清楚,只有自己写json的解析了.
C语言学习八结构体，综合应用，学生管理系统 dcj3sjt126com C语言
实现功能的代码： # include <stdio.h> # include <malloc.h> struct Student { int age; float score; char name[100]; }; int main(void) { int len; struct Student * pArr; int i,
vagrant学习笔记 dcj3sjt126com vagrant
想了解多主机是如何定义和使用的, 所以又学习了一遍vagrant 1. vagrant virtualbox 下载安装 https://www.vagrantup.com/downloads.html https://www.virtualbox.org/wiki/Downloads 查看安装在命令行输入vagrant 2.
14.性能优化-优化-软件配置优化 frank1234 软件配置性能优化
1.Tomcat线程池修改tomcat的server.xml文件： <Connector port="8080" protocol="HTTP/1.1" connectionTimeout="20000" redirectPort="8443" maxThreads="1200" m
一个不错的shell 脚本教程入门级 HarborChung linux shell
一个不错的shell 脚本教程入门级建立一个脚本　　Linux中有好多中不同的shell，但是通常我们使用bash (bourne again shell) 进行shell编程，因为bash是免费的并且很容易使用。所以在本文中笔者所提供的脚本都是使用bash（但是在大多数情况下，这些脚本同样可以在 bash的大姐，bourne shell中运行）。　　如同其他语言一样
Spring4新特性——核心容器的其他改进 jinnianshilongnian spring 动态代理 spring4 依赖注入
Spring4新特性——泛型限定式依赖注入 Spring4新特性——核心容器的其他改进 Spring4新特性——Web开发的增强 Spring4新特性——集成Bean Validation 1.1(JSR-349)到SpringMVC Spring4新特性——Groovy Bean定义DSL Spring4新特性——更好的Java泛型操作API Spring4新
Linux设置tomcat开机启动 liuxingguome tomcat linux 开机自启动
执行命令sudo gedit /etc/init.d/tomcat6 然后把以下英文部分复制过去。（注意第一句#!/bin/sh如果不写，就不是一个shell文件。然后将对应的jdk和tomcat换成你自己的目录就行了。 #!/bin/bash # # /etc/rc.d/init.d/tomcat # init script for tomcat precesses
第13章 Ajax进阶（下） onestopweb Ajax
index.html <!DOCTYPE html PUBLIC "-//W3C//DTD XHTML 1.0 Transitional//EN" "http://www.w3.org/TR/xhtml1/DTD/xhtml1-transitional.dtd"> <html xmlns="http://www.w3.org/
Troubleshooting Crystal Reports off BW blueoxygen BO
http://wiki.sdn.sap.com/wiki/display/BOBJ/Troubleshooting+Crystal+Reports+off+BW#TroubleshootingCrystalReportsoffBW-TracingBOE Quite useful, especially this part: SAP BW connectivity For t
Java开发熟手该当心的11个错误 tomcat_oracle java jvm 多线程单元测试
#1、不在属性文件或XML文件中外化配置属性。比如，没有把批处理使用的线程数设置成可在属性文件中配置。你的批处理程序无论在DEV环境中，还是UAT（用户验收测试）环境中，都可以顺畅无阻地运行，但是一旦部署在PROD 上，把它作为多线程程序处理更大的数据集时，就会抛出IOException，原因可能是JDBC驱动版本不同，也可能是#2中讨论的问题。如果线程数目可以在属性文件中配置，那么使它成为
正则表达式大全 yang852220741 html 编程正则表达式
今天向大家分享正则表达式大全，它可以大提高你的工作效率正则表达式也可以被当作是一门语言，当你学习一门新的编程语言的时候，他们是一个小的子语言。初看时觉得它没有任何的意义，但是很多时候，你不得不阅读一些教程，或文章来理解这些简单的描述模式。一、校验数字的表达式数字：^[0-9]*$ n位的数字：^\d{n}$ 至少n位的数字：^\d{n,}$ m-n位的数字：^\d{m,n}$

LibROSA库提取MFCC特征的过程解析

源码解析

获取梅尔频谱

分帧

加窗

快速傅里叶变换

梅尔滤波器

取对数

离散余弦变换

总结

你可能感兴趣的:(音视频)