丶葉SiR

Matlab中MFCC的几种实现方式（转载）

几种函数对比及说明

melbankm
由Voicebox提供，在Mel频率上设计平均分布的滤波器，此函数与音频信号没有关系，只是做MFCC前对滤波器的设计。

function [x,mc,mn,mx]=melbankm(p,n,fs,fl,fh,w)
%MELBANKM determine matrix for a mel/erb/bark-spaced filterbank [X,MN,MX]=(P,N,FS,FL,FH,W)
%
% Inputs:
%       p   number of filters in filterbank or the filter spacing in k-mel/bark/erb [ceil(4.6*log10(fs))]
%       n   length of fft
%       fs  sample rate in Hz
%       fl  low end of the lowest filter as a fraction of fs [default = 0]
%       fh  high end of highest filter as a fraction of fs [default = 0.5]
%       w   any sensible combination of the following:
%             可取代Mel频率的选项：
%             'b' = bark scale instead of mel
%             'e' = erb-rate scale
%             'l' = log10 Hz frequency scale
%             'f' = linear frequency scale
%
%             'c' = fl/fh specify centre of low and high filters
%             'h' = fl/fh are in Hz instead of fractions of fs
%             'H' = fl/fh are in mel/erb/bark/log10
%
%             滤波器形状：
%             't' = triangular shaped filters in mel/erb/bark domain (default)
%             'n' = hanning shaped filters in mel/erb/bark domain
%             'm' = hamming shaped filters in mel/erb/bark domain
%
%             'z' = highest and lowest filters taper down to zero [default]
%             'y' = lowest filter remains at 1 down to 0 frequency and
%                   highest filter remains at 1 up to nyquist freqency
%
%             'u' = scale filters to sum to unity
%
%             's' = single-sided: do not double filters to account for negative frequencies
%
%             输出滤波器组的响应曲线：
%             'g' = plot idealized filters [default if no output arguments present]
%
% Note that the filter shape (triangular, hamming etc) is defined in the mel (or erb etc) domain.
% Some people instead define an asymmetric triangular filter in the frequency domain.
%
%              If 'ty' or 'ny' is specified, the total power in the fft is preserved.
%
% Outputs:  x     a sparse matrix containing the filterbank amplitudes
%                 If the mn and mx outputs are given then size(x)=[p,mx-mn+1]
%                 otherwise size(x)=[p,1+floor(n/2)]
%                 Note that the peak filter values equal 2 to account for the power
%                 in the negative FFT frequencies.
%           mc    the filterbank centre frequencies in mel/erb/bark滤波器中心频率
%           mn    the lowest fft bin with a non-zero coefficient
%           mx    the highest fft bin with a non-zero coefficient
%                 Note: you must specify both or neither of mn and mx.mn与mx必须同时指定或者不指定
%
% =============================！用法举例（MFCC流程）==============================
%
% (a) Calcuate the Mel-frequency Cepstral Coefficients
%
%       f=rfft(s);                  % rfft() returns only 1+floor(n/2) coefficients去除虚数部分
%       x=melbankm(p,n,fs);         % n is the fft length, p is the number of filters wanted
%       z=log(x*abs(f).^2);         % multiply x by the power spectrum
%       c=dct(z);                   % take the DCT
%
% (b) Calcuate the Mel-frequency Cepstral Coefficients efficiently
%
%       f=fft(s);                        % n is the fft length, p is the number of filters wanted
%       [x,mc,na,nb]=melbankm(p,n,fs);   % na:nb gives the fft bins that are needed
%       z=log(x*(f(na:nb)).*conj(f(na:nb)));
%
% (c) Plot the calculated filterbanks
%
%      plot((0:floor(n/2))*fs/n,melbankm(p,n,fs)')   % fs=sample frequency
%
% (d) Plot the idealized filterbanks (without output sampling)
%
%      melbankm(p,n,fs);

该函数只是设计滤波器组，属于MFCC处理的一部分。

mfcc_m
由宋知用老师书中提供，涉及到归一化Mel滤波器组系数、归一化倒谱提升窗口。

bank=melbankm(p,frameSize,fs,0,0.5,'m');
% 归一化Mel滤波器组系数
bank=full(bank);
bank=bank/max(bank( : ));

% 归一化倒谱提升窗口：对MFCC系数中某些谱线进行增强

w = 1 + 6 * sin(pi * [1:p2] ./ p2);
w = w/max(w);

需要修正的地方：
只有一阶差分系数；
滤波器选择后并不能只截取想要的部分；
归一化Mel滤波器组系数、归一化倒谱提升窗口有待考证。

melcepst
属于voicebox工具箱，现在官方已经不提供了，程序中调用了melbankm函数。

function [c,tc]=melcepst(s,fs,w,nc,p,n,inc,fl,fh)
%MELCEPST Calculate the mel cepstrum of a signal C=(S,FS,W,NC,P,N,INC,FL,FH)
%
%
% Simple use: (1) c=melcepst(s,fs)          % calculate mel cepstrum with 12 coefs, 256 sample frames
%             (2) c=melcepst(s,fs,'E0dD')   % include log energy, 0th cepstral coef, delta and delta-delta coefs
%
% Inputs:
%     s   speech signal
%     fs  sample rate in Hz (default 11025)
%     w   mode string (see below)
%     nc  number of cepstral coefficients excluding 0'th coefficient [default 12] MFCC维数设定
%     p   number of filters in filterbank [default: floor(3*log(fs)) =  approx 2.1 per ocatave] 滤波器数量
%     n   length of frame in samples [default power of 2 < (0.03*fs)] 帧长
%     inc frame increment [default n/2] 帧移
%     fl  low end of the lowest filter as a fraction of fs [default = 0] 滤波器最低频率
%     fh  high end of highest filter as a fraction of fs [default = 0.5] 滤波器最高频率，通过fs归一化
%
%     w   any sensible combination of the following:
%               时域窗函数：
%               'R'  rectangular window in time domain
%               'N'  Hanning window in time domain
%               'M'  Hamming window in time domain (default)
%
%               频域窗函数：
%               't'  triangular shaped filters in mel domain (default)
%               'n'  hanning shaped filters in mel domain
%               'm'  hamming shaped filters in mel domain
%
%
%               'p'  filters act in the power domain
%               'a'  filters act in the absolute magnitude domain (default)
%
%               MFCC除12维基本参数之外的选择：
%               '0'  include 0'th order cepstral coefficient
%               'E'  include log energy
%               'd'  include delta coefficients (dc/dt)
%               'D'  include delta-delta coefficients (d^2c/dt^2)
%
%               滤波器频率设置：
%               'z'  highest and lowest filters taper down to zero (default)
%               'y'  lowest filter remains at 1 down to 0 frequency and
%                    highest filter remains at 1 up to nyquist freqency
%
%              If 'ty' or 'ny' is specified, the total power in the fft is preserved.
%
% Outputs:  c     mel cepstrum output: one frame per row. Log energy, if requested, is the
%                 first element of each row followed by the delta and then the delta-delta
%                 coefficients.
%           tc    fractional time in samples at the centre of each frame
%                 with the first sample being 1.

% ==================================设置默认参数=================================
if nargin<2 fs=11025; end% 滤波器的最高频率
if nargin<3 w='M'; end% hamming窗
if nargin<4 nc=12; end% MFCC维数
if nargin<5 p=floor(3*log(fs)); end% p个滤波器
if nargin<6 n=pow2(floor(log2(0.03*fs))); end% n是一帧FFT后数据的长度
if nargin<9
   fh=0.5;% 滤波器的最高频率，用fs归一化   
   if nargin<8
     fl=0;% 设计滤波器的最低频率
     if nargin<7
        inc=floor(n/2);
     end
  end
end

if isempty(w)
   w='M';
end
if any(w=='R')
   [z,tc]=enframe(s,n,inc);
elseif any (w=='N')
   [z,tc]=enframe(s,hanning(n),inc);
else
   [z,tc]=enframe(s,hamming(n),inc);
end

% =================================！理论核心部分=================================
f=rfft(z.');
[m,a,b]=melbankm(p,n,fs,fl,fh,w);% m为滤波器的频域响应
pw=f(a:b,:).*conj(f(a:b,:));% 计算帧能量
pth=max(pw(:))*1E-20;
if any(w=='p')
   y=log(max(m*pw,pth));
else
   ath=sqrt(pth);
   y=log(max(m*abs(f(a:b,:)),ath));
end
c=rdct(y).';% 得到13维系数

nf=size(c,1);
nc=nc+1;
if p>nc
   c(:,nc+1:end)=[];% 当滤波器个数比所需维数多的时候，就将后面滤波器获得的参数删去
elseif p<nc
   c=[c zeros(nf,nc-p)];% 滤波器个数少的时候，用0补齐
end
if ~any(w=='0')
   c(:,1)=[];
   nc=nc-1;
end
if any(w=='E')
   c=[log(max(sum(pw),pth)).' c];
   nc=nc+1;
end

% ===============================计算一阶和二阶差分==============================
if any(w=='D')
  vf=(4:-1:-4)/60;
  af=(1:-1:-1)/2;
  ww=ones(5,1);
  cx=[c(ww,:); c; c(nf*ww,:)];
  vx=reshape(filter(vf,1,cx(:)),nf+10,nc);
  vx(1:8,:)=[];
  ax=reshape(filter(af,1,vx(:)),nf+2,nc);
  ax(1:2,:)=[];
  vx([1 nf+2],:)=[];
  if any(w=='d')
     c=[c vx ax];
  else
     c=[c ax];
  end
elseif any(w=='d')
  vf=(4:-1:-4)/60;
  ww=ones(4,1);
  cx=[c(ww,:); c; c(nf*ww,:)];
  vx=reshape(filter(vf,1,cx(:)),nf+8,nc);
  vx(1:8,:)=[];
  c=[c vx];
end
 
% =======================如果不输出任何参数，就会输出语谱图==========================
if nargout<1
   [nf,nc]=size(c);
%    t=((0:nf-1)*inc+(n-1)/2)/fs;
   ci=(1:nc)-any(w=='0')-any(w=='E');
   imh = imagesc(tc/fs,ci,c.');
   axis('xy');
   xlabel('Time (s)');
   ylabel('Mel-cepstrum coefficient');
    map = (0:63)'/63;
    colormap([map map map]);
    colorbar;
end

melcepst默认得到12维MFCC参数，时域中用hamming窗，频域中用三角窗，最低频率为0，最高频率为采样频率的一半（采样定理），帧移为帧长的一半，帧长为2的次幂但是小于0.03*fs。
E：包括对数能量
0：包括0阶倒谱系数
d：包括一阶差分
D：包括二阶差分
melcepst对参数’0’的处理

if ~any(w=='0')
   c(:,1)=[];
   nc=nc-1;
end

如果不需要’0’阶系数，就将第一列删除，并得到13-1=12维数据，说明DCT后得到的是13维数据，默认将第一个元素，即0阶倒谱系数删去。第一维比后12维都大很多（直流项？）。

cepstralFeatureExtractor
由Audio Toolbox提供，需要先将音频分帧，每一列作为一帧，再将每一帧依次输入至cepstralFeatureExtractor，所以输入的第一帧的delta与deltaDelta都是0。

test = 'D:\DataBase\TIMIT\TRAIN\DR2\MARC0\SX108.WAV';
[x, fs] = audioread(test);
n=pow2(floor(log2(0.03*fs)));
inc=floor(n/2);
f = enframe(x,hamming(n),inc);
cepFeatures = cepstralFeatureExtractor('SampleRate',fs,'LogEnergy','Replace');
[coeffs, delta, deltaDelta]= cepFeatures(f(1,:)');

参数设置中有FilterBankNormalization，选项为：Area，Bandwidth（默认），None，用于滤波器组的权重分配。

cepstralFeatureExtractor类的部分代码：

classdef (StrictDefaults)cepstralFeatureExtractor < dsp.private.SampleRateEngine
 %cepstralFeatureExtractor Cepstral Feature Extractor
 %   cepFeatures = cepstralFeatureExtractor returns a System object,
 %   cepFeatures, that calculates cepstral features. Columns of the input
 %   are treated as individual channels.
 %
 %   cepFeatures = cepstralFeatureExtractor('Name',Value, ...) returns a
 %   cepstralFeatureExtractor System object, cepFeatures, with each
 %   specified property name set to the specified value. You can specify
 %   additional name-value pair arguments in any order as
 %   (Name1,Value1,...NameN,ValueN).
 %
 %   step method syntax内置的step()函数:
 %
 %   [COEFFS,DELTA,DELTADELTA] = step(cepFeatures,X) returns the cepstral
 %   coefficients, the delta, and the delta-delta. The log energy is also
 %   returned in the COEFFS output based on the LogEnergy property. The
 %   DELTA and DELTADELTA are initialized as zero-vectors. X must be a
 %   real-valued, double-precision or single-precision matrix. Each column
 %   of X is treated as an independent channel.
 %
 %   System objects may be called directly like a function instead of using
 %   the step method. For example, y = step(obj,x) and y = obj(x) are
 %   equivalent.
 %   对象可以直接作为函数使用，所以step()与obj()功能一致
 %
 %   cepstralFeatureExtractor methods:
 %   step       - See above description for use of this method
 %   release    - Allow property values and input characteristics to change
 %   clone      - Create cepstralFeatureExtractor object with same property 
 %                values
 %   isLocked   - Locked status (logical)
 %   <a href="matlab:help matlab.System/reset   ">reset</a>      - Reset the internal states to initial conditions
 %   getFilters - Get filterbank used to calculate the cepstral 
 %                coefficients
 %
 %   cepstralFeatureExtractor properties:
 %   FilterBank  - Filter bank ('Mel'/'Gammatone')
 %   InputDomain - Domain of input signal
 %   NumCoeffs   - Number of coefficients to return
 %   FFTLength   - FFT length
 %   LogEnergy   - Log energy usage ('Append'/'Replace'/'Ignore')
 %   SampleRate  - Sample rate (Hz)
 %
 %   Advanced properties:
 %   BandEdges               - Band edges of mel filter bank (Hz)
 %   FilterBankNormalization - Normalize filter bank
 %   FilterBankDesignDomain  - Domain for mel filter bank design
 %   FrequencyRange          - Gammatone filter bank frequency range
    
    %#codegen
    properties
        %SampleRate Input sample rate (Hz)
        % Specify the sampling rate of the input in Hertz as a real, finite
        % numeric scalar. The default is 16000 Hz. This property is 
        % tunable.
        SampleRate = 16000;
    end
    
    properties (Constant, Hidden)
        % SampleRateSet is used to setup the choices for SampleRate
        SampleRateSet = matlab.system.SourceSet({'PropertyOrMethod', ...
            'SystemBlock', 'InheritSampleRate', 'getInheritedSampleRate',true});
    end
    
    properties (Nontunable)
        %BandEdges Band edges of Mel filter bank (Hz)
        % Specify the band edges of the mel filter bank as a monotonically
        % increasing vector in the range [0,fs/2]. The number of band edges
        % must be in the range [4,160]. The default band edges are spaced
        % linearly for the first ten and then logarithmically thereafter.
        % This property applies when FilterBank is 'Mel'.
        % 只有是Mel的时候，BandEdges属性才有用
        BandEdges = cepstralFeatureExtractor.getDefaultBandEdges();
        %FFTLength FFT length 默认FFT长度是输入的行数，所以做好分帧！
        FFTLength = [];
        %NumCoeffs Number of coefficients to return 默认MFCC维数13
        NumCoeffs = 13;
        %InputDomain Domain of the input signal 默认输入数据是时域的
        InputDomain = 'Time';
        %FilterBankNormalization Filter bank normalization 默认以带宽设置滤波器权重
        FilterBankNormalization = 'Bandwidth';
        %LogEnergy Log energy usage 默认log能量参数是有的
        LogEnergy = 'Append';
    end
---------------------------------------------------------略-----------------------------------------------------------
end

mfcc
由Audio Toolbox提供，最低频率不是0，它用的是cepstralFeatureExtractor函数。

[audioIn,fs] = audioread('Counting-16-44p1-mono-15secs.wav');
[coeffs,delta,deltaDelta,loc] = mfcc(audioIn,fs);

function varargout = mfcc(x, fs, varargin)
%MFCC Extract the mfcc, log-energy, delta, and delta-delta of audio signal
%   coeffs = MFCC(audioIn,fs) returns the mel-frequency cepstral
%   coefficients over time for the audio input. Columns of the input are
%   treated as individual channels. coeffs is returned as an L-by-M-by-N
%   array.
%       L - Number of frames the audio signal is partitioned into.
%           This is determined by the WINDOWLENGTH and OVERLAPLENGTH 
%           properties.
%       M - Number coefficients returned per frame.
%           This is determined by the NUMCOEFFS property.
%       N - Number of channels.
%       
%   'WindowLength' defaults to round(0.030 * fs).
%   'OverlapLength' defaults to round(fs*0.02).
%   'NumCoeffs'  If not specified, the number of coefficients is 13.
%   'FFTLength'  By default, the FFT length is set to the WINDOWLENGTH.
%   'DeltaWindowLength' The default is 2.
%   coeffs = MFCC(...,'LogEnergy',LOGENERGY) specifies if and how the log
%   energy is used. Specify log energy as a character vector:
%       'Append'  - Adds the log-energy as the first element of the
%                   returned coefficients vector. This is the default
%                   setting.
%       'Replace' - Replaces the zeroth coefficient (first element of
%                   coeffs) with the log-energy.
%       'Ignore'  - Ignores and does not return the log-energy.

% =========================验证输入数据的格式=============================
validateRequiredInputs(x, fs)

params =  audio.internal.MFCCValidator(fs,size(x,1),varargin{:});% 输入默认的参数

hopLength = params.WindowLength - params.OverlapLength;% 帧移

% ==========================创建mfcc提取object============================
mfccObject = cepstralFeatureExtractor( ...
    'SampleRate',              fs, ...
    'FFTLength',               params.FFTLength, ...
    'NumCoeffs',               params.NumCoeffs, ...
    'LogEnergy',               params.LogEnergy);

% ====================验证所需要的mfcc维数比滤波器个数少===================
numValidBands = sum(mfccObject.BandEdges <= floor(fs/2)) - 2;
coder.internal.errorIf(numValidBands < params.NumCoeffs, ...
    'audio:mfcc:BadNumCoeffs', ...
    numValidBands,fs);

% ==========================mfcc参数获取=================================
[nRow,nChan] = size(x);% 一般都是单通道，audiorea读取到的是一列数据
N            = params.WindowLength;
numHops      = floor((nRow-N)/hopLength) + 1;

y            = audio.internal.buffer(x,N,hopLength);
c            = mfccObject(y);% mfccObject是cepstralFeatureExtractor类，所以，与cepstralFeatureExtractor求解方法一样
c2           = reshape(c , size(c,1) , size(c,2)/nChan   , nChan );
coeffs       = permute(c2 , [2 1 3]);% 将第1维与第2维转置，因为cepstralFeatureExtractor得到的特征是列排的

varargout{1} = coeffs;

%=========================一阶差分====================================
if nargout > 1
    delta        = audio.internal.computeDelta(coeffs,params.DeltaWindowLength);
    varargout{2} = delta;
end

% ============================二阶差分=================================
if nargout > 2
    deltaDelta   = audio.internal.computeDelta(delta,params.DeltaWindowLength);
    varargout{3} = deltaDelta;
end

% -------------------------------------------------------------------------
% Output sample stamp -----------------------------------------------------
if nargout > 3
    varargout{4} = ...
        cast(((0:(numHops-1))*hopLength + params.WindowLength)','like',x);
end

end

% -------------------------------------------------------------------------
% Validate required inputs
% -------------------------------------------------------------------------
function validateRequiredInputs(x,fs)
validateattributes(x,{'single','double'},...
    {'nonempty','2d','real'}, ...
    'mfcc','audioIn')
validateattributes(fs,{'single','double'}, ...
    {'nonempty','positive','real','scalar','nonnan','finite'}, ...
    'mfcc','fs');
end

默认有40个滤波器，得到14维参数，相当于melcepst中的’E0’，只是melcepst的最低频率从0Hz开始；delta与deltaDelta的第一行都是0；loc是每一帧的开始位置。
如何使delta与deltaDelta的首行不为0？设置DeltaWindowLength参数即可。

从滤波器组设置可以看出，每个滤波器的起点是上个滤波器带宽的中点。

HelperComputePitchAndMFCC
查看源码后，发现使用的是mfcc函数
melSpectrogram
output的第一维是Number of bandpass filters in filterbank，默认为32个滤波器；第二维是Number of frames in spectrogram，即帧数。
它不可以计算差分，只是spectrogram的一个小分支，若取40个滤波器，得到的结果与mfcc相近，只是需要转置一下。

几种实现方式的对比

实现方式	MFCC	频谱图
mfcc
cepstralFeatureExtractor
melcepst
melSpectrogram

结论

可见，cepstralFeatureExtractor与mfcc所用算法基本一致，只是cepstralFeatureExtractor分帧求取，melcepst与它们的第2维数据有数量级的差异，暂时认为是滤波器归一化的原因。在mfcc中，log能量是作为额外系数默认附加的，通常Matlab会提供最好的性能，所以暂时按默认选项进行。melSpectrogram默认32个滤波器，mfcc默认40个滤波器，且melSpectrogram不能计算差分，所以mfcc总的来说，更合适作为以后的计算使用。

https://www.jianshu.com/p/1c2742096382

深入解析 TensorFlow 1.15 “Cannot convert a symbolic Tensor to a numpy array” 错误 Crazy learner C++与python编程 tensorflow numpy 人工智能
目录1.错误来源分析2.可能的原因**原因1：初始状态或输入数据的形状不匹配****原因2：TensorFlow和NumPy的版本兼容性问题****原因3：EagerExecution的影响**3.解决方法**方法1：检查输入形状和初始状态****方法2：降级NumPy版本****方法3：禁用EagerExecution****方法4：升级到TensorFlow2.x****方法5：调整代码生成初
Linux 系统中的 .7z 压缩与解压详解 Crazy learner Linux基本命令 C++与python编程 linux 7z
目录一、安装p7zip工具二、压缩文件到.7z格式三、解压.7z文件五、常见操作实例六、总结在Linux系统中，.7z是一种高效的压缩文件格式，通常使用p7zip工具来进行操作。7z格式以其高压缩率和支持多种压缩算法（如LZMA、LZMA2等）而闻名。本文将深入讲解如何在Linux环境下使用.7z文件格式进行压缩和解压操作，并通过多个实例帮助你掌握这些技能。一、安装p7zip工具在大多数Linux
如何在Pycharm等Terminal中获取当前的环境变量信息潇囧囧 pycharm python
目标：查看当前编程环境变量信息。方法：直接使用os库即可查看当前虚拟环境对应的全局变量。importos#打印所有环境变量forkey,valueinos.environ.items():print(f"{key}:{value}")#获取特定环境变量的值path=os.environ.get("PATH")print(f"PATH:{path}")需求：有时会遇到虚拟环境的某些配置和我们系统的配
Sentinel实战：构建可靠的微服务防护系统 ivwdcwso 安全 sentinel 微服务架构防护安全 java 开发
1.引言在微服务架构中，保障系统的可用性和稳定性至关重要。Sentinel作为一个强大的流量控制组件，为我们提供了实现熔断、限流、系统保护等功能的有力工具。本文将通过实际案例，详细介绍Sentinel的使用方法和最佳实践，并探讨如何在容器环境中部署Sentinel。2.Sentinel简介Sentinel是阿里巴巴开源的面向分布式服务架构的流量控制组件，主要以流量为切入点，从流量控制、熔断降级、系
【Java】代理模式非白代理模式 java 开发语言
代理模式代理模式是指给某一个对象提供一个代理，并由代理对象来控制对真实对象的访问代理模式是一种结构型设计模式背景如果不采用代理，对一个类的多个方法进行监控时，重复的代码总是重复出现，不但破坏了原方法，如果要实现多个监控，将会对代码造成大量冗余。同时，还导致业务代码，与非业务的监控代码掺杂在一起，不利于扩展和维护。代理类在无限制膨胀，就需要无限的修改业务代码。而采用代理后，原方法不需要做任何改动，操
1-刷力扣问题记录 leaf_leaves_leaf 算法数据结构
25.1.191.size()和.length()有什么区别2.result.push_back({nums[i],nums[left],nums[right]});为什么用大括号？使用大括号{}是C++11引入的初始化列表语法，它允许我们在构造或初始化对象时直接传入一组值。大括号的使用在许多情况下都能让代码更加简洁和直观。{nums[i],nums[left],nums[right]}是一个初始
国外7个最佳大语言模型 (LLM) API推荐程序员后端
大型语言模型(LLM)API将彻底改变我们处理语言的方式。在深度学习和机器学习算法的支持下，LLMAPI提供了前所未有的自然语言理解能力。通过利用这些新的API，开发人员现在可以创建能够以前所未有的方式理解和响应书面文本的应用程序。下面，我们将比较从Bard到ChatGPT、PaLM等市场上顶级LLMAPI。我们还将探讨整合这些LLM的潜在用例，并考虑其对语言处理的影响。什么是大语言模型(LLM)
QT界面自适应天生爱打工 qt qt 开发语言
一自适应工具类介绍:1.1功能控件能跟随界面大小的变化实现字体、大小同比例的变化1.2优点控件大小,字体可跟随界面大小同比例任意变化。同一套程序能兼容不同分辨率及不同DPI的显示器对于控件数目固定不变的UI区域:只需要将控件拖拽到指定位置即可，不需要使用弹簧及布局等qt属性对于控件数目有可能会根据需求变化的UI区域:可以使用qt原有的布局,但解放了qt原有布局中不能改变字体的属性。二自适应工具类使
[QT] 断点调试天生爱打工 qt qt 开发语言
目录一设置断点二调试窗口信息2.1默认窗口2.2详细窗口属性三调试方法和技巧一设置断点在QtCreator中我们有两种方式添加断点。用鼠标直接点击代码编辑窗口中的某一行按下F9添加/取消断点(操作的是当前鼠标光标所在的代码行)二调试窗口信息2.1默认窗口这里列出几个默认的窗口红色圆点表示断点,黄色箭头表示当前程序运行位置。stack:堆栈表示当前函数之间的调用关系，比如位于哪个函数体中。Local
百度地图显示多个infoWindow信息窗口时只展示最后一条数据射手buff 前端百度
这两天遇到一个问题，百度地图在循环加载多个信息窗口的时候所有的窗口显示的都是最后一条数据的内容效果如下：如图所示两个信息窗口都是一样的值，代码如下$.ajax({type:"POST",url:"../api/zhandian.json",success:function(res){vardata=res.data;for(vari=0;i联系电话："+data[i].phone,opts);//
责任链模式原理详解和源码实例以及Spring AOP拦截器链的执行源码如何使用责任链模式？一个儒雅随和的男子 spring 设计模式责任链模式 spring java
前言本文首先介绍了责任链的基本原理，并附带一个例子说明责任链模式，确保能够理解责任链的前提下，在进行SpringAOP执行责任链的源码分析。责任链模式允许将多个处理对象连接成链，请求沿着链传递，直到被处理或结束。每个处理者可以选择处理请求或传递给下一个。 SpringAOP的拦截器链，拦截器或者过滤器链，都是典型的责任链应用。比如，当一个方法被调用时，多个拦截器按顺序执行，每个拦截器可以决定
【部署】Ktransformer是什么、如何利用单卡24GB显存部署Deepseek-R1 和 Deepseek-V3 仙人掌_lz 人工智能人工智能 AI 部署自然语言处理
简介KTransformers是一个灵活的、以Python为中心的框架，旨在通过先进的内核优化和放置/并行策略提升HuggingFaceTransformers的使用体验。它具有高度的可扩展性，用户可通过单行代码注入优化模块，获得兼容Transformers的接口、符合OpenAI和Ollama的RESTfulAPI，甚至简化的ChatGPT风格的WebUI。KTransformers的性能优化基
深圳SMT贴片加工厂家核心技术及服务优势解析安德胜SMT贴片其他
内容概要在电子制造领域，高效、精准的生产能力已成为企业保持竞争力的关键要素。如何通过技术创新与服务优化实现快速交付与品质保障，是当前行业关注的核心议题。深圳作为国内电子制造产业的重要聚集地，其SMT贴片加工厂家通过持续的技术迭代与服务升级，形成了独特的市场竞争力。本文将系统解析该类企业在核心技术与服务模式上的突破路径，涵盖设备精度提升、工艺创新、品控体系完善等关键维度。首先，高精度贴片设备与智能化
SMT贴片加工报价构成要素与成本优化策略解析安德胜SMT贴片其他
内容概要在现代电子制造领域，SMT贴片加工报价的精准核算直接影响企业供应链成本控制效能。本文通过结构化分析框架，系统解构报价体系的五大核心要素，并建立可操作的优化模型。研究路径覆盖从基材选型到生产规划的完整价值链，重点揭示各环节成本动因的相互作用机制。为直观呈现报价要素的关联性，特构建以下参数对照表：要素类别成本占比范围关键波动因素优化切入点PCB基材成本15-25%层数/板材类型/表面处理工艺标
技术分享：MyBatis SQL 日志解析脚本￡漫步云端彡运维趣分享 sql java mybatis 日志解析
技术分享：MyBatisSQL日志解析脚本1.脚本功能概述2.实现细节2.1HTML结构2.2JavaScript逻辑3.脚本代码4.使用方法4.1示例5.总结在日常开发中，使用MyBatis作为持久层框架时，我们经常需要查看SQL日志以调试和优化查询。然而，MyBatis的日志输出通常包含占位符和参数信息，这使得直接执行这些SQL语句变得困难。为了解决这个问题，我们开发了一个简单的HTML和Ja
SMT贴片生产的发展趋势与技术创新解析安德胜SMT贴片人工智能
内容概要SMT贴片生产作为现代电子制造的重要组成部分，其发展一直颇具前景与活力。当前，行业内的技术进步与市场需求的快速变化使得SMT贴片生产面临新的机遇与挑战。尤其是在自动化技术方面，许多企业逐步引入更加智能化的设备，从而提升生产效率并降低人为错误。这不仅能够缩短生产周期，还能提高产品的一致性和可靠性。另外，材料科技的进步也促进了SMT贴片生产的变革。新型材料的应用，例如高电导率材料和环保型焊料，
C语言-回调函数的应用 woainizhongguo. C/C++c语言
什么是回调函数回调函数就是一个被作为参数传递的函数。在C语言中，回调函数只能使用函数指针实现，在C++、Python、ECMAScript等更现代的编程语言中还可以使用仿函数或匿名函数。工作机制⑴定义一个回调函数；⑵提供函数实现的一方在初始化的时候，将回调函数的函数指针注册给调用者；⑶当特定的事件或条件发生的时候，调用者使用函数指针调用回调函数对事件进行处理。应用案例（1）应用层：通过调用hal层
技术爱好者不容错过！探秘 Thrive 现代化博客管理系统秋野酱前端课程设计 java 开源 java spring boot vue.js 课程设计
探索ThriveX：现代化博客管理系统的技术与实现在当今数字化时代，知识的分享与交流变得愈发重要。对于技术爱好者和从业者而言，一个优质的博客管理系统不仅是知识输出的窗口，更是思想碰撞的平台。今天，让我们一同走进ThriveX，领略其独特的魅力。一、开源助力，点亮项目之星开源的道路充满艰辛与挑战，每一段代码都凝聚着开发者的心血。如果您在了解ThriveX的过程中有所收获，不妨花费短短10秒钟，为这个
C语言结构体学习笔记 BUG 劝退师 c语言 c语言学习笔记
C语言结构体学习笔记目录结构体基本概念结构体变量定义结构体初始化结构体数组结构体指针共用体枚举类型typedef自定义类型总结结构体基本概念1.什么是结构体？结构体：一种用户自定义的数据类型，用于将多个不同类型的变量组合成一个整体。用途：表示复杂数据（如学生信息：学号、姓名、成绩等）。2.结构体定义struct结构体名{数据类型成员1;数据类型成员2;//可以嵌套结构体struct子结构体名子成员
mds_stores不能关闭 nicekwell mac mac mds_stores alfred
有次发现mds_stores占用了很高的cpu，网上有人建议把它关掉：sudomdutil-a-ioff关掉之后发现alfred不能找到新安装的应用了，所以最好还是不要关掉。sudomdutil-a-ion
解决win11下taskmgr放在“启动”文件夹中无法自启动问题 nicekwell windows的使用 windows
https://superuser.com/questions/1647652/why-the-task-manager-automatically-does-not-start-from-the-startup-folder-at-usewindows中设置开机自动启动的常用方法是把要启动的程序或文件的快捷方式放到C:\Users\\AppData\Roaming\Microsoft\Windo
ubuntu下vscode ctrl+tab松开ctrl后不自动选中文件 nicekwell ubuntu vscode linux
vscode用ctrl+tab切换文件时，松开ctrl键后会自动选中切换的文件。但是在ubuntu下发现有时不能自动选中切换的文件，需要再次按enter键才能打开文件。经过测试发现解决方法有两个：方法1：确认wayland状态，关闭wayland。（编辑/etc/gdm3/custom.conf，设置WaylandEnable=false）方法2：我用tweaks调换了capslock和ctrl，
Tomcat 8 安装包下载 m0_74824517 面试学习路线阿里巴巴 tomcat java
Tomcat8安装包下载【下载地址】Tomcat8安装包下载本仓库提供了一个包含Windows和Linux版本的Tomcat8安装包，方便用户快速下载并部署Tomcat8服务器[这里是图片001]项目地址:https://gitcode.com/open-source-toolkit/fda7c简介本仓库提供了一个包含Windows和Linux版本的Tomcat8安装包，方便用户快速下载并部署To
前端：纯前端快速实现html导出word和pdf m0_74823715 前端 html word
实现html导出word，需要使用两个库。html-docx-js和file-saver导出word的js方法>npminstallhtml-docx-js>npminstallfile-saverjs引入importFileSaverfrom“file-saver”;importhtmlDocxfrom“html-docx-js/dist/html-docx”;/**导出word方法*/expo
Python Union 联合类型注解详解人才程序员杂谈 python 服务器 java linux 后端软件工程开发语言
文章目录PythonUnion联合类型注解详解1.什么是Union联合类型？**语法（Python3.9及之前版本）**：**语法（Python3.10及之后版本）**：2.Union联合类型注解示例**(1)使用Union来表示多个类型的参数****(2)使用`|`来表示联合类型（Python3.10及之后版本）**3.使用Union进行复杂类型注解**(1)使用Union与列表结合****(2
Ubuntu22.4.03服务器版安装及搭建深度学习环境的问题总结蜡笔小祎在线学习问题集合深度学习人工智能
Ubuntu22.4.03服务器版安装流程整个流程已经有很多分享帖了，这里概述一下：下载iso制作启动U盘，按f2进入安装，选择语言，键盘布局english，ubuntuserver安装，DHCP自动配置网络（问题1），代理服务器我们没填，配置阿里云镜源http://mirrors.aliyun.com/ubuntu/，磁盘分区（问题2），设置服务器密码，安装ssh远程工具，重启reboot。可参
macOS Catalina 10.15 - 新增功能及其他信息记录伊织code Apple 开发+10.15 macOS Catalina Sidecar
文章目录推荐阅读参考一、基本信息WWDC2019壁纸二、beta版本安装macOS10.15Xcode11三、新功能添加屏幕使用时间iPadOS应用可在Mac上运行APFS宗卷被拆分为只读的系统宗卷(System)和用户数据宗卷(Data)增加Findmy查找添加由Siri控制的「捷径」和「屏幕时间」AppleWatch可解锁MacSidecar：将iPad作为副显示屏四、其他变更终端shell建
PCB 打样哪家好？探寻专业猎板之选 lboyj 运维
在电子产业蓬勃发展的当下，PCB（印制电路板）作为电子产品的关键组成部分，其打样质量对于产品的研发和后续生产至关重要。对于众多电子工程师和企业而言，寻找一家可靠的PCB打样厂商是一项重要且具有挑战性的任务。那么，PCB打样究竟哪家好呢？接下来，让我们从多个维度来探讨这一问题，并深入了解猎板PCB在其中的表现。一、品质保障是基石优质的PCB打样，首先体现在品质上。从原材料的选择到生产工艺的把控，每一
猎板 PCB：HDI 技术精要解读 lboyj 人工智能
HDI技术凭借增加盲埋孔的方式，达成了高密度布局，在高端服务器、智能手机、多功能POS机以及安防摄像机等诸多领域均有广泛应用。尤其在通讯和计算机行业中，对HDI线路板有着较高的需求，这在一定程度上有力地推动了科技的持续进步，使得HDI板在国内市场展现出十分乐观的发展前景。然而，HDI技术作为一种特殊工艺，也面临诸多挑战。一方面，其成本相对较高；另一方面，对制造商的生产能力有着严格要求。倘若缺乏先进
Spring Bean 生命周期详解黑风风 java 多线程 spring java 数据库
SpringBean生命周期详解在Spring框架中，Bean的生命周期由Spring容器全权管理。了解和掌握Bean的生命周期对于使用Spring开发稳定且高效的应用程序至关重要。本文将详细介绍SpringBean生命周期的五个主要阶段：实例化、属性注入、初始化、使用和销毁，并涵盖各个阶段的关键步骤和扩展点。1.实例化（Instantiation）实例化阶段包括以下关键步骤：BeanNameAw
Linux的Initrd机制被触发 linux
Linux 的 initrd 技术是一个非常普遍使用的机制，linux2.6 内核的 initrd 的文件格式由原来的文件系统镜像文件转变成了 cpio 格式，变化不仅反映在文件格式上， linux 内核对这两种格式的 initrd 的处理有着截然的不同。本文首先介绍了什么是 initrd 技术，然后分别介绍了 Linux2.4 内核和 2.6 内核的 initrd 的处理流程。最后通过对 Lin
maven本地仓库路径修改 bitcarter maven
默认maven本地仓库路径：C:\Users\Administrator\.m2 修改maven本地仓库路径方法： 1.打开E:\maven\apache-maven-2.2.1\conf\settings.xml 2.找到
XSD和XML中的命名空间 darrenzhu xml xsd schema namespace 命名空间
http://www.360doc.com/content/12/0418/10/9437165_204585479.shtml http://blog.csdn.net/wanghuan203/article/details/9203621 http://blog.csdn.net/wanghuan203/article/details/9204337 http://www.cn
Java 求素数运算周凡杨 java 算法素数
网络上对求素数之解数不胜数，我在此总结归纳一下，同时对一些编码，加以改进，效率有成倍热提高。第一种：原理: 6N(+-)1法任何一个自然数，总可以表示成为如下的形式之一： 6N，6N+1，6N+2，6N+3，6N+4，6N+5 (N=0，1，2，…)
java 单例模式 g21121 java
想必单例模式大家都不会陌生，有如下两种方式来实现单例模式： class Singleton { private static Singleton instance=new Singleton(); private Singleton(){} static Singleton getInstance() { return instance; }
Linux下Mysql源码安装 510888780 mysql
1.假设已经有mysql-5.6.23-linux-glibc2.5-x86_64.tar.gz (1)创建mysql的安装目录及数据库存放目录解压缩下载的源码包，目录结构，特殊指定的目录除外：
32位和64位操作系统墙头上一根草 32位和64位操作系统
32位和64位操作系统是指：CPU一次处理数据的能力是32位还是64位。现在市场上的CPU一般都是64位的，但是这些CPU并不是真正意义上的64 位CPU，里面依然保留了大部分32位的技术，只是进行了部分64位的改进。32位和64位的区别还涉及了内存的寻址方面，32位系统的最大寻址空间是2 的32次方= 4294967296（bit）= 4（GB）左右，而64位系统的最大寻址空间的寻址空间则达到了
我的spring学习笔记10-轻量级_Spring框架 aijuans Spring 3
一、问题提问： → 请简单介绍一下什么是轻量级？轻量级（Leightweight）是相对于一些重量级的容器来说的，比如Spring的核心是一个轻量级的容器，Spring的核心包在文件容量上只有不到1M大小，使用Spring核心包所需要的资源也是很少的，您甚至可以在小型设备中使用Spring。
mongodb 环境搭建及简单CURD antlove Web Install curd NoSQL mongo
一搭建mongodb环境 1. 在mongo官网下载mongodb 2. 在本地创建目录 "D:\Program Files\mongodb-win32-i386-2.6.4\data\db" 3. 运行mongodb服务 [mongod.exe --dbpath "D:\Program Files\mongodb-win32-i386-2.6.4\data\
数据字典和动态视图百合不是茶 oracle 数据字典动态视图系统和对象权限
数据字典（data dictionary）是 Oracle 数据库的一个重要组成部分，这是一组用于记录数据库信息的只读（read-only）表。随着数据库的启动而启动,数据库关闭时数据字典也关闭数据字典中包含数据库中所有方案对象（schema object）的定义(包括表，视图，索引，簇，同义词，序列，过程，函数，包，触发器等等) 数据库为一
多线程编程一般规则 bijian1013 java thread 多线程 java多线程
如果两个工两个以上的线程都修改一个对象，那么把执行修改的方法定义为被同步的，如果对象更新影响到只读方法，那么只读方法也要定义成同步的。不要滥用同步。如果在一个对象内的不同的方法访问的不是同一个数据，就不要将方法设置为synchronized的。
将文件或目录拷贝到另一个Linux系统的命令scp bijian1013 linux unix scp
一.功能说明 scp就是security copy，用于将文件或者目录从一个Linux系统拷贝到另一个Linux系统下。scp传输数据用的是SSH协议，保证了数据传输的安全，其格式如下： scp 远程用户名@IP地址：文件的绝对路径
【持久化框架MyBatis3五】MyBatis3一对多关联查询 bit1129 Mybatis3
以教员和课程为例介绍一对多关联关系，在这里认为一个教员可以叫多门课程，而一门课程只有1个教员教，这种关系在实际中不太常见，通过教员和课程是多对多的关系。示例数据：地址表： CREATE TABLE ADDRESSES ( ADDR_ID INT(11) NOT NULL AUTO_INCREMENT, STREET VAR
cookie状态判断引发的查找问题 bitcarter form cgi
先说一下我们的业务背景： 1.前台将图片和文本通过form表单提交到后台，图片我们都做了base64的编码，并且前台图片进行了压缩 2.form中action是一个cgi服务 3.后台cgi服务同时供PC，H5，APP 4.后台cgi中调用公共的cookie状态判断方法（公共的，大家都用，几年了没有问题）问题：（折腾两天。。。。） 1.PC端cgi服务正常调用，cookie判断没
通过Nginx,Tomcat访问日志(access log)记录请求耗时 ronin47
一、Nginx通过$upstream_response_time $request_time统计请求和后台服务响应时间 nginx.conf使用配置方式： log_format main '$remote_addr - $remote_user [$time_local] "$request" ''$status $body_bytes_sent "$http_r
java-67- n个骰子的点数。把n个骰子扔在地上，所有骰子朝上一面的点数之和为S。输入n，打印出S的所有可能的值出现的概率。 bylijinnan java
public class ProbabilityOfDice { /** * Q67 n个骰子的点数 * 把n个骰子扔在地上，所有骰子朝上一面的点数之和为S。输入n，打印出S的所有可能的值出现的概率。 * 在以下求解过程中，我们把骰子看作是有序的。 * 例如当n=2时，我们认为（1，2）和（2，1）是两种不同的情况 */ private stati
看别人的博客，觉得心情很好 Cb123456 博客心情
以为写博客，就是总结，就和日记一样吧，同时也在督促自己。今天看了好长时间博客: 职业规划: http://www.iteye.com/blogs/subjects/zhiyeguihua android学习: 1.http://byandby.i
[JWFD开源工作流]尝试用原生代码引擎实现循环反馈拓扑分析 comsci 工作流
我们已经不满足于仅仅跳跃一次，通过对引擎的升级，今天我测试了一下循环反馈模式，大概跑了200圈，引擎报一个溢出错误在一个流程图的结束节点中嵌入一段方程，每次引擎运行到这个节点的时候，通过实时编译器GM模块，计算这个方程，计算结果与预设值进行比较，符合条件则跳跃到开始节点，继续新一轮拓扑分析，直到遇到
JS常用的事件及方法 cwqcwqmax9 js
事件描述 onactivate 当对象设置为活动元素时触发。 onafterupdate 当成功更新数据源对象中的关联对象后在数据绑定对象上触发。 onbeforeactivate 对象要被设置为当前元素前立即触发。 onbeforecut 当选中区从文档中删除之前在源对象触发。 onbeforedeactivate 在 activeElement 从当前对象变为父文档其它对象之前立即
正则表达式验证日期格式 dashuaifu 正则表达式 IT其它 java其它
正则表达式验证日期格式 function isDate(d){ var v = d.match(/^(\d{4})-(\d{1,2})-(\d{1,2})$/i); if(!v) { this.focus(); return false; } } <input value="2000-8-8" onblu
Yii CModel.rules() 方法、validate预定义完整列表、以及说说验证 dcj3sjt126com yii
public array rules () {return} array 要调用 validate() 时应用的有效性规则。返回属性的有效性规则。声明验证规则，应重写此方法。每个规则是数组具有以下结构：array('attribute list', 'validator name', 'on'=>'scenario name', ...validation
UITextAttributeTextColor = deprecated in iOS 7.0 dcj3sjt126com ios
In this lesson we used the key "UITextAttributeTextColor" to change the color of the UINavigationBar appearance to white. This prompts a warning "first deprecated in iOS 7.0." Ins
判断一个数是质数的几种方法 EmmaZhao Math python
质数也叫素数，是只能被1和它本身整除的正整数，最小的质数是2，目前发现的最大的质数是p=2^57885161-1【注1】。判断一个数是质数的最简单的方法如下： def isPrime1(n): for i in range(2, n): if n % i == 0: return False return True 但是在上面的方法中有一些冗余的计算，所以
SpringSecurity工作原理小解读坏我一锅粥 SpringSecurity
SecurityContextPersistenceFilter ConcurrentSessionFilter WebAsyncManagerIntegrationFilter HeaderWriterFilter CsrfFilter LogoutFilter Use
JS实现自适应宽度的Tag切换 ini JavaScript html Web css html5
效果体验：http://hovertree.com/texiao/js/3.htm 该效果使用纯JavaScript代码，实现TAB页切换效果，TAB标签根据内容自适应宽度，点击TAB标签切换内容页。 HTML文件代码： <!DOCTYPE html> <html xmlns="http://www.w3.org/1999/xhtml"
Hbase Rest API : 数据查询 kane_xie REST hbase
hbase（hadoop）是用java编写的，有些语言（例如python）能够对它提供良好的支持，但也有很多语言使用起来并不是那么方便，比如c#只能通过thrift访问。Rest就能很好的解决这个问题。Hbase的org.apache.hadoop.hbase.rest包提供了rest接口，它内嵌了jetty作为servlet容器。启动命令：./bin/hbase rest s
JQuery实现鼠标拖动元素移动位置（源码+注释）明子健 jquery js 源码拖动鼠标
欢迎讨论指正！ print.html代码： <!DOCTYPE html> <html> <head> <meta http-equiv=Content-Type content="text/html;charset=utf-8"> <title>发票打印</title> &l
Postgresql 连表更新字段语法 update qifeifei PostgreSQL
下面这段sql本来目的是想更新条件下的数据，可是这段sql却更新了整个表的数据。sql如下： UPDATE tops_visa.visa_order SET op_audit_abort_pass_date = now() FROM tops_visa.visa_order as t1 INNER JOIN tops_visa.visa_visitor as t2 ON t1.
将redis,memcache结合使用的方案? tcrct redis cache
公司架构上使用了阿里云的服务，由于阿里的kvstore收费相当高，打算自建，自建后就需要自己维护，所以就有了一个想法，针对kvstore(redis)及ocs(memcache)的特点，想自己开发一个cache层，将需要用到list，set，map等redis方法的继续使用redis来完成，将整条记录放在memcache下，即findbyid，save等时就memcache，其它就对应使用redi
开发中遇到的诡异的bug wudixiaotie bug
今天我们服务器组遇到个问题：我们的服务是从Kafka里面取出数据，然后把offset存储到ssdb中，每个topic和partition都对应ssdb中不同的key，服务启动之后，每次kafka数据更新我们这边收到消息，然后存储之后就发现ssdb的值偶尔是-2,这就奇怪了，最开始我们是在代码中打印存储的日志，发现没什么问题，后来去查看ssdb的日志，才发现里面每次set的时候都会对同一个key

Matlab中MFCC的几种实现方式（转载）

相关的函数

几种函数对比及说明

几种实现方式的对比

结论

你可能感兴趣的:(Matlab中MFCC的几种实现方式（转载）)