数据堂官方账号

Kaldi的MFCC特征提取代码分析

Kaldi的MFCC特征提取代码分析

本文转载自微信公众号：433的3号同学

make_mfcc.sh脚本
首先看顶层脚本make_mfcc.sh，地址：https://github.com/kaldi-asr/kaldi/blob/master/egs/wsj/s5/steps/make_mfcc.sh。使用方式如下：


./steps/make_mfcc.sh 
Usage: ./steps/make_mfcc.sh [options]  [ [] ]
 e.g.: ./steps/make_mfcc.sh data/train
Note:  defaults to /log, and
       defaults to /data.
Options:
  --mfcc-config           # config passed to compute-mfcc-feats.
  --nj                             # number of parallel jobs.
  --cmd > # how to run jobs.
  --write-utt2num-frames   # If true, write utt2num_frames file.
  --write-utt2dur          # If true, write utt2dur file.

 $cmd JOB=1:$nj $logdir/make_mfcc_${name}.JOB.log \
    compute-mfcc-feats $vtln_opts $write_utt2dur_opt --verbose=2 \
      --config=$mfcc_config scp,p:$logdir/wav_${name}.JOB.scp ark:- \| \
    copy-feats $write_num_frames_opt --compress=$compress ark:- \
      ark,scp:$mfccdir/raw_mfcc_$name.JOB.ark,$mfccdir/raw_mfcc_$name.JOB.scp \

上图为脚本里的核心函数：compute-mfcc-feats，使用方法及参数如下：


./compute-mfcc-feats 

Create MFCC feature files.
Usage:  compute-mfcc-feats [options...]  

Options:
  --allow-downsample          : If true, allow the input waveform to have a higher frequency than the specified --sample-frequency (and we'll downsample). (bool, default = false)
  --allow-upsample            : If true, allow the input waveform to have a lower frequency than the specified --sample-frequency (and we'll upsample). (bool, default = false)
  --blackman-coeff            : Constant coefficient for generalized Blackman window. (float, default = 0.42)
  --cepstral-lifter           : Constant that controls scaling of MFCCs (float, default = 22)
  --channel                   : Channel to extract (-1 -> expect mono, 0 -> left, 1 -> right) (int, default = -1)
  --debug-mel                 : Print out debugging information for mel bin computation (bool, default = false)
  --dither                    : Dithering constant (0.0 means no dither). If you turn this off, you should set the --energy-floor option, e.g. to 1.0 or 0.1 (float, default = 1)
  --energy-floor              : Floor on energy (absolute, not relative) in MFCC computation. Only makes a difference if --use-energy=true; only necessary if --dither=0.0.  Suggested values: 0.1 or 1.0 (float, default = 0)
  --frame-length              : Frame length in milliseconds (float, default = 25)
  --frame-shift               : Frame shift in milliseconds (float, default = 10)
  --high-freq                 : High cutoff frequency for mel bins (if <= 0, offset from Nyquist) (float, default = 0)
  --htk-compat                : If true, put energy or C0 last and use a factor of sqrt(2) on C0.  Warning: not sufficient to get HTK compatible features (need to change other parameters). (bool, default = false)
  --low-freq                  : Low cutoff frequency for mel bins (float, default = 20)
  --max-feature-vectors       : Memory optimization. If larger than 0, periodically remove feature vectors so that only this number of the latest feature vectors is retained. (int, default = -1)
  --min-duration              : Minimum duration of segments to process (in seconds). (float, default = 0)
  --num-ceps                  : Number of cepstra in MFCC computation (including C0) (int, default = 13)
  --num-mel-bins              : Number of triangular mel-frequency bins (int, default = 23)
  --output-format             : Format of the output files [kaldi, htk] (string, default = "kaldi")
  --preemphasis-coefficient   : Coefficient for use in signal preemphasis (float, default = 0.97)
  --raw-energy                : If true, compute energy before preemphasis and windowing (bool, default = true)
  --remove-dc-offset          : Subtract mean from waveform on each frame (bool, default = true)
  --round-to-power-of-two     : If true, round window size to power of two by zero-padding input to FFT. (bool, default = true)
  --sample-frequency          : Waveform data sample frequency (must match the waveform file, if specified there) (float, default = 16000)
  --snip-edges                : If true, end effects will be handled by outputting only frames that completely fit in the file, and the number of frames depends on the frame-length.  If false, the number of frames depends only on the frame-shift, and we reflect the data at the ends. (bool, default = true)
  --subtract-mean             : Subtract mean of each feature file [CMS]; not recommended to do it this way.  (bool, default = false)
  --use-energy                : Use energy (not C0) in MFCC computation (bool, default = true)
  --utt2spk                   : Utterance to speaker-id map rspecifier (if doing VTLN and you have warps per speaker) (string, default = "")
  --vtln-high                 : High inflection point in piecewise linear VTLN warping function (if negative, offset from high-mel-freq (float, default = -500)
  --vtln-low                  : Low inflection point in piecewise linear VTLN warping function (float, default = 100)
  --vtln-map                  : Map from utterance or speaker-id to vtln warp factor (rspecifier) (string, default = "")
  --vtln-warp                 : Vtln warp factor (only applicable if vtln-map not specified) (float, default = 1)
  --window-type               : Type of window ("hamming"|"hanning"|"povey"|"rectangular"|"blackmann") (string, default = "povey")
  --write-utt2dur             : Wspecifier to write duration of each utterance in seconds, e.g. 'ark,t:utt2dur'. (string, default = "")

Standard options:
  --config                    : Configuration file to read (this option may be repeated) (string, default = "")
  --help                      : Print out usage message (bool, default = false)
  --print-args                : Print the command line arguments (to stderr) (bool, default = true)
  --verbose                   : Verbose level (higher->more logging) (int, default = 0)

很多参数，但是必须的参数只有两个：输入的wav-rspecifier和输出的feats-wspecifier。不了解rspecifier和wspecifier的读者请先阅读Kaldi文档解读和Kaldi I/O mechanisms。我们首先需要准备输入的文件：

compute-mfcc-feats只能读取WAV格式的数据，其它的格式需要转换成WAV格式。转换可以”离线”的方式提前用工具转好。

compute-mfcc-feats.cc


 int main(int argc, char *argv[]) {
   try {
     using namespace kaldi;
     const char *usage =
         "Create MFCC feature files.\n"
         "Usage:  compute-mfcc-feats [options...]  "
         "\n";
 
     // Construct all the global objects.
     ParseOptions po(usage);
     MfccOptions mfcc_opts;
     // Define defaults for global options.
     bool subtract_mean = false;
     BaseFloat vtln_warp = 1.0;
     std::string vtln_map_rspecifier;
     std::string utt2spk_rspecifier;
     int32 channel = -1;
     BaseFloat min_duration = 0.0;
     std::string output_format = "kaldi";
     std::string utt2dur_wspecifier;
 
     // Register the MFCC option struct.
     mfcc_opts.Register(&po);
 
     // Register the options.
     po.Register("output-format", &output_format, "Format of the output "
                 "files [kaldi, htk]");
     po.Register("subtract-mean", &subtract_mean, "Subtract mean of each "
                 "feature file [CMS]; not recommended to do it this way. ");
     po.Register("vtln-warp", &vtln_warp, "Vtln warp factor (only applicable "
                 "if vtln-map not specified)");
     po.Register("vtln-map", &vtln_map_rspecifier, "Map from utterance or "
                 "speaker-id to vtln warp factor (rspecifier)");
     po.Register("utt2spk", &utt2spk_rspecifier, "Utterance to speaker-id map "
                 "rspecifier (if doing VTLN and you have warps per speaker)");
     po.Register("channel", &channel, "Channel to extract (-1 -> expect mono, "
                 "0 -> left, 1 -> right)");
     po.Register("min-duration", &min_duration, "Minimum duration of segments "
                 "to process (in seconds).");
     po.Register("write-utt2dur", &utt2dur_wspecifier, "Wspecifier to write "
                 "duration of each utterance in seconds, e.g. 'ark,t:utt2dur'.");
 
     po.Read(argc, argv);
 
     if (po.NumArgs() != 2) {
       po.PrintUsage();
       exit(1);
     }
 
     std::string wav_rspecifier = po.GetArg(1);
 
     std::string output_wspecifier = po.GetArg(2);
 
     Mfcc mfcc(mfcc_opts);
 
     if (utt2spk_rspecifier != "" && vtln_map_rspecifier == "")
       KALDI_ERR << ("The --utt2spk option is only needed if "
                     "the --vtln-map option is used.");
     RandomAccessBaseFloatReaderMapped vtln_map_reader(vtln_map_rspecifier,
                                                       utt2spk_rspecifier);
 
     SequentialTableReader reader(wav_rspecifier);
     BaseFloatMatrixWriter kaldi_writer;  // typedef to TableWriter.
     TableWriter htk_writer;
 
     if (output_format == "kaldi") {
       if (!kaldi_writer.Open(output_wspecifier))
         KALDI_ERR << "Could not initialize output with wspecifier "
                   << output_wspecifier;
     } else if (output_format == "htk") {
       if (!htk_writer.Open(output_wspecifier))
         KALDI_ERR << "Could not initialize output with wspecifier "
                   << output_wspecifier;
     } else {
       KALDI_ERR << "Invalid output_format string " << output_format;
     }
 
     DoubleWriter utt2dur_writer(utt2dur_wspecifier);
 
     int32 num_utts = 0, num_success = 0;
     for (; !reader.Done(); reader.Next()) {
       num_utts++;
       std::string utt = reader.Key();
       const WaveData &wave_data = reader.Value();
       if (wave_data.Duration() < min_duration) {
         KALDI_WARN << "File: " << utt << " is too short ("
                    << wave_data.Duration() << " sec): producing no output.";
         continue;
       }
       int32 num_chan = wave_data.Data().NumRows(), this_chan = channel;
       {  // This block works out the channel (0=left, 1=right...)
         KALDI_ASSERT(num_chan > 0);  // should have been caught in
         // reading code if no channels.
         if (channel == -1) {
           this_chan = 0;
           if (num_chan != 1)
             KALDI_WARN << "Channel not specified but you have data with "
                        << num_chan  << " channels; defaulting to zero";
         } else {
           if (this_chan >= num_chan) {
             KALDI_WARN << "File with id " << utt << " has "
                        << num_chan << " channels but you specified channel "
                        << channel << ", producing no output.";
             continue;
           }
         }
       }
       BaseFloat vtln_warp_local;  // Work out VTLN warp factor.
       if (vtln_map_rspecifier != "") {
         if (!vtln_map_reader.HasKey(utt)) {
           KALDI_WARN << "No vtln-map entry for utterance-id (or speaker-id) "
                      << utt;
           continue;
         }
         vtln_warp_local = vtln_map_reader.Value(utt);
       } else {
         vtln_warp_local = vtln_warp;
       }
 
       SubVector waveform(wave_data.Data(), this_chan);
       Matrix features;
       try {
         mfcc.ComputeFeatures(waveform, wave_data.SampFreq(),
                              vtln_warp_local, &features);
       } catch (...) {
         KALDI_WARN << "Failed to compute features for utterance " << utt;
         continue;
       }
       if (subtract_mean) {
         Vector mean(features.NumCols());
         mean.AddRowSumMat(1.0, features);
         mean.Scale(1.0 / features.NumRows());
         for (int32 i = 0; i < features.NumRows(); i++)
           features.Row(i).AddVec(-1.0, mean);
       }
       if (output_format == "kaldi") {
         kaldi_writer.Write(utt, features);
       } else {
         std::pair, HtkHeader> p;
         p.first.Resize(features.NumRows(), features.NumCols());
         p.first.CopyFromMat(features);
         HtkHeader header = {
           features.NumRows(),
           100000,  // 10ms shift
           static_cast(sizeof(float)*(features.NumCols())),
           static_cast( 006 | // MFCC
           (mfcc_opts.use_energy ? 0100 : 020000)) // energy; otherwise c0
         };
         p.second = header;
         htk_writer.Write(utt, p);
       }
       if (utt2dur_writer.IsOpen()) {
         utt2dur_writer.Write(utt, wave_data.Duration());
       }
       if (num_utts % 10 == 0)
         KALDI_LOG << "Processed " << num_utts << " utterances";
       KALDI_VLOG(2) << "Processed features for key " << utt;
       num_success++;
     }
     KALDI_LOG << " Done " << num_success << " out of " << num_utts
               << " utterances.";
     return (num_success != 0 ? 0 : 1);
   } catch(const std::exception &e) {
     std::cerr << e.what();
     return -1;
   }
 }

前面的parse参数和选项我们可以略过，如果需要，”Mfcc mfcc(mfcc_opts);”，这是真正干活的。Mfcc是OfflineFeatureTpl模板类使用MfccComputer的typedef：

typedef OfflineFeatureTpl Mfcc;

对于OfflineFeatureTpl的官网描述如下：

这个模板类用于离线特征提取，即。

在那里你可以在一开始就接触到整个信号。它主要存在于旧的（2016年前）MFCC、PLP等类的替换中，用于离线情况。2016年4月，我们重构了在线计算代码，以实现更大的模块性，并正确支持snip edges=false选项。

ComputeFeatures
我们来看计算特征的函数：


 void OfflineFeatureTpl::ComputeFeatures(
     const VectorBase &wave,
     BaseFloat sample_freq,
     BaseFloat vtln_warp,
     Matrix *output) {
   KALDI_ASSERT(output != NULL);
   BaseFloat new_sample_freq = computer_.GetFrameOptions().samp_freq;
   if (sample_freq == new_sample_freq) {
     Compute(wave, vtln_warp, output);
   } else {
     if (new_sample_freq < sample_freq &&
         ! computer_.GetFrameOptions().allow_downsample)
         KALDI_ERR << "Waveform and config sample Frequency mismatch: "
                   << sample_freq << " .vs " << new_sample_freq
                   << " (use --allow-downsample=true to allow "
                   << " downsampling the waveform).";
     else if (new_sample_freq > sample_freq &&
              ! computer_.GetFrameOptions().allow_upsample)
       KALDI_ERR << "Waveform and config sample Frequency mismatch: "
                   << sample_freq << " .vs " << new_sample_freq
                 << " (use --allow-upsample=true option to allow "
                 << " upsampling the waveform).";
     // Resample the waveform.
     Vector resampled_wave(wave);
     ResampleWaveform(sample_freq, wave,
                      new_sample_freq, &resampled_wave);
     Compute(resampled_wave, vtln_warp, output);
   }

它其实只是检查从WAV头部读取的采样率和compute-mfcc-feats传入的是否一致，如果一致使用Compute函数计算，否则如果运行的话对WAV文件进行上采样或者下采样以便满足compute-mfcc-feats的要求，最终还是调用Compute函数。

Compute


 void OfflineFeatureTpl::Compute(
     const VectorBase &wave,
     BaseFloat vtln_warp,
     Matrix *output) {
   KALDI_ASSERT(output != NULL);
   int32 rows_out = NumFrames(wave.Dim(), computer_.GetFrameOptions()),
       cols_out = computer_.Dim();
   if (rows_out == 0) {
     output->Resize(0, 0);
     return;
   }
   output->Resize(rows_out, cols_out);
   Vector window;  // windowed waveform.
   bool use_raw_log_energy = computer_.NeedRawLogEnergy();
   for (int32 r = 0; r < rows_out; r++) {  // r is frame index.
     BaseFloat raw_log_energy = 0.0;
     ExtractWindow(0, wave, r, computer_.GetFrameOptions(),
                   feature_window_function_, &window,
                   (use_raw_log_energy ? &raw_log_energy : NULL));
 
     SubVector output_row(*output, r);
     computer_.Compute(raw_log_energy, vtln_warp, &window, &output_row);
   }

首先使用NumFrames计算WAV有多少帧，然后遍历每一帧：使用ExtractWindow抽取每一帧，然后使用computer_.Compute提取特征。

NumFrames
目前默认的方式是snip_edges，也和HTK一致，也就是保证不需要padding，如果往后移动超出范围，那就不要了。


 int32 NumFrames(int64 num_samples,
                 const FrameExtractionOptions &opts,
                 bool flush) {
   int64 frame_shift = opts.WindowShift();
   int64 frame_length = opts.WindowSize();
   if (opts.snip_edges) {
     // with --snip-edges=true (the default), we use a HTK-like approach to
     // determining the number of frames-- all frames have to fit completely into
     // the waveform, and the first frame begins at sample zero.
     if (num_samples < frame_length)
       return 0;
     else
       return (1 + ((num_samples - frame_length) / frame_shift));
     // You can understand the expression above as follows: 'num_samples -
     // frame_length' is how much room we have to shift the frame within the
     // waveform; 'frame_shift' is how much we shift it each time; and the ratio
     // is how many times we can shift it (integer arithmetic rounds down).
   } else {
     // if --snip-edges=false, the number of frames is determined by rounding the
     // (file-length / frame-shift) to the nearest integer.  The point of this
     // formula is to make the number of frames an obvious and predictable
     // function of the frame shift and signal length, which makes many
     // segmentation-related questions simpler.
     //
     // Because integer division in C++ rounds toward zero, we add (half the
     // frame-shift minus epsilon) before dividing, to have the effect of
     // rounding towards the closest integer.
     int32 num_frames = (num_samples + (frame_shift / 2)) / frame_shift;
 
     if (flush)
       return num_frames;
 
     // note: 'end' always means the last plus one, i.e. one past the last.
     int64 end_sample_of_last_frame = FirstSampleOfFrame(num_frames - 1, opts)
         + frame_length;
 
     // the following code is optimized more for clarity than efficiency.
     // If flush == false, we can't output frames that extend past the end
     // of the signal.
     while (num_frames > 0 && end_sample_of_last_frame > num_samples) {
       num_frames--;
       end_sample_of_last_frame -= frame_shift;
     }
     return num_frames;
   }
 }

ExtractWindow
这里提取每一帧的时候会有一些小的trick，比如采样点的偏移、要求采样点是2的幂，否则在后面padding、在ProcessWindow里加pre-emphasis或者dithering(增加很小的随机噪声防止log为0）以及计算每一帧的能量。最后会把这些点乘以窗口函数FeatureWindowFunction（默认为povey自己设计的窗）


 void ExtractWindow(int64 sample_offset,
                    const VectorBase &wave,
                    int32 f,  // with 0 <= f < NumFrames(feats, opts)
                    const FrameExtractionOptions &opts,
                    const FeatureWindowFunction &window_function,
                    Vector *window,
                    BaseFloat *log_energy_pre_window) {
   KALDI_ASSERT(sample_offset >= 0 && wave.Dim() != 0);
   int32 frame_length = opts.WindowSize(),
       frame_length_padded = opts.PaddedWindowSize();
   int64 num_samples = sample_offset + wave.Dim(),
       start_sample = FirstSampleOfFrame(f, opts),
       end_sample = start_sample + frame_length;
 
   if (opts.snip_edges) {
     KALDI_ASSERT(start_sample >= sample_offset &&
                  end_sample <= num_samples);
   } else {
     KALDI_ASSERT(sample_offset == 0 || start_sample >= sample_offset);
   }
 
   if (window->Dim() != frame_length_padded)
     window->Resize(frame_length_padded, kUndefined);
 
   // wave_start and wave_end are start and end indexes into 'wave', for the
   // piece of wave that we're trying to extract.
   int32 wave_start = int32(start_sample - sample_offset),
       wave_end = wave_start + frame_length;
   if (wave_start >= 0 && wave_end <= wave.Dim()) {
     // the normal case-- no edge effects to consider.
     window->Range(0, frame_length).CopyFromVec(
         wave.Range(wave_start, frame_length));
   } else {
     // Deal with any end effects by reflection, if needed.  This code will only
     // be reached for about two frames per utterance, so we don't concern
     // ourselves excessively with efficiency.
     int32 wave_dim = wave.Dim();
     for (int32 s = 0; s < frame_length; s++) {
       int32 s_in_wave = s + wave_start;
       while (s_in_wave < 0 || s_in_wave >= wave_dim) {
         // reflect around the beginning or end of the wave.
         // e.g. -1 -> 0, -2 -> 1.
         // dim -> dim - 1, dim + 1 -> dim - 2.
         // the code supports repeated reflections, although this
         // would only be needed in pathological cases.
         if (s_in_wave < 0) s_in_wave = - s_in_wave - 1;
         else s_in_wave = 2 * wave_dim - 1 - s_in_wave;
       }
       (*window)(s) = wave(s_in_wave);
     }
   }
 
   if (frame_length_padded > frame_length)
     window->Range(frame_length, frame_length_padded - frame_length).SetZero();
 
   SubVector frame(*window, 0, frame_length);
 
   ProcessWindow(opts, window_function, &frame, log_energy_pre_window);
 }
 
 }  // namespace kaldi
 FeatureWindowFunction::FeatureWindowFunction(const FrameExtractionOptions &opts) {
   int32 frame_length = opts.WindowSize();
   KALDI_ASSERT(frame_length > 0);
   window.Resize(frame_length);
   double a = M_2PI / (frame_length-1);
   for (int32 i = 0; i < frame_length; i++) {
     double i_fl = static_cast(i);
     if (opts.window_type == "hanning") {
       window(i) = 0.5  - 0.5*cos(a * i_fl);
     } else if (opts.window_type == "hamming") {
       window(i) = 0.54 - 0.46*cos(a * i_fl);
     } else if (opts.window_type == "povey") {  // like hamming but goes to zero at edges.
       window(i) = pow(0.5 - 0.5*cos(a * i_fl), 0.85);
     } else if (opts.window_type == "rectangular") {
       window(i) = 1.0;
     } else if (opts.window_type == "blackman") {
       window(i) = opts.blackman_coeff - 0.5*cos(a * i_fl) +
         (0.5 - opts.blackman_coeff) * cos(2 * a * i_fl);
     } else {
       KALDI_ERR << "Invalid window type " << opts.window_type;
     }
   }
 }

MfccComputer

最终到了干活的代码了，上面会调用它的Compute函数：


 void MfccComputer::Compute(BaseFloat signal_raw_log_energy,
                            BaseFloat vtln_warp,
                            VectorBase *signal_frame,
                            VectorBase *feature) {
   KALDI_ASSERT(signal_frame->Dim() == opts_.frame_opts.PaddedWindowSize() &&
                feature->Dim() == this->Dim());
   // 获取Mel FilterBank，为了复用，会把每一个VLTN的alpha作为key存在map里。
   const MelBanks &mel_banks = *(GetMelBanks(vtln_warp));
 
   if (opts_.use_energy && !opts_.raw_energy)
     // 用向量向量乘法计算能量
     signal_raw_log_energy = Log(std::max(VecVec(*signal_frame, *signal_frame),
                                      std::numeric_limits::epsilon()));
  // FFT，默认是split-radix算法
   if (srfft_ != NULL)  // Compute FFT using the split-radix algorithm.
     srfft_->Compute(signal_frame->Data(), true);
   else  // An alternative algorithm that works for non-powers-of-two.
     RealFft(signal_frame, true);
    // FFT得到的复数计算其模得到功率谱
   // Convert the FFT into a power spectrum.
   ComputePowerSpectrum(signal_frame);
   SubVector power_spectrum(*signal_frame, 0,
                                       signal_frame->Dim() / 2 + 1);
   // 使用Filter bank滤波器组提取每个滤波器的能量
   mel_banks.Compute(power_spectrum, &mel_energies_);
  // 避免对零取log (如果有dithering那么不应该是零，但是dithering是可选的，所以保险一点还是要处理)
   // avoid log of zero (which should be prevented anyway by dithering).
   mel_energies_.ApplyFloor(std::numeric_limits::epsilon());
   mel_energies_.ApplyLog();  // take the log.
 
   feature->SetZero();  // in case there were NaNs.
   // 进行DCT得到倒谱
   // feature = dct_matrix_ * mel_energies [which now have log]
   feature->AddMatVec(1.0, dct_matrix_, kNoTrans, mel_energies_, 0.0);
   
   if (opts_.cepstral_lifter != 0.0)
     feature->MulElements(lifter_coeffs_);
   // 如果使用能量，那么把这一帧的能量替换掉倒谱的第一个系数。
   if (opts_.use_energy) {
     if (opts_.energy_floor > 0.0 && signal_raw_log_energy < log_energy_floor_)
       signal_raw_log_energy = log_energy_floor_;
     (*feature)(0) = signal_raw_log_energy;
   }
 
   if (opts_.htk_compat) {
     BaseFloat energy = (*feature)(0);
     for (int32 i = 0; i < opts_.num_ceps - 1; i++)
       (*feature)(i) = (*feature)(i+1);
     if (!opts_.use_energy)
       energy *= M_SQRT2;  // scale on C0 (actually removing a scale
     // we previously added that's part of one common definition of
     // the cosine transform.)
     (*feature)(opts_.num_ceps - 1)  = energy;
   }
 }

最终我们可以使用计算的函数compute-mfcc-feats.cc做一个简单的实验：

compute_cmvn_stats.sh
之后看顶层脚本compute_cmvn_stats.sh，地址：https://github.com/kaldi-asr/kaldi/blob/master/egs/wsj/s5/steps/compute_cmvn_stats.sh。使用方式如下：


steps/compute_cmvn_stats.sh 
Usage: steps/compute_cmvn_stats.sh [options]  [ [] ]
e.g.: steps/compute_cmvn_stats.sh data/train exp/make_mfcc/train mfcc
Note:  defaults to /log, and  defaults to /data
Options:
 --fake          gives you fake cmvn stats that do no normalization.
 --two-channel   is for two-channel telephone data, there must be no segments 
                 file and reco2file_and_channel must be present.  It will take
                 only frames that are louder than the other channel.
 --fake-dims   Generate stats that won't cause normalization for these
                  dimensions (e.g. 13:14:15)


compute-cmvn-stats --spk2utt=ark:$data/spk2utt scp:$data/feats.scp ark,scp:$cmvndir/cmvn_$name.ark,$cmvndir/cmvn_$name.scp \
    2> $logdir/cmvn_$name.log && echo "Error computing CMVN stats. See $logdir/cmvn_$name.log"

上图为脚本里的核心函数：compute-cmvn-stats，使用方法及参数如下：


compute-cmvn-stats 

Compute cepstral mean and variance normalization statistics
If wspecifier provided: per-utterance by default, or per-speaker if
spk2utt option provided; if wxfilename: global
Usage: compute-cmvn-stats  [options]  (|)
e.g.: compute-cmvn-stats --spk2utt=ark:data/train/spk2utt scp:data/train/feats.scp ark,scp:/foo/bar/cmvn.ark,data/train/cmvn.scp
See also: apply-cmvn, modify-cmvn-stats

Options:
  --binary                    : write in binary mode (applies only to global CMN/CVN) (bool, default = true)
  --spk2utt                   : rspecifier for speaker to utterance-list map (string, default = "")
  --weights                   : rspecifier for a vector of floats for each utterance, that's a per-frame weight. (string, default = "")

Standard options:
  --config                    : Configuration file to read (this option may be repeated) (string, default = "")
  --help                      : Print out usage message (bool, default = false)
  --print-args                : Print the command line arguments (to stderr) (bool, default = true)
  --verbose                   : Verbose level (higher->more logging) (int, default = 0)

很多参数，但是必须的参数只有两个：输入的feat-rspecifier和输出的stats-wspecifier。我们首先需要准备输入的文件，即上一步提取mfcc特征的输出文件raw_mfcc。

compute-cmvn-stats.cc


 int main(int argc, char *argv[]) {
   try {
     using namespace kaldi;
     using kaldi::int32;
 
     const char *usage =
         "Compute cepstral mean and variance normalization statistics\n"
         "If wspecifier provided: per-utterance by default, or per-speaker if\n"
         "spk2utt option provided; if wxfilename: global\n"
         "Usage: compute-cmvn-stats  [options]  (|)\n"
         "e.g.: compute-cmvn-stats --spk2utt=ark:data/train/spk2utt"
         " scp:data/train/feats.scp ark,scp:/foo/bar/cmvn.ark,data/train/cmvn.scp\n"
         "See also: apply-cmvn, modify-cmvn-stats\n";
 
     ParseOptions po(usage);
     std::string spk2utt_rspecifier, weights_rspecifier;
     bool binary = true;
     po.Register("spk2utt", &spk2utt_rspecifier, "rspecifier for speaker to utterance-list map");
     po.Register("binary", &binary, "write in binary mode (applies only to global CMN/CVN)");
     po.Register("weights", &weights_rspecifier, "rspecifier for a vector of floats "
                 "for each utterance, that's a per-frame weight.");
 
     po.Read(argc, argv);
 
     if (po.NumArgs() != 2) {
       po.PrintUsage();
       exit(1);
     }
 
     int32 num_done = 0, num_err = 0;
     std::string rspecifier = po.GetArg(1);
     std::string wspecifier_or_wxfilename = po.GetArg(2);
 
     RandomAccessBaseFloatVectorReader weights_reader(weights_rspecifier);
 
     if (ClassifyWspecifier(wspecifier_or_wxfilename, NULL, NULL, NULL)
         != kNoWspecifier) { // writing to a Table: per-speaker or per-utt CMN/CVN.
       std::string wspecifier = wspecifier_or_wxfilename;
 
       DoubleMatrixWriter writer(wspecifier);
 
       if (spk2utt_rspecifier != "") {
         SequentialTokenVectorReader spk2utt_reader(spk2utt_rspecifier);
         RandomAccessBaseFloatMatrixReader feat_reader(rspecifier);
 
         for (; !spk2utt_reader.Done(); spk2utt_reader.Next()) {
           std::string spk = spk2utt_reader.Key();
           const std::vector &uttlist = spk2utt_reader.Value();
           bool is_init = false;
           Matrix stats;
           for (size_t i = 0; i < uttlist.size(); i++) {
             std::string utt = uttlist[i];
             if (!feat_reader.HasKey(utt)) {
               KALDI_WARN << "Did not find features for utterance " << utt;
               num_err++;
               continue;
             }
             const Matrix &feats = feat_reader.Value(utt);
             if (!is_init) {
               InitCmvnStats(feats.NumCols(), &stats);
               is_init = true;
             }
             if (!AccCmvnStatsWrapper(utt, feats, &weights_reader, &stats)) {
               num_err++;
             } else {
               num_done++;
             }
           }
           if (stats.NumRows() == 0) {
             KALDI_WARN << "No stats accumulated for speaker " << spk;
           } else {
             writer.Write(spk, stats);
           }
         }
       } else {  // per-utterance normalization
         SequentialBaseFloatMatrixReader feat_reader(rspecifier);
 
         for (; !feat_reader.Done(); feat_reader.Next()) {
           std::string utt = feat_reader.Key();
           Matrix stats;
           const Matrix &feats = feat_reader.Value();
           InitCmvnStats(feats.NumCols(), &stats);
 
           if (!AccCmvnStatsWrapper(utt, feats, &weights_reader, &stats)) {
             num_err++;
             continue;
           }
           writer.Write(feat_reader.Key(), stats);
           num_done++;
         }
       }
     } else { // accumulate global stats
       if (spk2utt_rspecifier != "")
         KALDI_ERR << "--spk2utt option not compatible with wxfilename as output "
                    << "(did you forget ark:?)";
       std::string wxfilename = wspecifier_or_wxfilename;
       bool is_init = false;
       Matrix stats;
       SequentialBaseFloatMatrixReader feat_reader(rspecifier);
       for (; !feat_reader.Done(); feat_reader.Next()) {
         std::string utt = feat_reader.Key();
         const Matrix &feats = feat_reader.Value();
         if (!is_init) {
           InitCmvnStats(feats.NumCols(), &stats);
           is_init = true;
         }
         if (!AccCmvnStatsWrapper(utt, feats, &weights_reader, &stats)) {
           num_err++;
         } else {
           num_done++;
         }
       }
       Matrix stats_float(stats);
       WriteKaldiObject(stats_float, wxfilename, binary);
       KALDI_LOG << "Wrote global CMVN stats to "
                 << PrintableWxfilename(wxfilename);
     }
     KALDI_LOG << "Done accumulating CMVN stats for " << num_done
               << " utterances; " << num_err << " had errors.";
     return (num_done != 0 ? 0 : 1);
   } catch(const std::exception &e) {
     std::cerr << e.what();
     return -1;
   }
 }
根据每个说话人的音频集合进行AccCmvnStatsWrapper函数的处理。

AccCmvnStatsWrapper
 bool AccCmvnStatsWrapper(const std::string &utt,
                          const MatrixBase &feats,
                          RandomAccessBaseFloatVectorReader *weights_reader,
                          Matrix *cmvn_stats) {
   if (!weights_reader->IsOpen()) {
     AccCmvnStats(feats, NULL, cmvn_stats);
     return true;
   } else {
     if (!weights_reader->HasKey(utt)) {
       KALDI_WARN << "No weights available for utterance " << utt;
       return false;
     }
     const Vector &weights = weights_reader->Value(utt);
     if (weights.Dim() != feats.NumRows()) {
       KALDI_WARN << "Weights for utterance " << utt << " have wrong dimension "
                  << weights.Dim() << " vs. " << feats.NumRows();
       return false;
     }
     AccCmvnStats(feats, &weights, cmvn_stats);
     return true;
   }
 }

AccCmvnStatsWrapper主要是对一些特殊情况进行处理，主要干活的是AccCmvnStats。

AccCmvnStats


 void AccCmvnStats(const VectorBase &feats, BaseFloat weight, MatrixBase *stats) {
   int32 dim = feats.Dim();
   KALDI_ASSERT(stats != NULL);
   KALDI_ASSERT(stats->NumRows() == 2 && stats->NumCols() == dim + 1);
   // Remove these __restrict__ modifiers if they cause compilation problems.
   // It's just an optimization.
    double *__restrict__ mean_ptr = stats->RowData(0),
        *__restrict__ var_ptr = stats->RowData(1),
        *__restrict__ count_ptr = mean_ptr + dim;
    const BaseFloat * __restrict__ feats_ptr = feats.Data();
   *count_ptr += weight;
   // Careful-- if we change the format of the matrix, the "mean_ptr < count_ptr"
   // statement below might become wrong.
   for (; mean_ptr < count_ptr; mean_ptr++, var_ptr++, feats_ptr++) {
     *mean_ptr += *feats_ptr * weight;
     *var_ptr +=  *feats_ptr * *feats_ptr * weight;
   }
 }

这里将satate的第一行构造为传入feat的每一列的行加权和，第一行最后一维是feat的帧数。state的第二行是传入的feat的每一列的行加权平方和。

最终我们可以使用函数compute-mfcc-feats.cc和compute-cmvn-stats.cc做一个简单的实验：

你可能感兴趣的:(分享)

微信视频号禁止下载？3招隐藏技巧秒存！安卓/iOS双端亲测有效，最后1招官方都默许微丽宝值得分享视频下载视频号里面的短视频怎样下载
一、视频号不提供下载按钮的原因版权保护为保护创作者原创内容，避免未经授权的传播和侵权行为[1][2]。平台生态维护鼓励用户在微信生态内互动（点赞、评论、分享），减少内容外流[1]。用户体验优化避免用户因下载导致存储空间不足或下载速度问题[1]。二、安卓用户下载方法1分钟提取缓存文件完整播放目标视频（确保缓存生成）。进入手机【文件管理】→【内部存储】→【Android】→【data】→【com.te
线上一个隐匿 Bug 的复盘 Wu_Candy 大数据测试大数据
前言之前负责的一个项目上线好久了，最近突然爆出一Bug，最后评估影响范围将Bug升级成了故障，只因为影响的数据量有10000条左右，对业务方造成了一定的影响。但因为不涉及到资金损失，Bug修复后对数据进行修补，所以最终级别也是较低的。今天和大家分享这个线上隐匿的Bug，也好在工作的项目中得以借鉴哈~需求背景主题：民宿入住回访问卷描述：针对入住民宿的顾客，在离店后的当天或第二天内需要给顾客发送本次入
漫谈JVM weixin_34111790 运维 java python
2019独角兽企业重金招聘Python工程师标准>>>背景介绍创建了一个技术类公众号:一起源码分析，里面会分享最新的开源代码、源码解读、开发技巧等，欢迎大家关注。JVM已经是Java开发的必备技能了，JVM相当于Java的操作系统。JVM,javavirtualmachine,即Java虚拟机，是运行javaclass文件的程序。Java代码经过Java编译器编译，会编译成class文件，一种平台
vant官网-vant ui 首页-移动端Vue组件库 embelfe_segge 面试学习路线阿里巴巴 android 前端后端
Vant是有赞前端团队开源的移动端vue组件库，适用于手机端h5页面。鉴于百度搜索不到vant官方网址，分享一下vant组件库官网地址，方便新手使用vant官网地址https://vant-contrib.gitee.io/vant/#/zh-CN/通过npm安装在现有项目中使用Vant时，可以通过npm或yarn进行安装：#Vue2项目，安装Vant2：npmivant-S#Vue3项目，安装V
Android端ReactNative环境搭建——上 hzulwy reactnative react native android react.js
前言最近一年，因为公司业务需要，部门引入了rn这门跨段技术来开发业务需求。从去年部门大佬调研rn这个框架到现在已有超过一年的时间了。而我从当时毕业不到1年的小白成长到现在负责维护项目的Android端代码的主力。同时，自己对rn相关的技术有了不少理解。因此，想要分享一些知识点，希望可以帮助到大家。我会以一个专栏的方式述说在这一年当中使用rn开发需求遇到的困难。大家可以借鉴参考下，共同进步！！！使用
基于 MySQL 和 Spring Boot 的在线论坛管理系统设计与实现城南|阿洋-计算机从小白到大神 mysql spring boot 数据库
markdownCopy✌全网粉丝20W+,csdn特邀作者、博客专家、CSDN[新星计划]导师、java领域优质创作者,博客之星、掘金/华为云/阿里云/InfoQ等平台优质作者、专注于Java、pyhton、机器学习技术领域和毕业项目实战✌哈喽兄弟们，好久不见哦～最近整理了一下之前写过的一些小项目/毕业设计。发现还是有很多存货的，想一想既然放在电脑里面也吃灰，那么还不如分享出去，没准还可以帮助到
python processpoolexecutor_Python多进程解决方案multiprocessing ProcessPoolExecutor weixin_39599046 python
大多数编程语言都会有多线程和多进程的概念，至于线程和进程的概念，大家可以百度一下。作为一门胶水语言，Python毫不意外，也可以利用多线程和多进程处理并发问题，但是多线程由于GIL的存在，起作用范围大打折扣，仅限于在IO等场景可以发挥点作用。所以，今天要跟大家分享的是Python多进程方案，更好地利用系统多核，从而提升性能。基础方案一：利用Process新建一个子进程，在子进程执行任务。我们写一个
conda：一个当下最流行的Python虚拟环境工具 Wang_AI
点击上方“AI派”，选择“设为星标”最新分享，第一时间送达！作者：LeonWang，现为中科院特别研究助理(博士后)，在AI、数据科学和科学计算等方面相关的工程实践上积累了丰富的经验。编辑：王老湿前面的文章中，为大家介绍过Python下的虚拟环境和包管理。在实际中，更为流行的是用Conda来管理Python环境。今天这篇文章就为大家介绍这方面的相关内容。Conda环境Conda简介Conda是目前
DeepSeek 如何处理多模态数据（如文本、图像、视频）？借雨醉东风人工智能
关注我，持续分享逻辑思维&管理思维&面试题；可提供大厂面试辅导、及定制化求职/在职/管理/架构辅导；推荐专栏《10天学会使用asp.net编程AI大模型》，目前已完成所有内容。一顿烧烤不到的费用，让人能紧跟时代的浪潮。从普通网站，到公众号、小程序，再到AI大模型网站。干货满满。学成后可接项目赚外快，绝对划算。不仅学会如何编程，还将学会如何将AI技术应用到实际问题中，为您的职业生涯增添一笔宝贵的财富
Python知识分享第十四天闵少搞AI python 开发语言
“”"1.面向对象相关概述概述面向对象是一种编程思想强调的是以对象为基础完成的各种操作它是基于面向过程的扩展Python中是同时支持面向对象和面向过程这两种编程思想的思想特点更符合人们的思考习惯把复杂的问题简单化把人们(程序员)从执行者变成了指挥者2.面向对象三大特征介绍封装继承多态封装概述封装就是隐藏对象的属性和实现细节仅对外提供公共的访问方式举例:插板电脑手机好处提高代码的安全性弊端代码量增加
【Docker系列四】Docker 网络 Kwan的解忧杂货铺@新空间代码工作室 s4 Docker系列 docker 网络容器
欢迎来到我的博客，很高兴能够在这里和您见面！希望您在这里可以感受到一份轻松愉快的氛围，不仅可以获得有趣的内容和知识，也可以畅所欲言、分享您的想法和见解。推荐:kwan的首页,持续学习,不断总结,共同进步,活到老学到老导航檀越剑指大厂系列:全面总结java核心技术,jvm,并发编程redis,kafka,Spring,微服务等常用开发工具系列:常用的开发工具,IDEA,Mac,Alfred,Git,
HarmonyOS Next 应用性能优化实战 SameX-4869 harmonyos 性能优化华为
本文旨在深入探讨华为鸿蒙HarmonyOSNext系统（截止目前API12）中应用性能优化的技术细节，基于实际开发实践进行总结。主要作为技术分享与交流载体，难免错漏，欢迎各位同仁提出宝贵意见和问题，以便共同进步。本文为原创内容，任何形式的转载必须注明出处及原作者。一、性能评估指标与工具（一）关键性能评估指标CPU使用率CPU使用率是衡量应用在运行过程中对CPU资源占用情况的重要指标。一个高效的Ha
HarmonyOS Next 企业级移动办公应用构建 SameX-4869 harmonyos 华为
本文旨在深入探讨华为鸿蒙HarmonyOSNext系统（截止目前API12）在企业级移动办公应用构建中的应用，基于实际开发实践进行总结。主要作为技术分享与交流载体，难免错漏，欢迎各位同仁提出宝贵意见和问题，以便共同进步。本文为原创内容，任何形式的转载必须注明出处及原作者。第一章：应用场景与架构规划一、常见应用场景及要求任务管理在企业办公中，任务管理是核心场景之一。员工需要能够创建任务，详细描述任务
AtCoder备赛冲刺必刷题（C++） | 洛谷 AT_abc396_a Triple Four 热爱编程的通信人 c++算法开发语言
本文分享的必刷题目是从蓝桥云课、洛谷、AcWing等知名刷题平台精心挑选而来，并结合各平台提供的算法标签和难度等级进行了系统分类。题目涵盖了从基础到进阶的多种算法和数据结构，旨在为不同阶段的编程学习者提供一条清晰、平稳的学习提升路径。欢迎大家订阅我的专栏：算法题解：C++与Python实现！附上汇总贴：算法竞赛备考冲刺必刷题（C++）|汇总【题目来源】洛谷：AT_abc396_a[ABC396A]
LabVIEW实现LoRa通信不脱发的程序猿 LabVIEW物联网开发实战 labview
目录1、LoRa通信原理2、硬件环境部署3、程序架构4、前面板设计5、程序框图设计6、测试验证本专栏以LabVIEW为开发平台，讲解物联网通信组网原理与开发方法，覆盖RS232、TCP、MQTT、蓝牙、Wi-Fi、NB-IoT等协议。结合实际案例，展示如何利用LabVIEW和常用模块实现物联网系统的快速开发与原型设计，助你从基础到实战，全面掌握物联网开发技能。开源免费LabVIEW学习专栏分享：L
[代码规范]1_良好的命名规范能减轻工作负担啾啾大学习编程通用代码规范 Java命名规范命名规范长命名方案
欢迎来到啾啾的博客，一个致力于构建完善的Java程序员知识体系的博客，记录学习的点滴，分享工作的思考、实用的技巧，偶尔分享一些杂谈。欢迎评论交流，感谢您的阅读。目录引言命名——提炼含义减少注释类名命名接口与实现类的命名方法命名的最佳实践1.方法名的结构2.参数与返回值的隐含3.避免缩写4.逻辑与副作用的体现5.条件判断方法长命名处理——实战答疑处理方法1.利用上下文环境简化名称2.使用领域术语或缩
facefusion AI换脸软件的本地部署过程记录 kfrealme 人工智能
tags:AI驾驭facefusion我的环境Win10+N卡安装步骤安装Python3.10方案手动安装Python官网下载安装包安装PythonReleasesforWindows|Python.org我的蓝奏云分享https://www.lanzoub.com/i9La81s1o5gb密码:h17b命令行安装1以管理员身份打开「命令提示符」2删除Microsoft官方源wingetsourc
为微服务架构增加聚合层 hello_world! 云原生 springboot
最近公司业务繁忙，全力以赴在做狐小E，一直没时间做技术分享，现在上线了，终于有时间来写点东西。网关是微服务架构不可或缺的一部分，作为微服务架构的唯一入口，将所有请求转发到后端对应的微服务上去，同时又可以将各个微服务中的通用功能集中到网关去做，而不是在每个微服务都实现一遍，比如权限校验，限流，熔断和监控等。如图所示，这是个典型的前后端分离的微服务架构，但这个架构在的问题是，一个接口无法同时满足不同场
短视频矩阵系统源码新发布技术方案有那几种？ Yxh18137784554 短视频矩阵开发矩阵算法架构
短视频矩阵系统从21年发展到现在经历了历史性的发展高潮经过各平台的反复变化政策，短视频矩阵系统目前做的为数不多的同梯队的筷子科技、云罗抖去推、超级编导都选用的是什么方式的代发解决方案呢？今天小编就来给我的技术粉们分享下一下几种常见的开发方案#短视频矩阵系统##短视频矩阵系统还能用吗？##短视频矩阵系统源码##短视频矩阵系统代发/托管发都有什么解决方案?短视频矩阵系统源码新发布的技术方案通常有以下几
**[特殊字符] 计算机领域创作挑战赛，邀你共绘文字海洋！** 爱编程的Loren 活动文章活动文章
亲爱的大学博主们：大家好！你是否热爱写作，渴望在文字的海洋中遨游，展示自己的创作才华？你是否对计算机领域充满热情，希望将你的知识和见解分享给更多人？如果你对这两点都给出了肯定的答案，那么这个创作活动就是为你量身定制的！ **创作挑战赛火热开启** 我们诚挚地邀请你参加为期14天的创作挑战赛！这是一个以写作博客为目的的创作活动，旨在鼓励大学生博主们挖掘自己的创作潜能，展现自己的写作才
GPT-4o mini TTS：OpenAI 推出轻量级文本转语音模型！情感操控+白菜价冲击配音圈蚝油菜花每日 AI 项目与应用实例开源人工智能
❤️如果你也关注AI的发展现状，且对AI应用开发感兴趣，我会每日分享大模型与AI领域的开源项目和应用，提供运行实例和实用教程，帮助你快速上手AI技术！AI在线答疑->智能检索历史文章和开源项目->丰富的AI工具库->每日更新->尽在微信公众号->搜一搜：蚝油菜花️“声优连夜转行送外卖！OpenAI新模型每分钟语音成本仅9分钱”大家好，我是蚝油菜花。当同行还在用机械音合成器折磨听众时，这个AI怪物已
Dify-Plus：企业级AI管理核弹！开源方案吊打SaaS，额度+密钥+鉴权系统全面集成蚝油菜花每日 AI 项目与应用实例人工智能开源开源人工智能
❤️如果你也关注AI的发展现状，且对AI应用开发感兴趣，我会每日分享大模型与AI领域的开源项目和应用，提供运行实例和实用教程，帮助你快速上手AI技术！AI在线答疑->智能检索历史文章和开源项目->丰富的AI工具库->每日更新->尽在微信公众号->搜一搜：蚝油菜花“CTO集体失眠！这个开源项目让企业AI管理进入上帝模式”大家好，我是蚝油菜花。当同行还在为API调用次数和预算超支扯皮时，这个国产神器已
五个冷门的Adobe系列软件小技巧 reddingtons adobe
在当今的数字时代，Adobe系列软件在设计、视频编辑和创意制作领域占据着重要地位。许多学校和教育机构为学生提供教育邮箱，允许他们免费使用Adobe全系列软件的教育订阅。这意味着无论是Photoshop、Illustrator还是PremierePro等热门软件，学生都能轻松获取。然而，本文将分享一些冷门的Adobe软件小技巧，这些技巧主要适用于付费用户，可能不适用于某些免费用户。小技巧一：使用Ad
从“一壶浊酒”到“一份报告”，看永洪科技助力郎酒集团的数字化升级之旅永洪科技大数据数据分析数据可视化 BI
白酒在社交、庆祝和宴请活动中扮演着重要的角色，它与人们的生活密切相关。白酒的制作过程、酿造技艺、酒文化习俗等方面都体现了当地的历史、传统和价值观。同时它也是一种文化的载体，承载着人们对于生活、友谊、团聚的情感和期待。人们通过分享白酒来加强彼此之间的联系和沟通，它成为了社交场合中的重要元素。白酒还通过艺术、文学、电影等形式在文化领域中得到了表达和展示。郎酒庄园作为我国传统的白酒行业，郎酒在国内市场占
侯捷 C++ 课程学习笔记：深入掌握 C++ 高阶特性 —— 实践与心得分享清水白石008 C++学习笔记课程教程 c++学习笔记
侯捷C++课程学习笔记：深入掌握C++高阶特性——实践与心得分享自从开始接触侯捷C++系列精品课程以来，我对C++语言有了全新的认识与深入理解。这套课程不仅系统地梳理了C++的基础知识，更从实际案例中展示了许多高阶特性和工程实战技巧。作为一名长期从事C++开发的专业人士，我深深感受到侯捷老师讲解中那种由浅入深、逻辑严密的魅力，也正是这种教学风格让我在短时间内掌握了不少难以琢磨的知识点。今天，我将结
使用Python和Django构建支持多语言的博客网站程序员～小强 python django sqlite
随着互联网的发展,博客已经成为人们获取信息和分享想法的重要平台。但是不同国家和地区的用户语言各异,这给博客的国际化带来了挑战。本文将介绍如何使用Python和Django这两个强大的Web开发框架,来构建一个支持多语言的博客网站。Django框架概述Django是一个开源的Web应用框架,由Python写成。它鼓励快速开发和干净的设计。通过提供大量常用组件,Django可以更快地构建高质量的Web
DMDDM文档数据库学习分享合作愉快：）数据库学习
达梦新云文档数据库（简称DMDDM），是一款由达梦公司独立研发的分布式原生文档数据库产品。一、关键特性1、高性能、高可用性：DMDDM文档数据库支持快速的数据读写操作，能够满足高性能应用的需求。支持主备集群和分布式集群部署方式，单个节点故障不影响整个系统的正常运行。提供DDM-Meta、DDM-Store和DDM-Engine三个核心组件，分别负责存储数据库元数据和集群调度、存储实际的数据库数据以
STM32F103C8T6点灯/流水灯（指定IO，正向反向） BDXiaotianYA stm32 嵌入式硬件单片机
参加2023年电赛后，到现在上班一年多，长达两年时间内，几乎没有再碰过单片机，由于现在工作中需要接触到一些代码，先退回来复习下32单片机。本人在此做一件事情，傻瓜式代码，让代码足够简洁，足够规范，让你复制我的代码百分百能够使用。此账号仅作为分享本人复习过程中记录使用，如果无法使用，或者或者有优化的地方，欢迎留言，看到后第一时间给予回复。有空会将2023激光打靶代码开源出来。在使用本程序的时候，默认
Python 爬虫实战：社交媒体品牌反馈数据抓取与舆情分析西攻城狮北 python 爬虫媒体
一、引言在当今数字化时代，社交媒体已成为公众表达意见、分享信息的重要渠道。品牌的声誉和市场表现往往受到消费者在社交平台上的反馈和评价的影响，因此品牌舆情分析变得至关重要。本文将介绍如何使用爬虫技术爬取社交媒体上的品牌反馈数据，并通过数据分析技术，分析品牌的舆情动态。二、环境准备在开始之前，确保你的开发环境已经安装了以下必要的Python库：requests:用于发送HTTP请求。beautiful
Vision mamba(mamba_ssm)安装踩坑指南 ggitjcg 深度学习 python
在这篇博客中，我将分享我在linux环境安装和使用VisionMamba（mamba_ssm）过程中遇到的一些问题和解决方法。前置检查：PyTorch和Python版本在安装mamba_ssm前，请确保你的PyTorch和Python环境版本正确。以下代码可用来检查环境信息：importtorchprint("PyTorchVersion:{}".format(torch.__version__)
ASM系列五利用TreeApi 解析生成Class lijingyao8206 ASM 字节码动态生成 ClassNode TreeAPI
前面CoreApi的介绍部分基本涵盖了ASMCore包下面的主要API及功能，其中还有一部分关于MetaData的解析和生成就不再赘述。这篇开始介绍ASM另一部分主要的Api。TreeApi。这一部分源码是关联的asm-tree-5.0.4的版本。在介绍前，先要知道一点， Tree工程的接口基本可以完
链表树——复合数据结构应用实例 bardo 数据结构树型结构表结构设计链表菜单排序
我们清楚：数据库设计中，表结构设计的好坏，直接影响程序的复杂度。所以，本文就无限级分类（目录）树与链表的复合在表设计中的应用进行探讨。当然，什么是树，什么是链表，这里不作介绍。有兴趣可以去看相关的教材。需求简介：经常遇到这样的需求，我们希望能将保存在数据库中的树结构能够按确定的顺序读出来。比如，多级菜单、组织结构、商品分类。更具体的，我们希望某个二级菜单在这一级别中就是第一个。虽然它是最后
为啥要用位运算代替取模呢 chenchao051 位运算哈希汇编
在hash中查找key的时候，经常会发现用&取代%，先看两段代码吧， JDK6中的HashMap中的indexFor方法： /** * Returns index for hash code h. */ static int indexFor(int h, int length) {
最近的情况麦田的设计者生活感悟计划软考想
今天是2015年4月27号整理一下最近的思绪以及要完成的任务 1、最近在驾校科目二练车，每周四天，练三周。其实做什么都要用心，追求合理的途径解决。为
PHP去掉字符串中最后一个字符的方法 IT独行者 PHP 字符串
今天在PHP项目开发中遇到一个需求，去掉字符串中的最后一个字符原字符串1,2,3,4,5,6, 去掉最后一个字符","，最终结果为1,2,3,4,5,6 代码如下： $str = "1,2,3,4,5,6,"; $newstr = substr($str,0,strlen($str)-1); echo $newstr;
hadoop在linux上单机安装过程 _wy_ linux hadoop
1、安装JDK jdk版本最好是1.6以上，可以使用执行命令java -version查看当前JAVA版本号，如果报命令不存在或版本比较低，则需要安装一个高版本的JDK，并在/etc/profile的文件末尾，根据本机JDK实际的安装位置加上以下几行： export JAVA_HOME=/usr/java/jdk1.7.0_25
JAVA进阶----分布式事务的一种简单处理方法无量多系统交互分布式事务
每个方法都是原子操作：提供第三方服务的系统，要同时提供执行方法和对应的回滚方法 A系统调用B,C,D系统完成分布式事务 =========执行开始======== A.aa(); try { B.bb(); } catch(Exception e) { A.rollbackAa(); } try { C.cc(); } catch(Excep
安墨移动广告：移动DSP厚积薄发引领未来广告业发展命脉矮蛋蛋 hadoop 互联网
　　“谁掌握了强大的DSP技术，谁将引领未来的广告行业发展命脉。”2014年，移动广告行业的热点非移动DSP莫属。各个圈子都在纷纷谈论，认为移动DSP是行业突破点，一时间许多移动广告联盟风起云涌，竞相推出专属移动DSP产品。　　到底什么是移动DSP呢? 　　DSP(Demand-SidePlatform)，就是需求方平台，为解决广告主投放的各种需求，真正实现人群定位的精准广
myelipse设置 alafqq IP
在一个项目的完整的生命周期中，其维护费用，往往是其开发费用的数倍。因此项目的可维护性、可复用性是衡量一个项目好坏的关键。而注释则是可维护性中必不可少的一环。注释模板导入步骤安装方法：打开eclipse/myeclipse 选择 window-->Preferences-->JAVA-->Code-->Code
java数组百合不是茶 java数组
java数组的声明创建初始化； java支持C语言数组中的每个数都有唯一的一个下标一维数组的定义声明： int[] a = new int[3];声明数组中有三个数int[3] int[] a 中有三个数，下标从0开始，可以同过for来遍历数组中的数
javascript读取表单数据 bijian1013 JavaScript
利用javascript读取表单数据，可以利用以下三种方法获取： 1、通过表单ID属性：var a = document.getElementByIdx_x_x("id"); 2、通过表单名称属性：var b = document.getElementsByName("name"); 3、直接通过表单名字获取：var c = form.content.
探索JUnit4扩展：使用Theory bijian1013 java JUnit Theory
理论机制（Theory）一.为什么要引用理论机制（Theory）当今软件开发中，测试驱动开发（TDD — Test-driven development）越发流行。为什么 TDD 会如此流行呢？因为它确实拥有很多优点，它允许开发人员通过简单的例子来指定和表明他们代码的行为意图。 TDD 的优点： &nb
[Spring Data Mongo一]Spring Mongo Template操作MongoDB bit1129 template
什么是Spring Data Mongo Spring Data MongoDB项目对访问MongoDB的Java客户端API进行了封装，这种封装类似于Spring封装Hibernate和JDBC而提供的HibernateTemplate和JDBCTemplate，主要能力包括 1. 封装客户端跟MongoDB的链接管理 2. 文档-对象映射，通过注解:@Document(collectio
【Kafka八】Zookeeper上关于Kafka的配置信息 bit1129 zookeeper
问题： 1. Kafka的哪些信息记录在Zookeeper中 2. Consumer Group消费的每个Partition的Offset信息存放在什么位置 3. Topic的每个Partition存放在哪个Broker上的信息存放在哪里 4. Producer跟Zookeeper究竟有没有关系？没有关系！！！ //consumers、config、brokers、cont
java OOM内存异常的四种类型及异常与解决方案 ronin47 java OOM 内存异常
　OOM异常的四种类型：　　　　　一：　StackOverflowError ：通常因为递归函数引起（死递归，递归太深）。-Xss 128k 一般够用。　二：　out Of memory: PermGen Space：通常是动态类大多，比如web 服务器自动更新部署时引起。-Xmx
java-实现链表反转-递归和非递归实现 bylijinnan java
20120422更新：对链表中部分节点进行反转操作，这些节点相隔k个： 0->1->2->3->4->5->6->7->8->9 k=2 8->1->6->3->4->5->2->7->0->9 注意1 3 5 7 9 位置是不变的。解法：将链表拆成两部分： a.0-&
Netty源码学习-DelimiterBasedFrameDecoder bylijinnan java netty
看DelimiterBasedFrameDecoder的API，有举例：接收到的ChannelBuffer如下： +--------------+ | ABC\nDEF\r\n | +--------------+ 经过DelimiterBasedFrameDecoder(Delimiters.lineDelimiter())之后，得到： +-----+----
linux的一些命令 -查看cc攻击-网口ip统计等 hotsunshine linux
Linux判断CC攻击命令详解 2011年12月23日 ⁄ 安全 ⁄ 暂无评论查看所有80端口的连接数 netstat -nat|grep -i '80'|wc -l 对连接的IP按连接数量进行排序 netstat -ntu | awk '{print $5}' | cut -d: -f1 | sort | uniq -c | sort -n 查看TCP连接状态 n
Spring获取SessionFactory ctrain sessionFactory
String sql = "select sysdate from dual"; WebApplicationContext wac = ContextLoader.getCurrentWebApplicationContext(); String[] names = wac.getBeanDefinitionNames(); for(int i=0; i&
Hive几种导出数据方式 daizj hive 数据导出
Hive几种导出数据方式 1.拷贝文件如果数据文件恰好是用户需要的格式，那么只需要拷贝文件或文件夹就可以。 hadoop fs –cp source_path target_path 2.导出到本地文件系统 --不能使用insert into local directory来导出数据，会报错 --只能使用
编程之美 dcj3sjt126com 编程 PHP 重构
我个人的 PHP 编程经验中，递归调用常常与静态变量使用。静态变量的含义可以参考 PHP 手册。希望下面的代码，会更有利于对递归以及静态变量的理解 header("Content-type: text/plain"); function static_function () { static $i = 0; if ($i++ < 1
Android保存用户名和密码 dcj3sjt126com android
转自：http://www.2cto.com/kf/201401/272336.html 我们不管在开发一个项目或者使用别人的项目，都有用户登录功能，为了让用户的体验效果更好，我们通常会做一个功能，叫做保存用户，这样做的目地就是为了让用户下一次再使用该程序不会重新输入用户名和密码，这里我使用3种方式来存储用户名和密码 1、通过普通的txt文本存储 2、通过properties属性文件进行存
Oracle 复习笔记之同义词 eksliang Oracle 同义词 Oracle synonym
转载请出自出处：http://eksliang.iteye.com/blog/2098861 1.什么是同义词同义词是现有模式对象的一个别名。概念性的东西，什么是模式呢？创建一个用户，就相应的创建了一个模式。模式是指数据库对象，是对用户所创建的数据对象的总称。模式对象包括表、视图、索引、同义词、序列、过
Ajax案例 gongmeitao Ajax jsp
数据库采用Sql Server2005 项目名称为:Ajax_Demo 1.com.demo.conn包 package com.demo.conn; import java.sql.Connection;import java.sql.DriverManager;import java.sql.SQLException; //获取数据库连接的类public class DBConnec
ASP.NET中Request.RawUrl、Request.Url的区别 hvt .net Web C#asp.net hovertree
如果访问的地址是：http://h.keleyi.com/guestbook/addmessage.aspx?key=hovertree%3C&n=myslider#zonemenu那么Request.Url.ToString() 的值是：http://h.keleyi.com/guestbook/addmessage.aspx?key=hovertree<&
SVG 教程（七）SVG 实例，SVG 参考手册天梯梦 svg
SVG 实例在线实例下面的例子是把SVG代码直接嵌入到HTML代码中。谷歌Chrome，火狐，Internet Explorer9，和Safari都支持。注意：下面的例子将不会在Opera运行，即使Opera支持SVG - 它也不支持SVG在HTML代码中直接使用。 SVG 实例 SVG基本形状一个圆矩形不透明矩形一个矩形不透明2 一个带圆角矩
事务管理 luyulong java spring 编程事务
事物管理 spring事物的好处为不同的事物API提供了一致的编程模型支持声明式事务管理提供比大多数事务API更简单更易于使用的编程式事务管理API 整合spring的各种数据访问抽象 TransactionDefinition 定义了事务策略 int getIsolationLevel()得到当前事务的隔离级别 READ_COMMITTED
基础数据结构和算法十一：Red-black binary search tree sunwinner Algorithm Red-black
The insertion algorithm for 2-3 trees just described is not difficult to understand; now, we will see that it is also not difficult to implement. We will consider a simple representation known
centos同步时间 stunizhengjia linux 集群同步时间
做了集群，时间的同步就显得非常必要了。以下是查到的如何做时间同步。在CentOS 5不再区分客户端和服务器，只要配置了NTP，它就会提供NTP服务。 1)确认已经ntp程序包： # yum install ntp 2)配置时间源（默认就行，不需要修改） # vi /etc/ntp.conf server pool.ntp.o
ITeye 9月技术图书有奖试读获奖名单公布 ITeye管理员 ITeye
ITeye携手博文视点举办的9月技术图书有奖试读活动已圆满结束，非常感谢广大用户对本次活动的关注与参与。 9月试读活动回顾：http://webmaster.iteye.com/blog/2118112本次技术图书试读活动的优秀奖获奖名单及相应作品如下（优秀文章有很多，但名额有限，没获奖并不代表不优秀）：《NFC：Arduino、Andro