kaldi sre16/v1中local/make_sre.sh

#!/bin/bash
# Copyright 2017   David Snyder
# Apache 2.0.
#
# See README.txt for more info on data required.

set -e
# 你写的每个脚本都应该在文件开头加上set -e,
# 这句语句告诉bash如果任何语句的执行结果不是true则应该退出。
# 这样的好处是防止错误像滚雪球般变大导致一个致命的错误,
# 而这些错误本应该在之前就被处理掉。如果要增加可读性,
# 可以使用set -o errexit,它的作用与set -e相同

data_root=$1
data_dir=$2

wget -P data/local/ http://www.openslr.org/resources/15/speaker_list.tgz   
# 下载
tar -C data/local/ -xvf data/local/speaker_list.tgz   
#  解压
sre_ref=data/local/speaker_list   
# 把一个文件夹的路径赋值给sre_ref

# 查看speaker_list 的第一行,是下面的样子:(共计36614行)
# 100304 f sre2006 obtz B
# 含义是:speaker, gender, other_sre_year, utt_id, channel

local/make_sre.pl $data_root/LDC2006S44/ \
   04 $sre_ref $data_dir/sre2004
   
   # make_sre.pl 这个文件做了什么呢?主要还是转换声音格式
   # 参考local/make_mx6_mic.pl,local/make_mx6_calls.pl
   # Usage: make_sre.pl    
   # name-of-source实际指的是sre_year
   # 最后调用utils/utt2spk_to_spk2utt.pl,utils/fix_data_dir.sh

local/make_sre.pl $data_root/LDC2011S01 \
  05 $sre_ref $data_dir/sre2005_train

local/make_sre.pl $data_root/LDC2011S04 \
  05 $sre_ref $data_dir/sre2005_test

local/make_sre.pl $data_root/LDC2011S09 \
  06 $sre_ref $data_dir/sre2006_train

local/make_sre.pl $data_root/LDC2011S10 \
  06 $sre_ref $data_dir/sre2006_test_1

local/make_sre.pl $data_root/LDC2012S01 \
  06 $sre_ref $data_dir/sre2006_test_2

rm data/local/speaker_list.*    
# 删除

你可能感兴趣的:(kaldi学习)