（1）Chum et al[1]

简介：这里开发了两种算法：第一种是基于隐马尔可夫模型（HMM）和高斯混合模型（GMM）。所使用的特征包括短时傅立叶变换，响度和光谱稀疏度。第二种算法在基于帧的层面上应用支持向量机（SVM）。
code：CHR
方法：在两个框架的不同的特征，分类：(a)：前框架SVM+多数表决；(b)：HMM
开发语言：matlab
相关的文章：M. Chum, A. Habshush, A. Rahman, and C. Sang, “IEEE AASP scene classification challenge using hidden Markov models and frame based classification,” 2013.
成员：
- Dan Stowell（[email protected]），Manager
- Emmanouil Benetos （[email protected]），Manager
- Mark Plumbley （[email protected]），Manager

(2)Geiger et al[3]

简介：这是对声学场景分类的IEEE AASP挑战的贡献。从30秒长的高可变录音中，提取频谱，倒谱，能量和声音相关的音频特征。使用滑动窗口方法来获得短段上低级特征的统计学特征。 SVM用于对这些短段进行分类，并采用多数投票方案来获得整个记录的决策。关于挑战的官方发展，实现了73％的准确性。使用t统计量的特征分析表明，主要的Mel谱是最相关的特征。
code:GSR
方法：不同的特征，在4秒的窗口中使用SVM进行分类，然后投票表决
开发语言：Weka/HTK
相关文章：
- (1)J. T. Geiger, B. Schuller, and G. Rigoll, “Recognising acoustic scenes with large-scale audio feature extraction and SVM,” 2013.
- (2)J. T. Geiger, B. Schuller, and G. Rigoll, “Large-Scale Audio Feature Extraction and SVM for Acoustic Scene Classification,” in WASPAA, 2013, p. 4.(有代码)
成员：
- Dan Stowell （[email protected]），Manager
- Emmanouil Benetos （[email protected]），Manager
- Jürgen Geiger （[email protected]），Manager
- Mark Plumbley （[email protected]），Manager

Olivetti[8]

简介：我们提出一种方法，将一般对象（如音频样本）有效地嵌入到矢量特征空间中，适用于分类问题。从实践的角度来看，采用提出的方法的研究者只需要提供两个成分：这些对象的高效压缩器，以及将两个对象组合成新对象的方式。所提出的方法基于两个主要元素：不相似性表示和归一化压缩距离（NCD）。不相似性表示是欧几里德嵌入算法，即将通用对象映射到向量空间中的过程，其需要在对象之间定义距离函数。所产生的嵌入的质量严格依赖于该距离的选择。 NCD是基于Kolmogorov复杂性概念的对象之间的距离。在实践中，NCD基于两个构建块：压缩函数和将两个对象组合成新对象的方法。我们声称，一旦良好的压缩机和有意义的组合两个对象的方法可用，则可以构建分类算法可以准确的有效特征空间。作为我们向IEEE AASP挑战提交的文件，我们在声场分类的上下文中展示了所提出的方法的实际应用，其中压缩器是自由和开源的Vorbis有损音频压缩器，并且两个音频样本的组合是它们的简单连接。
code:OE
方法：归一化压缩距离（vorbis），欧几里德嵌入，由随机森林分类
开发语言：Phyon
相关文章：
- E. Olivetti, “The wonders of the normalized compression dissimilarity representation,” 2013.
成员：
- Dan Stowell （[email protected]），Manager
- Emmanouil Benetos （[email protected]），Manager
- Mark Plumbley （[email protected]），Manager

Roma et al[11]

简介：该代码使用重复量化分析（RQA）功能进行场景分类任务。这些特征是通过从MFCC特征的窗口计算出的阈值相似度矩阵来计算的。增加了传统的MFCC统计，它们在使用标准SVM分类器时提高了准确性。
code:RNH
方法：复发定量分析应用于MFCC时间序列，由SVM分类
开发语言：matlab
相关文章：
- (1)G. Roma, W. Nogueira, and P. Herrera, “Recurrence Quantification Analysis for auditory scene classification,” 2013.
成员：
- Dan Stowell （[email protected]），Manager
- Emmanouil Benetos （[email protected]），Manager
- Mark Plumbley （[email protected]），Manager

DCASE 2013任务1(声学场景分类)参赛作品相关信息

（1）Chum et al[1]

(2)Geiger et al[3]

Olivetti[8]

Roma et al[11]

你可能感兴趣的:(DCASE 2013任务1(声学场景分类)参赛作品相关信息)