qq_22237367

openSMILE 简介

openSMILE简介

最近使用到openSMILE来提取音频特征，看了手册有一点学习心得，整理了一下发出来。

openSMILE工具简介

openSMILE是一款以命令行形式运行的工具，通过配置config文件，主要用于提取音频特征。
openSMILE适用于：
① speech recognition (feature extraction front-end, keyword spotting, etc.), the area of affective computing (emotion recognition, affect sensitive virtual agents, etc.), Music Information Retrieval(chord labeling, beat tracking, onset detection etc.).（语音识别、情感计算、音乐信息获取）
② 2.0版本之后的openSMILE包括了openCV库，可以用于视频处理和视频特征提取

openSMILE安装

官网下载
linux和windows两个版本，windows的也可以不用编译直接用。

openSMILE的输入输出格式

① 文件输入格式可以是：
• RIFF-WAVE (PCM) (for MP3, MP4, OGG, etc. a converter needs to be used)
• Comma Separated Value (CSV)
• HTK parameter files
• WEKA’s ARFF format.（由htk工具产生）
• Video streams via openCV.（opencv产生的视频流数据）

② 文件输出格式可以是：
• RIFF-WAVE (PCM uncompressed audio)
• Comma Separated Value (CSV)
• HTK parameter file
• WEKA ARFF file
• LibSVM feature file format
• Binary float matrix format

③ 分类器和其他组件
语音处理任务经常需要对语音流进行分段，出于这个目的，openSMILE提供语音活动监测算法：
• Voice Activity Detection based on Fuzzy Logic
• Voice Activity Detection based on LSTM-RNN with pre-trained models
• Turn-/Speech-segment detector
• LibSVM (on-line)
• LSTM-RNN (Neural Network) classifier which can load RNNLIB and CURRENNT nets
• GMM (experimental implementation from eNTERFACE’12 project, to be release soon)
• SVM sink (for loading linear kernel WEKA SMO models)
• Speech Emotion recognition pre-trained models (openEAR)

openSMILE执行方式

openSMILE软件是通过命令行形式运行提取音频特征的。
① 先切换到处理文件SMILExtract.exe所在的目录下
② 再使用语句：
windows下：SMILExtract_Release -C 配置文件 -I “要处理的音频” -O “要保存特征向量的路径及文件名”
linux下：SMILExtract -C 配置文件 -I “要处理的音频” -O “要保存特征向量的路径及文件名”
（其中，-C 后面加提取特征的配置文件，-I 后面加输入的数据源，-O 说明输出的特征文件，另，执行 SMILExtraction –h 命令，可以显示openSMILE软件所有使用信息并退出。提供的配置文件都在config文件夹中）
比如在windows下：

cd D:\openSMILE-2.1.0\bin\Win32
SMILExtract_Release -C D:\openSMILE-2.1.0\config\IS09_emotion.conf -I d:\6.wav -O d:\6.txt

openSMILE运行机制

OpenSMILE可以对数据进行以下四类的特征提取操作：

Signal Processing: The following functionality is provided for general signal processing or signal pre-processing (prior to feature extraction):
• Windowing-functions (Rectangular, Hamming, Hann (raised cosine), Gauss, Sine, Triangular, Bartlett, Bartlett-Hann, Blackmann, Blackmann-Harris, Lanczos)
• Pre-/De-emphasis (i.e. 1st order high/low-pass)
• Re-sampling (spectral domain algorithm)
• FFT (magnitude, phase, complex) and inverse （快速傅里叶变换–幅度、相和 complex fft–及反变换）
• Scaling of spectral axis via spline interpolation (open-source version only)（通过样条插值进行频谱轴的缩放）
• dbA weighting of magnitude spectrum（幅度谱加权）
• Autocorrelation function (ACF) (via IFFT of power spectrum)（自相关函数）
• Average magnitude difference function (AMDF)(平均幅值差分函数)

Data Processing: openSMILE can perform a number of operations for feature normalisation,
modification, and differentiation:
• Range normalisation (off-line and on-line) （幅度标准化）
• Mean-Variance normalisation (off-line and on-line)(均值方差标准化)
• Delta-Regression coefficients (and simple differential) （Delta 回归系数和简易的微分）
• Weighted Differential as in [SER07] （加权微分）
• Various vector operations: length, element-wise addition, multiplication, logarithm, and
power.（各种各样的向量运算）
• Moving average filter for smoothing of contour over time

Audio features (low-level): The following (audio specific) low-level descriptors can be computed by openSMILE :
• Frame Energy （帧能量）
• Frame Intensity / Loudness (approximation)（帧强度）
• Critical Band spectra (Mel/Bark/Octave, triangular masking filters)（临界频带谱）
• Mel-/Bark-Frequency-Cepstral Coefficients (MFCC)（倒谱系数）
• Auditory Spectra（听觉谱）
• Loudness approximated from auditory spectra.（听觉谱近似强度）
• Perceptual Linear Predictive (PLP) Coefficients
• Perceptual Linear Predictive Cepstral Coefficients (PLP-CC)
• Linear Predictive Coefficients (LPC) （线性预测系数）
• Line Spectral Pairs (LSP, aka. LSF)（线光谱对）
• Fundamental Frequency (via ACF/Cepstrum method and via Subharmonic-Summation
(SHS)) （基础频率）
• Probability of Voicing from ACF and SHS spectrum peak（ACF 和 SHS 谱峰的概率）
• Voice-Quality: Jitter and Shimmer （声音质量：紧张和支支吾吾）
• Formant frequencies and bandwidths （共振频率和带宽）
• Zero- and Mean-Crossing rate （过零率和平均穿越率）
• Spectral features (arbitrary band energies, roll-off points, centroid, entropy, maxpos, minpos, variance (=spread), skewness, kurtosis, slope)
• Psychoacoustic sharpness, spectral harmonicity（心理声学锐度和声谱调和性）
• CHROMA (octave warped semitone spectra) and CENS features (energy normalised and
smoothed CHROMA)
• CHROMA-derived Features for Chord and Key recognition（用于和弦、声调识别的 CHROMA 产生的特征）
• F0 Harmonics ratios

Video features (low-level): The following video low-level descriptors can be currently computed by openSMILE , based on the openCV library：
• HSV colour histograms
• Local binary patterns (LBP)
• LBP histograms
• Face detection: all these features can be extracted from an automatically detected facial
region, or from the full image.• Optical flow and optical flow histograms

Functionals: In order to map contours of audio and video low-level descriptors onto a vector
of fixed dimensionality, the following functionals can be applied:
• Extreme values and positions
• Means (arithmetic, quadratic, geometric)
• Moments (standard deviation, variance, kurtosis, skewness)
• Percentiles and percentile ranges
• Regression (linear and quadratic approximation, regression error)
• Peaks
• Centroid
• Segments
• Sample values
• Times/durations
• Onsets/Offsets
• Discrete Cosine Transformation (DCT)
• Linear Predictive Coding (LPC) coefficients and gain• Zero-Crossings

SMILExtract二进制文件是可以运行所有配置文件的主要应用程序。如果您查看它的源代码(在smilext.cpp中可以找到)，您将看到它相当短。它使用openSMILE API中的类来创建组件并运行配置。这些API函数可以在自定义应用程序中使用，如GUI前端等。为了获得对openSMILE运行的组件、它们如何交互以及程序执行在哪些阶段中被分割的一般理解，下面给出简要概述。

openSMILE的应用流程可以分为三个阶段:

预配置阶段：读取命令行选项，并解析配置文件。此外，如果需要，将显示使用信息，并生成一个内置组件列表。

配置阶段：组件管理器被创建并实例化其实例配置数组中列出的所有组件。然后配置过程分为3个阶段,第一个注册组件管理器组件和内存的数据,然后执行等主要配置步骤的输入/输出文件,分配的内存等等,最后敲定它们的配置(例如,设置它们的输出字段的名称和尺寸,等等)。这3个阶段中的每个阶段都要经过数次，因为有些组件可能依赖于其他组件完成了它们的配置(例如，组件读取来自另一个组件的输出，并需要知道输出的维度和输出中字段的名称)。由于配置错误、虚假输入值或无法访问的文件而导致的错误很可能在此阶段发生。

执行阶段：当所有组件都被成功初始化时，组件管理器将启动主执行循环(也称为滴答循环)。每个组件都有一个tick()方法，该方法实现主要的增量处理功能，并通过其返回值报告处理的状态。
在执行循环的一次迭代中，组件管理器调用系列中的所有tick()函数(注意:当组件在多个线程中运行时，行为是不同的)。只要至少有一个组件的tick()方法返回非零值(表示数据是由该组件处理的)，循环就会继续。如果所有组件表明他们不处理数据,它可以安全地假定没有更多的数据到达和输入的结束已经达到(这可能是在线设置稍有不同,然而,由源组件返回一个积极的返回值或暂停执行循环,当他们正在等待数据)。
当输入结束时，组件管理器通过运行执行循环的最后一次迭代向组件发出输入结束条件的信号。在此之后，执行循环将运行一个新的，直到所有组件报告一个失败状态。第二个阶段称为输入端处理。它主要用于离线处理，例如从最后一个(但不完整的)帧中计算特征，表示对一个完整序列进行规范化，或者从一个完整序列中计算函数。

openSMILE包含三个不能从配置文件实例化的类。这些是commandline解析器(cCommandlineParser)、configuration manager (cConfigManager)和组件管理器(cComponentManager)。现在，我们将在一段简短的段落中简要地描述每一个角色。段落的顺序对应于在执行SMILExtract程序时创建类的顺序。
命令行解析器
这个类解析命令行，并为调用应用程序提供易于访问的格式选项。还执行简单的命令行语法检查。在初始化配置管理器并解析配置之后，再次解析命令行，以获得当前配置文件中用户定义的命令行选项集。
配置管理器
配置管理器加载配置文件，这是在SMILExtract命令行中指定的。因此，配置部分被分割，然后分别解析。配置部分以ConfigInstance类的抽象表示形式存储(这些类的结构由ConfigType类描述)。因此，很容易为当前实现的inistyle格式之外的格式添加额外的解析器。
组件管理器
组件管理器负责实例化、配置和执行组件。有关openSMILE应用程序流的上述部分已经介绍了详细信息。此外，组件管理器负责在插件中枚举和注册组件。因此，会扫描一个名为plugins的目录来寻找二进制的plugins。所发现的插件都已注册，一个与内置组件完全一样可用的插件。一个插件二进制因此可以包含多个openSMILE组件。

Figure.1 Overview on openSMILE’s component types and openSMILE’s basic architecture
图1显示了openSMILE的整体数据流架构，其中的数据内存是所有数据源、数据处理器和数据链接组件之间的中心链接。

Figure.2 Incremental processing with ring-buffers. Partially filled buffers (left) and filled buffers with warped read/write pointers (right).
基于环缓冲区的增量处理如图3所示。在这个设置中有三个层次:波、帧和音高。cw波形源组件将样本写入“wave”级别。水平中的写位置用红色箭头表示。cFramer从wave样本(不重叠)中生成3号帧，并将这些帧写入“帧”级别。cPitch(具有此名称的组件不存在，这里选择它只是为了说明目的)组件从框架中提取音调特性并将其写到“音调”级别。在图3(右)中，缓冲区已被填充，写入指针已被扭曲。过去存在比“buffersize”框架更多的数据已经被覆盖。

默认特征集及其配置文件

对于音乐信息检索和语音处理领域中的常见任务，openSMILE在config文件夹中提供了一些示例配置文件，它们对应着2009-2013年INTERSPEECH在情感和paralinguistics（辅助语言？）上挑战的基线声学特征集。

以上配置文件既可以直接使用，也可以根据需要自定义修改成自己的配置文件。

通用配置文件

自2.2版以来，大多数标准的特征提取配置文件指定了命令行中输入文件和输出文件的格式（WEKA Arff，HTK二进制，CSV文本）。通用配置文件可以在文件夹config/shared中找到。
如果想要查看配置文件的可用选项，使用以下命令：

SMILExtract -C conf/putconfigfilenamehere.config -ccmdHelp(linux下)
SMILExtract_Release -C conf/putconfigfilenamehere.config -ccmdHelp(windows下)

以下选项可用于所有标准配置文件的音频输入：

-inputfile，  -I       输入音频文件的路径和名称。
-start        in seconds>    从哪里开始分析，相对到文件的开头（0）。
-end          in seconds>    在哪里结束分析，相对到文件的开头（0），默认（-1）是文件的结尾

这些选项在config/shared/standard wave input.conf.inc中定义。

以下选项可用于控制缓冲区和分段行为：

-frameModeFunctionalsConf   Include文件，它为所有组件函数配置帧模式。默认值：shared/FrameModeFunctionals.inc.conf
-bufferModeConf  shared/BufferMode.inc.conf
-bufferModeRbLagConf  shared/BufferModeRbLag.inc.conf
-bufferModeRbConf  shared/BufferModeRb.inc.conf

frameModeFunctionalsConf是最重要的选项。它控制着函数组件运作的时间单位。下面的例子（include文件的内容）说明了四种最常见的用例。
A.使用完整汇总：

full
frameSize = 0
frameStep = 0
frameCenterSpecial = left

B.在固定尺寸（滑动）窗口上的多个汇总（帧长5s，帧移2s）：

frameMode = fixed
frameSize = 5
frameStep = 2
frameCenterSpecial = left

C.给定的分段列表汇总（4.2秒到5.6秒，7.0到9.0秒，10秒到文件结束）：

frameMode = list  
frameList = 4.2s-5.6s，7.0s-9s，10s-E
frameCenterSpecial = left

D.通过cTurnDetector组件实时检测变量段的摘要，并通过smile messages收到：

frameMode = var
frameCenterSpecial = left

使用messageRecp选项的cTurnDetector组件必须存在于配置中并指向配置中的所有函数组件。请参阅cTurnDetector的在线帮助或简单例子config/emobase_live4.conf获得有关详细信息。
bufferMode配置文件设置dataMemory级别输出缓冲区的大小，缓冲区大小配置必须匹配frameModeFunctionalsConf中的frameMode设置，即缓冲区在bufferModeConf中指定的值必须至少是所请求的分段单元的大小（frameMode）。如果要汇总完整的输入（frameMode = full），则输出缓冲区必须配置为动态增长（growDyn = 1），而不是像ring/cyclical缓冲器（isRb = 0）一样响应，例如：

writer.levelconf.growDyn = 1
writer.levelconf.isRb = 0
writer.levelconf.nT = 100

nT的值是不相关的，它只是设置缓冲区的初始大小（以LLD帧数为单位）。这种配置不适用于实时模式，因为它将随着时间的推移占用大量内存，导致openSMILE进程在某个时间点崩溃。
因此，对于实时演示，缓冲区大小必须受到限制，并且要有最大的分段大小，汇总特征也必须受到限制。在variable模式（当收到消息来自cTurnDetector），这是通过cTurnDetector中的最大转向长度设置实现的。否则，frameSize设置例如应该小于缓冲区大小（nT）。一个例子实时模式的ring-buffer配置是：

writer.levelconf.growDyn = 0
writer.levelconf.isRb = 1
writer.levelconf.nT =

这表示，如果LLD特征的帧率为10ms，则缓冲区大小为10s，这基本上是所有配置文件的默认设置。

下面的选项适用于控制输出数据格式（通过统计函数提供特征汇总的configurations，比如全部的INTERSPEECH和AVEC挑战集）：

=============================
-instname  通常是输入文件的名称保存在CSV和ARFF输出的首列。默认是"unknow"
=============================
-lldcsvoutput, -D   启动LLD帧向输出到CSV格式文件
-appendcsvlld <0/1> 设为1代表添加到已有CSV文件文末，默认0覆盖
-timestampcsvlld  <0/1> 设为0禁止把时间步输出到CSV第二列，默认为1
-headercsvlld <0/1> 设为0禁止把标题输入到CSV，默认为1
=============================
-lldhtkoutput  启动LLD帧向输出到HTK格式文件
=============================
-lldarffoutput, -D  启动LLD帧向输出到ARFF格式文件
-appendarfflld <0/1> 设为1代表添加到已有ARFF文件文末，默认0覆盖
-timestamparfflld <0/1> 设为0禁止把时间步输出到ARFF第二列，默认为1
-lldarfftargetsfile  指定配置包含定义目标域（类）的文，默认为: shared/arff_targets_conf.inc
=============================
-output, -O  默认输出选项. ARFF格式，存放特征汇总
-appendarff <0/1> 设为0代表不添加到已有ARFF文件文末，默认1添加 
-timestamparff <0/1> 设为1把时间步输出到ARFF第二列，默认为0
-arfftargetsfile 指定配置包含定义目标域（类）的文，默认为: shared/arff_targets_conf.inc
=============================
-csvoutput  默认输出选项. CSV格式，存放特征汇总
-appendcsv <0/1> 设为0代表不添加到已有CSV文件文末，默认1
-timestampcsv <0/1> 设为0禁止把时间步输出到CSV第二列，默认为1
-headercsv <0/1> 设为0禁止把标题输入到CSV，默认为1
=============================
-htkoutput  输出特征汇总（函数）到HTK格式文件

这些选项都被定义在config/shared/standard data output.conf.inc.

以下输出选项用于配置LLDs特征（没有使用各种时间统计方法的汇总特征）：

============================
-csvoutput  默认输出选项. CSV格式，存放帧向LLD
-appendcsv <0/1> 设为1代表添加到已有CSV文件文末，默认0
-timestampcsv <0/1> 设为0禁止把时间步输出到CSV第二列，默认为1
-headercsv <0/1> 设为0禁止把标题输入到CSV，默认为1
============================
-output  输出特征汇总（函数）到HTK格式文件
============================
-arffoutput  默认输出选项. ARFF格式，存放帧向LLD
-appendarff <0/1> 设为0代表不添加到已有ARFF文件文末，默认1添加
-timestamparff <0/1> 设为0禁止把时间步输出到ARFF第二列，默认为1
arfftargetsfile 指定配置包含定义目标域（类）的文，默认为:shared/arff_targets_conf.inc

这些选项都被定义在config/shared/standard data output lldonly.conf.inc

注：从2.2版本起，你可以指定一个“?”替代文件名。它会禁止相应的输出组件，即它不会产生输出文件，在标准输出接口界面，看到的所有的文件名默认都是”?”
所有支持标准数据输出格式的配置文件都可以在WINDOWS的批特征提取GUI（使用VS10 C#编写，位于progsrc/openSMILEbatchGUI/）。这个工具允许openSMILE自动的执行文件夹中的若干文件。它可以在图形界面中选择音频文件和指定输出类型。

色度特征

配置文件config/chroma_fft.conf从一个短时FFT谱（窗口大小为50ms，速率为10ms，高斯窗口）计算音乐色度特征（12个半色调特征）。
生成的CSV文件包含12个以“;”分隔的ASCII浮点值的色度特征，表示色度均值，一帧一行。
此配置使用“cTonespec”组件来计算半音谱。我们还提供了一个使用实验性“cTonefilt”组件作为“cTonespec”替代品的配置文件config/chroma_filt.conf。
我们还提供了一个计算整个输入序列上的色度特征的平均值矢量的示例配置。这样的矢量可以用于识别歌曲的音乐键。配置提供在config/chroma fft.sum.conf中。它使用“cFunctionals”组件来计算色度等值线的均值。通过以下命令行使用它：

SMILExtract -C config/chroma_fft.sum.conf -I input.wav -O chroma.csv

MFCC特征

为了提取MFCC特征（兼容HTK），提供了以下四个文件（它们是以它们所代表的相应的HTK参数类型命名的）：
MFCC12_0_D_A.conf此配置从25毫秒的音频帧中提取梅尔频率倒谱系数（以10毫秒的速率采样）（汉明窗口）。它由26个Mel频带计算13个MFCC（0-12）组，并应用了一个权重参数为22的倒谱提升滤波器。13个一阶和13个二阶系数被附加到MFCC后。
MFCC12_E_D_A.conf此配置跟MFCC12_0_D_A.conf一样，除了附加到MFCC1-12的不是0-th个MFCC，而是对数能量。
MFCC12_0_D_A_Z.conf这个配置跟MFCC12_0_D_A.conf配置一样，除了所有特征是参考整个输入序列进行了标准化（通常是转弯或者分转弯段,usually a turn　or sub-turn segment）。
MFCC12_E_D_A_Z.conf这个配置跟MFCC12_E_D_A.conf配置一样，除了所有特征是参考整个输入序列进行了标准化（通常是转弯或者分转弯段,usually a turn　or sub-turn segment）。
帧长为25ms,帧移为10ms，使用的汉明窗，预增强参数为0.97。由26个通过FFT功率谱计算的mel-滤波器组计算MFCC 0/1-12。MEL频谱的频率范围为0-8kHz，同时这些配置文件提供了-I,-O选项。输出文件格式是HTK参数文件格式。如果需要输出其他文件格式，你必须在配置文件中更改‘cHtkSink’组件类型为你想要的类型。命令行示例如下：

SMILExtract -C config/MFCC12_E_D_A.conf -I input.wav -O output.mfcc.htk

注：MFCC即梅尔频率倒谱系数，是音频的时域信号经过FFT变换成频谱，再映射在梅尔频率上，再经过IDFT变换过程中的0-L个系数（L通常取12-16）。

PLP特征

用于提取PLP倒谱系数（PLP-CC）（与HTK兼容）以下四个文件（它们是以它们所代表的相应的HTK参数类型命名的）：
PLP_0_D_A.conf该配置从25 ms长音频（以10ms的速率采样）帧提取Mel频率倒谱系数（汉明窗口）。它从26个Mel频带，并使用预测阶数为5计算6个PLP（0-5），并应用了一个权重参数为22的倒谱提升滤波器。6个一阶和6个二阶系数被附加到PLP-CC后。
PLP_E_D_A.conf该配置与PLP_0_D_A.conf相同，但是是对数能量被附加到PLP 1-5而不是第0个PLP。
PLP_0_D_A_Z.conf此配置与PLP_0_D_A.conf相同，除了所有特征是参考整个输入序列进行了标准化（通常是转弯或者分转弯段,usually a turn　or sub-turn segment）
PLP_E_D_Z.conf此配置与PLP_E_D_A.conf相同，除了所有特征是参考整个输入序列进行了标准化（通常是转弯或者分转弯段,usually a turn　or sub-turn segment）
帧长为25ms,帧移为10ms，使用的汉明窗，预增强参数为0.97。由26个通过FFT功率谱计算的听觉mel-滤波器组(压缩系数为0.33)计算PLP 0/1-5。线性预测器的预测阶数为5。MEL频谱的频率范围为0-8kHz，同时这些配置文件提供了-I,-O选项。输出文件格式是HTK参数文件格式。如果需要输出其他文件格式，你必须在配置文件中更改‘cHtkSink’组件类型为你想要的类型。命令行示例如下：

SMILExtract -C config/PLP_E_D_A.conf -I input.wav -O output.plp.htk

韵律特征

提供了用于提取韵律特征的示例配置文件config/prosodyAcf.conf和config/prosodyShs.conf。
这些文件提取基频（F0），发声概率和响度轮廓。文件prosodyAcf.conf使用“cPitchACF”组件来提取基频，基于自相关和倒谱的方法。文件prosodyShs.conf使用“cPitchShs”组件，基于次谐波采样算法（SHS）。这两种配置都将CSV格式设置为输出格式。示例命令行如下：

SMILExtract -C config/prosodyShs.conf -I input.wav -O prosody.csv

情感识别特征提取

自openSMILE在openEAR的项目EWS09情感识别中被使用，openSMILE提供了各种情感识别的标准特征集。
The INTERSPEECH 2009 Emotion Challenge feature set（参见[SSB09]）由配置文件config/emo IS09.conf提供。它包含对LLDs应用统计函数得到的384个特征。该特征被保存在Arff格式（针对WEKA），新的实例会被附加到一个已存在文件（这是用于批处理，其中openSMILE被反复调用从多个文件提取特征到单个特征文件）。出现在Arff文件中16个低级描述符（LLDs）的名称，见下面的列表：

pcm_RMSenergy  信号帧均方根能量
mfcc  梅尔频率倒谱系数1-12
Pcm_zcr  时间信号的过零率（基于帧）
voiceProb  从ACF计算的发声概率。
F0  从倒谱计算的基频

附加到低级描述符名称的后缀_sma表示它们是通过窗口长度为3的移动平均滤波器进行平滑。附加到sma的后缀_de表示当前特征是低级描述符平滑后的一阶delta系数（微分）。

max  轮廓的最大值
min  轮廓的最小值
range  = max- min
maxPos  最大值的绝对位置（以帧为单位）
minPos  最小值的绝对位置（以帧为单位）
amean  轮廓的算术平均值
linregc1  轮廓线性逼近的斜率（m）
linregc2  轮廓线性逼近的偏移量（t）
linregerrQ  计算的二次误差作为线性近似值和实际轮廓的差值
stddev  轮廓上的值的标准偏差
skewness  偏度（3阶矩）
kurtosis  峰度（4阶矩）

The INTERSPEECH 2010 Paralinguistic Challenge feature set（见2010年INTERSPEECH会议论文集）由配置文件config/IS10_paraling.conf提供。该集包含的1582个特征是由34个低级描述符（LLDs）和34个相应的delta作为68个LLDs轮廓值，在此基础上应用21个函数得到1428个特征，另外，对4个基于音高的LLD及其4个delta系数应用了19个函数得到152个特征，最后附加音高（伪音节）的数量和总数输入的持续时间（2个特征）。
该特征被保存在Arff格式（针对WEKA），新的实例会被附加到一个已存在文件（这是用于批处理，其中openSMILE被反复调用从多个文件提取特征到单个特征文件）。出现在Arff文件中34个低级描述符（LLDs）的名称，见下面的列表：

pcm_loudness  归一化强度提高到0.3的幂的响度
mfcc  美尔频率倒谱系数0-14
logMelFreqBand  梅尔频带的对数功率0-7（分布范围内从0到8 kHz）
lspFreq  从8个LPC系数计算出的8个线谱对频率。
F0finEnv  平滑的基频轮廓线。
voicingFinalUnclipped  最终基频候选的发声概率。Unclipped的意思是，当其低于浊音阈值时，它不被设置为零。

附加到低级描述符名称的后缀_sma表示它们是通过窗口长度为3的移动平均滤波器进行平滑。附加到sma的后缀_de表示当前特征是低级描述符平滑后的一阶delta系数（微分）。出现在Arff文件中的21个函数的名字,均在以下列表中：

maxPos  最大值的绝对位置（以帧为单位）
minPos  最小值的绝对位置（以帧为单位）
amean  轮廓的算术平均值
linregc1  轮廓线性逼近的斜率（m）
linregc2  轮廓线性逼近的偏移量（t）
linregerrA  把线性误差计算作为线性近似值和实际的轮廓的误差
linregerrQ  把二次误差计算作为线性近似值和实际的轮廓的误差
stddev  轮廓中的值的标准偏差
skewness  偏度（3阶矩）。
kurtosis 峰度（4阶矩）。
quartile1  第一四分位数（25％百分位数）
quartile2  第一四分位数（50％百分位数）
quartile3  第一四分位数（75％百分位数）
iqr1-2  四分位数间距：quartile2- quartile1
iqr2-3  四分位数间距：quartile3- quartile2
iqr1-3  四分位数间距：quartile3- quartile1
percentile1.0  轮廓的离群值鲁棒最小值，按1％百分位数表示。
percentile99.0  轮廓的离群值鲁棒最大值，按99％百分位数表示。
pctlrange0-1  由1％和99％的百分点的范围表示的离群值鲁棒信号范围“max-min”。
upleveltime75  信号超过（75％*范围+min）的时间百分比。
upleveltime90  信号超过（90％*范围+min）的时间百分比。

四个音高相关的LLD（及相应的delta系数）如下（清音区域均为0，因此功能仅适用于这些轮廓的浊音区域）：

F0final  平滑的基频频率
jitterLocal  本地（帧到帧）抖动（音调周期长度偏差）
jitterDDP  差分帧间抖动（‘Jitter of the Jitter’）
shimmerLocal  本地（帧到帧）闪烁（音调周期幅度偏差）

对这4 + 4个LLD应用了19个函数，即上述21个函数的集合没有最小值（1％百分位数）和范围。

The INTERSPEECH 2011 Speaker State Challenge feature set（见2011年INTERSPEECH会议论文集）由配置文件config/IS11_speake_state.conf提供。该集包含的4368个特征是由4个能量相关+50个频谱相关的低级描述符（LLDs）和54个相应的delta作为108个LLDs，在此基础上应用33个基本函数+平均值、最小值、最大值、标准差得到3996个特征；5个声音相关和5个对应的delta作为10个LLDs，在此基础上应用33个基本函数+二次平均、上升时长、下降时长得到360个特征；6个F0基本函数和对应的delta，12个特征。

The INTERSPEECH 2012 Speaker Trait Challenge feature set（见2012年INTERSPEECH会议论文集）由配置文件config/IS12_speake_trait.conf提供。该集包含的6125个特征。

The INTERSPEECH 2013 ComParE Challenge feature set （见2013年INTERSPEECH会议论文集）由配置文件config/IS13_ComParE.conf提供。该集包含的6373个特征，LLD包括能量，频谱，倒谱（MFCC）、声音、对数谐波噪声比（HNR），频谱谐度和心理声学频谱清晰度。
The MediaEval 2012 TUM feature set for violent video scenes detection 针对好莱坞流行电影的暴力进行检测的特征集在config/mediaeval2012_tum_affect/，里面有不同的设置，参考文章：Florian Eyben, Felix Weninger, Nicolas Lehment, Gerhard Rigoll, Björn Schuller: ”Violent Scenes Detection with Large, Brute-forced Acoustic and Visual Feature Sets”, Proc. MediaEval 2012 Workshop, Pisa, Italy, 04.-05.10.2012.
MediaEval Audio IS12based subwin2.conf包含的是从2s的子窗中提取音频特征的配置。MediaEval Audio IS12based subwin2 step0.5.conf提取一样的特征，但是2s子窗的偏移为0.5s。MediaEval VideoFunctionals.conf用于视频特征提取，如文章使用方法，需要一个包含LLDs的CSV文件（由openCV提取）作为输入和输出，ARFF文件作为视频特征。

The openSMILE/openEAR ‘emobase’ set早期的基线集（参照”emobase2”集作为新的基线集），拥有情感识别的998个声学特征，包含以下低级描述符（LLDs）：强度，响度，12 MFCC，音高（F0），浊音概率，F0包络线，8 LSF（线频谱频率），过零率，以及这些LLD的Delta回归系数。以下函数被应用于上述LLDs及其Delta系数。：Max./Min。输入的相对位置和范围，范围，算术平均值，2线性回归系数，线性和二次误差，标准差，偏度，峰度，四分位数1-3和三位四分位数范围。
The large openSMILE emotion feature set用于提取更多的LLDs和更多的函数(6552个特征)，配置文件为config/emo_large.conf。

The openSMILE ‘emobase2010’ reference set 是基于the INTERSPEECH 2010 Paralinguistic Challenge feature set，配置文件为config/emobase2010.conf。
对持续时间和位置特征的规范化进行了一些调整。这个特性集包含了一套大大增强的低级描述符(LLDs)，以及一套“emobase”相比更加精细化选择的函数列表。建议使用此特征集作为比较新的情感识别特征集和方法的参考，因为它代表当前最先进的情感和语言识别功能。
该集合包含1582个特征（与INTERSPEECH 2010 Paralinguistic 挑战集相同设置），其由34个低级描述符（LLDs）和34个相应的delta作为68个LLDs轮廓值，在此基础上应用21个函数得到1 428个特征，另外，对4个基于音高的LLD及其4个delta系数应用了19个函数得到152个特征，最后附加音高（伪音节）的数量和总数输入的持续时间（2个特征）。唯一的区别是INTERSPEECH 2010 paralinguistic挑战集标准化的是是“maxPos”和“minPos”特征，本配置被标准化为段长度。

官网：https://audeering.com/technology/opensmile/
官网提供的阅读手册：http://www.audeering.com/research-and-open-source/files/openSMILE-book-latest.pdf
参考链接1：https://blog.csdn.net/lccever/article/details/78743632

你可能感兴趣的:(openSMILE)

【音频特征】opensmile 工具的使用和批处理 weiquan fan 音频
目录1.前言2.openSMILE的输入输出格式3.openSMILE使用流程简介3.1官方配置文件3.2MFCC特征3.3PLP特征3.4情感特征集4.python批处理提取openSMILE特征5.输出数据格式控制6.最后一点话参考文献1.前言openSMILE是一款以命令行形式运行的工具，通过配置config文件来提取音频特征。主要应用于语音识别、情感计算、音乐信息获取。2.0版本之后的op
调用opensmile编译的DLL动态库API进行声音特征提取蜡笔小心点机器学习深度学习 c++语音识别 1024程序员节
目录一、opensmlie：二、SMILEapi调用方式。1、创建实例2、初始化。3、设置回调4、写音频数据。5、配置文件改动三、详细代码：最近尝试使用opensmile进行声音特征提取，查了一些资料和文档，记录在此。一、opensmlie：opensmile:官网github项目：https://github.com/audeering/opensmile文档:openSMILE—openSMI
使用vs2017调试opensmile 好像不对劲信号处理 opensmile opensmile 语音情感识别特征提取
从opensmile官网下载的包包括了vs工程，可直接用vs打开。一、使用opensmilevs工程打开工程后，vs提示升级解决方案，点击确定。或在项目-重定解决方案目标中升级将调试模式debug改为release。注意，release同样可以加断点调试。编译若直接编译，出现错误。解决方法是在openSimleLib项目中右键添加-现有项，在opensmile-2.3.0\src\examples
Speech | openSMILE语音特征提取工具夏天｜여름이다 -实用篇 --环境配置 --Speech -人工智能语音处理
官方地址：openSMILE3.0-audEERING使用指导：openSMILE—openSMILEDocumentation(audeering.github.io)openSMILE简介openSMILE是一款以命令行形式运行的工具，通过配置config文件来提取音频特征。主要应用于语音识别、情感计算、音乐信息获取。2.0版本之后的openSMILE包括了openCV库，可以用于视频处理和视
《openSMILE用户手册》第2章 (3) 默认特征集的使用 InterStellar1145 语音处理情感
语音情感计算经常会用到openSMILE进行语音特征的提取，openSMILE作为一款已经被很多研究者使用的提取情感特征的工具箱，却没有一个完整的中文版手册，也是为了自己查阅方便吧，慢慢翻译一下，算是记录自己的工作，如能给有需要的同行觉得有点用处当然好，即便不能方便什么人，也算是自己的一点积累吧。水平有限，难免错漏，请不吝赐教。先放上来，边写边修正和排版吧2.5默认特征集对于音乐信息检索和语音处理
Speech | 提取语音（数据集）的语音特征合集夏天｜여름이다 -Speech -#SER #TTS 语音识别人工智能语音特征提取
本文主要讲解了提取数据集的一些主要工具，以及如何使用这些工具，包含安装以及运行命令。提取语音（数据集）的语音特征工具（Extractaudiofeaturestoolkits）•openSMILE•COVAREP•ESPNet•YAAFE1.openSMILELinux上安装。环境：Ubuntu20.04.（docker容器）opensmile安装方法一及使用#安装pipinstallopensm
openSMILE 简介 qq_22237367 openSMILE
openSMILE简介最近使用到openSMILE来提取音频特征，看了手册有一点学习心得，整理了一下发出来。openSMILE工具简介openSMILE是一款以命令行形式运行的工具，通过配置config文件，主要用于提取音频特征。openSMILE适用于：①speechrecognition(featureextractionfront-end,keywordspotting,etc.),thea
Semi-supervised Multi-modal Emotion Recognition with Cross-Modal Distribution Matching 阅读笔记 B站：阿里武多模态多模态半监督学习情感分析
Semi-supervisedMulti-modalEmotionRecognitionwithCross-ModalDistributionMatching、特征提取部分BERT-large1024维DenseNet342OPENsmile1582z-normalization（怀疑就是这个导致准备率不高，测试一下）DAE部分对于视觉和文字，因为是一个关于时间的序列特征，所以使用Seq2Seq的
在Python上用openSMILE提取IS09和eGeMAPS特征集王小运e 软件应用语音相关笔记 python opensmile
基础知识两个特征集的维度IS09、eGeMAPS是以整个句子进行提取的，没有进行分帧载提取。IS09->384维eGeMAPS->88维opensmile下载使用下载地址：https://github.com/audeering/opensmile/releases/tag/v3.0.0下载之后解压到一个自己方便找到的地方即可，后期使用的时候要用到该位置。后期主要用到bin和config两个文件夹
用python实现语音的分割并保存为.wav文件王小运e 语音相关笔记 python 语音分割
功能描述因为在研究使用openSMILE提取特征时，需要对语音进行分割，我找了很多方法，都无法实现自己想要效果，语音自己实现了语音分割并保存的代码，我测试了一下，可以达到自己想要的结果，因此写一篇博客，方便自己后期查看，也可以分享给大家参考。功能为：给定一个语音句子，将这个句子等分几个片段，并保存为.wav文件。代码实现和分析大家如果想尝试，自己在代码所在文件夹下准备一个.wav语音文
opensmile在windows用法美环花子若野
http://download.csdn.net/download/cjs68/9335087#comment请教：用OpenSMILE从多个文件（同一文件夹下）批量提取同一特征的命令应该怎么写？比如从单个文件提取特征：SMILExtract-C-I-O,那么批量提取应该怎么写命令呢？usingabatchprocessingfile?工具：OpenSMILE-2.3.0首先，要进入opensmi
使用openSMILE提取MFCC简易教程（Mac）夜深读书人
openSMILE是一款专门为提取音频特征设计的软件，介绍和安装方法网上已经有很多，这里不再赘述，我摸索openSMILE的使用方法的时候发现网上关于这个软件的教程很少，所以将自己使用的经验写出来放到这个博客上来，希望有人使用这个软件的时候不要再绕那么多弯路。我安装软件的时候跟visualstudio不停地冲突，所以我尝试了一下安装到mac系统上，并且使用shell编写程序脚本，进行特征的提取。在
Opensmile 简介 yuanmengxinglong
OpenSMILE软件简介--此部分内容转载自他人，并进行笔记梳理。--装载连接：http://blog.sina.com.cn/s/blog_8d351dfc0102w85j.html一、简介1.OpenSMILE软件介绍openSMILE软件是一种以命令行形式运行的而不是图形界面的操作软件，通过配置config文件对音频进行特征提取。现在openSMILE被世界上的研究学者和公司广泛应用。op
编写opensmile配置文件云飞扬° opensmile
编写opensmile配置文件openSMILE可以生成简单场景的配置文件模板。1.创建一个myconfig,用来保存配置文件如：在opensmile-2.3.0\config目录下创建myconfig文件夹2.输入一下内容，生成配置文件D:\Software\OpenSMILE\msvcbuild>SMILExtract_Release-cfgFileTemplate-configDfltcWa
opensmile 批量提取语音文件 sy8207880 脚本
@echooffsetlocalenabledelayedexpansionset/asum=0D:cd\opensmile\opensmile-2.3.0\bin\Win32for/rF:\music%%iin(*.wav)do(set/asum=sum+1SMILExtract_Release-CD:\opensmile\opensmile-2.3.0\config\IS09_emotion.
特征融合之openSMILE提取音频特征与生成文件的处理 IT无边界音频特征提取特征融合自然语言处理深度学习 python
如果以下内容对你有所帮助，可以点个赞关注一波哈！下载安装openSMILEopenSMILE的主要版本包括Windows（32位）和Linux（64位）以及Android的二进制文件ARM（自2.1以来，android-10）。对于Windows的朋友来说，大概意思就是你得再安一个linux系统（除非你的系统是WindowsXP）。这边建议在虚拟机中安linux系统。那具体怎么安装，这个别的地方应
openSMILE安装详细教程幻想天使人工智能
openSMILESep27,2017S1.下载最新的稳定版本openSMILE(http://audeering.com/technology/opensmile/#download)S2.下载依赖工具库autotools(automake,autoconf,libtool,andm4)makeGNUCandC++compilergccandg++12345$brewinstallautomak
【opensmile翻译】2.3提取特征demo-编写opensmile配置文件好像不对劲信号处理 opensmile
文档机翻openSMILE可以生成配置用于简单场景的模板。我们将使用此功能生成我们的第一个配置，能够读取波形，计算帧能量，并保存输出到CSV文件。首先，创建一个目录myconfig，它将保存你的配置文件。现在键入以下内容（不带换行符）以生成第一个配置文件：SMILExtract-cfgFileTemplate-configDfltcWaveSource,cFramer,cEnergy,cCsvSi
使用opensmile提取音频的特征云飞扬° opensmile
使用opensmile提取音频的特征OpenSMILE/msvcbuildOpenSMILE/opensmile-2.3.0/bin在D:\Software\OpenSMILE\msvcbuild路径下打开命令窗口。在提取特征之前我们还需要做一个测试看我们能否正常运行SMILExtractRelease.exe，①使用SMILExtract-h命令行，查看版本号等信息。SMILExtract_Re
openSMILE批量提取语音文件脚本 sy8207880 脚本脚本 openSMILE 语音识别提取
@echooffsetlocalenabledelayedexpansionset/asum=0D:cd\opensmile\opensmile-2.3.0\bin\Win32for/rF:\music%%iin(*.wav)do(set/asum=sum+1SMILExtract_Release-CD:\opensmile\opensmile-2.3.0\config\IS09_emotion.
利用opensmile批量提取音频特征及opensmile生成文件处理指南 cg896406166 项目经验
1.opensmile2.3.0下载2.调用命令行运行opensmileopensmile运行基本参数-C（后面加config文件）-I（后面加输入的音频文件）-O（后面加输出的路径），例如：SMILExtract_Release-CD:/Program/opensmile/opensmile-2.3.0/opensmile-2.3.0/config/IS09_emotion.conf-IC:/U
用opensmile批量提取语音特征星辰终变 Windows 语音情感分析
@echooffset/asum=0setextension=.txtE:cd\openSMILE-2.1.0\bin\Win32for/f"tokens=1-10delims=\"%%ain('dirF:\esdata\casia\casiawav\sametext50\*.wav/a-d/b/s')do(echo%%a\%%b\%%c\casiafeature\sametext50\%%f\%
语音特征公式与python实现好像不对劲信号处理语音情感识别
参考pyAudioAnalysis、openSmile以及语音信号处理实验教程（MATLAB源代码）IntroductiontoAudioAnalysis–AMatlabApproach完整测试文件注意，以下代码不在genFeatures.py内的，可在pyAudioAnalysis.audioFeatureExtraction文件内观察得到1.过零率zerocrossingrate每帧信号内，信
Ubuntu16.04 LTS 安装openSMILE 吴鑫达 Ubuntu16.04 深度学习 openSMILE Ubuntu
Step1:下载最新的稳定版本openSMILE(http://audeering.com/technology/opensmile/#download)Step2:下载依赖工具库$sudoapt-getinstallautomake$sudoapt-getinstallautoconf$sudoapt-getinstalllibtool$sudoapt-getinstallm4$sudoapt-
OpenSmile 修改配置文件，抽取 IS13_ComParE 的 LLDs 特征 jinmingz 情感识别
OpenSmile之前也一直用，但是都是用现成的改好的配置文件，如今想自己根据需求抽取里面的部分特征，比如现在以抽取IS13_ComParE_core.lld.conf.inc中的特征为例子。另外提供IS09_emotion.conf自定义抽取frame=0.4s,shift=0.05s为例子。（Pending）这里没有提供基本的格式说明，可以参考：https://blog.csdn.net/lc
opensmile使用指南 zeroQiaoba （C++）工程方面总结
opensmile参数设置opensmile运行基本参数-C（后面加configure文件）-I（后面夹输入的音频文件）-O（输出的路径），例如：-C"D:\\DeskTop\\opensmile-2.0-rc1\\opensmile-2.0-rc1\\testdata\\loud.conf"-I"D:\\DeskTop\\opensmile-2.0-rc1\\opensmile-2.0-rc1\
利用openSMILE进行声音特征提取 xiake001 机器学习
声音特征提取资源下载FFMPEG-win64下载opensmile-2.3.0.zip下载opensmile提取特征配置参数修改根据论文“C.AcousticFeatureExtraction:openSMILE”小节，配置修改如下：配置文件路径：config/shared/FrameModeFunctionals.conf.incframeMode=fixedframeSize=0.1#滑动窗口
OpenSmile提取eGeMAPS 特征集叁_ NLP
语音特征提取在NLP中很重要的一步，初学，复现一篇论文用到了eGeMAPS特征集，本来想用Librosa提取，但是好像它的函数没又提取eGeMAPS特征集。参考一下这篇：论文笔记：语音情感识别（五）语音特征集之eGeMAPS，ComParE，09IS，BoAW对特征集的描述，还有里面提及到使用OpenSmile可以提取eGeMAPS特征集。OpenSmile下载后在doc目录下有个PDF文件：op
ubuntu18.04安装openSMILE教程以及出错解决办法 wxysunshy openSMILE
首先安装依赖：$sudoapt-getinstallautomake$sudoapt-getinstallautoconf$sudoapt-getinstalllibtool$sudoapt-getinstallm4$sudoapt-getinstallgcc从官网下载安装包：https://www.audeering.com/opensmile/执行以下命令：tar-zxvfopensmile-
openSMILE用户手册2.3章——提取你的第一个语音特征 goodman_liqifei opensmile
在提取你的第一个语音特征之前，首先要保证你已经正确的编译了opensmile，我的系统是win10，编译软件是VS2015，opensmile包是opensmile-2.3.0，下面是官方给的编译步骤。1.在你的系统上任意位置建立一个opensmile的文件夹2.将你下载好的opensmilerelease包复制到刚刚建好的opensmile的文件夹里经行解压3.解压后你在opensmile的文件
多线程编程之存钱与取钱周凡杨 java thread 多线程存钱取钱
生活费问题是这样的：学生每月都需要生活费，家长一次预存一段时间的生活费，家长和学生使用统一的一个帐号，在学生每次取帐号中一部分钱，直到帐号中没钱时通知家长存钱，而家长看到帐户还有钱则不存钱，直到帐户没钱时才存钱。问题分析：首先问题中有三个实体，学生、家长、银行账户，所以设计程序时就要设计三个类。其中银行账户只有一个，学生和家长操作的是同一个银行账户，学生的行为是
java中数组与List相互转换的方法征客丶 JavaScript java jsonp
1.List转换成为数组。（这里的List是实体是ArrayList) 　　调用ArrayList的toArray方法。　　toArray 　　public T[] toArray(T[] a)返回一个按照正确的顺序包含此列表中所有元素的数组；返回数组的运行时类型就是指定数组的运行时类型。如果列表能放入指定的数组，则返回放入此列表元素的数组。否则，将根据指定数组的运行时类型和此列表的大小分
Shell 流程控制 daizj 流程控制 if else while case shell
Shell 流程控制和Java、PHP等语言不一样，sh的流程控制不可为空，如(以下为PHP流程控制写法)： <?php if(isset($_GET["q"])){ search(q);}else{// 不做任何事情} 在sh/bash里可不能这么写，如果else分支没有语句执行，就不要写这个else，就像这样 if else if if 语句语
Linux服务器新手操作之二周凡杨 Linux 简单操作
1.利用关键字搜寻Man Pages man -k keyword 其中-k 是选项，keyword是要搜寻的关键字如果现在想使用whoami命令，但是只记住了前3个字符who，就可以使用 man -k who来搜寻关键字who的man命令 [haself@HA5-DZ26 ~]$ man -k
socket聊天室之服务器搭建朱辉辉33 socket
因为我们做的是聊天室，所以会有多个客户端，每个客户端我们用一个线程去实现，通过搭建一个服务器来实现从每个客户端来读取信息和发送信息。我们先写客户端的线程。 public class ChatSocket extends Thread{ Socket socket; public ChatSocket(Socket socket){ this.sock
利用finereport建设保险公司决策分析系统的思路和方法老A不折腾 finereport 金融保险分析系统报表系统项目开发
决策分析系统呈现的是数据页面，也就是俗称的报表，报表与报表间、数据与数据间都按照一定的逻辑设定，是业务人员查看、分析数据的平台，更是辅助领导们运营决策的平台。底层数据决定上层分析，所以建设决策分析系统一般包括数据层处理（数据仓库建设）。项目背景介绍通常，保险公司信息化程度很高，基本上都有业务处理系统（像集团业务处理系统、老业务处理系统、个人代理人系统等）、数据服务系统（通过
始终要页面在ifream的最顶层林鹤霄
index.jsp中有ifream，但是session消失后要让login.jsp始终显示到ifream的最顶层。。。始终没搞定，后来反复琢磨之后，得到了解决办法，在这儿给大家分享下。。 index.jsp--->主要是加了颜色的那一句 <html> <iframe name="top" ></iframe> <ifram
MySQL binlog恢复数据 aigo mysql
1，先确保my.ini已经配置了binlog： # binlog log_bin = D:/mysql-5.6.21-winx64/log/binlog/mysql-bin.log log_bin_index = D:/mysql-5.6.21-winx64/log/binlog/mysql-bin.index log_error = D:/mysql-5.6.21-win
OCX打成CBA包并实现自动安装与自动升级 alxw4616 ocx cab
近来手上有个项目,需要使用ocx控件 (ocx是什么? http://baike.baidu.com/view/393671.htm) 在生产过程中我遇到了如下问题. 1. 如何让 ocx 自动安装? a) 如何签名? b) 如何打包? c) 如何安装到指定目录? 2.
Hashmap队列和PriorityQueue队列的应用百合不是茶 Hashmap队列 PriorityQueue队列
HashMap队列已经是学过了的,但是最近在用的时候不是很熟悉,刚刚重新看以一次, HashMap是K,v键 ,值 put()添加元素 //下面试HashMap去掉重复的 package com.hashMapandPriorityQueue; import java.util.H
JDK1.5 returnvalue实例 bijian1013 java thread java多线程 returnvalue
Callable接口：返回结果并且可能抛出异常的任务。实现者定义了一个不带任何参数的叫做 call 的方法。 Callable 接口类似于 Runnable，两者都是为那些其实例可能被另一个线程执行的类设计的。但是 Runnable 不会返回结果，并且无法抛出经过检查的异常。 ExecutorService接口方
angularjs指令中动态编译的方法(适用于有异步请求的情况) 内嵌指令无效 bijian1013 JavaScript AngularJS
在directive的link中有一个$http请求，当请求完成后根据返回的值动态做element.append('......');这个操作，能显示没问题，可问题是我动态组的HTML里面有ng-click，发现显示出来的内容根本不执行ng-click绑定的方法！
【Java范型二】Java范型详解之extend限定范型参数的类型 bit1129 extend
在第一篇中，定义范型类时，使用如下的方式： public class Generics<M, S, N> { //M,S,N是范型参数 } 这种方式定义的范型类有两个基本的问题： 1. 范型参数定义的实例字段，如private M m = null;由于M的类型在运行时才能确定，那么我们在类的方法中，无法使用m，这跟定义pri
【HBase十三】HBase知识点总结 bit1129 hbase
1. 数据从MemStore flush到磁盘的触发条件有哪些？ a.显式调用flush，比如flush 'mytable' b.MemStore中的数据容量超过flush的指定容量，hbase.hregion.memstore.flush.size,默认值是64M 2. Region的构成是怎么样？ 1个Region由若干个Store组成
服务器被DDOS攻击防御的SHELL脚本 ronin47
mkdir /root/bin vi /root/bin/dropip.sh #!/bin/bash/bin/netstat -na|grep ESTABLISHED|awk ‘{print $5}’|awk -F:‘{print $1}’|sort|uniq -c|sort -rn|head -10|grep -v -E ’192.168|127.0′|awk ‘{if($2!=null&a
java程序员生存手册-craps 游戏-一个简单的游戏 bylijinnan java
import java.util.Random; public class CrapsGame { /** * *一个简单的赌*博游戏，游戏规则如下： *玩家掷两个骰子，点数为1到6，如果第一次点数和为7或11，则玩家胜， *如果点数和为2、3或12，则玩家输， *如果和为其它点数，则记录第一次的点数和，然后继续掷骰，直至点数和等于第一次掷出的点
TOMCAT启动提示NB: JAVA_HOME should point to a JDK not a JRE解决开窍的石头 JAVA_HOME
当tomcat是解压的时候，用eclipse启动正常，点击startup.bat的时候启动报错; 报错如下： The JAVA_HOME environment variable is not defined correctly This environment variable is needed to run this program NB: JAVA_HOME shou
[操作系统内核]操作系统与互联网 comsci 操作系统
我首先申明：我这里所说的问题并不是针对哪个厂商的，仅仅是描述我对操作系统技术的一些看法操作系统是一种与硬件层关系非常密切的系统软件，按理说，这种系统软件应该是由设计CPU和硬件板卡的厂商开发的，和软件公司没有直接的关系，也就是说，操作系统应该由做硬件的厂商来设计和开发
富文本框ckeditor_4.4.7 文本框的简单使用支持IE11 cuityang 富文本框
<html xmlns="http://www.w3.org/1999/xhtml"> <head> <meta http-equiv="Content-Type" content="text/html; charset=UTF-8" /> <title>知识库内容编辑</tit
Property null not found darrenzhu datagrid Flex Advanced propery null
When you got error message like "Property null not found ***", try to fix it by the following way: 1)if you are using AdvancedDatagrid, make sure you only update the data in the data prov
MySQl数据库字符串替换函数使用 dcj3sjt126com mysql 函数替换
需求：需要将数据表中一个字段的值里面的所有的 . 替换成 _ 原来的数据是 site.title site.keywords .... 替换后要为 site_title site_keywords 使用的SQL语句如下： updat
mac上终端起动MySQL的方法 dcj3sjt126com mysql mac
首先去官网下载: http://www.mysql.com/downloads/ 我下载了5.6.11的dmg然后安装,安装完成之后..如果要用终端去玩SQL.那么一开始要输入很长的:/usr/local/mysql/bin/mysql 这不方便啊,好想像windows下的cmd里面一样输入mysql -uroot -p1这样...上网查了下..可以实现滴. 打开终端,输入: 1
Gson使用一（Gson） eksliang json gson
转载请出自出处：http://eksliang.iteye.com/blog/2175401 一.概述从结构上看Json，所有的数据（data）最终都可以分解成三种类型：第一种类型是标量（scalar），也就是一个单独的字符串（string）或数字（numbers），比如"ickes"这个字符串。第二种类型是序列（sequence），又叫做数组（array）
android点滴4 gundumw100 android
Android 47个小知识 http://www.open-open.com/lib/view/open1422676091314.html Android实用代码七段（一） http://www.cnblogs.com/over140/archive/2012/09/26/2611999.html http://www.cnblogs.com/over140/arch
JavaWeb之JSP基本语法 ihuning javaweb
目录 JSP模版元素 JSP表达式 JSP脚本片断 EL表达式 JSP注释特殊字符序列的转义处理如何查找JSP页面中的错误 JSP模版元素 JSP页面中的静态HTML内容称之为JSP模版元素，在静态的HTML内容之中可以嵌套JSP
App Extension编程指南（iOS8/OS X v10.10）中文版啸笑天 ext
当iOS 8.0和OS X v10.10发布后，一个全新的概念出现在我们眼前，那就是应用扩展。顾名思义，应用扩展允许开发者扩展应用的自定义功能和内容，能够让用户在使用其他app时使用该项功能。你可以开发一个应用扩展来执行某些特定的任务，用户使用该扩展后就可以在多个上下文环境中执行该任务。比如说，你提供了一个能让用户把内容分
SQLServer实现无限级树结构 macroli oracle sql SQL Server
表结构如下：数据库id path titlesort 排序 1 0 首页 0 2 0,1 新闻 1 3 0,2 JAVA 2 4 0,3 JSP 3 5 0,2,3 业界动态 2 6 0,2,3 国内新闻 1 创建一个存储过程来实现，如果要在页面上使用可以设置一个返回变量将至传过去 create procedure test as begin decla
Css居中div，Css居中img，Css居中文本，Css垂直居中div qiaolevip 众观千象学习永无止境每天进步一点点 css
/**********Css居中Div**********/ div.center { width: 100px; margin: 0 auto; } /**********Css居中img**********/ img.center { display: block; margin-left: auto; margin-right: auto; }
Oracle 常用操作(实用) 吃猫的鱼 oracle
SQL>select text from all_source where owner=user and name=upper('&plsql_name'); SQL>select * from user_ind_columns where index_name=upper('&index_name'); 将表记录恢复到指定时间段以前
iOS中使用RSA对数据进行加密解密 witcheryne ios rsa iPhone objective c
RSA算法是一种非对称加密算法,常被用于加密数据传输.如果配合上数字摘要算法, 也可以用于文件签名. 本文将讨论如何在iOS中使用RSA传输加密数据. 本文环境 mac os openssl-1.0.1j, openssl需要使用1.x版本, 推荐使用[homebrew](http://brew.sh/)安装. Java 8 RSA基本原理 RS