Yang SiCheng

【语音信号处理】1语音信号可视化——时域、频域、语谱图、MFCC详细思路与计算、差分

基本语音信号处理操作入门

1. 数据获取
2. 语音信号可视化
- 2.1 时域特征
- 2.2 频域特征
- 2.3 语谱图
3. 倒谱分析
4. 梅尔系数
- 4.1 梅尔频率倒谱系数
- 4.2 Mel滤波器原理
- 4.3 MFCC特征提取思路
- 4.4 计算Mel filterbank
- 4.5 代码实现
- - 4.5.1 通过python_speech_features提取mfcc
  - 4.5.2 通过librosa提取mfcc
5. 差分
6. 完整代码
小结

1. 数据获取

数据集来自：

中国科学院自动化所的CASIA汉语情感语料库——共包括四个专业最佳人，六种情绪生气（怒），高兴（高兴）），害怕（fear），悲伤（sad），其他（surprise）和中性（neutral），共9600句不同最佳。其中300句是相同文本的，也就是说对相同的文本赋以不同的情感来阅读，这些语料可以利用对比分析不同的情感状态下的声学和韵律表现；另外100句是不同文本的，这些文本从字面意思就可以修剪其情感归属，以便录音人更准确地表现出情感，但完整的CASIA数据集是收费的，因此只找到了1200句残缺数据集，压缩包共58.2MB
好未来 TAL_SER语音情感数据集——该数据集为好未来老师上课音频，共包含4541条音频，总时长12.5小时。录音在安静的室内环境中录制，每条音频只有一个说话人。标注包括愉悦度（Pleasure）和激情度（Arousal）两个维度，每个音频片段对应一个P值和A值，范围都在[-3,3]之间，值越大表示愉悦度或激情度越高。音频长度：10s，采样率：16kHz
一个多模态英文数据集，在此申请获得许可，《Multimodal Language Analysis in the Wild_ CMU-MOSEI Dataset and Interpretable Dynamic Fusion Graph》数据集下载地址
《CH-SIMS: A Chinese Multimodal Sentiment Analysis Dataset with Fine-grained Annotations of Modality》–【中文多模态情绪】，Github地址，论文地址

2. 语音信号可视化

参考Python语音信号处理一文，MFCC特征提取与神经网络可见此文：基于CNN+MFCC的语音情感识别，以及有个专栏，其中有很多关于语音信号处理基础的Blog，还有这个Speech Recognition 专栏

2.1 时域特征

使用wave模块读取wav音频文件，画图时域图像：

2.2 频域特征

numpy模块自带了快速傅里叶变换的函数，对上面的音频数据进行傅里叶变换：

2.3 语谱图

语音信号用频谱向量序列表示

语音的时域分析和频域分析是语音分析的两种重要方法，但是都存在着局限性。时域分析对语音信号的频率特性没有直观的了解，频域特性中又没有语音信号随时间的变化关系。语谱图的原理如下：

语音被分为很多帧，每帧语音都对应于一个频谱（通过短时FFT计算），频谱表示频率与能量的关系。在实际使用中，频谱图有三种，即线性振幅谱、对数振幅谱、自功率谱（对数振幅谱中各谱线的振幅都作了对数计算，所以其纵坐标的单位是dB（分贝）。这个变换的目的是使那些振幅较低的成分相对高振幅成分得以拉高，以便观察掩盖在低幅噪声中的周期信号）

将其中一帧语音的频谱通过坐标表示出来，如上图左。现在我们将左边的频谱旋转90度。得到中间的图。然后把这些幅度映射到一个灰度级表示，0表示黑，255表示白色。幅度值越大，相应的区域越黑。这样就得到了最右边的图。那为什么要这样呢？为的是增加时间这个维度，这样就可以显示一段语音而不是一帧语音的频谱，而且可以直观的看到静态和动态的信息

这样会得到一个随着时间变化的频谱图，这个就是描述语音信号的spectrogram语谱图或声谱图：

语谱图综合了时域和频域的优点，明显的显示出了语音频谱随时间的变化情况、语谱图的横轴为时间，纵轴为频率，任意给定频率成分在给定时刻的强弱用颜色深浅来表示。颜色深的，频谱值大，颜色浅的，频谱值小。语谱图上不同的黑白程度形成不同的纹路，称之为声纹，不同讲话者的声纹是不一样的，可用作声纹识别。

语谱图分为功率谱，幅度谱，相位谱。使用matplotlib可以直接获得语谱图：

具体函数的参数可见matplotlib官方文档

语谱图分为窄带和宽带语谱图。“窄带”，顾名思义，带宽小，则时宽大，则短时窗长，窄带语谱图就是长窗条件下画出的语谱图。“宽带”，正好相反。至于“横竖条纹”，窄带语谱图的带宽窄，那么在频率上就“分得开”，即能将语音各次谐波“看得很清楚”，即表现为“横线”。“横”就体现出了频率分辨率高。分辨率可以直观的看做“分开能力”。“频率分辨率”高就是在频率上将各次谐波分开的能力高，表现为能分辨出各次谐波的能力高，频率分辨率越高，越容易分辨各次谐波。类似的，宽带语谱图的时宽窄，那么在时间上就“分得开”，即能将语音在时间上重复的部分“看得很清楚”，即表现为“竖线”。“竖”就体现出了时间分辨率高。时间分辨率越高，谱图上的竖线看得越清楚。图1和图2分别示出了一条语音句子的窄带语谱图和宽带语谱图。短时窗长度分别是20ms和2ms

我们为什么要为语谱图而烦恼？在语谱图中可以更好地观察到音素Phone及其特性，通过声母和它们的转换可以更好地识别声音，隐马尔可夫模型对这些谱图进行隐性建模，以进行语音识别

语谱图的作用：

语音信号的时间-频率表示方法
语谱图是研究语音（音素Phone）的工具
语音学家对音素Phone及其特性进行直观研究
隐马尔科夫模型隐含了语音到文本系统的语谱图模型
有助于评估文本到语音系统——一个高质量的文本到语音系统应该产生合成语音，其频谱图应该与自然句子几乎一致

3. 倒谱分析

Cepstral Analysis

MFCC的PPT，以及对应的这篇Blog写的很好

语音频谱样本：

峰值表示语音信号中的主导频率成分
峰值被称为共振峰（formants）
共振峰带有声音的特征

我们要提取什么？-语音频谱包络

共振峰和连接它们的平滑曲线
这种平滑曲线被称为频谱包络线

log X[k] = log H[k] + log E[k]

我们的目标：我们希望将频谱包络和频谱细节从频谱中分离出来
即给定对数X[k]，得到对数H[k]和对数E[k]，使对数X[k]=对数H[k]+对数E[k]

怎么实现这个分离？

技巧：取频谱的FFT!
频谱上的FFT被称为反向FFT（IFFT）
注：我们处理的是对数域的频谱（部分技巧）
对数频谱的IFFT将在伪频轴上表示信号

在实际操作中，你所能接触到的只有对数X[k]，因此你可以得到x[k]
如果知道x[k] 过滤低频区域，得到h[k]
x[k]简称为Cepstrum
h[k]是通过考虑x[k]的低频区域得到的
h[k]代表频谱包络，被广泛用于语音识别的特征

现在总结下倒谱分析，它实际上是这样一个过程：

将原语音信号经过傅里叶变换得到频谱：X[k]=H[k]E[k]；只考虑幅度就是：|X[k] |=|H[k]||E[k] |；
我们在两边取对数：log||X[k] ||= log ||H[k] ||+ log ||E[k] ||
再在两边取逆傅里叶变换得到：x[k]=h[k]+e[k]

专业的名字叫做同态信号处理。它的目的是将非线性问题转化为线性问题的处理方法。对应上面，原来的语音信号实际上是一个卷性信号（声道相当于一个线性时不变系统，声音的产生可以理解为一个激励通过这个系统），第一步通过卷积将其变成了乘性信号（时域的卷积相当于频域的乘积）。第二步通过取对数将乘性信号转化为加性信号，第三步进行逆变换，使其恢复为卷性信号。这时候，虽然前后均是时域序列，但它们所处的离散时域显然不同，所以后者称为倒谱频域

总结下，倒谱（cepstrum）就是一种信号的傅里叶变换经对数运算后再进行傅里叶反变换得到的谱。它的计算过程如下：

4. 梅尔系数

4.1 梅尔频率倒谱系数

Mel Frequency Cepstral Coefficient (MFCC) tutorial，MFCC特征原理，这篇关于MFCC的计算过程很详细

人的听觉系统是一个特殊的非线性系统，它响应不同频率信号的灵敏度是不同的。在语音特征的提取上，人类听觉系统做得非常好，它不仅能提取出语义信息, 而且能提取出说话人的个人特征，这些都是现有的语音识别系统所望尘莫及的。如果在语音识别系统中能模拟人类听觉感知处理特点，就有可能提高语音的识别率

梅尔频率倒谱系数（Mel Frequency Cepstrum Coefficient, MFCC）考虑到了人类的听觉特征，先将线性频谱映射到基于听觉感知的Mel非线性频谱中，然后转换到倒谱上

我们将频谱通过一组Mel滤波器就得到Mel频谱。公式表述就是：log X[k] = log (Mel-Spectrum)。这时候我们在log X[k]上进行倒谱分析：

取对数：log X[k] = log H[k] + log E[k]
进行逆变换：x[k] = h[k] + e[k]

在Mel频谱上面获得的倒谱系数h[k]就称为Mel频率倒谱系数，简称MFCC

4.2 Mel滤波器原理

将普通频率转化到Mel频率的公式是：
$\operatorname{mel}(f)=2595 * \log _{10}(1+f / 700)$
由下图可以看到，它可以将不统一的频率转化为统一的频率，也就是统一的滤波器组

import math
import matplotlib.pyplot as plt
plt.rcParams['font.sans-serif'] = ['SimHei']  # 显示中文标签
plt.rcParams['axes.unicode_minus'] = False

x = list(range(5500))		# [300, 8000]
y = [2595 * math.log((1 + i/700), 10) for i in x]	# [401.9705861630035, 2840.0230467083184]
y = [1125 * math.log(1 + i/700) for i in x]		# [401.25931193107397, 2834.997715799179]
plt.plot(x,y)
plt.xlim(0,)
plt.ylim(0,)
plt.xlabel('普通频率(HZ)',fontsize=12)
plt.ylabel('Mel频率(HZ)',fontsize=12)
plt.show()

在Mel频谱上面获得的倒谱系数h[k]就称为Mel频率倒谱系数，简称MFCC

4.3 MFCC特征提取思路

这篇文章有详细的计算

(梅尔语谱图)

提取MFCC特征的过程：

预加重：减小噪声的高频分量，但是对噪声并没有影响，因此可有效提高输出信噪比
波形图分帧
对每一帧进行加窗：例如使用汉明窗(hamming window)对信号进行加窗处理
对每一帧进行离散傅里叶变化（DFT)
计算功率谱
计算Mel-spaced filterbank
对上述128维的mel功率谱取log，得到128维的 log-mel filer bank energies

具体的，我们从一个语音信号开始，我们假设采样频率为16kHz：

将信号框成20-40ms的帧。25ms是标准的。这意味着16kHz信号的帧长是0.025*16000=400个采样。帧步长通常是10ms（160个样本）这样的东西，这允许帧有一些重叠。第一个400个采样帧从0号采样开始，下一个400个采样帧从160号采样开始，等等，直到到达语音文件的终点。如果语音文件没有被分成偶数帧，就用0垫起来，这样就可以了
接下来的步骤应用于每一个单帧，每帧提取一组12个MFCC系数。一个简短的旁白符号：我们称我们的时域信号为 $s (n)$ 。一旦它被定格，我们有 $s_i(n)$ 其中n范围在1-400（如果我们的帧是400个样本）和 $i$ 范围超过帧数。当我们计算复数DFT时，我们得到 $S_i(k)$ –其中 $i$ 表示对应于时域帧的帧数， $P_i(k)$ 那么就是帧 $i$ 的功率谱
要对帧进行离散傅里叶变换，请执行以下操作：
$S_{i}(k)=\sum_{n=1}^{N} s_{i}(n) h(n) e^{-j 2 \pi k n / N} \quad 1 \leq k \leq K$
其中 $h (n)$ 是一个样本长为N的分析窗口(例如hamming window)，K是DFT的长度，基于周期图的语音帧 $s_i(n)$ 功率谱估计方法：
$P_{i}(k)=\frac{1}{N}\left|S_{i}(k)\right|^{2}$
这就是所谓的功率谱的周期图估计。我们取复数傅里叶变换的绝对值，并将结果平方。我们一般会执行512个点的FFT，只保留前257个系数
计算Mel间隔滤波库。这是一组20-40（26是标准的）三角滤波器，我们将其应用于步骤2中的周期图功率谱估计。我们的滤波库是以26个长度为257的向量的形式出现的（假设FFT设置为第2步）。每个向量大部分都是零，但在某段频谱中是非零。为了计算滤波组的能量，我们将每个滤波组与功率谱相乘，然后将系数相加。一旦这样做，我们就会得到26个数字，这些数字可以让我们知道每个滤波组有多少能量。关于如何计算滤波组的详细解释请看下文。下面是一张Mel Filterbank和窗口功率谱图，希望能说明问题
取步骤3中26个能量的对数。这样我们就有26个对数滤波库(filterbank)能量
对26个对数滤波库能量进行离散余弦变换(DCT)，得到26个表观系数。对于ASR，只保留26个系数中较低的12-13个
由此产生的特征（每帧12个数字）称为Mel频率倒数系数

4.4 计算Mel filterbank

在本节中，本例将使用10个filterbanks，因为它更容易显示，在现实中你会使用26-40个过滤库

为了得到图(a)所示的滤波库filterbanks，我们首先要选择一个下频和上频。好的值是下限频率为300Hz，上限频率为8000Hz。当然如果语音的采样频率为8000Hz，我们的上频就会被限制在4000Hz。然后按照以下步骤进行：

使用从频率到梅尔音阶的转换公式为：
$\ln (1+f / 700)$
将上、下频率转换为Mels。在我们的例子中，300Hz是401.25 Mels，8000Hz是2834.99 Mels
在这个例子中，我们将做10个滤波库，为此我们需要12个点。这意味着我们需要在401.25和2834.99之间再增加10个点的线性间隔。这就得出了：

[ 401.25931193  622.50825774  843.75720354 1065.00614935 1286.25509516 1507.50404096 1728.75298677 1950.00193257 2171.25087838 2392.49982419 2613.74876999 2834.9977158 ]

现在用公式：
$M^{-1}(m)=700(\exp (m / 1125)-1)$
把这些换算回赫兹，注意到，我们的起始点和终点都在我们想要的频率上：

[300.0, 517.3370529507943, 781.9095004869245, 1103.9833440625362, 1496.0557676334065, 1973.3400562864445, 2554.3559056550503, 3261.6480274431315, 4122.660934555949, 5170.803849453262, 6446.747056545612, 7999.999999999999]

我们不具备在上面计算的精确点上放滤波器所需的频率分辨率，所以我们需要将这些频率舍入到最近的FFT bin。这个过程不会影响特征的准确性。为了将频率单位转换为FFT bin数，我们需要知道FFT大小和采样率：

[  9.  16.  25.  35.  47.  63.  81. 104. 132. 165. 206. 256.]

我们可以看到，最终的滤波库在bin 256处完成，相当于8kHz，FFT大小为512点

现在我们创建我们的滤波组。第一个滤池从第一点开始，在第二点达到峰值，然后在第三点回到零。第二个滤岸将从第2点开始，在第3点达到最大值，然后在第4点为零，等等。计算公式如下:
$H_{m}(k)=\left\{\begin{array}{cl} 0 & kf(m+1) \end{array}\right.$

其中M是我们想要的滤波器数量，f()是M+2个Mel间隔频率的列表，所有10个滤波器相互叠加的最终图：

一个包含10个滤波器的Mel滤波库。这个滤波器库从0Hz开始，到8000Hz结束。这只是一个指南，上面的工作例子开始在300Hz

部分创建Filterbanks的代码：

import math
import numpy as np
# import matplotlib.pyplot as plt

import scipy.signal
# plt.rcParams['font.sans-serif'] = ['SimHei']  # 显示中文标签
# plt.rcParams['axes.unicode_minus'] = False

x = [300,8000]

mel = [1125 * math.log(1 + i/700) for i in x]
# print(mel)

mel_domain_hz = np.linspace(mel[0],mel[1],12)
# print(mel_domain_hz)

time_domain_hz = [700*(math.exp(i/1125)-1) for i in mel_domain_hz]
# print(time_domain_hz)

nfft=512
samplerate = 16000
FFT = np.floor((nfft+1)*np.array(time_domain_hz)/samplerate)
print(FFT)

MFCCs(Mel-frequency cepstral coefficients)即梅尔频率倒谱系数，mfcc特征在梅尔语谱图的基础上增加了dct倒谱环节，DCT也可以理解为没有虚部的FFT，通过python提取MFCCs有两种方式，通过librosa模块或者python_speech_features模块，具体区别可见语音MFCC提取：librosa && python_speech_feature，整个梅尔语音特征的提取过程如下：

Deltas and Delta-Deltas

又称微分系数和加速度系数。MFCC特征向量只描述了单帧的功率谱包络，但似乎语音也会有动态的信息，即MFCC系数随时间的轨迹是什么。事实证明，计算MFCC轨迹，并将其附加到原始特征向量上，会使ASR性能提高不少（如果我们有12个MFCC系数，我们也会得到12个delta系数，两者相加就会得到一个长度为24的特征向量）

4.5 代码实现

4.5.1 通过python_speech_features提取mfcc

官方文档，首先安装python_speech_features模块

pip install python_speech_features

结果：

MFCC:
窗口数 = 999
每个特征的长度 = 13

Filter bank:
窗口数 = 999
每个特征的长度 = 26

4.5.2 通过librosa提取mfcc

官方文档，首先安装librosa模块：

pip install librosa

结果：

从以上结果可以看到，这两个库提取出的mfcc是不一样的，原因在于一个nFFT为512，另一个为2048

5. 差分

a = [1 2 3 4 5 1 3 5 7] 
b = liborsa.feature.delta(a, width=3) 

> b= [ 0.5 1. 1. 1. -1.5 -1. 2. 2. 1. ]

6. 完整代码

import wave
import numpy as np
import matplotlib.pyplot as plt
from scipy.io import wavfile
from python_speech_features import mfcc, logfbank
import librosa

dic = {}

path = '... your path\\TAL_SER语音情感数据集\\TAL-SER\\'
path_label = path + 'label\\' + 'label'     # label:标签
path_utt2gen = path + 'label\\' + 'utt2gen'     # Gender:性别
path_utt2spk = path + 'label\\' + 'utt2spk'     # Speaker:说话人
path_wav = path + 'label\\' + 'wav.scp'     # wav地址

total = -1       # 4188
with open(path_label, 'r', encoding='utf-8') as file:
    for line in file.readlines():
        total += 1
        if total == 0:
            continue
        tmp = line.strip().split(' ')
        dic[eval(tmp[0])] = {'P':eval(tmp[1]), 'A':eval(tmp[2])}

with open(path_utt2gen, 'r', encoding='utf-8') as file:
    for line in file.readlines():
        tmp = line.strip().split(' ')
        dic[eval(tmp[0])].update({'Gender':tmp[1]})

with open(path_utt2spk, 'r', encoding='utf-8') as file:
    for line in file.readlines():
        tmp = line.strip().split(' ')
        dic[eval(tmp[0])].update({'Speaker':tmp[1]})

with open(path_wav, 'r', encoding='utf-8') as file:
    for line in file.readlines():
        tmp = line.strip().split(' ')
        dic[eval(tmp[0])].update({'Wav': tmp[1][1:]})

def read_wav(path_wav):
    f = wave.open(path_wav, 'rb')
    params = f.getparams()
    nchannels, sampwidth, framerate, nframes = params[:4]  # 通道数、采样字节数、采样率、采样帧数
    voiceStrData = f.readframes(nframes)
    waveData = np.frombuffer(voiceStrData, dtype=np.short)  # 将原始字符数据转换为整数
    waveData = waveData * 1.0 / max(abs(waveData))  # 音频数据归一化, instead of .fromstring
    waveData = np.reshape(waveData, [nframes, nchannels]).T  # .T 表示转置, 将音频信号规整乘每行一路通道信号的格式，即该矩阵一行为一个通道的采样点，共nchannels行
    f.close()
    return waveData, nframes, framerate

def draw_time_domain_image(waveData, nframes, framerate):       # 时域特征
    time = np.arange(0,nframes) * (1.0/framerate)
    plt.plot(time,waveData[0,:],c='b')
    plt.xlabel('time')
    plt.ylabel('am')
    plt.show()

def draw_frequency_domain_image(waveData):      # 频域特征
    fftdata = np.fft.fft(waveData[0, :])
    fftdata = abs(fftdata)
    hz_axis = np.arange(0, len(fftdata))
    plt.figure()
    plt.plot(hz_axis, fftdata, c='b')
    plt.xlabel('hz')
    plt.ylabel('am')
    plt.show()

def draw_Spectrogram(waveData, framerate):     # 语谱图
    framelength = 0.025     # 帧长20~30ms
    framesize = framelength * framerate       # 每帧点数 N = t*fs,通常情况下值为256或512,要与NFFT相等, 而NFFT最好取2的整数次方,即framesize最好取的整数次方
    nfftdict = {}
    lists = [32, 64, 128, 256, 512, 1024]
    for i in lists:     # 找到与当前framesize最接近的2的正整数次方
        nfftdict[i] = abs(framesize - i)
    sortlist = sorted(nfftdict.items(), key=lambda x: x[1])  # 按与当前framesize差值升序排列
    framesize = int(sortlist[0][0])  # 取最接近当前framesize的那个2的正整数次方值为新的framesize
    NFFT = framesize  # NFFT必须与时域的点数framsize相等，即不补零的FFT
    overlapSize = 1.0 / 3 * framesize  # 重叠部分采样点数overlapSize约为每帧点数的1/3~1/2
    overlapSize = int(round(overlapSize))  # 取整
    spectrum, freqs, ts, fig = plt.specgram(waveData[0], NFFT=NFFT, Fs=framerate, window=np.hanning(M=framesize),
                                            noverlap=overlapSize, mode='default', scale_by_freq=True, sides='default',
                                            scale='dB', xextent=None)  # 绘制频谱图
    plt.ylabel('Frequency')
    plt.xlabel('Time(s)')
    plt.title('Spectrogram')
    plt.show()


def mfcc_python_speech_features(path):
    sampling_freq, audio = wavfile.read(path)       # 读取输入音频文件
    mfcc_features = mfcc(audio, sampling_freq)      # 提取MFCC和滤波器组特征
    filterbank_features = logfbank(audio, sampling_freq)        # numpy.ndarray, (999, 26)
    print(filterbank_features.shape)        # (200, 26)
    # print('\nMFCC:\n窗口数 =', mfcc_features.shape[0])
    # print('每个特征的长度 =', mfcc_features.shape[1])
    # print('\nFilter bank:\n窗口数 =', filterbank_features.shape[0])
    # print('每个特征的长度 =', filterbank_features.shape[1])
    # mfcc_features = mfcc_features.T     # 画出特征图，将MFCC可视化。转置矩阵，使得时域是水平的
    # plt.matshow(mfcc_features)
    # plt.title('MFCC')
    # filterbank_features = filterbank_features.T     # 将滤波器组特征可视化。转置矩阵，使得时域是水平的
    # plt.matshow(filterbank_features)
    # plt.title('Filter bank')
    # plt.show()

def mfcc_librosa(path):
    y, sr = librosa.load(path, sr=None)
    '''
    librosa.feature.mfcc(y=None, sr=22050, S=None, n_mfcc=20, dct_type=2, norm='ortho', **kwargs)
    y：声音信号的时域序列
    sr：采样频率(默认22050)
    S：对数能量梅尔谱(默认为空)
    n_mfcc：梅尔倒谱系数的数量（默认取20）
    dct_type:离散余弦变换(DCT)的类型(默认为类型2)
    norm：如果DCT的类型为是2或者3，参数设置为"ortho"，使用正交归一化DCT基。归一化并不支持DCT类型为1
    kwargs：如果处理时间序列输入，参照melspectrogram
    返回：
    M：MFCC序列
    '''
    mfcc_data = librosa.feature.mfcc(y, sr, n_mfcc=13)
    plt.matshow(mfcc_data)
    plt.title('MFCC')
    plt.show()


if __name__ == '__main__':
    # for key in dic:
    #     print(dic[key])

    # print(dic[2])
    # path_wav = path + dic[2]['Wav']
    path_wav = '... your path\\CASIA database\\liuchanhg\\surprise\\201.wav'
    waveData, nframes, framerate = read_wav(path_wav)
    # draw_time_domain_image(waveData, nframes, framerate)
    # draw_frequency_domain_image(waveData)
    # draw_Spectrogram(waveData, framerate)
    mfcc_python_speech_features(path_wav)
    # mfcc_librosa(path_wav)

小结

大致入门了一下语音部分的基本操作：

时域、频域、语谱图绘制过程
倒谱分析，先经过短时傅里叶变化到频域，此时为乘积形式，求Log，转成加法形式，再分别求逆傅里叶变换，即可求得h[k]，MFCC就是在Mel频率下进行上述的计算
MFCC具体的过程，Filterbanks设计比较简单，之后对每一帧加重、分帧、加窗、求STFT、绝对值取平方、经过滤波器(矩阵乘法)、log、DCT、取低维部分为MFCC（倒谱提升、微分动态特征）

Linux:进程间通信——信号 muke_r 1024程序员节
信号是UNIX和Linux系统响应某些条件而产生的一个事件，接收到该信号的进程会相应地采取一些行动。信号是软中断，通常信号是由一个错误产生的。但它们还可以作为进程间通信或修改行为的一种方式，明确地由一个进程发送给另一个进程目录一、信号种类1.常见的信号2.不可靠信号和可靠信号注意二、信号捕捉三、进程休眠号四、信号集和信号阻塞五、附带数据信息的信号处理一、信号种类在终端输入kill-l命令可以看到l
利用AI与MySQL提升工业物联网健康监测的智慧水平——构建预测性维护的新纪元墨夶数据库学习资料1 人工智能 mysql 物联网
在工业4.0和智能制造的大背景下，如何确保生产设备的高效稳定运行成为企业竞争力的核心要素之一。传统的事后维修方式已经难以满足现代制造业的需求，而基于人工智能（AI）的预测性维护系统则为这一挑战提供了全新的解决方案。今天，我们将深入探讨如何结合AI技术和MySQL数据库，打造一个智能、高效的工业物联网（IIoT）健康监测平台，助力企业在激烈的市场竞争中脱颖而出。一、为什么选择AI+MySQL？1.A
MySQL中基于机器学习的自适应缓存热点识别优化策略——开启数据库性能新纪元墨夶数据库学习资料1 数据库 mysql 机器学习
在数据驱动的世界里，数据库的性能直接影响到整个应用系统的响应速度和用户体验。随着业务量的增长和技术的发展，传统的缓存机制逐渐暴露出局限性。如何更智能地识别并利用热点数据进行缓存优化，成为提升数据库性能的关键所在。今天，我们将深入探讨一种创新的方法——基于机器学习的自适应缓存热点识别优化策略，并分享其在MySQL中的具体实现方案。为什么选择机器学习？‍传统上，开发者们依赖于手动配置或预设规则来决定哪
Open3D 点云DBSCAN聚类算法 MelaCandy 算法聚类 numpy 计算机视觉图像处理 3d
目录一、DBSCAN基本原理二、代码实现2.1关键函数2.2完整代码三、实现效果3.1原始点云3.2聚类后点云Open3D点云算法汇总及实战案例汇总的目录地址：Open3D点云算法与点云深度学习案例汇总（长期更新）-CSDN博客一、DBSCAN基本原理DBSCAN（Density-BasedSpatialClusteringofApplicationswithNoise）是一种基于密度的聚类算法，
密码学，算法在人工智能的实战利用 china—hbaby 人工智能密码学
在人工智能（AI）的快速发展中，数据安全和隐私保护成为了核心议题。密码学，作为保护信息安全的基石，其在AI领域的应用显得尤为重要。本文将探讨密码学在AI中的利用，并提供一些代码示例来展示其实际应用。密码学的概述即常用加密方式密码学（Cryptography）是数学和计算机科学的一个分支，它涉及保护信息的安全性和隐私性。密码学的主要目标是确保信息在传输过程中不被未授权的第三方读取或篡改，以及确保信息
【人工智能时代】-人工智能发展史：1900~2023 xiaoli8748_软件开发人工智能时代人工智能搜索引擎
第一阶段：人工智能发展历史：1900-19591909年西班牙工程师LeonardoTorresyQuevedo发明了“Occultus”，这是一个可以自动执行国际象棋对弈的机器，预示了未来的计算智能。
语音识别学习系列（13）：语音识别中的情感识别与表达 DoYangTan 语音识别学习人工智能
语音识别学习系列（13）：语音识别中的情感识别与表达前言在语音识别领域，仅仅将语音准确转换为文字内容已不能满足日益多样化的人机交互需求。人们在交流过程中往往蕴含着丰富的情感信息，语音识别若能对情感进行识别与表达，将会使交互变得更加自然、智能且贴合人性化需求。本期我们就围绕语音识别中的情感识别与表达这一重要主题展开深入探讨，了解其背后的原理、方法以及实际应用价值。一、语音情感识别的基本原理与常用方法
目标检测领域总结：从传统方法到 Transformer 时代的革新 DoYangTan 目标检测系列目标检测 transformer 人工智能
目标检测领域总结：从传统方法到Transformer时代的革新目标检测是计算机视觉领域的一个核心任务，它的目标是从输入图像中识别并定位出目标物体。随着深度学习的兴起，目标检测方法已经取得了显著的进展。从最早的传统方法到现如今基于Transformer的先进算法，目标检测的发展经历了多个重要的阶段。本文将详细总结目标检测领域的演进，涵盖传统方法、两阶段检测方法、单阶段检测方法和基于Transform
2024MathorCup数学建模之——MathorCup奖杯”获得者经验思路分享美赛数学建模数学建模
一、经验分享1.工具选择：顺手即可。Matlab和Python都是比较主流的选择，二者的应用场合各有不同。Python在数据分析、深度学习方面的优势愈发明显，而Matlab更适合进行物理仿真和数值计算。不过随着Python社区不断发展，其功能也愈发全面与强大，因此我们比较推荐学有余力的情况下可以更早接触Python。2.模型算法：多多益善。不一定要精通所有的算法，但是手上至少要准备一些常用的算法（
AI人工智能软件开发方案：开启智能时代的创新钥匙广州硅基技术官方人工智能
一、引言：AI浪潮下的软件开发新机遇近年来，人工智能（AI）技术的迅猛发展如同一股汹涌澎湃的浪潮，席卷了全球各个领域。从最初的概念提出到如今的广泛应用，AI历经了漫长的发展历程，终于迎来了属于它的黄金时代。回首过去，AI的发展并非一帆风顺，早期由于计算能力和算法的限制，经历了多次起伏。但随着大数据、云计算、机器学习、深度学习等技术的不断突破，AI迎来了爆发式增长。如今，AI已经深入到人们生活和工作
深度学习框架PyTorch——从入门到精通（6.2）自动微分机制 Fansv587 深度学习 pytorch 人工智能经验分享 python 机器学习
本节自动微分机制是上一节自动微分的扩展内容自动微分是如何记录运算历史的保存张量非可微函数的梯度在本地设置禁用梯度计算设置requires_grad梯度模式（GradModes）默认模式（梯度模式）无梯度模式推理模式评估模式（`nn.Module.eval()`）自动求导中的原地操作原地操作的正确性检查多线程自动求导CPU上的并发不确定性计算图保留自动求导节点的线程安全性C++钩子函数不存在线程安全
Pytorch深度学习教程_9_nn模块构建神经网络 tRNA做科研深度学习保姆教程深度学习 pytorch 神经网络
欢迎来到《深度学习保姆教程》系列的第九篇！在前面的几篇中，我们已经介绍了Python、numpy及pytorch的基本使用，进行了梯度及神经网络的实践并学习了激活函数和激活函数，在上一个教程中我们学习了优化算法。今天，我们将开始使用pytorch构建我们自己的神经网络。欢迎订阅专栏进行系统学习：深度学习保姆教程_tRNA做科研的博客-CSDN博客目录1.理解nn模块：(1)使用nn.Sequent
【机器学习】算法分类 CH3_CH2_CHO 什么？！是机器学习！！机器学习算法有监督学习无监督学习半监督学习强化学习
1、有监督学习1.1定义使用带标签的数据训练模型。有监督学习是机器学习中最常见的一种类型，它利用已知的输入特征和对应的输出标签来训练模型，使模型能够学习到特征与标签之间的映射关系。在训练过程中，模型会不断地调整自身的参数，以最小化预测值与真实标签之间的误差，从而提高预测的准确性。1.2回归问题1.2.1目标预测连续值。回归问题的目标是预测一个连续的数值结果，模型的输出是一个实数值。1.2.2解释回
Radiance Fields from VGGSfM和Mast3r:两种先进3D重建方法的比较与分析 2401_87458718 3d
VGGSfM和Mast3r:3D场景重建的新方向在计算机视觉和3D重建领域,如何从2D图像重建3D场景一直是一个充满挑战的研究课题。近年来,随着深度学习技术的发展,一些新的方法被提出并取得了显著的进展。本文将重点介绍两种最新的基于深度学习的3D重建方法:VGGSfM和Mast3r,并通过GaussianSplatting技术对它们的性能进行全面比较和分析。VGGSfM:基于视觉几何的深度结构运动恢
基于 PyTorch 的 MNIST 手写数字分类模型欣然～ pytorch 分类人工智能
一、概述本代码使用PyTorch框架构建了一个简单的神经网络模型，用于解决MNIST手写数字分类任务。代码主要包括数据的加载与预处理、神经网络模型的构建、损失函数和优化器的定义、模型的训练、评估以及最终模型的保存等步骤。二、依赖库torch：PyTorch深度学习框架的核心库，提供了张量操作、自动求导等功能。torch.nn：PyTorch的神经网络模块，包含了各种神经网络层、损失函数等。torc
使用 Baseten 部署和运行机器学习模型的指南 shuoac 机器学习人工智能 python
随着机器学习模型在各个行业中的广泛应用，如何高效地部署和运行这些模型成为一个关键问题。本文将介绍如何使用Baseten平台来部署和服务机器学习模型。Baseten是LangChain生态系统中的一个重要提供者，它提供了所需的基础设施来高效地运行模型。无论是开源模型如Llama2和Mistral，还是专有或经过微调的模型，Baseten都能在专用GPU上运行。技术背景介绍Baseten提供了一种不同
探索Google AI聊天模型的集成和使用 qahaj 人工智能 python
随着人工智能的飞速发展，GoogleAI的聊天模型提供了强大的自然语言处理能力，可以应用于多种场景中。本文将为你介绍如何通过GoogleAI和LangChain库来使用这些聊天模型。技术背景介绍GoogleAI提供了一系列强大的聊天模型，这些模型具备不同的功能和参数设置。它们不仅可以通过GoogleAI服务访问，还可以通过GoogleCloudVertexAI以企业级功能使用。在本文中，我们将重点
“租赁业务ERP+deepseek”模式的应用软件研究员汽车 DeepSeek 汽车租赁系统
汽车租赁业务从上世纪90年代发展至今，从传统的人工管理到软件辅助，随着互联网的发展，业务公司对汽车租赁系统提出了更高的要求，比如自助订单，业务推广、客户资质评估，车辆风控，风险预警等，又随着近期人工智能的出现，业务公司对业务系统的期望更高，期望都节约更多人工成本，让管理变得简单快捷高效和智能。所以就引发人们新的启发：“业务系统ERP+deepseek”，但业务系统ERP+deepseek能否满足业
高效快速教你DeepSeek如何进行本地部署并且可视化对话大富大贵7 程序员知识储备1 程序员知识储备2 程序员知识储备3 经验分享
科技文章：高效快速教你DeepSeek如何进行本地部署并且可视化对话摘要：随着自然语言处理（NLP）技术的进步，DeepSeek作为一款基于深度学习的语义搜索技术，广泛应用于文本理解、对话系统及信息检索等多个领域。本文将探讨如何高效快速地在本地部署DeepSeek，并结合可视化工具实现对话过程的监控与分析。通过详尽的步骤、案例分析与代码示例，帮助开发者更好地理解和应用DeepSeek技术。同时，本
机器学习——分类、回归、聚类、LASSO回归、Ridge回归（自用）代码的建筑师模型学习模型训练机器学习机器学习分类回归正则化项 LASSO Ridge 朴素
纠正自己的误区：机器学习是一个大范围，并不是一个小的方向，比如：线性回归预测、卷积神经网络和强化学都是机器学习算法在不同场景的应用。机器学习最为关键的是要有数据，也就是数据集名词解释：数据集中的一行叫一条样本或者实例，列名称为特征或者属性。样本的数量称为数据量，特征的数量称为特征维度机器学习常用库：Numpy和sklearn朴素的意思是特征的各条件都是相互独立的机器学习（模型、策略、算法）损失函数
量化交易系统中如何处理机器学习模型的训练和部署？ openwin_top 量化交易系统开发机器学习人工智能量化交易
microPythonPython最小内核源码解析NI-motion运动控制c语言示例代码解析python编程示例系列python编程示例系列二python的Web神器Streamlit如何应聘高薪职位量化交易系统中，机器学习模型的训练和部署需要遵循一套严密的流程，以确保模型的可靠性、性能和安全性。以下是详细描述以及相关的示例：1.数据收集和预处理数据收集在量化交易中，数据是最重要的资产。收集的数
不懂英语可以学编程吗?,不懂英文可以学编程吗 P5688346 人工智能
大家好，给大家分享一下英语不好能学python编程吗，很多人还不知道这一点。下面详细解释一下。现在让我们来看看！Sourcecodedownload:本文相关源码提到人工智能，就不得不提Python编程语言，大多数人觉得编程语言肯定会涉及到很多代码，满屏的英文字母，想想就头疼，觉得自己不会英语，肯定学不好Python，但是不会英语到底能不能够学习Python呢，下面小编给大家分析分析。其实各位想要
Python基于深度学习的动物图片识别技术的研究与实现 Java老徐 Python 毕业设计 python 深度学习开发语言深度学习的动物图片识别技术 Python动物图片识别技术
博主介绍：✌程序员徐师兄、7年大厂程序员经历。全网粉丝12w+、csdn博客专家、掘金/华为云/阿里云/InfoQ等平台优质作者、专注于Java技术领域和毕业项目实战✌文末获取源码联系精彩专栏推荐订阅不然下次找不到哟2022-2024年最全的计算机软件毕业设计选题大全：1000个热门选题推荐✅Java项目精品实战案例《100套》Java微信小程序项目实战《100套》感兴趣的可以先收藏起来，还有大家
【深度学习与大模型基础】第7章-特征分解与奇异值分解 lynn-66 深度学习与大模型基础算法机器学习人工智能
一、特征分解特征分解（EigenDecomposition）是线性代数中的一种重要方法，广泛应用于计算机行业的多个领域，如机器学习、图像处理和数据分析等。特征分解将一个方阵分解为特征值和特征向量的形式，帮助我们理解矩阵的结构和性质。1.特征分解的定义对于一个n×n的方阵A，如果存在一个非零向量v和一个标量λ，使得：则称λ为矩阵A的特征值，v为对应的特征向量。特征分解将矩阵A分解为：其中：Q是由特征
《当人工智能遇上广域网：跨越地理距离的通信变革》程序猿阿伟人工智能
在数字化时代，广域网作为连接全球信息的纽带，让数据能够在不同地区的网络之间流动。然而，地理距离给广域网数据传输带来诸多挑战，如高延迟、低带宽、信号衰减和不稳定等问题。幸运的是，飞速发展的人工智能技术为解决这些难题提供了新的方向，开启了广域网传输的新篇章。广域网传输面临的地理挑战广域网覆盖范围极为广泛，可连接不同城市、国家甚至跨越洲际，这使得数据传输要跨越漫长的地理距离。以跨国公司的广域网为例，其总
【论文阅读】Persistent Homology Captures the Generalization of Neural Networks Without A Validation Set 开心星人论文阅读论文阅读
将神经网络表征为加权的无环图，直接根据模型的权重矩阵构造PD。计算相邻batch的权重矩阵PD之间的距离。比较同调收敛性与神经网络的验证精度变化趋势摘要机器学习从业者通常通过监控模型的某些指标来估计其泛化误差，并在训练数值收敛之前停止训练，以防止过拟合。通常，这种误差度量或任务相关的指标是通过一个验证集（holdoutset）来计算的。因为这些数据没有直接用于更新模型参数，通常假设模型在验证集上的
震惊！ “深度学习”都在学习什么扉间798 深度学习学习人工智能
常见的机器学习分类算法俗话说三个臭皮匠胜过诸葛亮这里面集成学习就是将单一的算法弱弱结合算法融合用投票给特征值加权重AdaBoost集成学习算法通过迭代训练一系列弱分类器，给予分类错误样本更高权重，使得后续弱分类器更关注这些样本，然后将这些弱分类器线性组合成强分类器，提高整体分类性能。（一）投票机制投票是一种直观且常用的算法融合策略。在多分类问题中，假设有多个分类器对同一数据进行分类判断。每个分类器
【论文阅读】Availability Attacks Create Shortcuts 开心星人论文阅读论文阅读
还得重复读这一篇论文，有些地方理解不够透彻可用性攻击通过在训练数据中添加难以察觉的扰动，使数据无法被机器学习算法利用，从而防止数据被未经授权地使用。例如，一家私人公司未经用户同意就收集了超过30亿张人脸图像，用于构建商业人脸识别模型。为解决这些担忧，许多数据投毒攻击被提出，以防止数据被未经授权的深度模型学习。它们通过在训练数据中添加难以察觉的扰动，使模型无法从数据中学习太多信息，从而导致模型在未见
NLP高频面试题（十）——目前常见的几种大模型架构是啥样的 Chaos_Wang_ NLP常见面试题自然语言处理架构人工智能
深入浅出：目前常见的几种大模型架构解析随着Transformer模型的提出与发展，语言大模型迅速崛起，已经成为人工智能领域最为关注的热点之一。本文将为大家详细解析几种目前常见的大模型架构，帮助读者理解其核心差异及适用场景。1.什么是LLM（大语言模型）？LLM通常指参数量巨大、能够捕捉丰富语义信息的Transformer模型，它们通过海量的文本数据训练而成，能够实现高度逼真的文本生成、复杂的语言理
深度学习 | pytorch + torchvision + python 版本对应及环境安装 zfgfdgbhs 深度学习 python pytorch
目录一、版本对应二、安装命令（pip）1.版本（1）v2.5.1~v2.0.0（2）v1.13.1~v1.11.0（3）v1.10.1~v1.7.02.安装全过程（1）选择版本（2）安装结果参考文章一、版本对应下表来自pytorch的github官方文档：pytorch/vision:Datasets,TransformsandModelsspecifictoComputerVisionpytor
apache 安装linux windows 墙头上一根草 apache inux windows
linux安装Apache 有两种方式一种是手动安装通过二进制的文件进行安装，另外一种就是通过yum 安装，此中安装方式，需要物理机联网。以下分别介绍两种的安装方式通过二进制文件安装Apache需要的软件有apr,apr-util,pcre 1，安装 apr 下载地址：htt
fill_parent、wrap_content和match_parent的区别 Cb123456 match_parent fill_parent
fill_parent、wrap_content和match_parent的区别: 1）fill_parent 设置一个构件的布局为fill_parent将强制性地使构件扩展，以填充布局单元内尽可能多的空间。这跟Windows控件的dockstyle属性大体一致。设置一个顶部布局或控件为fill_parent将强制性让它布满整个屏幕。 2） wrap_conte
网页自适应设计天子之骄 html css 响应式设计页面自适应
网页自适应设计网页对浏览器窗口的自适应支持变得越来越重要了。自适应响应设计更是异常火爆。再加上移动端的崛起，更是如日中天。以前为了适应不同屏幕分布率和浏览器窗口的扩大和缩小，需要设计几套css样式，用js脚本判断窗口大小，选择加载。结构臃肿，加载负担较大。现笔者经过一定时间的学习，有所心得，故分享于此，加强交流，共同进步。同时希望对大家有所
[sql server] 分组取最大最小常用sql 一炮送你回车库 SQL Server
--分组取最大最小常用sql--测试环境if OBJECT_ID('tb') is not null drop table tb;gocreate table tb( col1 int, col2 int, Fcount int)insert into tbselect 11,20,1 union allselect 11,22,1 union allselect 1
ImageIO写图片输出到硬盘 3213213333332132 java image
package awt; import java.awt.Color; import java.awt.Font; import java.awt.Graphics; import java.awt.image.BufferedImage; import java.io.File; import java.io.IOException; import javax.imagei
自己的String动态数组宝剑锋梅花香 java 动态数组数组
数组还是好说，学过一两门编程语言的就知道，需要注意的是数组声明时需要把大小给它定下来，比如声明一个字符串类型的数组：String str[]=new String[10]; 但是问题就来了，每次都是大小确定的数组，我需要数组大小不固定随时变化怎么办呢？动态数组就这样应运而生，龙哥给我们讲的是自己用代码写动态数组，并非用的ArrayList 看看字符
pinyin4j工具类 darkranger .net
pinyin4j工具类Java工具类 2010-04-24 00:47:00 阅读69 评论0 字号：大中小引入pinyin4j-2.5.0.jar包: pinyin4j是一个功能强悍的汉语拼音工具包，主要是从汉语获取各种格式和需求的拼音，功能强悍，下面看看如何使用pinyin4j。本人以前用AscII编码提取工具，效果不理想，现在用pinyin4j简单实现了一个。功能还不是很完美，
StarUML学习笔记----基本概念 aijuans UML建模
介绍StarUML的基本概念，这些都是有效运用StarUML?所需要的。包括对模型、视图、图、项目、单元、方法、框架、模型块及其差异以及UML轮廓。模型、视与图（Model, View and Diagram） &
Activiti最终总结 avords Activiti id 工作流
1、流程定义ID：ProcessDefinitionId，当定义一个流程就会产生。 2、流程实例ID：ProcessInstanceId，当开始一个具体的流程时就会产生，也就是不同的流程实例ID可能有相同的流程定义ID。 3、TaskId，每一个userTask都会有一个Id这个是存在于流程实例上的。 4、TaskDefinitionKey和（ActivityImpl activityId
从省市区多重级联想到的，react和jquery的差别 bee1314 jquery UI react
在我们的前端项目里经常会用到级联的select，比如省市区这样。通常这种级联大多是动态的。比如先加载了省，点击省加载市，点击市加载区。然后数据通常ajax返回。如果没有数据则说明到了叶子节点。针对这种场景，如果我们使用jquery来实现，要考虑很多的问题，数据部分，以及大量的dom操作。比如这个页面上显示了某个区，这时候我切换省，要把市重新初始化数据，然后区域的部分要从页面
Eclipse快捷键大全 bijian1013 java eclipse 快捷键
Ctrl+1 快速修复(最经典的快捷键,就不用多说了)Ctrl+D: 删除当前行 Ctrl+Alt+↓ 复制当前行到下一行(复制增加)Ctrl+Alt+↑ 复制当前行到上一行(复制增加)Alt+↓ 当前行和下面一行交互位置(特别实用,可以省去先剪切,再粘贴了)Alt+↑ 当前行和上面一行交互位置(同上)Alt+← 前一个编辑的页面Alt+→ 下一个编辑的页面(当然是针对上面那条来说了)Alt+En
js 笔记函数征客丶 JavaScript
一、函数的使用 1.1、定义函数变量 var vName = funcation(params){ } 1.2、函数的调用函数变量的调用： vName(params); 函数定义时自发调用：(function(params){})(params); 1.3、函数中变量赋值 var a = 'a'; var ff
【Scala四】分析Spark源代码总结的Scala语法二 bit1129 scala
1. Some操作在下面的代码中，使用了Some操作：if (self.partitioner == Some(partitioner))，那么Some(partitioner)表示什么含义？首先partitioner是方法combineByKey传入的变量， Some的文档说明： /** Class `Some[A]` represents existin
java 匿名内部类 BlueSkator java匿名内部类
组合优先于继承 Java的匿名类，就是提供了一个快捷方便的手段，令继承关系可以方便地变成组合关系继承只有一个时候才能用，当你要求子类的实例可以替代父类实例的位置时才可以用继承。在Java中内部类主要分为成员内部类、局部内部类、匿名内部类、静态内部类。内部类不是很好理解，但说白了其实也就是一个类中还包含着另外一个类如同一个人是由大脑、肢体、器官等身体结果组成，而内部类相
盗版win装在MAC有害发热，苹果的东西不值得买，win应该不用 ljy325 游戏 apple windows XP OS
Mac mini 型号: MC270CH-A RMB:5,688 Apple 对windows的产品支持不好,有以下问题: 1.装完了xp,发现机身很热虽然没有运行任何程序！貌似显卡跑游戏发热一样，按照那样的发热量,那部机子损耗很大,使用寿命受到严重的影响! 2.反观安装了Mac os的展示机，发热量很小，运行了1天温度也没有那么高 &nbs
读《研磨设计模式》-代码笔记-生成器模式-Builder bylijinnan java 设计模式
声明：本文只为方便我个人查阅和理解，详细的分析以及源代码请移步原作者的博客http://chjavach.iteye.com/ /** * 生成器模式的意图在于将一个复杂的构建与其表示相分离，使得同样的构建过程可以创建不同的表示（GoF） * 个人理解： * 构建一个复杂的对象，对于创建者（Builder）来说，一是要有数据来源(rawData)，二是要返回构
JIRA与SVN插件安装 chenyu19891124 SVN jira
JIRA安装好后提交代码并要显示在JIRA上，这得需要用SVN的插件才能看见开发人员提交的代码。 1.下载svn与jira插件安装包，解压后在安装包(atlassian-jira-subversion-plugin-0.10.1) 2.解压出来的包里下的lib文件夹下的jar拷贝到(C:\Program Files\Atlassian\JIRA 4.3.4\atlassian-jira\WEB
常用数学思想方法 comsci 工作
对于搞工程和技术的朋友来讲，在工作中常常遇到一些实际问题，而采用常规的思维方式无法很好的解决这些问题，那么这个时候我们就需要用数学语言和数学工具，而使用数学工具的前提却是用数学思想的方法来描述问题。。下面转帖几种常用的数学思想方法，仅供学习和参考函数思想　　把某一数学问题用函数表示出来，并且利用函数探究这个问题的一般规律。这是最基本、最常用的数学方法
pl/sql集合类型 daizj oracle 集合 type pl/sql
--集合类型 /* 单行单列的数据，使用标量变量单行多列数据，使用记录单列多行数据，使用集合（。。。） *集合：类似于数组也就是。pl/sql集合类型包括索引表（pl/sql table）、嵌套表（Nested Table）、变长数组（VARRAY）等 */ /* --集合方法 &n
[Ofbiz]ofbiz初用 dinguangx 电商 ofbiz
从github下载最新的ofbiz（截止2015-7-13），从源码进行ofbiz的试用 1. 加载测试库 ofbiz内置derby，通过下面的命令初始化测试库 ./ant load-demo (与load-seed有一些区别) 2. 启动内置tomcat ./ant start 或 ./startofbiz.sh 或 java -jar ofbiz.jar &
结构体中最后一个元素是长度为0的数组 dcj3sjt126com c gcc
在Linux源代码中，有很多的结构体最后都定义了一个元素个数为0个的数组，如/usr/include/linux/if_pppox.h中有这样一个结构体： struct pppoe_tag { __u16 tag_type; __u16 tag_len; &n
Linux cp 实现强行覆盖 dcj3sjt126com linux
发现在Fedora 10 /ubutun 里面用cp -fr src dest，即使加了-f也是不能强行覆盖的，这时怎么回事的呢？一两个文件还好说，就输几个yes吧，但是要是n多文件怎么办，那还不输死人呢？下面提供三种解决办法。方法一我们输入alias命令，看看系统给cp起了一个什么别名。 [root@localhost ~]# aliasalias cp=’cp -i’a
Memcached(一)、HelloWorld frank1234 memcached
一、简介高性能的架构离不开缓存，分布式缓存中的佼佼者当属memcached，它通过客户端将不同的key hash到不同的memcached服务器中，而获取的时候也到相同的服务器中获取，由于不需要做集群同步，也就省去了集群间同步的开销和延迟，所以它相对于ehcache等缓存来说能更好的支持分布式应用，具有更强的横向伸缩能力。二、客户端选择一个memcached客户端，我这里用的是memc
Search in Rotated Sorted Array II hcx2013 search
Follow up for "Search in Rotated Sorted Array":What if duplicates are allowed? Would this affect the run-time complexity? How and why? Write a function to determine if a given ta
Spring4新特性——更好的Java泛型操作API jinnianshilongnian spring4 generic type
Spring4新特性——泛型限定式依赖注入 Spring4新特性——核心容器的其他改进 Spring4新特性——Web开发的增强 Spring4新特性——集成Bean Validation 1.1(JSR-349)到SpringMVC Spring4新特性——Groovy Bean定义DSL Spring4新特性——更好的Java泛型操作API Spring4新
CentOS安装JDK liuxingguome centos
1、行卸载原来的： [root@localhost opt]# rpm -qa | grep java tzdata-java-2014g-1.el6.noarch java-1.7.0-openjdk-1.7.0.65-2.5.1.2.el6_5.x86_64 java-1.6.0-openjdk-1.6.0.0-11.1.13.4.el6.x86_64 [root@localhost
二分搜索专题2-在有序二维数组中搜索一个元素 OpenMind 二维数组算法二分搜索
1,设二维数组p的每行每列都按照下标递增的顺序递增。用数学语言描述如下：p满足 (1),对任意的x1，x2，y，如果x1<x2,则p(x1,y)<p(x2,y); (2),对任意的x，y1,y2, 如果y1<y2,则p(x,y1)<p(x,y2); 2,问题：给定满足1的数组p和一个整数k，求是否存在x0,y0使得p(x0,y0)=k? 3,算法分析： (
java 随机数 Math与Random SaraWon java Math Random
今天需要在程序中产生随机数，知道有两种方法可以使用，但是使用Math和Random的区别还不是特别清楚，看到一篇文章是关于的，觉得写的还挺不错的，原文地址是 http://www.oschina.net/question/157182_45274?sort=default&p=1#answers 产生1到10之间的随机数的两种实现方式： //Math Math.roun
oracle创建表空间 tugn oracle
create temporary tablespace TXSJ_TEMP tempfile 'E:\Oracle\oradata\TXSJ_TEMP.dbf' size 32m autoextend on next 32m maxsize 2048m extent m
使用Java8实现自己的个性化搜索引擎 yangshangchuan java superword 搜索引擎 java8 全文检索
需要对249本软件著作实现句子级别全文检索，这些著作均为PDF文件，不使用现有的框架如lucene，自己实现的方法如下： 1、从PDF文件中提取文本，这里的重点是如何最大可能地还原文本。提取之后的文本，一个句子一行保存为文本文件。 2、将所有文本文件合并为一个单一的文本文件，这样，每一个句子就有一个唯一行号。 3、对每一行文本进行分词，建立倒排表，倒排表的格式为：词=包含该词的总行数N=行号