分析语音数据增强及python实现

一、概述

音频时域波形具有以下特征：音调，响度，质量。我们在进行数据增强时，最好只做一些小改动，使得增强数据和源数据存在较小差异即可，切记不能改变原有数据的结构，不然将产生“脏数据”，通过对音频数据进行数据增强，能有助于我们的模型避免过度拟合并变得更加通用。

我发现对声波的以下改变是有用的：Noise addition（增加噪音）、Add reverb（增加混响）、Time shifting（时移）、Pitch shifting（改变音调）和Time stretching（时间拉伸）。

本章需要使用的python库：

matplotlib：绘制图像
librosa：音频数据处理
numpy：矩阵数据处理

使用先画出原始语音数据的语谱图和波形图

import librosa
import numpy as np
import matplotlib.pyplot as plt

plt.rcParams['font.sans-serif'] = ['SimHei']  # 用来正常显示中文标签
plt.rcParams['axes.unicode_minus'] = False  # 用来正常显示符号
fs = 16000

wav_data, _ = librosa.load("./p225_001.wav", sr=fs, mono=True)

# ########### 画图
plt.subplot(2, 2, 1)
plt.title("语谱图", fontsize=15)
plt.specgram(wav_data, Fs=16000, scale_by_freq=True, sides='default', cmap="jet")
plt.xlabel('秒/s', fontsize=15)
plt.ylabel('频率/Hz', fontsize=15)

plt.subplot(2, 2, 2)
plt.title("波形图", fontsize=15)
time = np.arange(0, len(wav_data)) * (1.0 / fs)
plt.plot(time, wav_data)
plt.xlabel('秒/s', fontsize=15)
plt.ylabel('振幅', fontsize=15)

plt.tight_layout()
plt.show()

二、加噪

添加的噪声为均值为0，标准差为1的高斯白噪声，有两种方法对数据进行加噪

2.1、第一种：控制噪声因子

def add_noise1(x, w=0.004):
    # w：噪声因子
    output = x + w * np.random.normal(loc=0, scale=1, size=len(x))
    return output

Augmentation = add_noise1(x=wav_data, w=0.004)

2.2、第二种：控制信噪比

通过信噪比的公式推导出噪声。

def add_noise2(x, snr):
    # snr：生成的语音信噪比
    P_signal = np.sum(abs(x) ** 2) / len(x)  # 信号功率
    P_noise = P_signal / 10 ** (snr / 10.0)  # 噪声功率
    return x + np.random.randn(len(x)) * np.sqrt(P_noise)

Augmentation = add_noise2(x=wav_data, snr=50)

三、加混响

我这里使用的是Image Source Method（镜像源方法）来实现语音加混响，我想用两种方法来给大家实现，第一种是直接调用python库——Pyroomacoustics来实现音频加混响，第二种就是按照公式推导一步一步来实现，两种效果一样，想看细节的可以参考第二种方法，只想开始实现效果的可以只看第一种方法：

3.1、方法一：Pyroomacoustics实现音频加混响

首先需要安装Pyroomacoustics，这个库非常强大，感兴趣也可以多看看其他API接口

pip install Pyroomacoustics

步骤：

1.创建房间（定义房间大小、所需的混响时间、墙面材料、允许的最大反射次数、）

2.在房间内创建信号源

3.在房间内放置麦克风

4.创建房间冲击响应

5.模拟声音传播

# -*- coding:utf-8 -*-
import pyroomacoustics as pra
import numpy as np
import matplotlib.pyplot as plt
import librosa

# 1、创建房间
# 所需的混响时间和房间的尺寸
rt60_tgt = 0.5  # 所需的混响时间，秒
room_dim = [9, 7.5, 3.5]  # 我们定义了一个9m x 7.5m x 3.5m的房间，米

# 我们可以使用Sabine's公式来计算壁面能量吸收和达到预期混响时间所需的ISM的最大阶数(RT60，即RIR衰减60分贝所需的时间)
e_absorption, max_order = pra.inverse_sabine(rt60_tgt, room_dim)    # 返回 墙壁吸收的能量 和 允许的反射次数
# 我们还可以自定义 墙壁材料 和 最大反射次数
# m = pra.Material(energy_absorption="hard_surface")    # 定义 墙的材料，我们还可以定义不同墙面的的材料
# max_order = 3

room = pra.ShoeBox(room_dim, fs=16000, materials=pra.Material(e_absorption), max_order=max_order)

# 在房间内创建一个位于[2.5,3.73,1.76]的源，从0.3秒开始向仿真中发出wav文件的内容
audio, _ = librosa.load("speech.wav",sr=16000)  # 导入一个单通道语音作为源信号 source signal
room.add_source([2.5, 3.73, 1.76], signal=audio, delay=0.3)

# 3、在房间放置麦克风
# 定义麦克风的位置：(ndim, nmics) 即每个列包含一个麦克风的坐标
# 在这里我们创建一个带有两个麦克风的数组，
# 分别位于[6.3,4.87,1.2]和[6.3,4.93,1.2]。
mic_locs = np.c_[
    [6.3, 4.87, 1.2],  # mic 1
    [6.3, 4.93, 1.2],  # mic 2
]

room.add_microphone_array(mic_locs)     # 最后将麦克风阵列放在房间里

# 4、创建房间冲击响应（Room Impulse Response）
room.compute_rir()

# 5、模拟声音传播，每个源的信号将与相应的房间脉冲响应进行卷积。卷积的输出将在麦克风上求和。
room.simulate()

# 保存所有的信号到wav文件
room.mic_array.to_wav("./guitar_16k_reverb_ISM.wav", norm=True, bitdepth=np.float32,)

# 测量混响时间
rt60 = room.measure_rt60()
print("The desired RT60 was {}".format(rt60_tgt))
print("The measured RT60 is {}".format(rt60[1, 0]))


plt.figure()
# 绘制其中一个RIR. both can also be plotted using room.plot_rir()
rir_1_0 = room.rir[1][0]    # 画出 mic 1和 source 0 之间的 RIR
plt.subplot(2, 1, 1)
plt.plot(np.arange(len(rir_1_0)) / room.fs, rir_1_0)
plt.title("The RIR from source 0 to mic 1")
plt.xlabel("Time [s]")

# 绘制 microphone 1 处接收到的信号
plt.subplot(2, 1, 2)
plt.plot(np.arange(len(room.mic_array.signals[1, :])) / room.fs, room.mic_array.signals[1, :])
plt.title("Microphone 1 signal")
plt.xlabel("Time [s]")

plt.tight_layout()
plt.show()

room = pra.ShoeBox(
    room_dim,
    fs=16000,
    materials=pra.Material(e_absorption),
    max_order=3,
    ray_tracing=True,
    air_absorption=True,
)

# 激活射线追踪
room.set_ray_tracing()

room.simulate(reference_mic=0, snr=10)      # 控制信噪比

3.2、方法二：Image Source Method 算法讲解

从这里要讲算法和原理了，

代码参考：matlab版本：RIR-Generator，python版本：rir-generator

镜像源法简介：

将反射面等效为一个虚像，或者说镜像。比如说，在一个开放空间里有一面平整墙面，那么一个声源可以等效为2两个声源；一个开放空间里有两面垂直的平整墙面，那么一个声源可以等效为4个；同理三面的话是8个。原理上就是这样，但是封闭的三维空间里情况有那么点复杂，

一般来说，家里的空房间可以一定程度上近似为矩形盒子，假设房间尺寸为：

元素大小分别代表长宽高，而声源的三维坐标为

麦克风的三维坐标为

镜像声源$(i,j,k)$到麦克风距离在三个坐标轴上的位置为

那么声源$(i,j,k)$距离麦克风的距离为

相对于直达声的到达延迟时间为

其中$c$为声速，$r$为声源到麦克风的直线距离。那么，混响效果等效为不同延迟的信号的叠加，即混响效果可以表示为一个FIR滤波器与信号源卷积的形式，此滤波器可写为如下形式

滤波器的抽头系数与镜面的反射系数与距离相关，如果每个面的反射系数不同则形式略复杂。详细代码还是要看RIR-Generator，我这里只做抛转引玉，写一个最简单的。

模拟镜像源：

房间尺寸(m)：4 X 4 X 3

声源坐标(m)：2 X 2 X 0

麦克风坐标(m)：2 X 2 X 1.5

混响时间(s)：0.2

RIR长度：512

clc;clear;
c = 340;                    % 声速 (m/s)
fs = 16000;                 % Sample frequency (samples/s)
r = [2 2 1.5];              % 麦克风位置 [x y z] (m)
s = [2 2 0];              % 扬声器位置 [x y z] (m)
L = [4 4 3];                % 房间大小 [x y z] (m)
beta = 0.2;                 % 混响时间 (s)
n = 512;                   % RIR长度

h = rir_generator(c, fs, r, s, L, beta, n);
disp(size(h))   % (1,4096)

[speech, fs] = audioread("./test_wav/p225_001.wav");
disp(size(speech)); % (46797,1)

y = conv(speech', h);
disp(length(y))


% 开始画图
figure('color','w');    % 背景色设置成白色
subplot(3,1,1)
plot(h)
title("房间冲击响应 RIR","FontSize",14)

subplot(3,2,3)
plot(speech)
title("原语音波形","FontSize",14)

subplot(3,2,4)
plot(y)
title("加混响语音波形","FontSize",14)

subplot(3,2,5)
specgram(speech,512,fs,512,256);
title("原语音频谱","FontSize",14)

subplot(3,2,6)
specgram(y,512,fs,512,256);
title("加混响语音频谱","FontSize",14)

audiowrite("./test_wav/matlab_p225_001_reverber.wav",y,fs)

四、生成指定SER的混响

SER的公式为

其中E是统计期望操作，$s(n)$是近端语音，$d(n)$是远端回声，

由于我们需要根据指定的SER求混响信号，并且近端语音和远端混响都是已知的，我们只需要求得一个系数，来调整回声信号的能量大小，与远端混响相乘即可得我们想要的混响语音，即调整后的回声信号为$kd(n)$

根据以上公式，可以推导出$k$的值

最终$kd(n)$即我们所求的指定SER的混响。

def add_echo_ser(near_speech, far_echo, SER):
    """根据指定的SER求回声
    :param near_speech: 近端语音
    :param far_echo: 远端回声
    :param SER: 指定的SER
    :return: 指定SER的回声
    """
    p_near_speech = np.mean(near_speech ** 2)  # 近端语音功率
    p_far_echo = np.mean(far_echo ** 2)  # 远端回声功率

    k = np.sqrt(p_near_speech / (10 ** (SER / 10)) / p_far_echo)

    return k * far_echo

五、波形位移

语音波形移动使用numpy.roll函数向右移动shift距离

numpy.roll(a,shift,axis=None)

参数：

a：数组
shift：滚动的长度
axis：滚动的维度。0为垂直滚动，1为水平滚动，参数为None时，会先将数组扁平化，进行滚动操作后，恢复原始形状

x = np.arange(10)
# array([0, 1, 2, 3, 4, 5, 6, 7, 8, 9])

print(np.roll(x, 2))
# array([8, 9, 0, 1, 2, 3, 4, 5, 6, 7])

波形位移函数：

def time_shift(x, shift):
    # shift：移动的长度
    return np.roll(x, int(shift))

Augmentation = time_shift(wav_data, shift=fs//2)

六、波形拉伸

在不影响音高的情况下改变声音的速度 / 持续时间。这可以使用librosa的time_stretch函数来实现。

def time_stretch(x, rate):
    # rate：拉伸的尺寸，
    # rate > 1 加快速度
    # rate < 1 放慢速度
    return librosa.effects.time_stretch(x, rate)

Augmentation = time_stretch(wav_data, rate=2)

七、音高修正（Pitch Shifting）

音高修正只改变音高而不影响音速，我发现-5到5之间的步数更合适

def pitch_shifting(x, sr, n_steps, bins_per_octave=12):
    # sr: 音频采样率
    # n_steps: 要移动多少步
    # bins_per_octave: 每个八度音阶(半音)多少步
    return librosa.effects.pitch_shift(x, sr, n_steps, bins_per_octave=bins_per_octave)

# 向上移三音（如果bins_per_octave为12，则六步）
Augmentation = pitch_shifting(wav_data, sr=fs, n_steps=6, bins_per_octave=12)
# 向上移三音（如果bins_per_octave为24，则3步）
Augmentation = pitch_shifting(wav_data, sr=fs, n_steps=3, bins_per_octave=24)
# 向下移三音（如果bins_per_octave为12，则六步）
Augmentation = pitch_shifting(wav_data, sr=fs, n_steps=-6, bins_per_octave=12)

还有写没有跑通，但是总感觉有些价值的代码，记录在这里：

py-RIR-Generator（没跑通的原因是我是window系统）gpuRIR（这个我跑通了，但是需要较大的计算资源）去github找代码的时候，不一定要搜索“回声”，“混响”，也可以通过搜索"RIR"同样可以得到想要的结果

本文画图代码：

# Author:凌逆战
# -*- coding:utf-8 -*-
import matplotlib.pyplot as plt
import librosa
import numpy as np

plt.rcParams['font.sans-serif']=['SimHei'] #用来正常显示中文标签
plt.rcParams['axes.unicode_minus']=False #用来正常显示符号


y1, _ = librosa.load("./speech.wav", sr=16000)
y2, _ = librosa.load("./guitar_16k_reverb_ISM.wav", sr=16000)


plt.subplot(2, 2, 1)
plt.specgram(y1, Fs=16000, scale_by_freq=True, sides='default', cmap="jet")
plt.title("语谱图", fontsize=13)
plt.xlabel('时间/s', fontsize=13)
plt.ylabel('频率/Hz', fontsize=13)

plt.subplot(2, 2, 2)
plt.plot(np.arange(len(y1)) / 16000, y1)
plt.title("波形图", fontsize=13)
plt.xlabel('时间/s', fontsize=13)
plt.ylabel('振幅', fontsize=13)

plt.subplot(2, 2, 3)
plt.specgram(y2, Fs=16000, scale_by_freq=True, sides='default', cmap="jet")
plt.title("语谱图(加混响)", fontsize=13)
plt.xlabel('时间/s', fontsize=13)
plt.ylabel('频率/Hz', fontsize=13)


plt.subplot(2, 2, 4)
plt.plot(np.arange(len(y2)) / 16000, y2)
plt.title("波形图(加混响)", fontsize=13)
plt.xlabel('时间/s', fontsize=13)
plt.ylabel('振幅', fontsize=13)

plt.tight_layout()
plt.show()

以上就是分析语音数据增强及python实现的详细内容，更多关于语音数据增强 python实现的资料请关注脚本之家其它相关文章！

Linux驱动学习--DRM框架介绍及基于DRM框架的HDMI开发文艺小少年 linux android hdmi 驱动程序 drm
目录一、引言二、DRM框架介绍三、DRM框架的使用四、源码分析一、引言Android4开始，hdmi等视频输出框架开始由framebuffer想DRM迁移，今天我们就来简单分析下DRM框架二、DRM框架介绍DRM是一个内核级的设备驱动，具体的说是显卡驱动的一种架构源码位置因为Linuxkernel内部接口和数据结构可能随时发生变化，所以DRI模块要针对特定的内核版本进行编译。kernel2.6.2
NL2SQL技术方案系列(6)：金融领域知识检索，NL2SQL技术方案以及行业案例实战讲解4 汀、人工智能 LLM工业级落地实践人工智能 NL2SQL LLM 自然语言处理 copilot 知识检索语义搜索
NL2SQL技术方案系列(6)：金融领域NL2SQL技术方案以及行业案例实战讲解4NL2SQL基础系列(1)：业界顶尖排行榜、权威测评数据集及LLM大模型（SpidervsBIRD）全面对比优劣分析[Text2SQL、Text2DSL]NL2SQL基础系列(2)：主流大模型与微调方法精选集，Text2SQL经典算法技术回顾七年发展脉络梳理NL2SQL进阶系列(1)：DB-GPT-Hub、SQLco
Hive 窗口函数与分析函数深度解析：开启大数据分析的新维度自节码大数据 hive 数据分析 hadoop
Hive窗口函数与分析函数深度解析：开启大数据分析的新维度在当今大数据蓬勃发展的时代，Hive作为一款强大的数据仓库工具，其窗口函数和分析函数犹如一把把精巧的手术刀，助力数据分析师们精准地剖析海量数据，挖掘出深藏其中的价值宝藏。本文将带领大家深入探索HiveQL中这些神奇函数的奥秘，从版本演进、功能特性到丰富多样的实际应用示例，全方位地呈现它们在大数据处理领域的卓越魅力。一、版本回溯与知识宝库指引
当下是否入行AI ? 一场关于未来的赌注与机遇 dami_king 随笔人工智能
当下是否入行AI：一场关于未来的赌注与机遇在科技的浪潮中，人工智能（AI）无疑是最为汹涌的一波。它不仅改变了我们与机器互动的方式，还重塑了各行各业的面貌。面对这样的变革，许多人站在十字路口犹豫不决——现在进入AI领域还来得及吗？这个问题的答案，并非简单的“是”或“否”。今天，让我们一起深入探讨这个话题，看看对于想要投身AI的人来说，当下是不是一个好的时机。AI行业的现状与发展2024年，AI已经从
JAVA之原型模式程序研 java 原型模式 java
原型模式（PrototypePattern）属于创建型模式，它允许一个对象通过复制自身来创建一个新的对象，而无需通过构造函数创建。这种模式特别适用于创建复杂对象时，避免构造函数的复杂性，同时提高性能。以下是关于原型模式的详细介绍、JAVA代码实现、运行结果及注释。一、原型模式概述定义原型模式：用原型实例指定创建对象的种类，并通过复制这些原型创建新的对象。主要角色（1）抽象原型（Prototype）
频域增强通道注意力机制EFCAM模型详解及代码复现呆头鹅AI工作室深度学习算法详解及代码复现深度学习人工智能神经网络 conda python
背景与动机在深度学习领域，如何有效处理时间序列数据一直是一个重要的研究方向。近年来，频域分析技术在时间序列处理中展现出了巨大潜力，特别是离散余弦变换（DCT）因其能够高效捕捉低频信息并避免高频噪声干扰而受到广泛关注。FECAM模型的开发正是基于这一背景，旨在结合频域分析和通道注意力机制，以提高模型对时间序列数据的特征提取和表示能力。通过这种创新方法，FECAM模型能够更有效地捕捉时间序列中的关键特
《Python实现简易DDoS压力测试脚本：原理、代码与使用警示》乐茵安全 python_study chrome 前端 python 网络安全
DDoS测试脚本声明：本文所涉及代码仅供学习使用，任何人利用此造成的一切后果与本人无关源码import requestsimport threading# 目标URLtarget_url = "http://47.121.xxx.xxx/"# 发送请求的函数def send_request(): while True: try: response = re
关于固定随机种子，模型每次结果也不一样的问题可能解决方法小白每天学一点 pytorch 深度学习人工智能 python
问题描述最近一直被“固定随机种子，模型每次结果也不一样”这个问题困扰，我的模型同样的代码每次跑的结果都不一样，而且还忽高忽低，有可能有模型本身架构不合适的问题（按理来说，即便有变动也不会差别太大），忽略掉每次结果差距较大这个问题，先来解决每次结果都不一样这个问题。原因分析：可以按照以下原因顺序检查模型：1.没有设置随机种子。2.虽然设置了随机种子，但随机初始化参数也会有变动。3.若第2中情况已检查
MyBatis缓存原理及插件实现小娄写码 mybatis 缓存 spring
目录MyBatis缓存原理缓存的工作机制一级缓存：二级缓存：MyBatis插件实现MyBatis缓存原理缓存的工作机制如果会话查询了一条数据，此数据会存入一级缓存；若会话被关闭或提交，则，其数据转存入二级缓存；新会话若再次查询之前查询过的数据，就从二级缓存中获取；不同的Mapper，查询出来的数据会被放置到不同的二级缓存中。一级缓存：SqlSession级别的，也称为本地缓存一级缓存的本质，就是：
书籍推荐 —— UML和模式应用（原书第3版） blackcat王文俊心得体会 uml 分析设计
出版社：机械工业出版社ISBN：9787111186823版次：1商品编码：13745494品牌：机工出版包装：平装丛书名：软件工程技术丛书开本：16开出版时间：2022-06-01用纸：胶版纸页数：524内容简介■关于面向对象分析与设计及UML的经典之作。■全面升级到UML2和新的迭代/敏捷实践。■增加了全新的案例研究，阐述了大量关键思想。无论对于专业人士还是教师来说，本书都堪称经典之作。本书介
阿里云通义开源首个推理步骤评估标准，探索AI推理模型新路径量子位
1月16日，阿里云通义开源全新的数学推理过程奖励模型Qwen2.5-Math-PRM，72B及7B尺寸模型性能均大幅超越同类开源过程奖励模型；在识别推理错误步骤能力上，Qwen2.5-Math-PRM以7B的小尺寸就超越了GPT-4o。同时，通义团队还开源首个步骤级的评估标准ProcessBench，填补了大模型推理过程错误评估的空白。在当前大模型推理过程中，不时存在逻辑错误或编造看似合理的推理步
【YashanDB知识库】YMP校验从yashandb同步到oracle的数据时，字段timestamp(0)出现不一致数据库
本文内容来自YashanDB官网，原文内容请见https://www.yashandb.com/newsinfo/7901520.html?templateId=171...问题现象在YMP校验过程中，从yashandb同步到oracle的数据时，字段timestamp(0)出现不一致问题的风险及影响YMP校验出现数据内容不一致问题影响的版本yashandb版本：23.2.7.101YMP版本：2
手把手教你学simulink（79.1）--智能家居窗帘与窗户控制场景实例：基于Simulink设计和仿真一个智能窗帘与窗户控制系统，以实现对室内环境的有效管理小蘑菇二号手把手教你学 MATLAB 专栏手把手教你学 Simulink matlab simulink
目录智能窗帘与窗户控制系统场景下的天气适应性操作建模项目实例项目背景介绍系统架构1.传感器模块(Sensors)2.控制器模块(Controller)3.执行器模块(Actuator)4.通信模块(Communication)仿真实现步骤1.创建新的Simulink模型2.添加传感器模块光照传感器温度传感器天气传感器在Simulink中实现传感器模块3.添加控制器模块天气分析算法决策算法在Simu
基于JavaScript的网页设计案例分析：打造现代化、交互性强的网站体验冷夜雨. javascript
引言随着互联网的快速发展，网页设计的要求也在不断提升。从最初的静态页面到如今的动态、交互式网页，JavaScript作为一种重要的前端开发语言，已成为现代网页设计中不可或缺的一部分。它能够为网页带来更强的交互性、灵活性和动态效果，不仅提升用户体验，也能在设计过程中实现更复杂的功能。本文将通过一个具体的JavaScript网页设计案例，来展示如何利用JavaScript打造现代化、交互性强的网站，并
Python网络爬虫入门教程：从抓取数据到应用实现冷夜雨. python
引言在大数据时代，信息就是力量。各种网站每天产生着海量的数据，这些数据中蕴藏着巨大的商业价值和研究价值。如何快速、自动化地从互联网上获取这些信息，成为了数据科学、人工智能、市场分析等领域中的一个重要课题。Python，作为一门易于学习且功能强大的编程语言，其丰富的库和工具使得构建网络爬虫变得非常简单。网络爬虫（WebScraper）是一种自动化程序，用来从网页中提取信息。无论是用于数据分析、竞争对
编程语言大揭秘：各显神通的编程世界冷夜雨. python java c++c#javascript
在当今数字化的时代，编程语言犹如一把把神奇的钥匙，打开了通往不同技术领域的大门。从网页开发到人工智能，从数据分析到游戏制作，每一种编程语言都有其独特的优势与适用场景。今天，就让我们一同深入探索几种主流编程语言的奥秘，看看在什么情况下它们能发挥最大的威力。Python：万能胶水，快速开发的利器Python以其简洁、易读的语法著称，仿佛是用自然语言编写代码一般，新手程序员也能快速上手。它拥有庞大且丰富
Linux配置网卡、创建用户赋予sudo权限、互信息等基本操作
Linux基本操作指南：配置网卡、创建用户赋予sudo权限与互信息计算在Linux系统中，网络配置、用户管理和信息分析是日常运维和开发中不可或缺的部分。本文将详细介绍如何配置网卡、创建用户并赋予sudo权限，以及计算互信息的基本操作，帮助您高效管理和分析系统资源。配置网卡在Linux系统中，配置网卡是连接网络的基础操作。以下步骤以配置eth0网卡为例，说明如何设置静态IP地址。1.编辑网卡配置文件
MDX语言的数据库交互 Linux520小飞鱼包罗万象 golang 开发语言后端
使用MDX语言进行数据库交互的深入探讨引言在当今数据驱动的时代，数据分析和数据挖掘的需求不断增加。多维数据分析工具和语言应运而生，其中MDX（多维表达式，MultidimensionalExpressions）便是一种非常重要的工具。MDX主要用于查询多维数据集（如OLAP数据立方体），在商业智能和数据仓库领域得到了广泛应用。本文将深入探讨MDX的基本概念、语法、应用场景以及与其他数据库交互的方式
【vLLM 学习】安装
vLLM是一款专为大语言模型推理加速而设计的框架，实现了KV缓存内存几乎零浪费，解决了内存管理瓶颈问题。更多vLLM中文文档及教程可访问→https://vllm.hyper.ai/vLLM是一个Python库，包含预编译的C++和CUDA(12.1)二进制文件。依赖环境操作系统：LinuxPython：3.8-3.12GPU：计算能力7.0或更高（例如V100、T4、RTX20xx、A100、L
冷启动性能分析优化实践 harmonyos
课程简介本课程是【HarmonyOSTechTalk】的第26课。本次交流聚焦于鸿蒙应用的冷启动环节。冷启动作为应用开启的初始关键阶段，其相关性能指标直接影响用户的第一印象与使用体验，涵盖启动时间、资源加载速度等多方面要素。常见分析思路则犹如一把钥匙，为开发者开启深入探究冷启动问题之门，可从系统环境到应用代码逻辑进行剖析。而实践优化方案更是本次交流的核心所在，通过诸如预加载资源、优化代码结构等一系
AppFreeze与资源泄漏能力开放及常见问题定位方法介绍 harmonyos
课程简介本课程是【HarmonyOSTechTalk】的第23课。本次议题围绕HarmonyOS应用开发的关键检测能力展开。appfreeze应用卡顿检测能力是保障应用流畅性的重要手段，通过对其深入了解，可及时发现并解决卡顿问题。故障日志规格为问题排查提供了重要依据，结合通用定位思路，能快速锁定故障源。同时，针对句柄、线程、内存泄漏检测能力的介绍，给予开发者全面的检测工具。详细的日志信息及各泄漏类
navicate远程mysql时报错： connection isbeing used
在使用Navicat远程连接MySQL时遇到错误提示"Connectionisbeingused"，通常是由于连接池中的连接未正确释放所导致。以下是详细的解决方法，帮助您排查并解决此问题：1.重启Navicat步骤说明：关闭当前打开的Navicat应用程序。等待几秒钟后，重新启动Navicat。尝试重新连接MySQL，查看问题是否已解决。原因分析：重启应用程序可以清除可能存在的临时连接问题，确保连
vSAN数据恢复—vSAN存储中虚拟机无法启动的数据恢复案例数据恢复
vSAN存储故障：异常断电导致vSAN存储上层虚拟机无法启动。vSAN存储结构：vSAN存储数据恢复过程：1、将故障vSAN存储上的硬盘标记后取出，硬件工程师对所有硬盘进行物理故障检测，经过检测确认异常断电并没有导致硬盘出现物理故障，都可以正常读取。将所有硬盘以只读方式进行扇区级完整镜像。镜像完成后将所有磁盘按照标记还原到原存储中。后续的数据分析和数据恢复操作都基于镜像进行，避免对原始磁盘数据造成
PyTorch FlexAttention技术实践：基于BlockMask实现因果注意力与变长序列处理
本文介绍了如何利用torch2.5及以上版本中新引入的FlexAttention和BlockMask功能来实现因果注意力机制与填充输入的处理。鉴于目前网络上缺乏关于FlexAttention处理填充输入序列的完整代码示例和技术讨论，本文将详细阐述一种实现方法，该方法同时涵盖了因果注意力机制的实现。本文不会详细讨论FlexAttention的理论基础，如需了解更多技术细节，建议参考PyTorch官方
linux安装oracl19c
安装OracleDatabase19c（以下简称Oracle19c）在Linux系统上的详细步骤如下。每一步都经过专业分析，确保安装过程顺利且高效。️1.下载安装包首先，从Oracle官方网站下载OracleDatabase19c的安装包。确保选择与您的Linux发行版和系统架构相匹配的版本。#示例命令（实际下载需通过浏览器或Oracle工具进行）wgethttps://download.orac
JAVA之单例模式程序研 java 单例模式
单例模式（SingletonPattern）是一种设计模式，用于确保一个类只有一个实例，并提供一个全局访问点来获取该实例。在软件设计中，单例模式常用于控制对资源的访问，例如数据库连接、线程池等。以下是单例模式的详细介绍及JAVA代码实现。一、单例模式的优点控制资源的使用，避免资源的多重占用。提供全局访问点，方便资源的管理。系统中只有一个实例，减少内存开销。避免对资源的多重占用，提高系统的性能。二、
https证书获取的方法及好处
获取HTTPS证书的多种方法及其优势✨在现代互联网环境中，HTTPS已成为保障网站安全的基本标准。获取HTTPS证书不仅能提升网站的安全性，还能增强用户信任度和提升搜索引擎排名。本文将详细介绍获取HTTPS证书的几种常见方法及其各自的优势，并通过图表和流程图帮助理解其工作原理。获取HTTPS证书的方法️1.购买商业证书购买商业证书是获取HTTPS证书的传统方式，适用于需要高信任度和额外保障的企业和
caddy介绍及安装 dockercaddy
参考文档：https://caddyserver.com一：caddy介绍Caddy是一款现代化的Web服务器，专为简化开发者和运维人员的工作流程而设计。它最大的特点是自动化和易用性，尤其是内置的自动HTTPS功能，使得部署安全的Web服务变得前所未有的简单。相比于传统的Web服务器（如Nginx、Apache），Caddy的目标是通过更简洁的配置、更智能的功能来减少人为出错的可能性，并提升部署效
XSAN数据恢复-数据从XSAN迁移到STORNEXT过程中丢失的数据恢复案例数据恢复
XSAN数据恢复环境：昆腾存储+MACOS操作系统，存储数据主要是视频类数据如MXF、MOV等格式文件。该昆腾存储中有9个数据卷：1个META信息卷和8个DATA信息卷。XSAN故障情况：将存储空间从XSAN架构迁移到STORNEXT架构后，发现存储空间中数据全部丢失。XSAN数据恢复过程：1、将昆腾存储的存储空间以只读方式进行完整镜像，后续的数据分析和数据恢复操作都基于镜像文件进行，避免对原存储
部署及使用 etl crontab 和 etl engine
**如何部署及使用etl_crontab和etl_engine**内容详细，适合新人上手1、前置条件获取到以下文件列表code.bin(授权文件，必须)code.key(授权文件，必须)conf.cron(调度配置文件，使用etl_crontab必须)sys.properties(环境配置文件，使用etl_crontab必须)etllog_mysql.sql(日志表结构文件，使用etl_cront
java线程Thread和Runnable区别和联系 zx_code java jvm thread 多线程 Runnable
我们都晓得java实现线程2种方式，一个是继承Thread，另一个是实现Runnable。模拟窗口买票，第一例子继承thread，代码如下 package thread; public class ThreadTest { public static void main(String[] args) { Thread1 t1 = new Thread1(
【转】JSON与XML的区别比较丁_新 json xml
1.定义介绍 (1).XML定义扩展标记语言 (Extensible Markup Language, XML) ，用于标记电子文件使其具有结构性的标记语言，可以用来标记数据、定义数据类型，是一种允许用户对自己的标记语言进行定义的源语言。 XML使用DTD(document type definition)文档类型定义来组织数据;格式统一，跨平台和语言，早已成为业界公认的标准。 XML是标
c++ 实现五种基础的排序算法 CrazyMizzz C++c 算法
#include<iostream> using namespace std; //辅助函数，交换两数之值 template<class T> void mySwap(T &x, T &y){ T temp = x; x = y; y = temp; } const int size = 10; //一、用直接插入排
我的软件麦田的设计者我的软件音乐类娱乐放松
这是我写的一款app软件，耗时三个月，是一个根据央视节目开门大吉改变的，提供音调，猜歌曲名。1、手机拥有者在android手机市场下载本APP，同意权限，安装到手机上。2、游客初次进入时会有引导页面提醒用户注册。（同时软件自动播放背景音乐）。3、用户登录到主页后，会有五个模块。a、点击不胫而走，用户得到开门大吉首页部分新闻，点击进入有新闻详情。b、
linux awk命令详解被触发 linux awk
awk是行处理器: 相比较屏幕处理的优点，在处理庞大文件时不会出现内存溢出或是处理缓慢的问题，通常用来格式化文本信息 awk处理过程: 依次对每一行进行处理，然后输出 awk命令形式: awk [-F|-f|-v] ‘BEGIN{} //{command1; command2} END{}’ file [-F|-f|-v]大参数，-F指定分隔符，-f调用脚本，-v定义变量 var=val
各种语言比较 _wy_ 编程语言
Java Ruby PHP 擅长领域
oracle 中数据类型为clob的编辑知了ing oracle clob
public void updateKpiStatus(String kpiStatus,String taskId){ Connection dbc=null; Statement stmt=null; PreparedStatement ps=null; try { dbc = new DBConn().getNewConnection(); //stmt = db
分布式服务框架 Zookeeper -- 管理分布式环境中的数据矮蛋蛋 zookeeper
原文地址： http://www.ibm.com/developerworks/cn/opensource/os-cn-zookeeper/ 安装和配置详解本文介绍的 Zookeeper 是以 3.2.2 这个稳定版本为基础，最新的版本可以通过官网 http://hadoop.apache.org/zookeeper/来获取，Zookeeper 的安装非常简单，下面将从单机模式和集群模式两
tomcat数据源 alafqq tomcat
数据库 JNDI(Java Naming and Directory Interface，Java命名和目录接口)是一组在Java应用中访问命名和目录服务的API。没有使用JNDI时我用要这样连接数据库： 03. Class.forName("com.mysql.jdbc.Driver"); 04. conn
遍历的方法百合不是茶遍历
遍历在java的泛
linux查看硬件信息的命令 bijian1013 linux
linux查看硬件信息的命令一.查看CPU： cat /proc/cpuinfo 二.查看内存： free 三.查看硬盘： df linux下查看硬件信息 1、lspci 列出所有PCI 设备； lspci - list all PCI devices:列出机器中的PCI设备（声卡、显卡、Modem、网卡、USB、主板集成设备也能
java常见的ClassNotFoundException bijian1013 java
1.java.lang.ClassNotFoundException: org.apache.commons.logging.LogFactory 添加包common-logging.jar2.java.lang.ClassNotFoundException: javax.transaction.Synchronization
【Gson五】日期对象的序列化和反序列化 bit1129 反序列化
对日期类型的数据进行序列化和反序列化时，需要考虑如下问题： 1. 序列化时，Date对象序列化的字符串日期格式如何 2. 反序列化时，把日期字符串序列化为Date对象，也需要考虑日期格式问题 3. Date A -> str -> Date B,A和B对象是否equals 默认序列化和反序列化 import com
【Spark八十六】Spark Streaming之DStream vs. InputDStream bit1129 Stream
1. DStream的类说明文档： /** * A Discretized Stream (DStream), the basic abstraction in Spark Streaming, is a continuous * sequence of RDDs (of the same type) representing a continuous st
通过nginx获取header信息 ronin47 nginx header
1. 提取整个的Cookies内容到一个变量，然后可以在需要时引用，比如记录到日志里面， if ( $http_cookie ~* "(.*)$") { set $all_cookie $1; } 变量$all_cookie就获得了cookie的值，可以用于运算了
java-65.输入数字n，按顺序输出从1最大的n位10进制数。比如输入3，则输出1、2、3一直到最大的3位数即999 bylijinnan java
参考了网上的http://blog.csdn.net/peasking_dd/article/details/6342984 写了个java版的： public class Print_1_To_NDigit { /** * Q65.输入数字n，按顺序输出从1最大的n位10进制数。比如输入3，则输出1、2、3一直到最大的3位数即999 * 1.使用字符串
Netty源码学习-ReplayingDecoder bylijinnan java netty
ReplayingDecoder是FrameDecoder的子类，不熟悉FrameDecoder的，可以先看看 http://bylijinnan.iteye.com/blog/1982618 API说，ReplayingDecoder简化了操作，比如： FrameDecoder在decode时，需要判断数据是否接收完全： public class IntegerH
js特殊字符过滤 cngolon js特殊字符 js特殊字符过滤
1.js中用正则表达式过滤特殊字符, 校验所有输入域是否含有特殊符号function stripscript(s) { var pattern = new RegExp("[`~!@#$^&*()=|{}':;',\\[\\].<>/?~！@#￥……&*（）——|{}【】‘；：”“'。，、？]"
hibernate使用sql查询 ctrain Hibernate
import java.util.Iterator; import java.util.List; import java.util.Map; import org.hibernate.Hibernate; import org.hibernate.SQLQuery; import org.hibernate.Session; import org.hibernate.Transa
linux shell脚本中切换用户执行命令方法 daizj linux shell 命令切换用户
经常在写shell脚本时，会碰到要以另外一个用户来执行相关命令，其方法简单记下： 1、执行单个命令：su - user -c "command" 如：下面命令是以test用户在/data目录下创建test123目录 [root@slave19 /data]# su - test -c "mkdir /data/test123"
好的代码里只要一个 return 语句 dcj3sjt126com return
别再这样写了：public boolean foo() { if (true) { return true; } else { return false;
Android动画效果学习 dcj3sjt126com android
1、透明动画效果方法一：代码实现 public View onCreateView(LayoutInflater inflater, ViewGroup container, Bundle savedInstanceState) { View rootView = inflater.inflate(R.layout.fragment_main, container, fals
linux复习笔记之bash shell (4)管道命令 eksliang linux管道命令汇总 linux管道命令 linux常用管道命令
转载请出自出处： http://eksliang.iteye.com/blog/2105461 bash命令执行的完毕以后，通常这个命令都会有返回结果，怎么对这个返回的结果做一些操作呢？那就得用管道命令‘|’。上面那段话，简单说了下管道命令的作用，那什么事管道命令呢？答：非常的经典的一句话，记住了，何为管
Android系统中自定义按键的短按、双击、长按事件 gqdy365 android
在项目中碰到这样的问题：由于系统中的按键在底层做了重新定义或者新增了按键，此时需要在APP层对按键事件（keyevent）做分解处理，模拟Android系统做法，把keyevent分解成： 1、单击事件：就是普通key的单击； 2、双击事件：500ms内同一按键单击两次； 3、长按事件：同一按键长按超过1000ms（系统中长按事件为500ms）； 4、组合按键：两个以上按键同时按住；
asp.net获取站点根目录下子目录的名称 hvt .net C#asp.net hovertree Web Forms
使用Visual Studio建立一个.aspx文件(Web Forms)，例如hovertree.aspx,在页面上加入一个ListBox代码如下： <asp:ListBox runat="server" ID="lbKeleyiFolder" /> 那么在页面上显示根目录子文件夹的代码如下： string[] m_sub
Eclipse程序员要掌握的常用快捷键 justjavac java eclipse 快捷键 ide
判断一个人的编程水平，就看他用键盘多，还是鼠标多。用键盘一是为了输入代码（当然了，也包括注释），再有就是熟练使用快捷键。曾有人在豆瓣评《卓有成效的程序员》：“人有多大懒，才有多大闲”。之前我整理了一个程序员图书列表，目的也就是通过读书，让程序员变懒。写道程序员作为特殊的群体，有的人可以这么懒，懒到事情都交给机器去做，而有的人又可
c++编程随记 lx.asymmetric C++笔记
为了字体更好看，改变了格式…… &&运算符： #include<iostream> using namespace std; int main(){ int a=-1,b=4,k; k=(++a<0)&&!(b--
linux标准IO缓冲机制研究音频数据 linux
一、什么是缓存I/O(Buffered I/O)缓存I/O又被称作标准I/O,大多数文件系统默认I/O操作都是缓存I/O。在Linux的缓存I/O机制中，操作系统会将I/O的数据缓存在文件系统的页缓存(page cache)中，也就是说，数据会先被拷贝到操作系统内核的缓冲区中，然后才会从操作系统内核的缓冲区拷贝到应用程序的地址空间。1.缓存I/O有以下优点:A.缓存I/O使用了操作系统内核缓冲区，
随想生活暗黑小菠萝生活
其实账户之前就申请了，但是决定要自己更新一些东西看也是最近。从毕业到现在已经一年了。没有进步是假的，但是有多大的进步可能只有我自己知道。毕业的时候班里12个女生，真正最后做到软件开发的只要两个包括我，PS：我不是说测试不好。当时因为考研完全放弃找工作，考研失败，我想这只是我的借口。那个时候才想到为什么大学的时候不能好好的学习技术，增强自己的实战能力，以至于后来找工作比较费劲。我
我认为POJO是一个错误的概念 windshome java POJO 编程 J2EE 设计
这篇内容其实没有经过太多的深思熟虑，只是个人一时的感觉。从个人风格上来讲，我倾向简单质朴的设计开发理念；从方法论上，我更加倾向自顶向下的设计；从做事情的目标上来看，我追求质量优先，更愿意使用较为保守和稳妥的理念和方法。 &

按字母分类： A B C D E F G H I J K L M N O P Q R S T U V W X Y Z 其他