长安er

机器学习大作业——基于DEAP数据集的脑电信号识别（DNN+CNN）

一、实验目的

二、实验原理介绍

2.1 数据集描述

2.2深度神经网络

2.2.1 关于DNN

2.2.2 网络模型代码实现

2.3 卷积神经网络

2.3.1 关于CNN

2.3.2 网络模型代码实现

三、模型训练与测试

3.1数据预处理

3.2 模型训练与测试

3.2.1训练前期准备

3.2.2训练模型的过程

四、实验结果与分析

4.1二元价态分类结果

五、实验总结

附录：实验代码

prepare_deap.py

reduce_dim.py

datasets.py

models.py

train.py

train_util.py

一、实验目的

1.1了解DEAP数据集的格式

1.2 熟悉深度深度神经网络DNN和卷积神经网络CNN

1.3 通过统计实验对获得的模型进行测试，以比较不同的模型

二、实验原理介绍

本部分首先将介绍本次实验采用的DEAP数据集，另外由于本次实验采用了两种不同的神经网络架构：具有完全连接层的深度神经网络（DNN）和卷积神经网络（CNN），只做了一些小的修改，本部分也将详细解释该模型的基本框架及这些模型中的训练技术。

2.1 数据集描述

本次实验采用的是DEAP数据集。DEAP是2014年发布的一个用于情绪分析的数据集。它是情感计算领域最大的公开数据集之一，还包含各种不同的生理和视频信号。

DEAP数据集由两部分组成：

（1）一个由120个一分钟音乐视频组成的数据库，每一个视频由14-16名志愿者根据效价、唤醒度和主导度进行评分。

（2）40个以上音乐视频的子集，每个视频具有32个参与者中每个参与者的相应EEG和生理信号。与第一部分一样，每个视频都是根据效价、唤醒和支配维度进行评分的。

由于完成时间有限，本次实验只使用了DEAP数据集的第二部分，其中包含EEG信号。

脑电信号是使用Biosemi ActiveTwo设备收集的，该设备记录了32个具有可配置采样率的脑电通道。

DEAP是在512Hz下收集的，但数据集的创建者也提供了EEG信号的预处理版本，下采样到128Hz，并应用了频率滤波器和其他有用的预处理步骤。

特别地，对于32个参与者中的每一个，存在以下预处理的信息：

•数据：一个40 x 40 x 8064的阵列，包含40个频道中每个频道和40个音乐视频中每个频道的8064个录音。每个视频每个频道有8064个录音，因为试验时间为63秒（3秒预审基线+60秒试验），采样率为128Hz（63 x 128=8064）。

•标签：一个40 x 4的数组，包含40个音乐视频中每个视频的效价、唤醒、支配和链接的注释。

下面展示的是准备DEAP数据集相关的部分代码。

2.2深度神经网络

2.2.1 关于DNN

DNN神经网络是一个具有3个隐藏层的深度神经网络。该体系结构的近似图形方案如图2所示，而每一层的确切细节如下图所示。

上图所描绘的神经元的数量仅用于表示，每层下方都报告了神经元的真实数量。表1展示的是深度神经网络架构，表2中报告了对于DEAP数据集用于训练的超参数、优化器和损失函数。

表1:深度神经网络架构

Layer type	Layer params	Output shape
Flatten	-	3168
Dropout	p=0.25	3168
Dense	in=3168,out=5000	5000
Dropout	p=0.50	5000
Dense	in=5000,out=500	500
Dropout	p=0.50	500
Dense	in=500,out=100	1000
Dropout	p=0.50	1000
Dense	in=1000,out=1	1
Number of parameters=18'847'501

表2:DEAP数据集用于训练的超参数、优化器和损失函数等指标（DNN）

metric	DEAP
Batch size	310
Epochs	250
Loss function	BCE
Optimizer	RMSProp
Learning rate	0.0001
Momentum	0

2.2.2 网络模型代码实现

上述设计的是一个简单的深度神经网络（DNN）模型类，继承自 PyTorch 的 Module 类。该模型由几个线性层（全连接层）和一些激活函数、Dropout 层组成。

模型的主要组件是四个线性层（self.linear1, self.linear2, self.linear3, self.linear4），分别将输入特征映射到不同的维度。其中，self.linear4 是二元分类任务的最后一层，输出一个值，用于区分高价值和低价值情绪状态。

模型还包括三个 Dropout 层（self.dropout1, self.dropout2），用于随机丢弃部分神经元，以减少过拟合风险。激活函数 ReLU（self.relu）被应用于线性层之后，以增加模型的非线性能力。最后，使用 Flatten 层（self.flatten）将输入张量展平，并通过 forward 方法来定义前向传播过程。在前向传播中，输入首先经过 Flatten 层，然后通过每个线性层、激活函数和 Dropout 层的序列。

最终，模型返回最后一个线性层的输出张量，用于进行二元分类任务的预测。

2.3 卷积神经网络

2.3.1 关于CNN

卷积神经网络 (CNN) 是一种用于处理图像和声音等网格结构数据的前馈神经网络。它利用卷积运算提取输入数据的特征，使用池化操作来压缩特征图的尺寸。CNN 可以通过改变卷积核的参数来调整特征的维度。在卷积层后通常会应用非线性激活函数，如 ReLU，并可使用批量归一化、Dropout 等技术来提高模型性能。最后一层通常是全连接层，将特征转换为向量表示以进行分类或回归等任务。下图是CNN的架构：

CNN模型利用卷积层，将数据视为形状为32 x 99的二维输入。

简而言之，该模型由两个卷积层组成，然后是最大池化层，最后是两个完全连接的层。卷积层将输入视为2D图像，通过卷积操作应用3x3滤波器。这种类型的层主要用于涉及图像的任务中。最大池化层用于减少数据的空间维度，在图像上滑动一个2x2的窗口，该窗口被减少到一个值：具有最高激活的神经元的值。最大池化减少了图像的空间维度，从而减少了最终完全连接层中所需的参数数量，并有助于网络避免过度拟合。

与DNN模型一样，CNN权重使用Xavier的正常技术进行初始化，偏差设置为0。表3中中报告了对于DEAP数据集用于训练的超参数、优化器和损失函数等。

表3:DEAP数据集用于训练的超参数、优化器和损失函数等指标（CNN）

metric	DEAP
Batch size	50
Epochs	250
Loss function	BCE
Optimizer	SGD
Learning rate	0.0001
Momentum	0.9

2.3.2 网络模型代码实现

在代码中我定义了一个名为CNN的类，继承自Module。该类实现了一个简单的卷积神经网络模型。在初始化方法中，首先定义了4个卷积层。其中，self.conv1是一个输入通道数为1，输出通道数为20的卷积层，卷积核大小为3x3，填充为1。self.conv2是一个输入通道数为20，输出通道数为40的卷积层，同样使用3x3的卷积核和1的填充。

接下来定义了一个最大池化层nn.MaxPool2d，使用2x2的窗口进行池化操作。

然后定义了两个全连接层self.linear1和self.linear2。self.linear1将输入的特征展平成一维向量，并将其映射到128维向量空间。self.linear2将128维向量映射为1维，用于二分类任务。在网络的前向传播方法forward中，首先对输入数据添加一个维度作为通道维度。然后通过self.dropout0对输入进行随机失活操作。

接下来通过卷积层self.conv1进行卷积操作，并通过ReLU激活函数进行非线性变换。随后再次应用self.dropout1进行随机失活，然后通过self.conv2进行卷积操作、ReLU激活函数和最大池化操作。之后通过self.flatten将特征图展平成一维向量，并通过self.dropout2进行随机失活。然后通过全连接层self.linear1进行线性变换和ReLU激活函数，并再次应用self.dropout3进行随机失活。

最后通过self.linear2进行线性变换，得到模型的输出。该模型总体上适用于二分类任务。

三、模型训练与测试

3.1数据预处理

在进行模型训练和测试前，对DEAP数据集进行处理。由于本次实验只使用了DEAP数据集中包含EEG信号的第二部分，数据维度已经降低。40个通道已被削减至32个，仅保留EEG信号，每个通道的8064个读数已减少至99个值。

预处理的具体过程如下：首先，通过循环遍历每位参与者（participant），并加载其数据。对每个参与者的数据进行以下操作：

①从原始数据中提取出32个EEG通道的数据，去除非EEG通道。

如图所示，已去除非EEG通道

②对通道数据进行全局标准化，即减去全局均值并除以全局标准差。

③使用reduce_dim函数对数据进行降维处理，将每个通道的数据从n_recordings维降至99维。

数据降维主要通过函数reduce_dim实现。下面是降维操作主要步骤：

·首先，根据输入数据的形状，确定分批处理的大小和总样本数。

·对每个通道的数据进行以下操作： a. 将8064个记录划分为10个批次（每个批次807个记录，第10个批次为801个记录）。 b. 针对每个批次，计算9个统计值，并将它们存储在处理后的数据中。这些统计值包括：平均值、中位数、最大值、最小值、标准差、方差、范围、偏度和峰度。 c. 对整个通道的数据也计算这9个统计值，并将它们存储在处理后的数据中的最后9个位置。

·最后，确保处理后的数据形状为(32, 99)，并返回处理后的数据。

④对降维后的数据进行独立通道标准化，即分别将每个通道的数据减去该通道的均值并除以该通道的标准差。

⑤对所有通道的数据进行全局标准化，即减去总体均值并除以总体标准差。

即使用以下公式，在示例的基础上对这些汇总值进行标准化，得到0的平均值和1的标准偏差：

⑥提取情感标签（valence和arousal）。

关于情感标签：在情感分析中，valence和arousal通常用来描述情感状态的两个主要维度。Valence表示情感的好坏程度，范围通常从负面到正面，例如，沮丧、愤怒、快乐、满足等。Arousal表示情感的强度或活跃程度，范围通常从低到高，例如，冷静、放松、兴奋、惊恐等。

⑦将处理后的数据和标签保存为.dat文件。

⑧输出保存成功的信息。

经过数据预处理后，DEAP数据集的大小为1280，数据集形状为32*99。数据包含32个通道，每个通道有99个记录，而标签包含2个值（效价和唤醒）。

执行以上数据预处理处理步骤的文件在项目中以prepare deap.py的名称提供。

3.2 模型训练与测试

3.2.1训练前期准备

（1）配置文件读取

with open('deap_dnn_arousal.yml') as yaml_file:

config = yaml.load(yaml_file, Loader=yaml.FullLoader)

使用 PyYAML 库读取并解析名为 'deap_dnn_arousal.yml' 的配置文件，将配置信息存储在 config 字典中供后续使用。

配置文件常用于训练一个基于CNN模型的情感分类器来对DEAP数据集中的情感进行分类。其中包括使用dropout技术防止过拟合，设置随机种子，将数据集分为训练集和测试集，设定批量大小、学习率、动量、训练轮数和导出模型的路径等。此处给出配置文件 'deap_dnn_arousal.yml' 内容

从该配置文件中还可以看出此部分数据集中，训练集与测试集比例为（1180:100）

（2）超参数设置

从配置文件中获取训练相关的超参数，包括训练轮数、批量大小、学习率和动量。

（3）模型类型选择

model_type = config['MODEL']['model']
从配置文件中获取模型的类型，可以是 'dnn' 或 'cnn'。

（4）训练目标选择

classification_of = config['TRAIN']['classification_of']

获取训练目标的类型，例如 'arousal' 或 'valence'。

（5）数据集加载与划分

根据DEAP数据集的路径，使用自定义的 DEAP类加载数据集。

获取随机种子和训练集、测试集的划分比例。然后使用 PyTorch 的 random_split 函数将数据集划分为训练集和测试集，并设置相应的随机种子。

（6）模型初始化

根据模型类型选择并初始化相应的模型和优化器。如果是 'dnn'，则使用自定义的 DNN 类创建模型，并使用 RMSprop 优化器；如果是 'cnn'，则使用自定义的 CNN 类创建模型，并使用 SGD 优化器。

（7）模型权重初始化

此部分定义了一个函数 init_weights，用于初始化模型的权重。它会遍历模型的所有线性层（Linear）并使用 Xavier 正态分布初始化权重，同时将偏置项（bias）设置为零。

3.2.2训练模型的过程

关于train()函数

这个函数用于训练模型。它接受一个模型、训练集数据加载器、损失函数、优化器等参数，并可选地进行准确率检查和测试集评估。

在函数内部，首先将模型设置为训练模式，并初始化最佳测试集准确率为 0.0。然后，创建空列表以记录每个 epoch 的平均损失值和准确率。

接下来，开始循环训练。对于每个 epoch，初始化当前 epoch 的损失列表。

然后，对于训练集中的每个批次，使用模型进行预测，并根据分类目标选择正确的标签列。计算损失并将其添加到当前 epoch 的损失列表中。

清零优化器的梯度，进行反向传播和参数更新。在训练过程中，还会打印当前 epoch 和批次的信息。每个 epoch 结束后，计算平均损失值，并将其添加到列表中。如果设置了准确率检查，且达到检查的间隔，则进行训练集和测试集的准确率检查。

如果测试集的准确率超过了之前的最佳准确率，则保存当前模型。

循环结束后，输出换行符以美化输出，并根据是否存在最佳准确率来输出最佳的测试集准确率。如果有最佳准确率，则返回该准确率。

2.关于准确率的计算

上部分的准确率计算依据的是函数check_accuracy

该函数用于计算模型在给定数据集上的准确率。它接受一个模型、数据加载器和一些可选参数（如分类目标、样本数量限制），并返回准确率。

在函数内部，首先初始化正确预测数目为 0，并根据需要设置样本数量限制。然后进入无梯度计算的上下文（torch.no_grad()），将模型设置为评估模式。

接下来，对于每个数据批次，使用模型进行预测，并将预测结果转换为二进制分类结果。根据分类目标选择正确的标签列，并确保预测结果和标签形状相同。

通过计算预测结果和标签相等的元素数量，累加得到正确预测的数目。最后，将模型设置回训练模式，并返回准确率。

3.关于测试集的准确度评估

在每个 epoch 的训练过程中，当满足 do_check_accuracy 为 True 并且当前 epoch 是检查准确率的间隔（根据 check_accuracy_every 参数指定）时，会执行准确率评估的代码块。

首先，会对训练集进行准确率评估，并打印出结果。接着，会对测试集进行准确率评估，并打印出结果。最后，会将测试集的准确率添加到 accuracy_per_epoch 列表中，并判断是否超过之前的最佳准确率。如果是，则保存当前模型。因此，测试集的准确率结果会在每个 epoch 的训练过程中输出，并保存在 accuracy_per_epoch 列表中供后续使用。

四、实验结果与分析

在本次实验中，每个数据集被分为两个子集：训练部分和测试部分。对于这个实验，模型已经在数据集的训练部分上进行了训练，并在相应数据集的测试集上进行了测试。

4.1二元价态分类结果

本次实验结果是采用固定训练集/测试集分割样本后的结果。

DNN和CNN模型在DEAP数据集上进行价值分类的结果，随着epoch的增加，测试的准确率变化如下图所示：

从上图可以看出，DNN模型在DEAP数据集上的分类结果似乎都优于CNN模型。

使用DNN模型分类的准确率在62%～79%之间，而使用CNN模型的分类准确率在56%～75%之间。

4.2 使用K折交叉验证对模型进行评估

此技术的主要思想是将数据集划分为相同大小的K个折叠（如果可能的话），然后，依次将每个折叠用作测试集，而数据集的其余部分用作训练集。对K个模型进行训练并评估其准确性，最后K次交叉验证的最终报告准确性是这些准确性的平均值。DEAP的32倍交叉验证结果如下图所示：

使用K-fold交叉验证发现的准确性远低于使用固定训练/测试分割发现的准确性。因此，可以说，模型存在高方差误差，即其性能与特定的训练和提供给它们的测试集高度相关。对于上图的结果，在数据集上操作的训练/测试分割很可能是“幸运”的分割，偶然产生了高精度。

在K折叠交叉验证过程中获得的特定折叠精度也证实了高方差猜想。例如，在DEAP上DNN模型的K-fold运行中，fold准确率从43%到78%不等，这表明不同的数据集分割如何从根本上改变准确率结果。

K-fold结果也证实了之前的结果，即CNN模型在两个数据集上都略优于DNN模型，而当在单个训练/测试分割上进行评估时，DNN模型能够达到更高的最大精度。

五、实验总结

本次实验我们基于DEAP数据集进行二分类脑电信号识别，采用的网络模型是深度神经网络和卷积神经网络。由于之前未接触过这方面的训练，我在最开始做本次实验时有种无从下手的感觉。因此本次实验的很多思路都是借鉴于期刊论文中的做法，例如对数据的处理思路，对模型的训练方式等。但完成本次实验后，还是得到了不少的收获。首先，我对深度神经网络和卷积神经网络有了更深的理解，理论课上只是学习了关于CNN的一些知识和运算，而通过本次实践，真正感受到了神经网络的强大和奇妙；其次，我对科研的严谨性有了更深的体会。对于每一个问题，都尝试运用不同的模型去得到结果，然后进行对比和考量，选择最优的方法。又或者将几种模型集成，得到一个更优的模型，这与理论课上学习的集成学习思想很类似。最后，本次实验也让我深知科研训练的必要性。不仅是在知识的融会贯通上，还是能力的提升上，进行相关科研训练都是十分有益的。在今后，我也将花更多的时间去锻炼自己的科研能力，努力提高自己的科研素养！

附录：实验代码

prepare_deap.py

import os, pickle, math
import numpy as np
import reduce_dim
src_dir = '/Users/peach/Desktop/DEAP/data_preprocessed_python/'
dst_dir = '/Users/peach/Desktop/DEAP/deap_preprocessed_standardized_global/'
n_experiments = 40 # experiment per participant
n_channels = 40 # channel per experiment
n_recordings = 8064 # recordings per channel
participants = os.listdir(src_dir)
participants.sort()
assert len(participants) == 32 # DEAP has 32 participants
tot_experiments = 40 * 32
exported_experiments = 0
for i, participant in enumerate(participants):
print(f'Participant {i+1}/{len(participants)} ({participant})')
participant_data_path = os.path.join(src_dir, participant)
with open(participant_data_path, mode='r+b') as f:
# encoding needed because DEAP data was pickled with Python2
data = pickle.load(f, encoding='latin1')
data, labels = data['data'], data['labels']
assert data.shape == (n_experiments, n_channels, n_recordings)
assert labels.shape == (n_experiments, 4)
for j in range(n_experiments):
# Removes non-EEG channels from data
data_tmp = data[j,0:32,:]
assert data_tmp.shape == (32, n_recordings)
data_tmp = reduce_dim.reduce_dim(data_tmp)
assert data_tmp.shape == (32, 99)
data_tmp = (data_tmp - np.mean(data_tmp)) / np.std(data_tmp)
label_tmp = labels[j,0:2]
assert label_tmp.shape == (2,)
dat = {
'data': data_tmp,
'labels': label_tmp,
}
dat_file_path = os.path.join(dst_dir, f'{i+1}_{j+1}.dat')
with open(dat_file_path, mode='w+b') as dat_file:
pickle.dump(dat, dat_file)
print(f'{dat_file_path} exported successfully.')
exported_experiments += 1
print('Done.')
print(f'Exported {exported_experiments} experiments out of {tot_experiments}.')

reduce_dim.py

import numpy as np
import scipy.stats as sp
def reduce_dim(data):
assert (data.shape == (32, 8064) or data.shape == (32, 8064*2))
processed_data = np.zeros((32, 99))
for channel_n in range(32):
# Divide the 8064 recordings in 10 batches of 807 (10th batch: 801)
if data.shape == (32, 8064):
batch_size = 807
n_samples = 8064
elif data.shape == (32, 8064*2):
batch_size = 807 * 2
n_samples = 8064 * 2
batch_n = 0
for batch_n in range(10):
if batch_n != 9:
batch = data[channel_n,(batch_n*batch_size):(batch_n*batch_size+batch_size)]
else:
batch = data[channel_n,(batch_n*batch_size):n_samples]
processed_data[channel_n,(batch_n * 9):(batch_n * 9 + 9)] = np.array([
np.mean(batch),
np.median(batch),
np.max(batch),
np.min(batch),
np.std(batch),
np.var(batch),
np.max(batch) - np.min(batch),
sp.skew(batch),
sp.kurtosis(batch),
])
processed_data[channel_n,90:99] = np.array([
np.mean(data[channel_n,:]),
np.median(data[channel_n,:]),
np.max(data[channel_n,:]),
np.min(data[channel_n,:]),
np.std(data[channel_n,:]),
np.var(data[channel_n,:]),
np.max(data[channel_n,:]) - np.min(data[channel_n,:]),
sp.skew(data[channel_n,:]),
sp.kurtosis(data[channel_n,:]),
])
assert processed_data.shape == (32, 99)
return processed_data

datasets.py

import os, pickle, torch
from torch.utils.data import Dataset
n_channels = 32
n_recordings = 99
# High val = 708, low val = 572
# High ar = 737, low ar = 543
class DEAP(Dataset):
def __init__(self, dataset_path):
self.dataset_path = dataset_path
self.sessions = os.listdir(dataset_path)
# remove .DS_Store if present
if '.DS_Store' in self.sessions:
self.sessions.remove('.DS_Store')
def __len__(self):
return len(self.sessions)
def __getitem__(self, index):
file_path = os.path.join(self.dataset_path, self.sessions[index])
with open(file_path, mode='rb') as file:
session = pickle.load(file)
data, labels = session['data'], session['labels']
data, labels = torch.from_numpy(data), torch.from_numpy(labels)
data, labels = data.float(), labels.float()
# 1 = high value, 0 = low value
labels = (labels >= 5.0).long()
assert data.shape == (n_channels, n_recordings)
assert labels.shape == (2,)
return data, labels

models.py

from torch import nn
n_channels = 32
n_recordings = 99
class DNN(nn.Module):
def __init__(self, sizes=(5000, 500, 1000), dropout_probs=(0.25, 0.5)):
super(DNN, self).__init__()
self.linear1 = nn.Linear(n_channels * n_recordings, sizes[0])
self.linear2 = nn.Linear(sizes[0], sizes[1])
self.linear3 = nn.Linear(sizes[1], sizes[2])
self.linear4 = nn.Linear(sizes[2], 1) # binary classification: high vs low
self.dropout1 = nn.Dropout(dropout_probs[0])
self.dropout2 = nn.Dropout(dropout_probs[1])
self.relu = nn.ReLU()
self.flatten = nn.Flatten(start_dim=1)
def forward(self, x):
x = self.flatten(x)
x = self.dropout1(x)
x = self.linear1(x)
x = self.relu(x)
x = self.dropout2(x)
x = self.linear2(x)
x = self.relu(x)
x = self.dropout2(x)
x = self.linear3(x)
x = self.relu(x)
x = self.dropout2(x)
x = self.linear4(x)
return x
class CNN(nn.Module):
def __init__(self, dropout_probs=(0.25, 0.15, 0.5, 0.25)):
super(CNN, self).__init__()
self.conv1 = nn.Conv2d(1, 20, (3, 3), padding=(1, 1))
self.conv2 = nn.Conv2d(20, 40, (3, 3), padding=(1, 1))
self.maxpool = nn.MaxPool2d((2, 2))
self.linear1 = nn.Linear(40 * 16 * 49, 128)
self.linear2 = nn.Linear(128, 1)
self.tanh = nn.Tanh()
self.relu = nn.ReLU()
self.dropout0 = nn.Dropout(dropout_probs[0])
self.dropout1 = nn.Dropout2d(dropout_probs[1])
self.dropout2 = nn.Dropout(dropout_probs[2])
self.dropout3 = nn.Dropout(dropout_probs[3])
self.flatten = nn.Flatten(start_dim=1)
self.softplus = nn.Softplus()
def forward(self, x):
x = x[:,None,:,:] # add dummy dim for channel
x = self.dropout0(x)
x = self.relu(self.conv1(x))
x = self.dropout1(x)
x = self.relu(self.conv2(x))
x = self.dropout1(x)
x = self.maxpool(x)
x = self.flatten(x)
x = self.dropout2(x)
x = self.relu(self.linear1(x))
x = self.dropout3(x)
x = self.linear2(x)
return x

train.py

# Imports
import torch, yaml, os
from torch.utils.data import DataLoader, random_split
from datasets import DEAP, MAHNOB
from models import DNN, CNN
from utils import check_train_test_split_balanced
from train_utils import train
# Read configs
with open('deap_dnn_arousal.yml') as yaml_file:
config = yaml.load(yaml_file, Loader=yaml.FullLoader)
# Hyperparams
num_epochs = config['TRAIN']['num_epochs']
batch_size = config['TRAIN']['batch_size']
lr = config['TRAIN']['lr']
momentum = config['TRAIN']['momentum']
# Model
model_type = config['MODEL']['model']
# Train
classification_of = config['TRAIN']['classification_of']
# Dataset
dataset_to_use = config['DATASET']['dataset_to_use']
# Export
model_path = config['EXPORT']['model_path']
model_name = f'{dataset_to_use}-{model_type}-{classification_of}'
if dataset_to_use == 'deap':
dataset_path = config['DATASET']['deap_dataset_path']
dataset = DEAP(dataset_path)
elif dataset_to_use == 'mahnob':
dataset_path = config['DATASET']['mahnob_dataset_path']
dataset = MAHNOB(dataset_path)
else:
assert False
# check_dataset_balanced(dataset_path)
seed = config['TRAIN']['seed']
train_set_size, test_set_size = config['TRAIN']['train_test_split']
train_set, test_set = random_split(
dataset,
[train_set_size, test_set_size],
generator=torch.Generator().manual_seed(seed)
)
print(f'{len(dataset)} examples found ({train_set_size} train, {test_set_size} test)')
train_loader = DataLoader(
train_set,
batch_size=batch_size,
shuffle=True
)
test_loader = DataLoader(
test_set,
batch_size=batch_size,
shuffle=True
)
check_train_test_split_balanced(train_loader, test_loader)
# Model
if model_type == 'dnn':
model = DNN(
sizes=tuple(config['MODEL']['sizes']),
dropout_probs=tuple(config['MODEL']['dropout_probs'])
)
optimizer = torch.optim.RMSprop(model.parameters(), lr=lr)
elif model_type == 'cnn':
model = CNN(dropout_probs=tuple(config['MODEL']['dropout_probs']))
optimizer = torch.optim.SGD(model.parameters(), lr=lr, momentum=momentum)
else:
assert False
def init_weights(m):
if isinstance(m, torch.nn.Linear):
torch.nn.init.xavier_normal_(m.weight)
m.bias.data.fill_(0.0)
model.apply(init_weights)
# Launch training
best_acc_test_set = train(
model,
train_loader,
torch.nn.BCEWithLogitsLoss(),
optimizer,
classification_of=classification_of,
num_epochs=num_epochs,
do_check_accuracy=True,
check_accuracy_every=1,
test_loader=test_loader,
model_path=model_path,
model_name=model_name,
)
os.system(f'say Best test accuracy {(best_acc_test_set*100):.2f}%')

train.py

# Imports
import torch, yaml, os
from torch.utils.data import DataLoader, random_split
from datasets import DEAP, MAHNOB
from models import DNN, CNN
from utils import check_train_test_split_balanced
from train_utils import train
# Read configs
with open('deap_dnn_arousal.yml') as yaml_file:
config = yaml.load(yaml_file, Loader=yaml.FullLoader)
# Hyperparams
num_epochs = config['TRAIN']['num_epochs']
batch_size = config['TRAIN']['batch_size']
lr = config['TRAIN']['lr']
momentum = config['TRAIN']['momentum']
# Model
model_type = config['MODEL']['model']
# Train
classification_of = config['TRAIN']['classification_of']
# Dataset
dataset_to_use = config['DATASET']['dataset_to_use']
# Export
model_path = config['EXPORT']['model_path']
model_name = f'{dataset_to_use}-{model_type}-{classification_of}'
if dataset_to_use == 'deap':
dataset_path = config['DATASET']['deap_dataset_path']
dataset = DEAP(dataset_path)
elif dataset_to_use == 'mahnob':
dataset_path = config['DATASET']['mahnob_dataset_path']
dataset = MAHNOB(dataset_path)
else:
assert False
# check_dataset_balanced(dataset_path)
seed = config['TRAIN']['seed']
train_set_size, test_set_size = config['TRAIN']['train_test_split']
train_set, test_set = random_split(
dataset,
[train_set_size, test_set_size],
generator=torch.Generator().manual_seed(seed)
)
print(f'{len(dataset)} examples found ({train_set_size} train, {test_set_size} test)')
train_loader = DataLoader(
train_set,
batch_size=batch_size,
shuffle=True
)
test_loader = DataLoader(
test_set,
batch_size=batch_size,
shuffle=True
)
check_train_test_split_balanced(train_loader, test_loader)
# Model
if model_type == 'dnn':
model = DNN(
sizes=tuple(config['MODEL']['sizes']),
dropout_probs=tuple(config['MODEL']['dropout_probs'])
)
optimizer = torch.optim.RMSprop(model.parameters(), lr=lr)
elif model_type == 'cnn':
model = CNN(dropout_probs=tuple(config['MODEL']['dropout_probs']))
optimizer = torch.optim.SGD(model.parameters(), lr=lr, momentum=momentum)
else:
assert False
def init_weights(m):
if isinstance(m, torch.nn.Linear):
torch.nn.init.xavier_normal_(m.weight)
m.bias.data.fill_(0.0)
model.apply(init_weights)
# Launch training
best_acc_test_set = train(
model,
train_loader,
torch.nn.BCEWithLogitsLoss(),
optimizer,
classification_of=classification_of,
num_epochs=num_epochs,
do_check_accuracy=True,
check_accuracy_every=1,
test_loader=test_loader,
model_path=model_path,
model_name=model_name,
)
os.system(f'say Best test accuracy {(best_acc_test_set*100):.2f}%')

train_util.py

import torch
import numpy as np
from utils import save_model
def check_accuracy(model, data_loader, classification_of='valence', num_examples=-1):
num_corrects = 0
if num_examples == -1:
num_examples = len(data_loader.dataset)
with torch.no_grad():
model.eval()
for data, labels in data_loader:
preds = model(data)
preds = torch.squeeze((preds >= 0.0).long())
labels = labels[:,0] if classification_of == 'valence' else labels[:,1]
assert preds.shape == labels.shape
num_corrects += torch.sum((preds == labels).long())
model.train()
return (num_corrects / num_examples).item()
def train(
model,
train_loader,
criterion,
optimizer,
classification_of='valence',
num_epochs=100,
do_check_accuracy=True,
test_loader=None,
model_path=None,
model_name=None,
check_accuracy_every=50
);
model.train()
best_acc_test_set = 0.0
avg_loss_per_epoch = []
accuracy_per_epoch = []
for epoch_n in range(1, num_epochs+1):
epoch_losses = []
for batch_i, (data, labels) in enumerate(train_loader, start=1):
preds = torch.squeeze(model(data))
labels = labels[:,0].float() if classification_of == 'valence' else labels[:,1].float()
loss = criterion(preds, labels)
if len(data) == train_loader.batch_size:
epoch_losses.append(loss.item())
optimizer.zero_grad()
loss.backward()
optimizer.step()
print(f'\rEPOCH {epoch_n}/{num_epochs}: batch {batch_i}: {loss:.3f}', end='')
avg_epoch_loss = np.mean(epoch_losses)
avg_loss_per_epoch.append(avg_epoch_loss)
print(f' (Avg epoch loss = {avg_epoch_loss:.3f})', end='')
if do_check_accuracy and epoch_n % check_accuracy_every == 0:
if test_loader == None or model_path == None or model_name == None:
assert False
print('\nChecking accuracy on training set... ', end=' ')
acc_train_set = check_accuracy(model, train_loader, classification_of=classification_of)
print(f'{(acc_train_set*100):.2f}%')
print('Testing accuracy on test set...', end=' ')
acc_test_set = check_accuracy(model, test_loader, classification_of=classification_of)
print(f'{(acc_test_set * 100):.2f}%')
accuracy_per_epoch.append(acc_test_set)
if acc_test_set > best_acc_test_set:
save_model(model, model_path=model_path, model_name=model_name)
best_acc_test_set = acc_test_set
print('\n')
if best_acc_test_set != 0.0:
print(f'Best accuracy on test set: {(best_acc_test_set*100):.2f}%')
return best_acc_test_set

写于2024-1-17

你可能感兴趣的:(机器学习,人工智能,DEAP,脑电信号识别,DNN,神经网络,CNN)

什么是证书吊销列表？CRL 解释 WoTrusSSL ssl https
数字证书是安全在线互动的支柱，用于验证身份和确保加密通信。但是，当这些证书被盗用或滥用时，必须立即撤销它们以维持信任。这就是证书撤销列表(CRL)的作用所在。CRL由证书颁发机构(CA)维护，对于识别和撤销已撤销的证书，防止其造成危害至关重要。在本指南中，我们将探讨什么是CRL、它们如何运作以及为什么它们对网络安全至关重要。什么是证书吊销列表(CRL)？证书吊销列表(CRL)是证书颁发机构(CA)
全面触摸屏输入法设计与实现长野君
本文还有配套的精品资源，点击获取简介：触摸屏输入法是针对触摸设备优化的文字输入方案，包括虚拟键盘、手写、语音识别和手势等多种输入方式。本方案通过提供主程序文件、用户手册、界面截图、示例图、说明文本和音效文件，旨在为用户提供一个完整的、多样的文字输入体验。开发者通过持续优化算法和用户界面，使用户在无物理键盘环境下也能高效准确地进行文字输入。1.触摸屏输入法概述简介在现代信息技术飞速发展的今天，触摸屏
高效批量单词翻译工具的设计与应用
本文还有配套的精品资源，点击获取简介：在信息技术飞速发展的今天，批量单词翻译工具通过计算机的数据处理能力，大大提高了语言学习和文字处理的效率。用户通过简单输入单词列表到一个文本文件，并运行翻译程序，即可获得翻译结果并保存至指定文件。该工具集成了内置或外部翻译引擎，利用自然语言处理技术实现快速准确的翻译，并可能提供词性识别等附加功能。尽管机器翻译无法完全取代人工校对，但它为用户提供了一种高效的翻译解
PyTorch & TensorFlow速成复习：从基础语法到模型部署实战（附FPGA移植衔接）阿牛的药铺算法移植部署 pytorch tensorflow fpga开发
PyTorch&TensorFlow速成复习：从基础语法到模型部署实战（附FPGA移植衔接）引言：为什么算法移植工程师必须掌握框架基础？针对光学类产品算法FPGA移植岗位需求（如可见光/红外图像处理），深度学习框架是算法落地的"桥梁"——既要用PyTorch/TensorFlow验证算法可行性，又要将训练好的模型（如CNN、目标检测）转换为FPGA可部署的格式（ONNX、TFLite）。本文采用"
算法学习笔记：17.蒙特卡洛算法 ——从原理到实战，涵盖 LeetCode 与考研 408 例题
在计算机科学和数学领域，蒙特卡洛算法（MonteCarloAlgorithm）以其独特的随机抽样思想，成为解决复杂问题的有力工具。从圆周率的计算到金融风险评估，从物理模拟到人工智能，蒙特卡洛算法都发挥着不可替代的作用。本文将深入剖析蒙特卡洛算法的思想、解题思路，结合实际应用场景与Java代码实现，并融入考研408的相关考点，穿插图片辅助理解，帮助你全面掌握这一重要算法。蒙特卡洛算法的基本概念蒙特卡
windows安装pnpm后报错：pnpm : 无法将“pnpm”项识别为 cmdlet、函数、脚本文件或可运行程序的名称。 Ithao2 Vue npm 前端 node.js
使用npm方式安装pnpm,命令如下：npminstall-gpnpm安装完以后，执行pnpm-v查看版本号：pnpm-v执行完发现报错：pnpm:无法将“pnpm”项识别为cmdlet、函数、脚本文件或可运行程序的名称。尝试配置环境变量，重启后均不生效。解决方案：使用PowerShell进行安装1.以管理员用户打开PowerShell，执行如下命令：iwrhttps://get.pnpm.io/
Linux操作系统磁盘管理 CZZDg linux 运维服务器
目录一.硬盘介绍1.硬盘的物理结构2.CHS编号3.磁盘存储划分4.开机流程5.要点6.磁盘存储数据的形式二.Linux文件系统1.根文件系统2.虚拟文件系统3.真文件系统4.伪文件系统三.磁盘分区与挂载1.磁盘分区方式2.分区命令3.查看与识别命令4.格式化命令5.挂载命令四.LVM逻辑卷1.概述2.管理命令五.磁盘配额1.概述usrquota:支持对用户的磁盘配额grpquota：支持对组的磁
“Datawhale AI夏令营”基于带货视频评论的用户洞察挑战赛 fzyz123 Datawhale AI夏令营人工智能 Datawhale 大模型技术 NLP 深度学习 AI夏令营
前言：本次是DatawhaleAI夏令营2025年第一期的内容，赛事是：基于带货视频评论的用户洞察挑战赛（科大讯飞AI大赛）一、赛事背景在直播电商爆发式增长浪潮中，短视频平台积累的海量带货视频及用户评论数据蕴含巨大商业价值。这些数据不仅是消费者体验的直接反馈，更是驱动品牌决策的关键资产。用户洞察的核心在于视频内容与评论数据的联合挖掘：通过智能识别推广商品分析评论中的情感表达与观点聚合精准捕捉消费者
被动降噪的概念及编程实现 CodeByte 人工智能算法 javascript 编程
被动降噪是指通过编程技术和算法，对输入的数据进行处理，以减少或消除其中的噪声。噪声可以是各种形式的干扰，例如来自传感器、通信信号或其他外部源的干扰。在本文中，我们将探讨被动降噪的意义以及如何使用编程来实现这一目标。被动降噪的意义：噪声对数据的准确性和可靠性产生负面影响。在许多应用领域，例如图像处理、音频处理和信号处理中，噪声的存在可能导致数据质量下降，使得后续的分析和处理变得困难。因此，被动降噪技
反光衣识别漏检率 30%？陌讯多尺度模型实测优化
在建筑工地、交通指挥等场景中，反光衣是保障作业人员安全的重要装备，对其进行精准识别是智能监控系统的核心功能之一。但传统视觉算法在实际应用中却屡屡碰壁：强光下反光衣易与背景混淆、远距离小目标漏检率高达30%、复杂场景下模型泛化能力不足[实测数据来源：某智慧工地项目2024年Q1日志]。这些问题直接导致安全监控系统预警滞后，给安全生产埋下隐患。一、技术解析：反光衣识别的核心难点与陌讯算法创新反光衣识别
【Linux内核模块】Linux内核模块程序结构 byte轻骑兵 #嵌入式Linux驱动开发实战 linux 运维服务器
如果你已经写过第一个"HelloWorld"内核模块，可能会好奇：为什么那个几行代码的程序能被内核识别？那些module_init、MODULE_LICENSE到底是什么意思？今天咱们就来扒一扒内核模块的程序结构，搞清楚一个合格的内核模块到底由哪些部分组成，每个部分又承担着什么角色。目录一、内核模块的"骨架"：最简化结构解析二、头文件：内核模块的"说明书"2.1最常用的三个头文件2.2按需添加的其
AI音乐模拟器：AIGC时代的智能音乐创作革命 lauo 人工智能 AIGC 开源前端机器人
AI音乐模拟器：AIGC时代的智能音乐创作革命引言：AIGC浪潮下的音乐创作新范式在数字化转型的浪潮中，人工智能生成内容（AIGC）正在重塑各个创意领域。音乐产业作为创意经济的重要组成部分，正经历着前所未有的变革。据最新市场研究数据显示，全球AI音乐市场规模预计将从2023年的5.8亿美元增长到2030年的26.8亿美元，年复合增长率高达24.3%。这一快速增长的市场背后，是AI音乐技术正在打破传
盲超分的核心概念小冷爱读书数学建模盲超分超分重建
一、盲超分的本质与数学建模1.退化过程的数学表达低分辨率图像（LR）可看作高分辨率图像（HR）经过退化模型后的结果：：观测到的低分辨率图像：待恢复的高分辨率图像：模糊核（BlurKernel）⊗：卷积操作↓：下采样（步长为）：加性噪声（如高斯噪声、泊松噪声等）盲超分的核心问题：在未知、、的情况下，从估计。2.为什么传统超分方法会失效？传统方法（如SRCNN、EDSR）假设退化是固定的（如双三次下采
【DBC】DBC中CAN信号多路复用徐饼干 DBC 程序人生其他经验分享
DBC文件信号多路复用详解1何时定义有些信号比较长，但是又不常用，就可以定义多路复用信号以节约空间。2具体定义2.1定义一个短信号来当做“控制开关”。【若定义1bit，则有2种可能0x00和0x01，复用两路】【若定义2bit，则有4种可能0x00和0x01和0x10和0x11，复用四路】…所以说，这个短信号的长度和你想复用多少路有关，多长？放在什么位置？由定义者决定2.2节约空间是如何体现的现在
LangChain中的向量数据库接口－Weaviate 洪城叮当 langchain 数据库经验分享笔记交互人工智能知识图谱
文章目录前言一、原型定义二、代码解析1、add_texts方法1.1、应用样例2、from_texts方法2.1、应用样例3、similarity_search方法3.1、应用样例三、项目应用1、安装依赖2、引入依赖3、创建对象4、添加数据5、查询数据总结前言 Weaviate是一个开源的向量数据库，支持存储来自各类机器学习模型的数据对象和向量嵌入，并能无缝扩展至数十亿数据对象。它提供存储文档嵌
干货分享 | TSMaster 中不同总线报文消息过滤的操作方式 TOSUN同星 TSMaster使用教程软件工程汽车
TSMaster软件平台支持对不同总线（CAN、LIN、FlexRay）报文和信号的过滤，包括全局接收过滤、数据流过滤、窗口过滤、字符串过滤、可编程过滤，针对不同的总线信号过滤器的使用方法基本相同。今天重点和大家分享一下关于TSMaster中报文消息过滤的多种方式操作。本文关键字：CAN、LIN、FlexRay、报文消息过滤目录Catalog1.CAN报文消息过滤2.LIN报文消息过滤3.Flex
什么是RFM模型走过冬季学习笔记大数据数据分析
RFM模型是客户价值分析中一种经典且实用的量化模型，它通过三个关键维度评估用户价值，帮助企业识别最有价值的客户群体。名称RFM由三个核心指标的英文首字母组成：R（Recency）-最近一次消费时间定义：用户上一次发生交易行为距今的时间长度（如多少天前）。意义：衡量用户的活跃度和流失风险。R值越小（最近有消费），说明用户越活跃，流失风险越低；R值越大（很久没消费），用户流失风险越高。母婴场景示例：一
视频分析：让AI看懂动态画面随机森林404 计算机视觉音视频人工智能 microsoft
引言：动态视觉理解的革命在数字信息爆炸的时代，视频已成为最主要的媒介形式。据统计，每分钟有超过500小时的视频内容被上传到YouTube平台，而全球互联网流量的82%来自视频数据传输。面对如此海量的视频内容，传统的人工处理方式已无法满足需求，这正是人工智能视频分析技术大显身手的舞台。视频分析技术赋予机器"看懂"动态画面的能力，使其能够自动理解、解释甚至预测视频中的内容，这一突破正在彻底改变我们与视
低温冷启动 & 高温热启动 hahaha6016 fpga开发
低温冷启动1.在低温下，晶体管的阈值电压可能升高，导致时序路径变慢，从而可能引起建立时间（setuptime）违规。另外，也可能出现保持时间（holdtime）违规，因为低温下信号传播速度可能变快（但通常低温下延迟增加，所以建立时间问题更常见）。2.droppinglogiccore意味着在低温下某个逻辑核心（可能是一个特定的模块或IP核）无法正常启动或工作，导致功能失效3.cellname，这通
目标检测（object detection）加油吧zkf 目标检测目标检测人工智能计算机视觉
目标检测作为计算机视觉的核心技术，在自动驾驶、安防监控、医疗影像等领域发挥着不可替代的作用。本文将系统讲解目标检测的概念、原理、主流模型、常见数据集及应用场景，帮助读者构建对这一技术的完整认知。一、目标检测的核心概念目标检测（ObjectDetection）是指在图像或视频中自动定位并识别出所有感兴趣的目标的技术。它需要解决两个核心问题：分类（Classification）：确定图像中每个目标的类
不同行业的 AI 数据安全与合规实践：7 大核心要点全解析观熵人工智能 DeepSeek 私有化部署
不同行业的AI数据安全与合规实践：7大核心要点全解析关键词AI数据安全、行业合规、私有化部署、数据分类分级、国产大模型、隐私保护、DeepSeek部署摘要随着国产大模型在金融、医疗、政务、教育等关键领域的深入部署，AI系统对数据安全与行业合规提出了更高要求。本文结合DeepSeek私有化部署实战，系统梳理当前各行业主流的数据安全合规标准与落地策略，从数据分类分级、访问控制、审计追踪到敏感信息识别与
Python的科学计算库NumPy（一） linlin_1998 python numpy 开发语言
NumPy(NumericalPython)是Python中最基础、最重要的科学计算库之一，提供了高性能的多维数组（ndarray）对象和大量数学函数，是许多数据科学、机器学习库（如Pandas、SciPy、TensorFlow等）的基础依赖。1.创建一个numpy里面的一维数组importnumpyasnp###通过array方法创建一个ndarrayarray1=np.array([1,2,3
STM32 ADC详解月入鱼饵 stm32 嵌入式硬件单片机
本文介绍stm32ADC的使用，本文较长，可以配合目录跳转到需要的地方阅读。ADC转换原理本文重点在于STM32的ADC的使用，介绍ADC转换原理是为了更好理解STM32中关于ADC的配置，所以这里只是简单介绍一下ADC的转换原理，想详细了解ADC的转换原理可以看看看完这篇文章，终于搞懂了ADC原理及分类！和ADC基本工作原理-CSDN。简单来说，模拟信号输入进来，经过低通滤波操作预处理信号之后，
STM32-DAC数模转换
DAC数模转换：将数字信号转换成模拟信号特性：2个DAC转换器每个都拥有一个转换通道8位或12位单调输出（8位右对齐；12位左对齐右对齐）双ADC通道同时或者分别转换外部触发中断电压源控制部分（外部触发3个APB1；不使用1个APB1）外部触发输出：DAC1-PA4;DAC2-PA5软件设计流程：使能端口以及DAC时钟；设置引脚为模拟输入RCC_APB2PeriphClockCmd(RCC_APB
Qualcomm Hexagon DSP 与 AI Engine 架构深度分析：从微架构原理到 Android 部署实战观熵国产 NPU ×Android 推理优化人工智能架构 android
QualcommHexagonDSP与AIEngine架构深度分析：从微架构原理到Android部署实战关键词QualcommHexagon、AIEngine、HTA、HVX、HMX、Snapdragon、DSP推理加速、AIC、QNNSDK、Tensor编排、AndroidNNAPI、异构调度摘要HexagonDSP架构是QualcommSnapdragonSoC平台中长期演进的异构计算核心之一
深度学习篇---昇腾NPU&CANN 工具包 Atticus-Orion 上位机知识篇图像处理篇深度学习篇深度学习人工智能 NPU 昇腾 CANN
介绍昇腾NPU是华为推出的神经网络处理器，具有强大的AI计算能力，而CANN工具包则是面向AI场景的异构计算架构，用于发挥昇腾NPU的性能优势。以下是详细介绍：昇腾NPU架构设计：采用达芬奇架构，是一个片上系统，主要由特制的计算单元、大容量的存储单元和相应的控制单元组成。集成了多个CPU核心，包括控制CPU和AICPU，前者用于控制处理器整体运行，后者承担非矩阵类复杂计算。此外，还拥有AICore
深度学习图像分类数据集—桃子识别分类 AI街潜水的八角深度学习图像数据集深度学习分类人工智能
该数据集为图像分类数据集，适用于ResNet、VGG等卷积神经网络，SENet、CBAM等注意力机制相关算法，VisionTransformer等Transformer相关算法。数据集信息介绍：桃子识别分类：['B1','M2','R0','S3']训练数据集总共有6637张图片，每个文件夹单独放一种数据各子文件夹图片统计:·B1:1601张图片·M2:1800张图片·R0:1601张图片·S3:
法律科技领域人工智能代理构建的十个经验教训，一位人工智能工程师通过构建、部署和维护智能代理的经验教训来优化法律工作流程的历程。知识大胖 NVIDIA GPU和大语言模型开发教程人工智能 ai
目录介绍什么是代理人？为什么它对法律如此重要？法律技术中代理用例示例-合同审查代理-法律研究代理在LegalTech中使用代理的十个教训-教训1：即使代理很酷，它们也不能解决所有问题-教训2：选择最适合您用例的框架-教训3：能够快速迭代不同的模型-教训4：从简单开始，必要时扩展-教训5：使用跟踪解决方案；您将需要它-教训6：确保跟踪成本，代理循环可能很昂贵-教训7：将控制权交给最终用户（人在环路中
在 Obsidian 中本地使用 DeepSeek — 无需互联网！知识大胖 NVIDIA GPU和大语言模型开发教程人工智能 deepseek
简介您是否想在Obsidian内免费使用类似于ChatGPT的本地LLM？如果是，那么本指南适合您！我将引导您完成在Obsidian中安装和使用DeepSeek-R1模型的确切步骤，这样您就可以在笔记中拥有一个由AI驱动的第二大脑。推荐文章《24GBGPU中的DeepSeekR1：UnslothAI针对671B参数模型进行动态量化》权重1，DeepSeek类《在RaspberryPi上运行语音识别
Llama-Omni会说话的人工智能“语音到语音LLM” 利用低延迟、高质量语音转语音 AI 彻底改变对话方式（教程含源码）知识大胖 NVIDIA GPU和大语言模型开发教程 llama 人工智能 nvidia llm
介绍“单靠技术是不够的——技术与文科、人文学科的结合，才能产生让我们心花怒放的成果。”——史蒂夫·乔布斯近年来，人机交互领域发生了重大变化，尤其是随着ChatGPT、GPT-4等大型语言模型(LLM)的出现。虽然这些模型主要基于文本，但人们对语音交互的兴趣日益浓厚，以使人机对话更加无缝和自然。然而，实现语音交互而不受语音转文本处理中常见的延迟和错误的影响仍然是一个挑战。关键字：Llama-Omni
辗转相处求最大公约数沐刃青蛟 C++漏洞
无言面对”江东父老“了，接触编程一年了，今天发现还不会辗转相除法求最大公约数。惭愧惭愧！为此，总结一下以方便日后忘了好查找。 1.输入要比较的两个数a,b 忽略：2.比较大小（因为后面要的是大的数对小的数做%操作） 3.辗转相除（用循环不停的取余，如a%b,直至b=0） 4.最后的a为两数的最大公约数 &
F5负载均衡会话保持技术及原理技术白皮书 bijian1013 F5 负载均衡
一.什么是会话保持？在大多数电子商务的应用系统或者需要进行用户身份认证的在线系统中，一个客户与服务器经常经过好几次的交互过程才能完成一笔交易或者是一个请求的完成。由于这几次交互过程是密切相关的，服务器在进行这些交互过程的某一个交互步骤时，往往需要了解上一次交互过程的处理结果，或者上几步的交互过程结果，服务器进行下
Object.equals方法：重载还是覆盖 Cwind java generics override overload
本文译自StackOverflow上对此问题的讨论。原问题链接在阅读Joshua Bloch的《Effective Java（第二版）》第8条“覆盖equals时请遵守通用约定”时对如下论述有疑问： “不要将equals声明中的Object对象替换为其他的类型。程序员编写出下面这样的equals方法并不鲜见，这会使程序员花上数个小时都搞不清它为什么不能正常工作：” pu
初始线程 15700786134
暑假学习的第一课是讲线程，任务是是界面上的一条线运动起来。既然是在界面上，那必定得先有一个界面，所以第一步就是，自己的类继承JAVA中的JFrame，在新建的类中写一个界面，代码如下： public class ShapeFr
Linux的tcpdump 被触发 tcpdump
用简单的话来定义tcpdump，就是：dump the traffic on a network，根据使用者的定义对网络上的数据包进行截获的包分析工具。 tcpdump可以将网络中传送的数据包的“头”完全截获下来提供分析。它支持针对网络层、协议、主机、网络或端口的过滤，并提供and、or、not等逻辑语句来帮助你去掉无用的信息。实用命令实例默认启动 tcpdump 普通情况下，直
安卓程序listview优化后还是卡顿肆无忌惮_ ListView
最近用eclipse开发一个安卓app，listview使用baseadapter，里面有一个ImageView和两个TextView。使用了Holder内部类进行优化了还是很卡顿。后来发现是图片资源的问题。把一张分辨率高的图片放在了drawable-mdpi文件夹下，当我在每个item中显示，他都要进行缩放，导致很卡顿。解决办法是把这个高分辨率图片放到drawable-xxhdpi下。 &nb
扩展easyUI tab控件，添加加载遮罩效果知了ing jquery
(function () { $.extend($.fn.tabs.methods, { //显示遮罩 loading: function (jq, msg) { return jq.each(function () { var panel = $(this).tabs(&
gradle上传jar到nexus 矮蛋蛋 gradle
原文地址： https://docs.gradle.org/current/userguide/maven_plugin.html configurations { deployerJars } dependencies { deployerJars "org.apache.maven.wagon
千万条数据外网导入数据库的解决方案。 alleni123 sql mysql
从某网上爬了数千万的数据，存在文本中。然后要导入mysql数据库。悲剧的是数据库和我存数据的服务器不在一个内网里面。。 ping了一下， 19ms的延迟。于是下面的代码是没用的。 ps = con.prepareStatement(sql); ps.setString(1, info.getYear())............; ps.exec
JAVA IO InputStreamReader和OutputStreamReader 百合不是茶 JAVA.io操作字符流
这是第三篇关于java.io的文章了，从开始对io的不了解-->熟悉--->模糊，是这几天来对文件操作中最大的感受，本来自己认为的熟悉了的，刚刚在回想起前面学的好像又不是很清晰了，模糊对我现在或许是最好的鼓励我会更加的去学加油！： JAVA的API提供了另外一种数据保存途径，使用字符流来保存的，字符流只能保存字符形式的流字节流和字符的难点：a,怎么将读到的数据
MO、MT解读 bijian1013 GSM
MO= Mobile originate，上行，即用户上发给SP的信息。MT= Mobile Terminate，下行，即SP端下发给用户的信息；上行:mo提交短信到短信中心下行:mt短信中心向特定的用户转发短信，你的短信是这样的，你所提交的短信，投递的地址是短信中心。短信中心收到你的短信后，存储转发，转发的时候就会根据你填写的接收方号码寻找路由，下发。在彩信领域是一样的道理。下行业务：由SP
五个JavaScript基础问题 bijian1013 JavaScript call apply this Hoisting
下面是五个关于前端相关的基础问题，但却很能体现JavaScript的基本功底。问题1：Scope作用范围考虑下面的代码： (function() { var a = b = 5; })(); console.log(b); 什么会被打印在控制台上？回答：上面的代码会打印 5。 &nbs
【Thrift二】Thrift Hello World bit1129 Hello world
本篇，不考虑细节问题和为什么，先照葫芦画瓢写一个Thrift版本的Hello World，了解Thrift RPC服务开发的基本流程 1. 在Intellij中创建一个Maven模块，加入对Thrift的依赖，同时还要加上slf4j依赖，如果不加slf4j依赖，在后面启动Thrift Server时会报错 <dependency>
【Avro一】Avro入门 bit1129 入门
本文的目的主要是总结下基于Avro Schema代码生成，然后进行序列化和反序列化开发的基本流程。需要指出的是，Avro并不要求一定得根据Schema文件生成代码，这对于动态类型语言很有用。 1. 添加Maven依赖 <?xml version="1.0" encoding="UTF-8"?> <proj
安装nginx+ngx_lua支持WAF防护功能 ronin47
需要的软件:LuaJIT-2.0.0.tar.gz nginx-1.4.4.tar.gz &nb
java-5.查找最小的K个元素-使用最大堆 bylijinnan java
import java.util.Arrays; import java.util.Random; public class MinKElement { /** * 5.最小的K个元素 * I would like to use MaxHeap. * using QuickSort is also OK */ public static void
TCP的TIME-WAIT bylijinnan socket
原文连接： http://vincent.bernat.im/en/blog/2014-tcp-time-wait-state-linux.html 以下为对原文的阅读笔记说明：主动关闭的一方称为local end，被动关闭的一方称为remote end 本地IP、本地端口、远端IP、远端端口这一“四元组”称为quadruplet，也称为socket 1、TIME_WA
jquery ajax 序列化表单 coder_xpf Jquery ajax 序列化
checkbox 如果不设定值，默认选中值为on；设定值之后，选中则为设定的值 <input type="checkbox" name="favor" id="favor" checked="checked"/> $("#favor&quo
Apache集群乱码和最高并发控制 cuisuqiang apache tomcat 并发集群乱码
都知道如果使用Http访问，那么在Connector中增加URIEncoding即可，其实使用AJP时也一样，增加useBodyEncodingForURI和URIEncoding即可。最大连接数也是一样的，增加maxThreads属性即可，如下，配置如下： <Connector maxThreads="300" port="8019" prot
websocket dalan_123 websocket
一、低延迟的客户端-服务器和服务器-客户端的连接很多时候所谓的http的请求、响应的模式，都是客户端加载一个网页，直到用户在进行下一次点击的时候，什么都不会发生。并且所有的http的通信都是客户端控制的，这时候就需要用户的互动或定期轮训的，以便从服务器端加载新的数据。通常采用的技术比如推送和comet（使用http长连接、无需安装浏览器安装插件的两种方式：基于ajax的长
菜鸟分析网络执法官 dcj3sjt126com 网络
最近在论坛上看到很多贴子在讨论网络执法官的问题。菜鸟我正好知道这回事情.人道"人之患好为人师" 手里忍不住,就写点东西吧. 我也很忙.又没有MM,又没有MONEY....晕倒有点跑题. OK,闲话少说,切如正题. 要了解网络执法官的原理. 就要先了解局域网的通信的原理. 前面我们看到了.在以太网上传输的都是具有以太网头的数据包.
Android相对布局属性全集 dcj3sjt126com android
RelativeLayout布局android:layout_marginTop="25dip" //顶部距离android:gravity="left" //空间布局位置android:layout_marginLeft="15dip //距离左边距 // 相对于给定ID控件android:layout_above 将该控件的底部置于给定ID的
Tomcat内存设置详解 eksliang jvm tomcat tomcat内存设置
Java内存溢出详解一、常见的Java内存溢出有以下三种： 1. java.lang.OutOfMemoryError: Java heap space ----JVM Heap（堆）溢出JVM在启动的时候会自动设置JVM Heap的值，其初始空间(即-Xms)是物理内存的1/64，最大空间(-Xmx)不可超过物理内存。可以利用JVM提
Java6 JVM参数选项 greatwqs java HotSpot jvm jvm参数 JVM Options
Java 6 JVM参数选项大全（中文版）作者：Ken Wu Email: [email protected] 转载本文档请注明原文链接 http://kenwublog.com/docs/java6-jvm-options-chinese-edition.htm！本文是基于最新的SUN官方文档Java SE 6 Hotspot VM Opt
weblogic创建JMC i5land weblogic jms
进入 weblogic控制太 1.创建持久化存储 --Services--Persistant Stores--new--Create FileStores--name随便起--target默认--Directory写入在本机建立的文件夹的路径--ok 2.创建JMS服务器 --Services--Messaging--JMS Servers--new--name随便起--Pers
基于 DHT 网络的磁力链接和BT种子的搜索引擎架构 justjavac DHT
上周开发了一个磁力链接和 BT 种子的搜索引擎 {Magnet & Torrent}，本文简单介绍一下主要的系统功能和用到的技术。系统包括几个独立的部分：使用 Python 的 Scrapy 框架开发的网络爬虫，用来爬取磁力链接和种子；使用 PHP CI 框架开发的简易网站；搜索引擎目前直接使用的 MySQL，将来可以考虑使
sql添加、删除表中的列 macroli sql
添加没有默认值：alter table Test add BazaarType char(1) 有默认值的添加列：alter table Test add BazaarType char(1) default(0) 删除没有默认值的列：alter table Test drop COLUMN BazaarType 删除有默认值的列：先删除约束（默认值）alter table Test DRO
PHP中二维数组的排序方法 abc123456789cba 排序二维数组 PHP
<?php/*** @package BugFree* @version $Id: FunctionsMain.inc.php,v 1.32 2005/09/24 11:38:37 wwccss Exp $*** Sort an two-dimension array by some level
hive优化之------控制hive任务中的map数和reduce数 superlxw1234 hive hive优化
一、控制hive任务中的map数: 1. 通常情况下，作业会通过input的目录产生一个或者多个map任务。主要的决定因素有： input的文件总个数，input的文件大小，集群设置的文件块大小(目前为128M, 可在hive中通过set dfs.block.size;命令查看到，该参数不能自定义修改)；2.
Spring Boot 1.2.4 发布 wiselyman spring boot
Spring Boot 1.2.4已于6.4日发布，repo.spring.io and Maven Central可以下载(推荐使用maven或者gradle构建下载)。这是一个维护版本，包含了一些修复small number of fixes,建议所有的用户升级。 Spring Boot 1.3的第一个里程碑版本将在几天后发布，包含许多