jessie_weiqing

卷积神经网络用于振动光谱数据分析

卷积神经网络在振动光谱数据上的应用

卷积神经网络用于振动光谱数据分析
Convolutional neural networks for vibrational spectroscopic data analysis

（一）摘要和简介
（二）方法

2.1 寻找重要的光谱区域
2.2 卷积核中元素的解释

（三）评估研究

3.1 数据集
3.2 用于比较的其他分类技术

3.2.1 PLS-LDA
3.2.2 Logistic回归
3.2.3 k近邻

3.3 数据预处理

（四）结果

4.1 原始数据上的结果
4.2 预处理数据上的结果
4.3 讨论

（五）重要光谱区域

5.1 FTIR beers 数据集
5.2 Tablets 数据集

（六）结论

卷积神经网络用于振动光谱数据分析

Convolutional neural networks for vibrational spectroscopic data analysis

Convolutional neural networks for vibrational spectroscopic data analysis

Jacopo Acquarelli, Twan van Laarhoven, Jan Gerretzen, Thanh N. Tran, Lutgarde M.C. Buydens, Elena Marchiori (2017)

（一）摘要和简介

这篇文章的研究结果表明，卷积神经网络可以有效地对振动光谱数据进行分类，识别重要的光谱区域。CNN是目前最先进的图像分类和语音识别技术，可以学习数据的可解释性表示。CNN的这些特性减少了对预处理和突出重要光谱区域的需求，而这两者都是分析振动光谱数据的关键步骤。

振动光谱数据的化学计量分析通常依赖于基线校正、散射校正和噪声去除等预处理方法，这些方法在模型建立之前应用于光谱。预处理是一个关键的步骤，因为即使在简单的问题中使用“合理的”预处理方法也可能降低最终模型的性能。

作者开发了一种新的基于CNN的方法，并提供了一个配套的公开可用的软件。它基于一个简单的CNN架构，只有一个卷积层（所谓浅CNN）他们的方法优于化学计量学标准分类分类算法（如PLS）应用于未进行过预处理的测试数据时的准确性（平均准确率86%，而PLS为62%）它甚至在预处理过的测试数据上达到了更好的性能（平均准确率96%，而PLS为89%）为了便于解释，作者的方法还包括了一个寻找重要光谱区域的过程，从而有助于结果的定性解释。

振动光谱学涉及到红外（IR）和拉曼光谱的特殊光学技术。振动光谱数据分类模型将输入对象（光谱）映射到所需的输出（类分配）。在此背景下设计一个分类模型是一项具有挑战性的任务，而这一任务在不同的领域都有所应用，如制药、聚合物、法医学、环境、食品科学以及医学。目前流行的化学计量学技术包括人工神经网络、支持向量机和线性判别分类器。这些技术通常应用于预处理过的数据。在这方面的主要困难之一是就使用何种光谱预处理方法和最佳设置达成共识。

数据预处理用于提高后续多元分析的稳健性和准确性，并通过纠正与光谱数据采集相关的问题来提高数据的可解释性。预处理方法通常取决于研究的目的和所使用的技术（拉曼或红外）已经开发了大量用于振动光谱数据的预处理方法和软件。这些方法通常是基于一些任意的标准来选择的，例如“它在以前的数据集上运行良好”。最近已经表明，即使对于相对简单的问题，大多数“合理的”预处理方法及其各自的参数设置实际上可能会降低最终模型的性能。一般来说，相同的预处理技术对于一个数据集可能很有效，但是当应用于使用不同的机器、设置或样本矩阵生成的另一个数据集时，则不起作用。

虽然化学计量学研究团体迄今为止主要集中在选择一个好的预处理方法的问题上，但是机器学习团体考虑了一些相关的问题，即学习数据的表示，识别和解开隐藏在数据中的潜在解释因素。尤其是卷积神经网络（CNNs）受到动物视觉皮层生物过程的启发（在动物视觉皮层中，细胞对视觉场的小的子区域很敏感）

CNN是多层感知器（MLP）的变体，MLP是一种前馈人工神经网络（ANN）模型（如下图）它将输入数据映射到一组适当的输出。用于分类的ANN在过去已被应用于振动光谱数据。然而，这些计算模型有两个主要问题。首先，它们容易过拟合，导致新数据的性能很差。其次，无法对分类器进行解释（训练后的神经网络被视为一个“黑匣子”）

机器学习的最新进展使得CNN可以被用来解决这两个问题。CNN的设计考虑了输入数据的空间信息：它们通过加强相邻层神经元之间的局部连接模式，探索空间-局部相关性。与传统的神经网络相比，CNN的参数更少，并且通过嵌入正则化技术，对过拟合问题具有更强的鲁棒性。这些网络的每个卷积层的输出与输入频谱的小区域直接相关。因此，训练后CNN可以用来从分类器中识别输入数据的重要区域。

CNN是目前二维数据（图像）分类的前沿技术，近年来也被应用于高光谱遥感场景的三维数据分类。用于图像分类的CNN使用池化层和全连接层。该文章主要关注一维数据（振动光谱数据），不使用池化层，而是利用卷积核和步长对数据进行平滑处理。步长使最终的模型更容易用于识别重要的光谱区域，而不是池化。此外，作者根据目标（平滑输入信号，在该例中是一个振动频谱）使用了一个新的正则项。这样，CNN能够更容易地适应不同的频谱输入，从而推广到其他数据。这是CNN在振动光谱数据重要区域的分类和识别上的第一次应用。

作者证明了一种基于浅层CNN的简单方法（如下图）比偏最小二乘回归线性判别分析（PLS-LDA）和kNN的分类精度有明显的提高，分别考虑了两种场景：即不进行任何预处理，以及对输入光谱采用了一种最优的预处理方法。此外，作者的研究结果还表明CNN比PLS-LDA更少地依赖于预处理（该软件提供了公开的获取途径）

结果的解释在化学计量学中与分类一样重要，这也是为什么PLS-LDA是化学计量学中使用的一种标准方法的原因。在作者使用的方法中，他们通过对卷积层的输出应用特征选择来检测重要的光谱区域：卷积提供的光谱的新表示突出了被认为相关的光谱区域。

总的来说，这篇文章的主要创新点为：

使用非标准CNN：浅层架构（只有一个隐藏的卷积层）没有池化层
为CNN设计了一个自定义的损失函数，其中包含一个新的正则项，以加强附近特征之间的相似性
通过寻找重要的光谱区域来增强CNN

实验结果表明，该方法为振动光谱数据的分类和解释提供了有力的工具。

（二）方法

本节将首先简要介绍ANN的一般原理。接下来描述该文章为了使神经网络适合于振动光谱数据的数据分析所做出的修改。最后详细描述CNN方法在光谱特征选择上的应用。

ANN由一组相互连接的神经元组成。神经元是神经网络的基本单位，由所谓的“激活函数”（将神经元的输入转换为输出）进行区分。神经元按层组织，每层的神经元都具有相同的激活函数。MLP是一个前馈神经网络，同一层单元之间没有连接（前馈意味着也没有从神经元到前一层的连接）

可以将层分为3组：输入层、隐藏层和输出层。输入层为第一层，一般具有线性激活函数。输出层是最后一层，一般具有线性或softmax激活函数，分别用于回归和分类。MLP一般有一个或多个具有相同非线性激活函数的隐层，每一层的每一个单元都使用加权连接连接到下一层的每一个单元（全连接）这些权重通常都会随机初始化并在训练阶段以有监督的方式进行学习。为此，利用反向传播和梯度下降法的不同变体，根据网络预测误差的目标函数，求出局部最小值。

使用全连接层意味着需要训练相当数量的权重，而这个数量取决于每一层的单元数。当只有几个样本可用来训练权重时，网络很容易过拟合。这是为什么ANN在化学计量学数据分析中不常用的主要原因之一，尽管它们非常适合处理高度非线性的问题（例如，可能由于数据预处理不当而发生的问题）。

作者试图通过使用MLP的变体来克服这个限制，使用非完全连接的层（即需要训练的权重更少）并在目标函数中引入正则项。正则化通过赋予小的权重，增强了神经网络在训练数据之外的适用性。这些方法通常更可取，因为从某种意义上说，较小的权重意味着较低的复杂性，因此可以更容易地解释数据。

作者使用的是卷积层，而不是全连接层（因此得名CNN）首先对输入使用一个卷积核做卷积操作。一般来说，一个或多个卷积核可用于捕获每个卷积层输入数据的不同的属性，而付出的代价是权重的增加。

卷积操作是通过从第一个到最后一个输入元素以某一个固定的步长 stride 移动一个包含 $N$ 个元素的卷积核 $\mathbf{k}=\sum_{i}^{N}w_i$ 。由输入生成的一个新的表示是利用整个频谱上的邻近特征得到的，为此每个内核都会被反复应用于输入本身。每次应用后，卷积的结果会作为输入提供给一个经过校正的线性函数， $\phi(x)=max(0,x)$ ，通常用作卷积层的激活函数。因此，每个核通过修正的线性函数，产生了输入的不同表示形式，并独立地连接到下一层。

与全连接层不同，在卷积层上，唯一需要学习的权值是卷积核的权值，这种权重数量的减少有利于网络泛化性能的提升。输出层使用softmax激活函数，这是分类任务的常见选择，因为它可以将预测转化为非负值，并将其标准化，从而得到类的概率分布： $softmax_k(x)=\frac{e^{W_k^Tx}}{\sum_{j=1}^ne^{W_j^Tx}}$ 其中， $x$ 是输入向量， $n$ 是输出层的节点个数（或者说类别个数） $W_k$ 是第k个节点的权重。

作为目标，作者考虑了由交叉熵误差损失组成的下列函数，并加入了正则项：

其中， $\hat{y_n} \equiv \psi(\mathbf{w}\cdot\mathbf{x}_n)$ 是网络的输出， $\psi(\cdot)$ 是激活函数， $x_n$ 是第n个样本， $\mathbf{w}$ 是权重， $y_n$ 是目标标签， $Shift(\dot)$ 是将数组的元素向左移动一个位置的操作。除了标准L2范数外，作者还使用了“近似L2范数”，这有助于网络保持相邻的输入变量（即振动光谱数据的波数）之间的相关性，以惩罚相邻权重之间的巨大差异。对于振动光谱数据，不期望这些变化，因为频谱在某个波数上的值依赖于相邻的波数值。

作者使用的是一维核，因为每个样本（即频谱）都表示为一维数组（向量）他们还使用了一个全链接的输出层（在卷积层之后）它的单元数等于类的数量。在这个输出层上使用softmax激活函数可以获得网络对输入样本的类预测。在神经网络的训练过程中，使用随机梯度下降（SGD）更新规则这一标准技术。

对于卷积核和输出层的权重的初始化，作者选择的是“Glorot”初始化，因为可以通过跟踪用于随机化的种子来复制初始化。因此，模型的参数及其值的范围是：

卷积层的卷积核个数： $\#kernels\in{ 1,2,4}$
卷积核的大小： $N\in[2,91]$
卷积步长： $S\in[1,39]$
正则项中的参数:： $\lambda_1,\lambda_2=10^n$ ，其中 $n\in[-3,3]$
SGD更新规则中的 momentum： $momentum\in0.1*[2,9]$
学习率： $lr=10^n$ ，其中 $n\in[-8,-1]$

为了找到参数值的最佳组合，作者在训练阶段使用随机网格搜索交叉验证框架（RGS-CV）来选择精度最高的配置。然后利用所有训练数据对该模型进行了改造，并将其应用于试验数据中，获得了较好的分类精度。

他们将得到的方法称为CNNVS，即用于振动光谱数据分类的卷积神经网络。

2.1 寻找重要的光谱区域

建立高质量的分类模型和识别潜在的重要光谱区域是振动光谱数据分析的两个重要方面。偏最小二乘回归-线性判别分析（PLS-LDA）等方法可以通过在潜在变量空间中表示输入特征来寻找重要的输入特征。虽然PLS-LDA可能提供不可靠的适应症，尤其是对于大量不相关数据的数据变体，但是它可以反馈变量重要性，这使得它在化学计量学数据分析中的受欢迎程度超过了更强大的方法，如具有非线性内核的支持向量机（如SVM，其特征相关性无法从模型中轻易量化）

将特征选择过程集成到CNNVS中来识别重要的光谱区域是很简单的。训练后的CNN卷积层的每个输出节点对应一个应用于频谱特定区域的核。因此，可以将特征选择算法应用到这种输出中去寻找重要的特征；然后将这些特征返回到光谱的相应区域。

在作者的分析中，使用了稳定性特征选择。稳定性特征选择是将特征选择应用于随机选取的数据子集（即训练后的CNNVS卷积层的输出）该特征选择是通过重新训练CNNVS的最后一层来执行的，该层可以被视为逻辑回归网络，该逻辑回归网络具有响应于光谱的不同子集的卷积层的输出作为输入，以及类别预测作为输出。每次再训练后，选择系数为正的特征。然后，通过考虑每个特征被选择的次数，合并子集上的结果，从而为每个特征生成一个分数。

稳定性特征选择的动力来自于该方法在特征数远大于样本数的问题中的有效性，这是大多数振动光谱数据集的情况。我们称之为识别重要光谱区域的结果方法CNNVSfs，卷积神经网络用于包含特征选择的振动光谱数据分类。

2.2 卷积核中元素的解释

如第2节所述，可以在一个卷积层上使用多个内核。目的是利用不同的核来捕捉光谱的不同性质。它们数量上的限制主要与过拟合有关，因此作者使用模型选择方法RGS-CV（在第2节末尾描述过）来排除那些对于所考虑的数据集而言具有太多卷积核的模型。

对于解释光谱上的伪影，以及推测每个核的行为与已知的预处理方法之间的关系，需要对学习到的核进行分析。

（三）评估研究

为了比较评估方法的性能，作者收集了一些公开可用的振动光谱数据集进行分类。他们将CNNVS与PLS-LDA进行了比较。PLS-LDA是一种具有一定预测精度和可解释性的模型，因此常用于化学计量数据分析。作者还考虑了Logistic回归，一个非常简单的神经网络，没有隐藏层，输入通过一个激活函数 $\phi(t)=\frac{1}{1+e^{-t}}$ 直接传递到输出层。因此，将CNNVS与Logistic回归进行比较，可以研究使用卷积隐层的有效性。最后，作者还使用了kNN，一个不需要训练的简单方法。

作者进行了两个系列的实验：

直接对原始数据应用不同的分类方法（即不进行预处理）
在应用分类方法之前进行数据预处理。为此，作者按照以往的一般程序对数据进行预处理。对于每一种分类方法，都使用内部交叉验证来找到应用于数据的最优预处理方法（或方法组合）3.3节会进行详细的描述。

3.1 数据集

该文章考虑了以下振动光谱数据集：

啤酒数据集包括Rochefort 8（类1）和Rochefort 10（类2）使用三种不同类型的光谱：傅里叶变换红外（FT-IR），近红外（NIR）和拉曼。
葡萄酒数据集（FT-IR），其中四个类别代表不同的地理区域来源
药片数据集，采用近红外（NIR）和拉曼光谱（Raman），将样品分为4种不同类型的片剂，其活性物质含量不同
咖啡数据集，包含阿拉比卡咖啡（1类）和罗布斯塔咖啡（2类）。该数据集中的光谱被截断为800-2000 $cm^{-1}$
橄榄油数据集（FT-IR）包含来自4个不同国家（希腊、意大利、葡萄牙和西班牙）的4个不同类别的样品。该数据集中的光谱被截断到799-1897 $cm^{-1}$
果汁数据集包含草莓果汁（1类）和非草莓果汁（2类）光谱截断至899-1802 $cm^{-1}$
肉类数据集包含鸡肉（1类）猪肉（2类）和火鸡肉（3类）光谱被截断至1000-1800 $cm^{-1}$

下表对不同数据集的特征进行了概述。对于片剂、咖啡、肉类和橄榄油数据集，在没有预先定义的测试集的情况下，作者构建了一个训练集，包含随机选择的67%的样本，其余33%的样本作为测试集。

3.2 用于比较的其他分类技术

作者采用了标准偏最小二乘线性判别分析（PLS-LDA）方法，逻辑回归（LogReg）和k近邻（kNN）

3.2.1 PLS-LDA

偏最小二乘是一种回归方法，其目的是将一个包含n个样本和p个变量的数据集表示为一个潜在变量 $T=[t_1,t_2,...t_a]$ 的空间，方向与响应既有高方差又有高相关性。然后使用这样一组n个响应表示来拟合所有样本。这与主成分回归（PCR）形成了鲜明的对比，后者只寻找那些能使方差最大化的潜在变量。已有研究表明，当样本的组内变异性大于组间变异性时，以及需要减少变量时，PLS才是有用和有效的。这是许多化学计量数据集的情况，因为它们通常包含许多变量和相对较少的样本。

3.2.2 Logistic回归

Logistic回归可以看作是CNN的最后一层，换句话说，它是一个非常简单的神经网络，没有隐藏层。因此，将CNN与包含L2正则的逻辑回归进行比较，可以直接研究卷积层的重要性。分类目标函数由交叉熵误差损失和L2正则项组成：

其中， $\hat{y_n} \equiv \psi(\mathbf{w}\cdot\mathbf{x}_n)$ ， $\psi(\cdot)$ 为激活函数， $x_n$ 为第n个样本， $w$ 为输出权值， $y_n$ 为目标标签。换句话说，这是一个简单的网络（需要调优的参数很少）因此它提供了一个可以与CNN进行比较的基线。使用RGS-CV网络进行学习的超参数为：

正则项系数 $\lambda_1:10^n$ ，其中 $n\in[-3,3]$
学习率 $10^n$ ，其中 $n\in[-8,1]$

训练过程中使用SGD更新权重。

3.2.3 k近邻

k近邻（kNN）是一种非常简单而著名的分类方法。新样本的分类方法是在特征空间中选择属于k个最近邻的最频繁的类。作者用来评估样本之间距离的度量标准是曼哈坦距离和欧氏距离。考虑了 $k\in[3,10]$ ，如前所述，k的最佳值与最佳度量方法使用RGS-CV进行选择。

3.3 数据预处理

光谱数据通常包含多个数据伪影。这些数据伪影表示与研究样本无关的数据中的变化。对于振动光谱数据，最常见的数据伪影是基线、光散射效应和仪器噪声。这种变化与响应变量无关，因此通常在实际数据分析之前需要通过数据预处理将其从数据中删除。作者采用了一种顺序的数据预处理方法，对数据连续应用了一系列预处理方法。这种连续应用的预处理方法的选择称为预处理策略。作者的预处理策略包括四个预处理步骤，每个步骤都与一些可能的方法相关联：

基线校正处理倾斜或变化基线的频谱：
多项式去趋势（PolDetr）：多项式阶数 $\in[2,4]$
非对称最小二乘基线估计（AsLS）
一/二阶导（deriv1/deriv2）
散射校正，以处理不同的光散射效应：
均值，中位数，最大值缩放（Mean/Median/MaxScaling）
L2范数（L2）
标准正态变量变换（SNV）
鲁棒正态变量变换（RNV）
多元散射校正（MSC）
消除噪声以平滑光谱：Savitsky-Golay（SavGol）（多项式阶数 $\in[2,4]$ 窗口宽度 $\in\{5,9,11\}px$ ）
缩放：
meancenter（MeanCent）
Auto/Level/Logarithm/Range/Pareto/Poisson缩放
对数变换（LogTrans）

注意，方法的顺序与这里给出的顺序是固定的，因为这是最常用的预处理方法顺序。meancenter总是应用于数据。

数据集预处理方法的最佳组合可能取决于所考虑的分类模型的类型。因此，对于每一个数据集和方法，都选择了最佳的预处理策略。考虑了上述方法的所有组合（ $7 * 10 * 10 * 7 = 4900$ 种组合）选择了对训练数据进行十折交叉验证精度最高的组合。下表总结了CNN的预处理策略。

（四）结果

下表展示了测试集中分类方法的精度：对于每一种方法，选择使用交叉验证获得最高精度的模型。

所述结果为分类方法在预处理数据（pre）和原始数据（raw）上的应用。使用3.3中描述的方法得到方法与数据集每次组合所采用的预处理策略。

4.1 原始数据上的结果

在非预处理数据上，CNNVS的准确率显著高于PLS-LDA （p值<0.001）平均提高24%。它也比Logistic回归（p值<0.001）有6%的平均改善。除了Raman tablet数据集，CNNVS总是优于逻辑回归。观察这个数据集与其他数据集的差异，在学习曲线、学习卷积核或原始光谱（在本例中与其他拉曼光谱进行了比较）方面没有发现大的差异。

4.2 预处理数据上的结果

预处理数据的结果表明，与非预处理数据相比，PLS-LDA的性能得到了提高，平均准确率提高了27%。在这种情况下，CNNVS比PLS-LDA（p值<0.001）和Logistic回归（p值<0.001）具有更好的准确性。PLS-LDA的平均精度仍然低于CNNVS（比CNNVS低7%）在考虑的大多数数据集中，有一个预处理策略使CNNVS优于PLS-LDA。事实上，任何使用优化预处理策略的方法的性能都显著优于不使用预处理的方法。换句话说，预处理对于数据分析确实是一个有价值的补充，不管使用什么数据分析方法。

4.3 讨论

结果表明，与PLS-LDA相比，CNNVS对预处理的依赖性较小。为了进一步证实这个结果，使用直方图比较了CNN和PLS-LDA的许多不同预处理策略的准确性。在Beers数据集上的结果如下图所示。直方图显示，PLS-LDA原始数据的精度与预处理可能达到的最佳精度相差甚远，而CNN的这种差异较小。此外，CNN获得的精度值范围小于PLS-LDA。这说明CNN对数据预处理的依赖程度比PLS-LDA低。

然而，适当的预处理仍然能够提高CNN模型的精度。对于Logistic回归和CNN来说，预处理在大多数情况下是适得其反的（即导致精度低于原始数据）这说明选择合适的预处理方法是数据分析的一个重要步骤。在其他数据集中也观察到类似的趋势。kNN对原始数据执行得相当好，但它似乎没有从特别的预处理中获益。

作者还研究了CNNVS学习到的核，以便可能将它们与众所周知的预处理方法联系起来。虽然没有进行全面的调查，但至少给出一个解释学习到的核的示例是有趣的。例如，CNNVS对beer非预处理数据集学习到的非零元素数量较多（见下图）说明它们在进行一种平滑处理，而它们的线性趋势表明它们在执行正向和反向求导。

模型选择方法在交叉验证的基础上为卷积层选择了两个核，以达到最高的精度。注意，这两个核并不是冗余的，因为在卷积层之后需要对非线性进行校正。因此，第一个核在强度上升时输出非零值，而第二个核在强度下降时输出非零值。

如果考虑使用预处理数据学习到的核，情况就不那么清楚了，CNNVS似乎也学习了与更高阶导数对应的核。模型选择方法为卷积层选择了四个内核，而不是像非预处理数据一样选择两个核。这表明，使用优化设计的预处理可以让CNNVS在不过拟合的情况下使用更多的核，从而达到更高的精度。

CNNVS学习其他数据集的核也表现出类似的行为，只有少数例外，这表明对于检查过的非预处理数据，需要一个平滑派生核。

（五）重要光谱区域

在化学计量学数据分析中，模型解释是一个非常重要的方面。因此，识别出与样本的鉴别化学性质相对应的重要光谱区域是至关重要的，例如物质的存在或其浓度。在接下来的部分中，将比较CNNVSfs在进行最佳预处理和不进行预处理的情况下检测到的重要区域。

关于beers和tablets的一些重要光谱区域的数据集已其他文献中进行过研究。因此，作者也对这些数据集，利用CNNVSfs来研究寻找重要的光谱区域。

5.1 FTIR beers 数据集

已有文献表明这一数据集最重要的光谱区域在1000-1200 $cm^{-1}$

CNNVSfs在非预处理数据集上的应用结果识别出的光谱区域为1000-1200 $cm^{-1}$ （见下图右侧）CNNVSfs在预处理数据集上的应用识别出光谱区域有两个，其中包括一个在 1000和2000 $cm^{-1}$ 中间的一个区域（见下图左侧）因此，使用预处理或非预处理输入光谱训练的CNNVSfs都突出了重要区域的一部分。

5.2 Tablets 数据集

在未经预处理的NIR Tablets数据集上，CNNVSfs在7700、8850、9500和10500 $cm^{-1}$ 左右的波数处识别到不同的光谱区域（见下图右）特别是在波数为 8830 $cm^{-1}$ 的区域，含有已知活性物质的峰值。该峰也由CNNVSfs在预处理后的输入光谱上得到了体现（见下图左）。因此，对于这个数据集，使用预处理或非预处理输入光谱训练的CNNVSfs都突出了重要的区域。

在Raman Tablets数据集中，重要区域来自于活性物质的存在，包括源于活性物质中氰化物（ $C\equiv N$ ）基团的波数为 2233 $cm^{-1}$ 的峰，在Tablets光谱中可以看到来自活性物质的几个其他峰（如波数为1614和3075 $cm^{-1}$ ）以往在这个数据集上使用的PLS分类方法只达到了较低的准确性，因此，以往没有进一步研究识别出的重要光谱区域。

在未进行预处理的数据集中，CNNVSfs在波数约 350、1700和3100 $cm^{-1}$ 之间选取光谱区域（见下图右）从而识别出活性物质的峰，但CNNVSfs认为主峰在波数2233 $cm^{-1}$ 处并不重要。在预处理数据集上，CNNVSfs选择了2233（活性物质的主峰，见下图左）和1900 $cm^{-1}$ 左右的波数之间的光谱区域。因此，在这种情况下，对输入光谱进行的最优预处理有助于识别出重要区域。

（六）结论

作者设计了一种简单的基于CNN的振动光谱数据分类方法，称为CNNVS，并展示了如何增强它以选择重要的光谱区域。与PLS-LDA和Logistic回归相比，CNNVS在未进行预处理和预处理数据上的应用都具有更好的精度。结果表明，与标准的PLS-LDA方法相比，CNNVS对预处理的依赖性较小，对预处理数据的处理效果较好。需要更多的振动光谱分类数据集，看看这些强结果是否也适用于不同的设置。

一般说来，振动光谱数据具有相对较少的样本和较多的特征。为了提高模型的精度，增加数据大小的一种技术是数据增强，即添加扰动样本。该技术在CNN图像分析中得到了广泛的应用。然而，对于振动光谱数据，它并没有产生有益的影响。初步实验表明，这可能是由于不同的数据需要不同的预处理策略组合，在这种情况下很难对噪声进行建模。

学习到的CNN核函数执行一种平滑和导数滤波。这将意味着这些过滤器不需要作为单独的预处理步骤，从而简化了最佳预处理方法的选择。如果CNNVS真的能够通过如此简单的预处理选择始终达到类似的精度，这将是一件有趣的事情。

本文研究了振动光谱数据的分类问题。未来可以考虑使用回归方法，将研究扩展到振动光谱数据的成分分析，这将是有意思的研究。

更详细的实验结果请查看该文章的支撑数据。

你可能感兴趣的:(CNN,振动光谱数据,笔记,近期论文笔记)

FB-OCC: 3D Occupancy Prediction based on Forward-BackwardView Transformation justtoomuchforyou 智驾
NVidia，CVPR20233DOccupancyPredictionChallengeworkshoppaper：https://arxiv.org/pdf/2307.1492code：https://github.com/NVlabs/FB-BEV大参数量imagebackboneInternImage-H，1B外部数据集预训练：object365nuscenes：有点云label，强化网络
[学习] C语言编程中线程安全的实现方法（示例）极客不孤独学习 c语言安全
C语言编程中线程安全的实现方法在多线程编程中，线程安全（ThreadSafety）是一个非常重要的概念。当多个线程同时访问共享资源时，如果没有合理的同步机制，就可能导致数据竞争、死锁甚至程序崩溃。本文将详细介绍在C语言中如何实现线程安全的几种主要方式，并提供可以实际运行的代码示例。文章目录C语言编程中线程安全的实现方法一、什么是线程安全？二、C语言中线程安全的实现方式方法一：互斥锁（Mutex）✅
[Python] 使用 dataclass 简化数据结构：定义、功能与实战踏雪无痕老爷子 Python python 开发语言
在经典面向对象编程中，为了保存和操作数据往往需要定义多个类，手写__init__()、__repr__()、__eq__()等方法。Python3.7引入了@dataclass装饰器，它能自动生成这些常见方法，大幅减少样板代码。本文将介绍dataclass的定义与参数、比较与普通类的差别、实战示例，以及常见注意事项。一、什么是dataclass@dataclass是一种类装饰器，它通过类成员的类型
[Python]-基础篇1- 从零开始的Python入门指南踏雪无痕老爷子 Python python 开发语言
无论你是尚未接触编程的新手，还是想从其他语言转向Python的开发者，这篇文章都是你的入门课。一、Python是什么？Python是一种解释型、高级、通用型编程语言，以简洁明了、简单易用着称。它可以应用于网站开发、自动化脚本、数据分析、人工智能、系统操作等多种场景。二、如何安装Python步骤：访问Python官方网站选择目前最新的Python3.x版本下载Windows用户请务必勾选“AddPy
如何在FastAPI中打造坚不可摧的Web安全防线？
url:/posts/9d6200ae7ce0a1a1a523591e3d65a82e/title:如何在FastAPI中打造坚不可摧的Web安全防线？date:2025-06-28T08:37:03+08:00lastmod:2025-06-28T08:37:03+08:00author:cmdragonsummary:Web安全三要素包括机密性、完整性和可用性。机密性通过加密算法保护数据传输和
算法竞赛备考冲刺必刷题（C++） | 洛谷 P8814 解密热爱编程的通信人算法 c++开发语言
本文分享的必刷题目是从蓝桥云课、洛谷、AcWing等知名刷题平台精心挑选而来，并结合各平台提供的算法标签和难度等级进行了系统分类。题目涵盖了从基础到进阶的多种算法和数据结构，旨在为不同阶段的编程学习者提供一条清晰、平稳的学习提升路径。欢迎大家订阅我的专栏：算法题解：C++与Python实现！附上汇总贴：算法竞赛备考冲刺必刷题（C++）|汇总【题目来源】洛谷：P8814[CSP-J2022]解密-洛
【网络】Linux 内核优化实战 - net.core.rmem_max 锅锅来了 Linux性能优化原理和实战网络 linux 运维
目录参数作用与原理默认值与查看方法调整场景与方法适用场景调整方法与其他参数的协同性能影响与注意事项典型案例总结net.core.rmem_max是Linux内核中控制套接字接收缓冲区（ReceiveBuffer）最大允许值的参数。它与net.core.rmem_default（默认值）共同决定了网络数据接收的性能上限和内存使用策略。以下是详细解析：参数作用与原理核心功能：限制单个套接字接收缓冲区的
构建医学文献智能助手：基于 LangChain 的专业领域 RAG 系统实践
前言在当今医疗科技快速发展的时代，每天都有数以千计的医学研究成果在全球范围内发表。从临床试验报告到基础研究论文，从流行病学调查到药物研发数据，这些专业文献承载着推动医学进步的重要知识。然而，面对如此海量且专业性极强的文献资料，医疗从业者往往感到力不从心。如何在有限的时间内，准确把握文献核心价值，并将其转化为临床实践的指导？这个问题一直困扰着整个医疗行业。1.项目背景与业务价值1.1医学文献阅读的困
Python爬虫实战：全方位爬取知乎学习板块问答数据 Python爬虫项目 2025年爬虫实战项目 python 爬虫学习开发语言 scrapy 游戏
1.项目背景与爬取目标知乎是中国最大的知识问答社区，聚集了大量高质量的学习资源和经验分享。爬取知乎“学习”板块的问答数据，可以为学习资料整理、舆情分析、推荐系统开发等提供数据支持。本项目目标：爬取“学习”话题下的热门问答列表抓取每个问答的标题、作者、回答内容、点赞数、评论数等详细信息实现动态加载内容的抓取，包含图片和富文本避免被反爬机制限制，保证数据采集稳定结合数据分析，为后续应用打基础2.知乎“
Python爬虫实战：爬取知乎问答与用户信息 Python爬虫项目 python 爬虫 php 数据分析开发语言开源
简介随着网络信息量的爆炸，如何有效获取有价值的内容，成为了数据分析、机器学习等领域的基础之一。爬虫作为数据采集的基本工具之一，常常被用来获取互联网上的公开数据。在这篇博客中，我们将结合最新的Python爬虫技术，详细讲解如何爬取知乎问答与用户信息。本文将会介绍：Python爬虫的基础知识知乎问答网页结构分析使用Python进行知乎数据爬取爬取知乎问答内容与用户信息如何处理和存储爬取的数据使用最新的
人脸识别算法赋能园区无人超市安防升级智驱力人工智能算法人工智能边缘计算人脸识别智慧园区智慧工地智慧煤矿
人脸识别算法赋能园区无人超市安防升级正文在园区无人超市的运营管理中，传统安防手段依赖人工巡检或基础监控设备，存在响应滞后、误报率高、环境适应性差等问题。本文从技术背景、实现路径、功能优势及应用场景四个维度，阐述如何通过人脸识别检测、人员入侵算法及疲劳检测算法的协同应用，构建高效、精准的智能安防体系。一、技术背景：视觉分析算法的核心支撑人脸识别算法基于深度学习的卷积神经网络（CNN）模型，通过提取面
企业级知识库私有化部署：腾讯混元+云容器服务TKE实战大熊计算机 #腾讯云语言模型
1.背景需求分析在金融、医疗等数据敏感行业，企业需要构建完全自主可控的知识库系统。本文以某证券机构智能投研系统为原型，演示如何基于腾讯混元大模型与TKE容器服务实现：千亿级参数模型的私有化部署金融领域垂直场景微调高并发低延迟推理服务全链路安全合规方案1.1典型技术挑战#性能基准测试数据（单位：QPS）|场景|裸机部署|容器化部署|优化后||--------------------|--------
MySQL表达式之公用表表达式(CTE)的使用示例 @Corgi 后端开发 mysql 数据库 CTE
示例一数据表中有每个企业每年每月并且每月的产值是累加的数据的数据记录需求：统计企业产值能力，找出所有家企业中产值最高的企业，其产值记为P。对于第i家企业，其产值为Pi则该企业的产值能力评分=Pi/P×100。SQL：--使用ROW_NUMBER()为每个企业每年每个月的产值排名，筛选出每个企业每年最大月份的产值。WITHMaxMonthlyOutputAS(SELECTcompany_id,dec
OPC/MQTT工业通信软件OPLink 牛宝柱
OPLink是上海泗博自主研发的基于OPC数据采集及转发，OPC数据到MQTT通信的产品。它是基于上海泗博多年的OPC应用经验和工业通信产品的开发背景，推出的OPC/MQTT工业通信软件。软件设计简洁、实用、稳定。同时，OPLink还具备与KepwareLinkMaster相似的数据转发功能，可实现PLC设备间的自主数据通信。功能升级实时性增强：针对复杂的工业自动化环境，OPLink优化了数据传输
SnowConvert：自动化数据迁移的技术解析与最佳实践 weixin_30777913 迁移学习数据库运维
SnowConvert是Snowflake生态系统的关键迁移工具，专为将传统数据仓库（如Oracle、Teradata、SQLServer等）的代码资产高效、准确地转换为Snowflake原生语法而设计。以下基于官方文档对其技术原理、工作流程及最佳实践进行深入分析：一、SnowConvert核心技术解析精准的语法映射引擎语言支持：深度解析源系统特有语法（OraclePL/SQL,TeradataB
AWS Lambda与RDS连接优化之旅 t0_54manong 编程问题解决手册 aws 云计算个人开发
在云计算的时代，AWSLambda与RDS的结合为开发者提供了高效且灵活的解决方案。然而，在实际应用中，我们常常会遇到一些性能瓶颈。本文将通过一个真实案例，探讨如何优化AWSLambda与RDS之间的连接，以提高API的响应速度。背景介绍最近，我们在AWS上部署了一个使用Dotnet6开发的API，它通过APIGateway暴露给外部，并连接到同VPC内的MySQLAuroraRDS数据库。部署前
Linux ss 指令 halugin Linux指令 linux 运维
Linuxss指令ss（SocketStatistics）是Linux系统中用于显示网络套接字（socket）信息的现代命令行工具，是netstat的继任者，性能更高、输出更简洁。它提供详细的网络连接、监听端口和协议统计信息，广泛用于网络监控、故障排查和性能分析。相比传统的netstat，ss直接从内核获取数据显示更快，功能更强大，适合现代Linux系统。什么是ss指令？ss是Linux系统中的一
AIRIOT物联网低代码平台如何配置MQTT驱动？ AIRIOT 网络服务器物联网
MQTT驱动配置简介MQTT全称为消息队列遥测传输（英语：MessageQueuingTelemetryTransport），是ISO标准（ISO/IECPRF20922）下基于发布(Publish)/订阅(Subscribe)范式的消息协议，工作在TCP/IP协议族上。MQTT最大优点在于，可以用极少的数据和有限的带宽，为连接远程设备提供实时可靠的消息服务。作为一种低开销、低带宽占用的即时通讯协
Redis配置与优化 ?ccc? redis 数据库缓存
目录一：Redis介绍1：关系数据库与非关系型数据库2：Redis基础2.1Redis简介2.2Redis安装部署2.3配置参数3：Redis命令工具3.1redis-cli命令行工具3.2redis-benchmark测试工具4：Redis数据库常用命令4.1key相关命令4.2多数据库常用命令二：Redis持久化1：RDB和AOF的区别2：RDB和AOF的优缺点3：Redis持久化配置三：性能
VB.NET,C#字典对象来保存用户数据,支持大小写专注VB编程开发20年 java 开发语言
用这个保存的,登录时大小写不一样会不会无法识别根据你提供的SaveUsersToJson方法，我注意到你使用了JSON序列化来保存用户数据，但没有显式指定字典的比较器。这意味着在反序列化时，默认会使用区分大小写的比较器，导致大小写不同的用户名无法正确匹配。问题分析当你保存用户数据时：PrivateSubSaveUsersToJson(usersAsDictionary(OfString,UserI
Nordic智能楼宇自动化系统方案/nrf-knx-iot Halfway-- Product 物联网 iot
1:KNXIoT通过物联网（IoT）的强大功能和灵活性扩展了KNX标准的能力。因此，它允许KNX设备与物联网设备和云服务集成，从而能够创建先进的智能楼宇自动化系统。通过KNXIoT，设备可以在IP网络上进行通信，从而在设备连接和控制方式上提供更大的灵活性2:KNXIoT由3个主要负责数据互操作性的主要元素组成：KNXIoT第三方API一个标准化的API，通过一个抽象层连接KNX特定知识和第三方应用
GPT-4o重磅升级！只需一条指令，教你秒出SCI级专业科研图！智写AI AI学术写作指南信息可视化人工智能
经过数月爆肝，七哥终于完成专业的学术AI使用教程，估计也有个80万字的详细操作指南。分为多个细分的专业写作场景，跟着一步一步操作，借助ChatGPT做学术、干科研、写论文、课题申报都变得超简单。欢迎加我交流（yida985），祝你一臂之力。七哥之前写过关于用AI生成流程图的教程，不过需要借助其他软件才能搞定完美的流程图。近期GPT-4o全新推出了“生图功能”，这个生图的过程就更加方便轻松了，全能G
Python 数据挖掘实战：关联规则与聚类分析，解锁数据价值的钥匙清水白石008 python Python题库 python 数据挖掘动画
Python数据挖掘实战：关联规则与聚类分析，解锁数据价值的钥匙引言在数字化浪潮席卷全球的今天，数据已成为企业和组织最重要的战略资产。海量数据蕴藏着巨大的价值，等待我们去挖掘和发现。数据挖掘(DataMining)，作为从海量数据中提取有价值知识和模式的关键技术，正日益受到各行各业的重视。它如同探矿者的火眼金睛，能够穿透数据的迷雾，发现隐藏在背后的规律和趋势，为商业决策、科学研究和社会发展提供强有
【基于ESP32-S3的Modbus RTU单双精度浮点数验证方案】 2345VOR #Arduino小项目开发工业通讯 esp32s3 ModBusRTU 浮点数
基于ESP32-S3的ModbusRTU单双精度浮点数验证方案一、核心功能升级在工业自动化场景中，单纯的整型数据已无法满足高精度测量需求。本文在原有ADC数据采集方案基础上，通过ModbusRTU协议扩展实现以下功能升级：新增1路16位浮点数（3.3V量程）新增1路32位双精度浮点数（±2.5V量程）保持原有4通道ADC数据传输本方案在原有ADC数据采集基础上，重点实现单双精度浮点数（float&
大数据面试必备：Kafka性能优化 Producer与Consumer配置指南
Kafka面试题-在Kafka中，如何通过配置优化Producer和Consumer的性能?回答重点在Kafka中，通过优化Producer和Consumer的配置，可以显著提高性能。以下是一些关键配置项和策略：1、Producer端优化:batch.size：批处理大小。增大batch.size可以使Producer每次发送更多的消息，但要注意不能无限制增大，否则会导致内存占用过多。linger
为什么90%企业的AI数据分析都失败了？奥威BI给出破局方案 qq_43696218 人工智能数据分析数据挖掘
一、引言：AI数据分析在数字化转型中的核心地位在当今企业全面数字化转型的背景下，‌AI数据分析已成为解锁业务增长潜力的关键钥匙。然而，市场上众多AI数据分析产品常陷入“伪需求场景”，看似前沿却难以真正落地。本文将深入探讨奥威BI如何通过其AI数据分析能力，突破伪需求，实现数据价值的最大化。二、AI数据分析：伪需求场景的挑战伪需求场景的定义与表现AI数据分析领域的伪需求场景，指的是那些表面创新实则难
BI+AI实战：我们如何用3秒完成车企供应链推演 qq_43696218 人工智能
一、BI+AI引领财务分析新纪元在财务数据分析领域，奥威BI+AI正以革命性的姿态颠覆传统。当金蝶、用友等工具仍深陷报表泥潭时，奥威BI+AI通过深度融合商业智能（BI）与人工智能（AI），实现了从滞后报表到实时洞察的飞跃。这不仅极大地提升了财务分析的效率，更为企业的战略决策提供了前所未有的精准支持。二、BI+AI的核心技术优势‌实时动态分析‌o奥威BI+AI摒弃了静态数据集，依托原始科目余额表实
008 【入门】算法和数据结构简介要天天开心啊算法专栏算法数据结构
算法与数据结构系统概览|[算法]-[基础]-[通用]一、算法分类与应用1.硬计算类算法|[算法]-[中级]-[通用]特点应用场景复杂度特征-精确求解问题-可能带来较高计算复杂度-大厂笔试/面试-ACM竞赛-所有程序员岗位必考⏱️通常为O(n)~O(n²)//[示例]快速排序算法-分治思想核心实现publicvoidquickSort(int[]arr,intleft,intright){if(le
Python3 数字(Number) froginwe11 开发语言
Python3数字(Number)引言在编程语言中，数字是构成程序的基础元素之一。Python3作为一种高级编程语言，提供了丰富的数字类型和操作方法。本文将详细介绍Python3中的数字类型，包括整数、浮点数、复数等，并探讨它们的特性和应用。整数（Integer）整数是Python3中最基本的数据类型之一，用于表示没有小数部分的数值。在Python3中，整数类型没有大小限制，可以表示任意大小的整数
技术调研：时序数据库（一） myskybeyond 时序数据库时序数据库数据库
选择时序数据库时，选择当下主流的解决方案。目前主流的开源解决方案有InfluxDB、TDengine和TimescaleDB。下文从多个维度对比分析，最终根据需求做出选型决策。1.核心架构与设计理念数据库架构特点核心优势InfluxDB-专为时序数据设计的分布式数据库-基于时间线（TimeSeries）模型-开源版（OSS）与商业版（Cloud/Enterprise）功能差异大高写入吞吐量、原生支
log4j对象改变日志级别 3213213333332132 java log4j level log4j对象名称日志级别
log4j对象改变日志级别可批量的改变所有级别，或是根据条件改变日志级别。 log4j配置文件： log4j.rootLogger=ERROR,FILE,CONSOLE,EXECPTION #log4j.appender.FILE=org.apache.log4j.RollingFileAppender log4j.appender.FILE=org.apache.l
elk+redis 搭建nginx日志分析平台 ronin47 elasticsearch kibana logstash
elk+redis 搭建nginx日志分析平台 logstash,elasticsearch,kibana 怎么进行nginx的日志分析呢？首先，架构方面，nginx是有日志文件的，它的每个请求的状态等都有日志文件进行记录。其次，需要有个队列，redis的l
Yii2设置时区 dcj3sjt126com PHP timezone yii2
时区这东西，在开发的时候，你说重要吧，也还好，毕竟没它也能正常运行，你说不重要吧，那就纠结了。特别是linux系统，都TMD差上几小时，你能不痛苦吗？win还好一点。有一些常规方法，是大家目前都在采用的1、php.ini中的设置，这个就不谈了，2、程序中公用文件里设置，date_default_timezone_set一下时区3、或者。。。自己写时间处理函数，在遇到时间的时候，用这个函数处理（比较
js实现前台动态添加文本框，后台获取文本框内容 171815164 文本框
<%@ page language="java" import="java.util.*" pageEncoding="UTF-8"%> <!DOCTYPE html PUBLIC "-//W3C//DTD XHTML 1.0 Transitional//EN" "http://w
持续集成工具 g21121 持续集成
持续集成是什么？我们为什么需要持续集成？持续集成带来的好处是什么？什么样的项目需要持续集成？... 持续集成(Continuous integration ,简称CI)，所谓集成可以理解为将互相依赖的工程或模块合并成一个能单独运行
数据结构哈希表(hash)总结永夜-极光数据结构
1.什么是hash 来源于百度百科: Hash，一般翻译做“散列”，也有直接音译为“哈希”的，就是把任意长度的输入，通过散列算法，变换成固定长度的输出，该输出就是散列值。这种转换是一种压缩映射，也就是，散列值的空间通常远小于输入的空间，不同的输入可能会散列成相同的输出，所以不可能从散列值来唯一的确定输入值。简单的说就是一种将任意长度的消息压缩到某一固定长度的消息摘要的函数。
乱七八糟程序员是怎么炼成的
eclipse中的jvm字节码查看插件地址： http://andrei.gmxhome.de/eclipse/ 安装该地址的outline 插件后重启，打开window下的view下的bytecode视图 http://andrei.gmxhome.de/eclipse/ jvm博客： http://yunshen0909.iteye.com/blog/2
职场人伤害了“上司” 怎样弥补 aijuans 职场
由于工作中的失误，或者平时不注意自己的言行“伤害”、“得罪”了自己的上司，怎么办呢？　　在职业生涯中这种问题尽量不要发生。下面提供了一些解决问题的建议：　　一、利用一些轻松的场合表示对他的尊重　　即使是开明的上司也很注重自己的权威，都希望得到下属的尊重，所以当你与上司冲突后，最好让不愉快成为过去，你不妨在一些轻松的场合，比如会餐、联谊活动等，向上司问个好，敬下酒，表示你对对方的尊重，
深入浅出url编码 antonyup_2006 应用服务器浏览器 servlet weblogic IE
出处：http://blog.csdn.net/yzhz 杨争 http://blog.csdn.net/yzhz/archive/2007/07/03/1676796.aspx 一、问题：编码问题是JAVA初学者在web开发过程中经常会遇到问题，网上也有大量相关的
建表后创建表的约束关系和增加表的字段百合不是茶标的约束关系增加表的字段
下面所有的操作都是在表建立后操作的,主要目的就是熟悉sql的约束,约束语句的万能公式 1,增加字段(student表中增加姓名字段) alter table 增加字段的表名 add 增加的字段名增加字段的数据类型 alter table student add name varchar2(10); &nb
Uploadify 3.2 参数属性、事件、方法函数详解 bijian1013 JavaScript uploadify
一.属性属性名称默认值说明 auto true 设置为true当选择文件后就直接上传了，为false需要点击上传按钮才上传。 buttonClass ” 按钮样式 buttonCursor ‘hand’ 鼠标指针悬停在按钮上的样子 buttonImage null 浏览按钮的图片的路
精通Oracle10编程SQL(16)使用LOB对象 bijian1013 oracle 数据库 plsql
/* *使用LOB对象 */ --LOB(Large Object)是专门用于处理大对象的一种数据类型，其所存放的数据长度可以达到4G字节 --CLOB/NCLOB用于存储大批量字符数据，BLOB用于存储大批量二进制数据，而BFILE则存储着指向OS文件的指针 /* *综合实例 */ --建立表空间 --#指定区尺寸为128k,如不指定，区尺寸默认为64k CR
【Resin一】Resin服务器部署web应用 bit1129 resin
工作中，在Resin服务器上部署web应用，通常有如下三种方式：配置多个web-app 配置多个http id 为每个应用配置一个propeties、xml以及sh脚本文件配置多个web-app 在resin.xml中,可以为一个host配置多个web-app <cluster id="app&q
red5简介及基础知识白糖_ 基础
简介 Red5的主要功能和Macromedia公司的FMS类似，提供基于Flash的流媒体服务的一款基于Java的开源流媒体服务器。它由Java语言编写，使用RTMP作为流媒体传输协议，这与FMS完全兼容。它具有流化FLV、MP3文件，实时录制客户端流为FLV文件，共享对象，实时视频播放、Remoting等功能。用Red5替换FMS后,客户端不用更改可正
angular.fromJson boyitech AngularJS AngularJS 官方API AngularJS API
angular.fromJson 描述: 把Json字符串转为对象使用方法: angular.fromJson(json); 参数详解: Param Type Details json string JSON 字符串返回值: 对象, 数组, 字符串或者是一个数字示例: <!DOCTYPE HTML> <h
java-颠倒一个句子中的词的顺序。比如： I am a student颠倒后变成：student a am I bylijinnan java
public class ReverseWords { /** * 题目：颠倒一个句子中的词的顺序。比如： I am a student颠倒后变成：student a am I.词以空格分隔。 * 要求： * 1.实现速度最快,移动最少 * 2.不能使用String的方法如split,indexOf等等。 * 解答：两次翻转。 */ publ
web实时通讯 Chen.H Web 浏览器 socket 脚本
关于web实时通讯，做一些监控软件。由web服务器组件从消息服务器订阅实时数据，并建立消息服务器到所述web服务器之间的连接，web浏览器利用从所述web服务器下载到web页面的客户端代理与web服务器组件之间的socket连接，建立web浏览器与web服务器之间的持久连接；利用所述客户端代理与web浏览器页面之间的信息交互实现页面本地更新，建立一条从消息服务器到web浏览器页面之间的消息通路
[基因与生物]远古生物的基因可以嫁接到现代生物基因组中吗? comsci 生物
大家仅仅把我说的事情当作一个IT行业的笑话来听吧..没有其它更多的意思如果我们把大自然看成是一位伟大的程序员,专门为地球上的生态系统编制基因代码,并创造出各种不同的生物来,那么6500万年前的程序员开发的代码,是否兼容现代派的程序员的代码和架构呢?
oracle 外部表 daizj oracle 外部表 external tables
oracle外部表是只允许只读访问，不能进行DML操作，不能创建索引，可以对外部表进行的查询，连接，排序，创建视图和创建同义词操作。 you can select, join, or sort external table data. You can also create views and synonyms for external tables. Ho
aop相关的概念及配置 daysinsun AOP
切面(Aspect): 通常在目标方法执行前后需要执行的方法（如事务、日志、权限），这些方法我们封装到一个类里面，这个类就叫切面。连接点（joinpoint） spring里面的连接点指需要切入的方法，通常这个joinpoint可以作为一个参数传入到切面的方法里面（非常有用的一个东西）。通知（Advice）通知就是切面里面方法的具体实现，分为前置、后置、最终、异常环
初一上学期难记忆单词背诵第二课 dcj3sjt126com english word
middle 中间的，中级的 well 喔，那么；好吧 phone 电话，电话机 policeman 警察 ask 问 take 拿到；带到 address 地址 glad 高兴的，乐意的 why 为什么 China 中国 family 家庭 grandmother (外)祖母 grandfather (外)祖父 wife 妻子 husband 丈夫 da
Linux日志分析常用命令 dcj3sjt126com linux log
1.查看文件内容 cat -n 显示行号 2.分页显示 more Enter 显示下一行空格显示下一页 F 显示下一屏 B 显示上一屏 less /get 查询"get"字符串并高亮显示 3.显示文件尾 tail -f 不退出持续显示 -n 显示文件最后n行 4.显示头文件 head -n 显示文件开始n行 5.内容排序 sort -n 按照
JSONP 原理分析 fantasy2005 JavaScript jsonp jsonp 跨域
转自 http://www.nowamagic.net/librarys/veda/detail/224 JavaScript是一种在Web开发中经常使用的前端动态脚本技术。在JavaScript中，有一个很重要的安全性限制，被称为“Same-Origin Policy”（同源策略）。这一策略对于JavaScript代码能够访问的页面内容做了很重要的限制，即JavaScript只能访问与包含它的
使用connect by进行级联查询 234390216 oracle 查询父子 Connect by 级联
使用connect by进行级联查询 connect by可以用于级联查询，常用于对具有树状结构的记录查询某一节点的所有子孙节点或所有祖辈节点。来看一个示例，现假设我们拥有一个菜单表t_menu，其中只有三个字段：
一个不错的能将HTML表格导出为excel,pdf等的jquery插件 jackyrong jquery插件
发现一个老外写的不错的jquery插件，可以实现将HTML 表格导出为excel,pdf等格式，地址在： https://github.com/kayalshri/ 下面看个例子，实现导出表格到excel,pdf <html> <head> <title>Export html table to excel an
UI设计中我们为什么需要设计动效 lampcy UI UI设计
关于Unity3D中的Shader的知识首先先解释下Unity3D的Shader，Unity里面的Shaders是使用一种叫ShaderLab的语言编写的，它同微软的FX文件或者NVIDIA的CgFX有些类似。传统意义上的vertex shader和pixel shader还是使用标准的Cg/HLSL 编程语言编写的。因此Unity文档里面的Shader，都是指用ShaderLab编写的代码，
如何禁止页面缓存 nannan408 html jsp cache
禁止页面使用缓存~ ------------------------------------------------ jsp:页面no cache： response.setHeader("Pragma","No-cache"); response.setHeader("Cache-Control","no-cach
以代码的方式管理quartz定时任务的暂停、重启、删除、添加等 Everyday都不同定时任务管理 spring-quartz
【前言】在项目的管理功能中，对定时任务的管理有时会很常见。因为我们不能指望只在配置文件中配置好定时任务就行了，因为如果要控制定时任务的 “暂停” 呢？暂停之后又要在某个时间点 “重启” 该定时任务呢？或者说直接 “删除” 该定时任务呢？要改变某定时任务的触发时间呢？ “添加” 一个定时任务对于系统的使用者而言，是不太现实的，因为一个定时任务的处理逻辑他是不
EXT实例 tntxia ext
（1）增加一个按钮 JSP: <%@ page language="java" import="java.util.*" pageEncoding="UTF-8"%> <% String path = request.getContextPath(); Stri
数学学习在计算机研究领域的作用和重要性 xjnine Math
最近一直有师弟师妹和朋友问我数学和研究的关系，研一要去学什么数学课。毕竟在清华，衡量一个研究生最重要的指标之一就是paper,而没有数学，是肯定上不了世界顶级的期刊和会议的，这在计算机学界尤其重要！你会发现，不论哪个领域有价值的东西，都一定离不开数学！在这样一个信息时代，当google已经让世界没有秘密的时候，一种卓越的数学思维，绝对可以成为你的核心竞争力. 无奈本人实在见地