轩儿毛肚

【论文阅读】An Experimental Survey of Missing Data Imputation Algorithms

论文地址：An Experimental Survey of Missing Data Imputation Algorithms | IEEE Journals & Magazine | IEEE Xplore

处理缺失数据最简单的方法就是是丢弃缺失值的样本，但这会使得数据更加不完整并且导致偏差或影响结果的代表性。因此，研究者提出了一系列填补方法，包括早期的简单统计填补方法、传统的机器学习填补方法和现代深度学习填补算法。

早期的简单统计填补方法是使用训练数据中的统计值（例如平均值、中值、众数）或最相似的统计量来替换缺失值，例如均值填补（Mean imputation）、热卡填补（Hot deck imputation，HDI)、冷卡填补(Cold deck imputation，CDI)和k近邻填补(KNNI) 。第二类填补方法是在机器学习中建立一个预测模型来预测缺失值，例如XGBoost填补(XGBI)、MissForest填补(MissFI)、链式方程的多重填补(MICE)、单模型填补(IIM)、软填补(SI)、矩阵分解填补(MFI)、主成分分析填补(PCAI)、多层感知器填补(MLPI)、循环Sinkhorn填补(RRSI)等。相比之下，现代深度学习填补算法的灵感来自于深度生成模型的强大能力。它们要么丰富显式生成模型的先验或后验，例如深度自动编码器 (AE)；要么利用对数似然概率产生隐式生成模型，例如生成对抗网络 (GAN)。总而言之，如图所示，目前填补算法可以分为三组，即统计填补方法、机器学习填补方法和深度学习填补方法。

1 统计填补方法

在早期的研究中，大多数研究人员都专注于基本的统计填补方法，包括基于统计的方法和基于相似度的方法。所有这些方法都属于单一填补，即用单个值来估算缺失值。

一）基于统计的方法

基于统计的填补方法通常利用统计值（例如平均值、中值、众数）来估算缺失值。均值填补（Mean imputation）方法[28]简单地用每个特征的所有观测数据的平均值、中值或众数来替换缺失数据。在包含缺失值的数据特征的情况下，用在该特征中观察到的值的平均值来填充缺失值。而在分类特征的情况下，则使用出现频率最高的值而不是平均值来代替缺失的值。

二）基于相似性的填补方法

基于相似性的填补方法使用一个或多个相似样本的值的平均值来估计缺失值，如图3.2所示。具体来说，基于相似性的填补方法最初计算每个样本对之间的欧几里得距离。在距离计算过程中，缺失值被视为零。然后，对于样本xi，根据xi的每个缺失值(例如，特征fj中缺少xij)，它从不完整数据矩阵X中选择xi的K个最近样本，用{x1,…,xK}表示，这样它们都可以观测到在特征fj上的值。接着，它聚合所选样本在特征fj上的观测值以估算缺失值xij。重复该过程，直到成功估算所有缺失值。具体的基于相似性的填补填补方法如下：

图3.2 基于相似度的插补说明

（1）KNNI。K近邻填补(K nearest neighbor imputation，KNNI)是一种典型的基于相似性的方法，缺失值可以通过最近邻的样本的值聚合而成。KNNI可以采用所有最近邻得值的加权平均值，其中与邻居的距离作为其权重，因此距离越近，聚合的权重越大。

（2）HDI。热卡填补（Hot deck imputation，HDI)是KNNI的一种变体，它使用来自最相似样本的相应值来估算缺失值。如果所有样本都包含缺失值，则选择缺失值数量最少的最近样本来估算缺失值。

（3）CDI。与KNNI和HDI不同，冷卡填补(Cold deck imputation，CDI)除了需要原始数据集外，还需要额外的补充数据集来进行填补。具体来说，CDI首先计算原始数据集中的样本与补充数据集中的样本之间的欧氏距离。然后，对于每个不完整的样本，CDI 将缺失值替换为补充数据集中最相似样本对应的值。重复此过程，直到所有缺失值都被估算。

以上所有的统计填补方法总结在表2中。在预测类型中，“一对一”表示为每个不完整特征构建至少一个预测模型，在填补类型中，“单一填补”(single imputation)是指采用一定方式，对每个缺失值只构造一个合理的替代值，并将其插补到原缺失数据的位置上，替代后构造出一个完整的数据集。

表2 统计填补方法的比较

类别	方法	模型	预测类型	填补类型	核心
统计	Mean	统计	一对一	单一填补	对每个特征使用全局均值
统计	KNNI	相似性	一对一	单一填补	在每个特征上使用近邻样本的均值
统计	HDI	相似性	一对一	单一填补	使用最相似样本的对应值
统计	CDI	相似性	一对一	单一填补	使用补充数据集中最相似样本的值

2 机器学习填补方法

与早期的统计填补方法相比，传统的机器学习填补方法解决方案是训练一个用于缺失值填补的预测模型。根据所使用的预测模型，我们可以进一步将现有的机器学习填补方法分为四个子组，即基于树的填补方法、基于回归的填补方法、基于压缩的填补方法和基于浅层神经网络（SNN）的填补方法。基于树的填补方法为每个包含缺失值的不完整特征构建一个决策树模型，例如XGBoost填补(XGBI)和MissForest填补(MissFI)；基于回归的填补方法使用具有多重填补的线性回归模型来估计缺失值，例如链式方程的多重填补(MICE)和单模型填补(IIM)；基于压缩的填补方法为整个不完整数据集构造一个预测模型(即数据压缩模型)，例如软填补(SI)、矩阵分解填补(MFI)和主成分分析填补(PCAI)；基于SNN的填补方法利用一个浅层神经网络在一个不完整的特征中估算缺失值，例如多层感知器填补(MLPI)和循环Sinkhorn填补(RRSI)。

一）基于树的填补方法

在基于树的填补方法中，它为涉及缺失值的每个特征构建了一颗决策树模型，例如随机森林和XGBoost。与统计填补方法类似，基于树的方法也是单一值填补，即用一个值对每个缺失值进行填补。它以掩码矩阵M 的不完整数据矩阵 X 作为输入，并返回最终估算矩阵X。最开始，X中的缺失值是通过均值填补估算的，估算矩阵存储在矩阵X0中。然后，它开始以迭代方式估算缺失值。参数 c 表示当前迭代时间，cmax 是迭代次数的最大数量。Xc用于记录矩阵 X 的当前估算矩阵。在每次迭代中，算法遍历每个具有缺失值的特征fj。Xcoj收集用于从X中观察到的特征fj的样本xi (即掩码矩阵M中对应位置的mij为1)形成一个新的训练数据集，使用训练数据集Xcoj在特征fj上训练预测模型∅j。然后使用预测模型∅j 来估算 X 中特征fj上的缺失值。此后，Xc通过将上述估算值合并到其中来继续进行更新，不断的进行重复，直到终止条件。具体的关于树的填补方法如下：

（1）XGBI。XGBoost填补方法(XGBI)遵循上述处理过程并且利用XGBoost作为预测模型。如果新估算Xc和先前估算 Xc−1 之间的平均差异小于给定阈值，则满足 XGBI给定的终止条件。

（2）MissFI。MissForest填补(MissFI)也是基于树的填补方法，也遵循上述的处理过程，并且MissFI利用随机森林作为预测模型。当它的新估算的估算矩阵Xc和先前估算的估算矩阵Xc−1之间的平均差值第一次出现增加时即可终止。

二）基于回归的填补方法

与基于树的填补方法不同，基于回归的填补方法为每个包含缺失值的特征构建多个预测模型，即线性回归模型。具体的回归填补方法如下：

（1）MICE。链式方程法(MICE)的多元填补是一种典型的多重填补方法，它以多次线性回归的结果的平均值来估计缺失值。在基于树的填补方法中的预测模型∅对应于MICE中的线性回归模型，MICE并不是通过多次迭代逐步输入数据来进行填补，而是多次独立地进行填补，最后聚合多个填补结果得到最终的估算矩阵X。

（2）IIM。通过单个模型 (IIM) 进行填补首先需要训练一组回归模型，然后使用xi的最近的样本(在特征fj中能观察到的其他的样本值)的回归模型来估算样本xi的每个缺失分量xij。它也是一种的基于回归的多重填补方法，具体来说，其流程如下：对于每个特征fj，它基于xi的最近邻的训练集（即在 X 中的特征fj上能观察到其他的样本值），根据特征fj上观察到的值为每个样本xi训练一组回归模型。对于样本xi，对应的回归模型的数量最多为其最近邻的最大数量。以图3.3所示的样本xi为例，对于其缺失值xij，IIM 首先找到在特征fj上xi的最近邻样本（即x1、x2 和 x3）的最佳回归模型（即∅1j、∅2j和 ∅3j。然后，用这些不同的最优回归模型预测结果xij1、xij2和xij3。最后，IIM 聚合这些回归结果以获得估算值xij。

图3.3 IIM填补方法示意图

三）基于压缩的填补方法

与其他三种机器学习填补方法不同，基于压缩的填补方法仅为整个不完整数据集构建一个数据压缩模型。基于压缩的填补的基本框架如图3.4所示。它由两个步骤组成，即压缩(步骤1)和重建(步骤2)。具体来说，在压缩步骤中，基于压缩的填补方法利用数据压缩技术（例如奇异值分解）来学习权重矩阵Wd×dt，然后将数据矩阵 X 压缩为潜在表示Tn×dt，即

其中dt是潜在维度，且dt

其中⊙表示同或运算。通过重构误差损失ℒc，基于压缩的填补方法迭代更新权重矩阵Wd×dt和重构矩阵X。重复该过程，直到迭代时间达到最大迭代次数。最后，估算矩阵X可由下式计算而出：X=M⊙X+(1−M)⊙X

图3.4 基于压缩的填补方法示意图

基于压缩的填补方法具体如下：

（1）SI。软填补方法 (SI) 是一种基本的基于数据压缩的填补方法，它通过利用阈值进行奇异值分解（SVD）对给定阈值的数据矩阵 X 进行迭代更新，这样SI就能得到一组具有不同阈值的估算矩阵X，最终就可以使用最优估算矩阵X来估算X。

（2）MFI。矩阵分解填补 (MFI) 采用潜在因素模型将不完整的数据矩阵 Xn×d压缩为两个小矩阵，即Un×p和Vd×pT，其中p远小于 n 和 d。于是这个算法的主要挑战就是推导出Un×p和Vd×pT。具体来说，MFI最初将X中缺失的分量替换为零，然后通过最小化来自X 中的观测值与来自Un×p和Vd×pT的相应预测值之间的平均差异来迭代优化Un×p∗Vd×pT，直到平均差异小于给定的阈值。同时，迭代时间受cmax的限制。最后，估算矩阵X可由下式计算而出：X=M⊙X+1−M⊙Un×p∗Vd×pT
（3）PCAI。主成分分析填补(PCAI) 使用前几个主成分来迭代填补缺失值并进行单一估算。具体来说，在每次迭代中，PCAI首先通过SVD[42]来计算特征值的特征向量对，然后根据特征值估算方差，利用所需方差的特征向量（即主成分）重建数据矩阵。接下来，PCAI计算新重构矩阵X在观测值上的重构误差，更新缺失值。一旦重建误差低于指定的容差，迭代就会停止。最后，根据 X=M⊙X+1−M⊙X，原始数据矩阵 X 由最后一个重构矩阵 X 估算。

四）基于SNN的填补方法

与基于树的填补方法模型类似，这种填补模型利用浅层神经网络 (SNN)为每个不完整特征构建一个预测模型。具体填补方法如下：

（1）MLPI。多层感知器填补方法(MLPI) 为每个不完整特征构建一个多层感知器 (MLP) 模型来估算缺失值，如图 3.5所示。具体来说，对于每个不完整的特征fj，X 中的完整样本收集在Xcj中。然后，MLPI 用Xcj迭代训练 MLP 模型∅j。最后，MLPI 使用经过训练的模型∅j 来估计 X 中不完整样本xi的特征 fj上的缺失值（如xij）。特别的，根据要估算的数值和分类特征的性质，在训练过程中需要最小化不同的误差函数，如平方误差和交叉熵误差。

图3.5 MLPI填补方法示意图

（2）RSSI。与MLPI类似，循环Sinkhorn填补(RRSI)使用浅层MLP作为每个不完整特征的预测模型。具体来说，对于每个不完整的特征fj，RRSI 首先用观察到的分量的平均值加上少量噪声来初始化其他不完整特征中的缺失值。然后，它从完整的样本中依次提取批次，并使用批次之间的Sinkhorn散度作为损失函数迭代训练MLP模型∅j。最后，RRSI 还利用经过训练的 MLP 模型∅j来估算 fj中相应的缺失分量。

以上所有的机器学习方法总结在表3中，其中在预测类型中，“一对一”表示为每个不完整特征构建至少一个预测模型，“一对多”表示为整个不完整数据集构建一个预测模型。在填补类型中，“单一填补”是指采用一定方式，对每个缺失值只构造一个合理的替代值，并将其插补到原缺失数据的位置上，替代后构造出一个完整的数据集。“多重填补”是指创建数据集的多个副本，并对每个副本使用不同的估计方法来估算缺失值。

表3 机器学习填补算法的比较

类别	方法	模型	预测类型	填补类型	核心
机器学习	XGBI	决策树	一对一	单一填补	用Boosting进行集合学习
机器学习	MissFI	决策树	一对一	单一填补	用随机森林模型进行集合学习
机器学习	MICE	回归	一对一	多重填补	多元线性回归
机器学习	IIM	回归	一对一	多重填补	将线性回归与 KNNI 结合起来
机器学习	SI	压缩	一对多	单一填补	使用多个阈值进行奇异值分解
机器学习	MFI	压缩	一对多	单一填补	典型矩阵因式分解与潜在模型
机器学习	PCAI	压缩	一对多	单一填补	带有缺失值估算的广义 PCA
机器学习	MLPI	SNN	一对一	单一填补	在每个特征上学习带有回归模型的MLP
机器学习	RRSI	SNN	一对一	单一填补	学习对每个特征进行最佳传输的 MLP

3 深度学习填补方法

在本节中，我们将介绍现代深度学习填补算法，其中包括基于自动编码器 (AE) 的算法和基于生成对抗网络 (GAN) 的算法。

一）基于AE的填补方法

基于自动编码器(AE)的填补的基本框架如图3.6所示。它以不完整的数据矩阵X和相应的掩码矩阵M作为输入。AE的结构由两个模块组成，即编码器和解码器。编码器模块将输入数据压缩为潜在表示，而解码器模块将潜在表示重构为与输入数据矩阵 X 相似的输出X。

图3.6 基于 AE 的填补架构

基于 AE 的填补算法中的编码器和解码器都是通过最小化损失函数 ℒAE来进行训练，即 X 中的观测值与 X中的相应生成值之间的重建误差（用ℒrec表示），其中ℒAE=ℒrec=M⊙X−X2，X是解码器的输出。最后，估算矩阵X=M⊙X+(1−M)⊙X。具体的基于AE的填补方法如下：

（1）MIDAE。去噪自编码器多重填补方法(MIDAE)是一种基于深度去噪自编码器(DAE)的多重填补方法。DAE 是基本 AE 的扩展，为了迫使隐藏层发现更好的特征并防止它只简单地进行学习，DAE 训练自动编码器从不完整数据集开始重建输入。MIDAE 多次运行 DAE 模型（次数用 c 表示），每次运行都有一组不同的随机初始权重，以完成多重填补。由于DAE模型在初始化时需要完整的数据，因此MIDAE在训练之前用均值填补来估算缺失值。在训练 DAE 模型时，MIDAE 首先使用随机均匀分布的权重来初始化 DAE。然后，训练阶段从随机损坏过程开始，该过程将部分数据随机设置为零。它的目标函数也是最小化 X 中的原始观测值与 DAE 生成的相应值之间的重构误差。最终估算矩阵X是通过对DAE模型导出的c个估算矩阵求平均值得到的。

（2）VAEI。首先，变分自动编码器 (VAE)与基本 AE 类似，两者都由编码器和解码器组成。编码器将输入数据映射到潜在分布中（用Rl表示），而解码器将潜在分布映射回数据空间。与 AE 不同，VAE 通过在潜在分布上施加先验来规范编码器，用p(Rl)表示，其中Rl~(0,1)。变分自动编码器填补方法 (VAEI)使用 VAE 模型来执行单值填补。它由两个阶段组成，模型训练阶段（使用初始估算数据进行训练 VAE）和迭代填补阶段（使用经过训练的 VAE 迭代地估算缺失的部分）。在训练阶段，VAEI 首先将 X 中的缺失值替换为零。然后，它在给定迭代时间内用估算的 X 迭代训练 VAE 模型。VAE的目标函数是最小化观测向量上的重构误差ℒrec和正则化编码器的特殊先验正则化项ℒprior的总和，即

ℒVAE=ℒrec+ℒprior

其中ℒprior=DKL(q(Rl|X )||0,1)，其中DKL是 Kullback-Leibler 散度，q(Rl|X )是编码器的输出。在迭代填补阶段，VAEI 将 X 中的缺失值替换为零。然后，它使用经过训练的 VAE 模型预测的值迭代地估算 X 中的缺失值。在每次迭代中，最后一个估算矩阵X首先被送入训练好的 VAE 模型中，该模型会输出一个新的重构矩阵。然后，VAEI根据观察到的分量计算最后一个估算矩阵和新重构矩阵之间的重构误差，从而更新缺失值。一旦重建误差低于指定阈值，迭代就会停止，或者达到最大迭代次数时间而停止。

（3）HI-VAE。异构不完全 VAE 模型 (Heterogeneous-incomplete VAE model，HI-VAE)是一个基于 VAE 的单值填补的通用模型。它引入了一个输入过滤编码器来处理缺失数据，首先用零替换 X 中的缺失值，然后通过利用不同数据类型之间的不同似然函数来处理异构数据，从而构建解码器模型。此外，为了捕获所有特征之间的统计依赖关系，HI-VAE 利用一个简单的深度神经网络来输入潜在特征从而生成中间特征。在训练模型时，HI-VAE 使用证据下界（ELBO）来优化编码器和解码器的参数，这些参数仅在观察到的值上计算。最后，缺失值由经过训练的 HI-VAE 模型估算。

（4）MIWAE。缺失数据重要性加权自动编码器模型 (MIWAE)是重要性加权自动编码器 (IWAE)的广义版本。IWAE 是一个生成模型，具有与 VAE 相同的架构，它引入了一种重要性加权策略来优化 VAE 的目标函数。在 IWAE 中，编码器模型使用多个样本来近似后验，这对复杂后验进行建模来说会更加灵活。与 IWAE 不同，MIWAE 的目标函数只关注具有单值填补的观察部分。最后，原始矩阵 X 的缺失值由经过训练的 MIWAE 预测。

二）基于GAN的填补方法

生成对抗网络 (GAN)为两方构建了一个对抗训练架构，即用生成器（用 G 表示）和判别器（用 D 表示）来解决极小极大优化问题。生成器尽可能地生成接近真实数据分布的数据，而判别器尽可能正确地区分生成的数据和真实数据之间的差异。基于 GAN 的填补方法的一般架构如图3.7所示。对于生成器 G，其输入包括原始数据矩阵 X、记录数据缺失状态的相应掩码矩阵 M 和噪声 z。生成器 G 为 X 中的缺失值生成一系列值（尽可能接近真实值分布），以欺骗新更新的判别器。相比之下，判别器D 的输入由估算矩阵X（由生成器 G 产生）和原始数据矩阵 X 组成，鉴别器 D 的目的就是将估算值与真实值区分开来。

图3.7基于 GAN 的填补架构

换句话说，在基于 GAN 的填补方法中，训练判别器 D 来最大化正确预测 M 的概率，而训练生成器 G 来最小化判别器 D 预测 M 的概率。因此，基于 GAN 的填补方法的损失函数，用ℒGAN表示，通常可以定义为

ℒGANG,D=M⊙logDX+(1−M)⊙log⁡(1−DGX,z)

其中DX表示判别器对 X 中数据的估计概率。因此，与标准GAN相同，基于GAN的填补方法的目标函数可以定义为极大极小问题，即minGmaxDℒGANG,D。具体的基于GAN的填补方法如下：

（1）GINN。图填补神经网络（GINN）是一种在 GAN 结构基础上进行单值填补的生成模型。对于 GINN 生成器来说，最基本的步骤是将每个样本编码为一个节点，从而构建基于流形正则化的相似性图。然后，在相似性图上使用图卷积去噪自编码器。它是通过最小化观测值的重构误差来训练的。由于生成器必须骗过判别器Dg（与标准 GAN 中的判别器相似）并同时最小化重构误差，因此其损失函数ℒGg定义为

ℒGg=M⊙CgX,GgX,zg−(1−M)⊙DgGgX,zg

其中zg是Gg的噪声。对于 X 的特征fj上的每个观察值xij (即掩码矩阵M中对应位置的mij为1)，Cg定义为：

Cgxij,xij=β∗xij−xij2 fj是数值型 β−1∗xij∗logxij fj是类别型

其中xij=Ggxij,zg，β是数据集数值特征和分类特征之间的比率的超参数。最终估算矩阵中的缺失值由经过训练的生成器Gg预测。受 GAN 中的判别器的启发，GINN 利用前馈网络作为判别模型Dg进行学习，将估算值与真实观测值区分开来，从而提高图卷积去噪自编码器的填补性能。因此，判别器的损失函数ℒDg表示被定义为：

ℒDg=(1−M)⊙DgGgX,zg−M⊙DgX

GINN通过对抗过程增强了图卷积去噪自编码器模型，同时训练判别器和图卷积去噪自编码器模型。

（2）GAIN。与标准GAN类似，生成对抗网络(GAIN)也由一对生成器(用GA表示)和判别器(用DA表示)组成，这两个都被建模为全连接神经网络，同时它使用小批量策略以迭代的方式来解决极小极大最优化问题。具体来说，在 GAIN 中，生成器GA最小化更新的判别器DA预测M的概率，并为整个数据 X 输出一个矩阵X（用GA(X ,za)）。在训练GA 时，GA生成的矩阵X 也应该接近 X 中的真实值。也就是说，生成器GA的损失函数可以定义为

ℒGA=α∗M⊙CaX,GAX,za−(1−M)⊙logDAGAX,za,H

其中za是GA的噪声，α是超参数。对于 X 的特征fj上的每个观察值xij (即掩码矩阵M中对应位置的mij为1)，Ca定义为：

Caxij,xij=xij−xij2 fj是数值型 −xij∗logxij fj是类别型

其中xij=GAxij,za，然后训练GA以最小化ℒGA。另一方面，GAIN 将生成器GA固定优化判别器 DA。判别器用于区分哪些值是观测值哪些值是估计值，也就是说，判别器是最大化正确预测 M 的概率。此外，GAIN 提供了一个提示矩阵，用 H 表示。DA使用提示矩阵 H 将注意力集中在某些缺失值的填补精度上，从而驱动GA准确地学习唯一的真实数据分布。因此，DA的损失函数ℒDA定义为：

ℒDA=−M⊙logDAX,H+(1−M)⊙log(1−DAGAX,za,H)

最后，生成器GA和判别器DA都在具有损失函数的最大最小化过程中中同时训练。

综上所述，这些深度学习填补方法如表4所示。其中在预测类型中， “一对多”表示为整个不完整数据集构建一个预测模型。在填补类型中，“单一填补”是指采用一定方式，对每个缺失值只构造一个合理的替代值，并将其插补到原缺失数据的位置上，替代后构造出一个完整的数据集。“多重填补”是指创建数据集的多个副本，并对每个副本使用不同的估计方法来估算缺失值。

表4 深度学习填补算法的比较

类别	方法	模型	预测类型	填补类型	核心
深度学习	MIDAE	AE	一对多	多重填补	广义DAE
深度学习	VAEI	AE	一对多	单一填补	广义VAE
深度学习	HI-VAE	AE	一对多	单一填补	用于异构数据填补的广义VAE
深度学习	MIWAE	AE	一对多	单一填补	考虑观察数据加权的广义IWAE
深度学习	GINN	GAN	一对多	单一填补	在相似性图上使用图卷积算法AE
深度学习	GAIN	GAN	一对多	单一填补	带有提示矩阵和噪声的对抗训练

实验

数据集：

总共15个基准数据集，使用了三种数据类型

(i) 数值数据集仅包含数值特征（简称 NumFs），包括 EEG、Abone、Wireless、Yeast、Balance、Valley 和 Wine。

(ii) 分类数据集仅包含分类特征（简称 CCatFs），包括 Connect、Ches、Letter、Turkiye、Car 和 Phishing。

(iii) 混合类型数据集包含数值和分类特征，包括 Anuran 和 Heart

指标：

第一个是平均均方根误差（ARMSE），它使用均方根误差(RMSE)进行数值特征，将准确度误差(AR)用于分类特征。ARMSE越小，填补效果越好。

第二个是利用平均绝对误差（MAE）进行数值特征估计，AR用于分类特征，AMAE越小，填补效果越好

实验一：在MCRA机制下，不同数据类型对填补算法的影响：

在数值、分类和混合类型数据集中，相应的实验结果如表7所示，其中Avg-num/cat/mix行分布表示数值、分类、和混合类型数据集的平均结果。从中可以观察到，所有的填补方法在数值数据集中都比在分类数据集中具有更高的填补精度（较小的ARMSE/AMAE值）。

我们可以进一步观察到，对于统计方法，在大多数情况下，KNNI 优于均值插补。在机器学习方法中，RRSI 优于所有其他方法。此属性归因于有效的 MLP 模型和 RRSI 的有用 Sinkhorn 散度损失函数。然而，MICE、IIM、MLPI 和 RRSI 在计算上是不可行的，并且由于执行时间长（超出接受范围），一些大型高维数据集中没有相应的结果。这是因为，所有这些方法都具有很高的复杂性，为每个不完整的特征构建至少一个预测模型。我们还发现，SI 和 MFI 不是很有效，尤其是与其他机器学习方法相比。关于深度学习算法，VGAIN、GAIN 和 MIWAE 属于第一类。虽然 MIWAE 非常昂贵，但即使是在相对较大的高维数据集上也没有工作。总之，基于 SNN 的方法和一些深度学习技术在插补问题上的准确率高于其他方法。

你可能感兴趣的:(#,数据填补,论文阅读,数据填补)

layUI树形组件出现偶尔加载不出来的情况 suoh's Blog ❤️❤️--layui ❤️❤️--vue2核心技术栈 layui树形结构无法加载 treeList加载不出来 layui树形组件不显示
用vue自带的nextTick函数强制执行树形结构nextTick()，是将回调函数延迟在下一次dom更新数据后调用，简单的理解是：当数据更新了，在dom中渲染后，自动执行该函数this.$nextTick(()=> { this.render(this.data); })
Jfinal+SQLite java工具类复制mysql表数据到 *.sqlite 秋林辉 sqlite java mysql
处理了时间类型packagechangeDataBase;importjava.sql.*;importjava.util.ArrayList;importjava.util.Iterator;importjava.util.List;publicclassMySQLToSQLiteMigration{privatestaticfinalStringMYSQL_URL="jdbc:mysql://
Jfinal+duckDB 秋林辉 java 前端数据库
com.jfinaljfinal3.6org.duckdbduckdb_jdbc1.2.2.0@OverridepublicvoidconfigPlugin(Pluginsme){//配置DuckDB数据源DruidPlugindruidPlugin=newDruidPlugin("jdbc:duckdb:E:/DUCKDB/DuckDB/hrls.duckdb","","","org.duckd
JSON全面解析：轻量级数据交换的核心技术新人码农11111 json python
目录JSON的本质特征⚙️序列化：数据到字符串的转换反序列化：字符串到数据的还原实际应用场景⚠️常见陷阱与解决方案最佳实践建议在当今数据驱动的时代，JSON（JavaScriptObjectNotation）已成为最流行的轻量级数据交换格式。本文将深入剖析JSON的核心特性及其在Python中的应用，帮助开发者高效处理数据序列化与反序列化。JSON的本质特征JSON采用纯文本格式，具有跨平台、易读
后仿之debug记录风之子npu 后仿单片机嵌入式硬件
在此记录一下在实际工作中碰到的在后仿过程中碰见的一些问题：1.数据采样失败原因1：iodelay增加不足；解决办法：根据sdc修正iodelay数值，同时参考后端PR的timingreport，修正delay；原因2：glitch导致采样失败，zerodelay期间，虽然在波形中看到信号变化时瞬时的，但是同一个timingslot中因为器件自身的原因，导致信号在同一个timingslot中其实变化
纸上得来终觉浅，绝知此事要躬行水晶了无痕
亲爱的，你猜感情里最难的是什么？最难的不是纠缠，而是放弃。因为纠缠，只要随着自己的心就好。而放弃，不仅要违背自己的心，还要把自己撕裂，再揉碎。没办法离开一段关系，通常是因为付出了太多的时间和精力成本，而无法割舍。不是放不下这段关系，而是执念太深，不是不够勇敢，而是为此投入了太多，不是不够独立，而是这段关系填补了自己内在的坑洞。让自己欲罢不能。但是请你相信，“揉碎之后”的你，会获得重生，浴火重生！！
SQLite数据库文件损坏的可能几种情况（一）界忆人工智能数据库 SQLite 数据库 sqlite c++
返回：SQLite—系列文章目录上一篇：SQLiteC/C++接口详细介绍sqlite3_stmt类（十三）下一篇：SQLite使用的临时文件（二）概述SQLite数据库具有很强的抗损坏能力。如果应用程序崩溃，或操作系统崩溃，甚至电源故障发生在事务中间，部分写入的事务应在下次自动回滚将访问数据库文件。恢复过程已完全完成自动，不需要用户采取任何行动或应用程序。尽管SQLite可以抵抗数据库损坏，但它
Jfinal 使用Druid对Sqlserver数据库配置文件中的密码项进行加密解密实现迟到的微笑 java web Jfina Druid
由于最近业务表较多，导致我好久没写博客了，今天为大家奉上一篇sqlserver配置文件如何加密和解密。网上看了下有mysql的我是sqlserver的忠实用户，居然没有sqlserver的，我瞬间不淡定了，决定写一篇帮助萌新。首先我们需要一个jar包，网上有，我就不提供下载地址了。第二步就是需要用这个jar来对密码进行加密了。网上有很多是下面这样的写法。这种写法对于懒惰的我来说就是一种折磨。我使用
2020-04-29 eMAGMA 基于基因的关联分析（Part1）程凉皮儿
输入数据准备本教程要求eMAGMA文件,软件(MAGMA)和辅助文件都在同一个目录下如果你的文件在不同的目录上，请在命令行加入路径信息cd/path/yourworkingfolder/eMAGMA解压缩软件包及辅助文件：magma_v1.07b.zip,NCBI37.3.zip和MDD2018_excluding23andMe(下载自PGCwebsite).unzip[filename].zip
AI+Python赋能！长时序植被遥感动态分析全攻略：从物候提取到生态评估梦想的初衷~ 土壤植被遥感人工智能遥感植被土壤
在遥感技术与人工智能深度融合的2025年，AI大模型正重塑长时序植被遥感数据分析范式。从Landsat/Sentinel卫星数据的智能化去云处理，到MODIS植被产品的AI辅助质量控制，以ChatGPT、DeepSeeK为代表的大模型技术已成为提升遥感数据处理效率与精度的核心工具——尤其在长时序植被动态监测、物候期精准提取、时空变异归因分析及生态环境质量评估等领域，展现出传统方法难以企及的技术优势
sqlite数据库字段类型鹿灏楷silves python web sql sqlite3 django python 数据库
数据库字段类型：字符型字段topic=models.CharField(max_length=)#需要传入参数，设置字符串的最长长度email=models.EmailTield()#电子邮箱字段，在CharField基础上，增加了邮箱的正则验证a=models.SlugField()#仅含有字母下划线数字和连字符的字符串url=models.URLField()#url字段，默认长度200字符f
前端学习笔记：React.js中state和props的区别和联系
文章目录1.`props`（属性）定义用途示例2.`state`（状态）定义用途示例3.核心区别4.常见使用场景props的场景state的场景5.交互模式父组件修改子组件状态子组件通知父组件6.最佳实践总结在React.js中，state和props是两个核心概念，用于管理组件的数据和数据流。它们的设计目的不同，但共同构成了React组件的状态管理系统。1.props（属性）定义外部传入的数据：
SQLite可视化管理工具汇总班力勤程序员 sqlite jvm 数据库
截至2012/9/14最新版本SQLiteSpy1.9.1–28Jul2011单文件，界面设计紧凑，较稳定,功能较少，创建表与添加数据均需sql语句，快捷键教方便，作为数据浏览和修改工具极佳，视图编码为utf-8，对gbk2312显示乱码。能满足一般的应用，但没有导出数据表功能，同时只能打开一个数据库文件不支持二进制字段编辑2、SQLiteStudio（推荐）开源免费单文件http://sqlit
全栈Todo应用实战：从零到一的本地部署与深度解析
全栈Todo应用实战：从零到一的本地部署与深度解析前言在现代Web开发中，全栈应用已成为主流。本文将以一个经典的Todo（待办事项）应用为例，详细记录从项目下载、环境配置、后端启动、数据库交互到前端运行的完整流程。我们将深入探讨在此过程中遇到的一个典型问题——CORS与API请求失败，并提供从“快速修复”到“最佳实践”的解决方案。这不仅是一份操作指南，更是一次宝贵的实战经验总结。你将从本博客中学到
用Flink实现的一个实时订单对账功能, Flink的双流实时对账
1.为什么业务订单数据不用Mysql之类的强事务性数据库监控反而用Flink的实时?一般这种涉及到订单的数据流都要用mysql监控实现,但是鉴于减少mysql的数据库压力和提高更实时性,可以考虑用Flink实时的数据流做实时的参考2.如何处理乱序数据?使用watermark水位保证第一层数据延迟.PS:这里的水位不能设置太长延迟使用processfuntion更加灵活的处理迟到数据,设置一个定时器
PyTorch数据准备：从基础Dataset到高效DataLoader 慕婉0307 pytorch pytorch 人工智能 python
一、PyTorch数据加载核心组件在PyTorch中，数据准备主要涉及两个核心类：Dataset和DataLoader。它们共同构成了PyTorch灵活高效的数据管道系统。Dataset类：作为数据集的抽象基类，需要实现三个关键方法：len():返回数据集大小getitem():获取单个数据样本(可选)init():初始化逻辑常见实现方式：继承torch.utils.data.Dataset使用T
Echarts柱状图series下去掉无数据的柱子，没数据不让其柱子占位置 , echarts图表,多个柱子其中数据为0时不占位吃西瓜不吐籽_ echarts javascript 前端
echarts图表,多个柱子其中数据为0时不占位修改前（中间柱子没数据但是还是会占位置）修改后（中间柱子没数据情况下会自动调整）思路：使用自定义柱子来做import*asechartsfrom'echarts';varchartDom=document.getElementById('main');varmyChart=echarts.init(chartDom);varoption;lettuf
vue中is属性搭配vuedraggable插件实现可拖动可视化大屏展示组件的自定义配置功能吃西瓜不吐籽_ vue.js 前端 javascript
最近有这样一个需求，将大屏上展示的东西都封装成独立的组件让用户自己可以自定义配置自己的组件位置及想要展示的组件，第一个我就想到通过is来实现，分享下我的思路及部分代码供大家参考。先看下大概布局：如图通过上方的组件拖拽的配置卡片来进行动态渲染组件，拖拽用了draggable插件，这样拖拽后直接传数据即可首先先看拖动卡片的部分代码（切换多个个性布局及如何默认展示，是否有配置过布局没有则怎么展示这些逻辑
深入TA-Lib：量化技术指标详解
深入TA-Lib：量化技术指标详解本文系统讲解TA-Lib技术指标分析，涵盖基础、数据处理、趋势与动量指标、均量线、布林线等，并结合Python代码与大数据、机器学习实战案例，助力读者掌握量化交易实战技巧。本文系统梳理了TA-Lib技术指标分析的核心内容，包括TA-Lib基础、数据处理、趋势与动量指标、均量线、布林线等关键技术指标分析方法，并结合Python代码示例与大数据、机器学习的融合实战案例
【python做接口测试的学习记录day6——pytest+yaml+allure自动化测试框架之URL拼接】小丫么小二郎~ 学习 pytest python 功能测试测试工具
在之前的测试框架中，可以发现的是，我们的yaml数据中所有的url中的除了路径不同外，其余都是相同的，我们想办法将这一部分自动化，这样的yaml中写用例url的时候就不用再每次都写上域名，只需要输入路径即可首先我们需要更改下之前的用例yaml文件中的url，将域名删除只留下路径即可，例如：接下来我们在根目录创建一个config.yam文件，用于存储我们的URL中的公共部分，这里由于公司相关，我隐藏
【python做接口测试的学习记录day9——pytest自动化测试框架之yaml数据驱动封装】小丫么小二郎~ pytest python pycharm 接口测试用例
之前我们的框架中，如果有多个测试用例，则需要在yaml文件中写入多个用例，而每个用例可能不同的仅仅只是个别参数值，这就导致很多重复代码，现在我们使用数据驱动就可以解决这个问题了。我依旧采用之前的登录接口为例，简单记录一下数据驱动封装的全过程一、DDT数据驱动yaml文件在根目录下创建包datas，用来存放我们的数据驱动yaml文件，在datas下新建一个get_token_data.yaml文件，
2018-7-24 grace2039
一、学习与实践1.付出不亚于任何人的努力2.要谦虚，不要骄傲3.要每天反省4.活着，就要感谢5.积善行，思利他6.不要有感性的烦恼二、今日分享这几天财务部全体人员都在加班加点上传数据，因为系统不是很稳定，大家干一会儿后不得不陪着系统“休息”一下，听说昨天嵘姐在休息时一试系统可以操作了，于是自己马上抓紧录入，没顾得上通知其他人，过了一会儿被旁边的小伙伴发现后，大家都笑骂她吃独食，真是积极乐观的团队呀
【电脑】鼠标的基础知识 Mike_Wuzy 电脑
下面是一些关于鼠标的详细知识：鼠标的基本结构外壳：通常由塑料或金属制成，提供手握的地方。滚轮：位于中央，用于滚动页面。有些高端型号的滚轮可以自定义功能。按键：最常见的是左键、右键和中键（即滚轮）。一些鼠标增加了额外的功能键。传感器：光学或激光传感器，用于捕捉移动信息并转换为数字信号传递给电脑。微处理器：处理传感器传输的数据，并将其转化为计算机可理解的命令。鼠标的类型无线鼠标：使用蓝牙、2.4GHz
【电脑】声卡的基础知识 Mike_Wuzy 电脑
声卡是计算机的重要组成部分之一，主要用于处理音频信号，包括录音、播放音乐和视频等。下面是一些关于声卡的详细知识：声卡的基本结构数模转换器(DAC)：将数字音频数据转换为模拟电信号。模数转换器(ADC)：将模拟音频信号转换为数字格式，用于录音或输入设备（如麦克风）。放大器：用于增强输出音量，确保声音清晰响亮。控制芯片：管理各种音频任务和功能的主控单元。声卡的主要类型集成声卡(OnboardSound
Navicat操作指南：MySQL数据库配置与Todo应用部署像风一样自由2020 数据库 mysql adb
Navicat操作指南：MySQL数据库配置与Todo应用部署前言本文档详细记录了使用Navicat管理MySQL数据库，并配置Todo应用的完整操作步骤。适用于使用Navicat作为MySQL管理工具的开发者。操作目标启动MySQL服务使用Navicat连接MySQL数据库创建todoapp数据库配置Todo应用环境变量验证应用正常运行步骤一：启动MySQL服务Windows用户方法1：通过Wi
分布式系统中优化ELK日志采集性能 Alex艾力的IT数字空间 elk 微服务中间件架构 ux 安全性测试可用性测试
架构设计、组件调优、资源分配等多维度入手一、架构优化：分布式与解耦设计分层采集与缓冲Filebeat轻量级采集：在每台服务器部署Filebeat替代Logstash作为日志收集器，降低资源占用（CPU/内存减少70%以上）。引入缓冲队列：通过Redis或Kafka作为日志缓冲池，缓解Logstash或Elasticsearch的突发流量压力，避免数据丢失（如Logstash异常时Redis暂存数据
HW prefetcher之CDP(Content-Directed Data Prefetching) Chip Design xPU Chip Design CPU GEM5
CDP是Content-DirectedDataPrefetching的缩写，它基于RobertCooksey和StephanJourdan提出的"Stateless,Content-DirectedDataPrefetchingMechanism"论文实现。是一种内容导向的数据预取机制，CDP通过分析内存中的数据内容来识别可能的指针，当识别到指针时，它会预取指针指向的内存地址。CDP使用VPN表
FPGA芯片厂商及关键的开发测试工具 Chip Design xPU Chip Design fpga开发
以下是结合2025年技术动态整理的。一、FPGA芯片主要厂商及产品系列厂商芯片系列典型特点目标市场AMD/XilinxVersal,Kintex,Artix,Zynq高性能异构计算（AI引擎+FPGA+CPU）数据中心、5G、航空航天Intel(Altera)Stratix,Arria,Agilex,Cyclone高带宽内存集成（HBM），支持CXL协议网络加速、边缘计算LatticeCertus
硬件预取的几个问题 1
1.硬件预取的定义和目标是什么？答案：硬件预取是CPU在程序执行前自动预测并加载可能使用的数据到缓存中的技术，目标是减少缓存未命中带来的延迟，提升指令吞吐量。2.硬件预取与软件预取的核心区别？答案：硬件预取由CPU内部逻辑自动触发，透明且通用；软件预取需程序员显式插入指令（如prefetch），可针对特定场景优化，但依赖代码适配。3.预取算法的主要分类？答案：分为规则驱动型（如顺序、步长预取）和机
黄仁勋对话Transformer七子：模型的未来在于数据质量，而非规模强化学习曾小健 #AI商业/产品/投融资前沿 #LLM大语言模型 transformer 深度学习人工智能
黄仁勋对话Transformer七子：模型的未来在于数据质量，而非规模乌鸦智能说2024-03-2216:14在今年的GTC大会上，英伟达CEO黄仁勋邀请了Transformer的七位作者（NikiParmar因故临时未能出席）参与圆桌论坛的讨论，这是Transformer团队首次在公开场合集体亮相。2017年，八位在谷歌工作的AI科学家发表了一篇名为《AttentionIsAllYouNeed》
iOS http封装 374016526 ios 服务器交互 http 网络请求
程序开发避免不了与服务器的交互，这里打包了一个自己写的http交互库。希望可以帮到大家。内置一个basehttp，当我们创建自己的service可以继承实现。 KuroAppBaseHttp *baseHttp = [[KuroAppBaseHttp alloc] init]; [baseHttp setDelegate:self]; [baseHttp
lolcat ：一个在 Linux 终端中输出彩虹特效的命令行工具 brotherlamp linux linux教程 linux视频 linux自学 linux资料
那些相信 Linux 命令行是单调无聊且没有任何乐趣的人们，你们错了，这里有一些有关 Linux 的文章，它们展示着 Linux 是如何的有趣和“淘气” 。在本文中，我将讨论一个名为“lolcat”的小工具 – 它可以在终端中生成彩虹般的颜色。何为 lolcat ? Lolcat 是一个针对 Linux，BSD 和 OSX 平台的工具，它类似于 cat 命令，并为 cat
MongoDB索引管理（1）——[九] eksliang mongodb MongoDB管理索引
转载请出自出处：http://eksliang.iteye.com/blog/2178427 一、概述数据库的索引与书籍的索引类似，有了索引就不需要翻转整本书。数据库的索引跟这个原理一样，首先在索引中找，在索引中找到条目以后，就可以直接跳转到目标文档的位置，从而使查询速度提高几个数据量级。不使用索引的查询称
Informatica参数及变量 18289753290 Informatica 参数变量
下面是本人通俗的理解，如有不对之处，希望指正 info参数的设置：在info中用到的参数都在server的专门的配置文件中（最好以parma）结尾下面的GLOBAl就是全局的，$开头的是系统级变量，$$开头的变量是自定义变量。如果是在session中或者mapping中用到的变量就是局部变量，那就把global换成对应的session或者mapping名字。 [GLOBAL] $Par
python 解析unicode字符串为utf8编码字符串酷的飞上天空 unicode
php返回的json字符串如果包含中文，则会被转换成\uxx格式的unicode编码字符串返回。在浏览器中能正常识别这种编码，但是后台程序却不能识别，直接输出显示的是\uxx的字符，并未进行转码。转换方式如下 >>> import json >>> q = '{"text":"\u4
Hibernate的总结永夜-极光 Hibernate
1.hibernate的作用,简化对数据库的编码,使开发人员不必再与复杂的sql语句打交道做项目大部分都需要用JAVA来链接数据库，比如你要做一个会员注册的页面，那么获取到用户填写的基本信后，你要把这些基本信息存入数据库对应的表中，不用hibernate还有mybatis之类的框架，都不用的话就得用JDBC，也就是JAVA自己的，用这个东西你要写很多的代码，比如保存注册信
SyntaxError: Non-UTF-8 code starting with '\xc4' 随便小屋 python
刚开始看一下Python语言，传说听强大的，但我感觉还是没Java强吧！写Hello World的时候就遇到一个问题，在Eclipse中写的，代码如下 ''' Created on 2014年10月27日 @author: Logic ''' print("Hello World!"); 运行结果 SyntaxError: Non-UTF-8
学会敬酒礼仪不做酒席菜鸟 aijuans 菜鸟
俗话说，酒是越喝越厚，但在酒桌上也有很多学问讲究，以下总结了一些酒桌上的你不得不注意的小细节。细节一：领导相互喝完才轮到自己敬酒。敬酒一定要站起来，双手举杯。细节二：可以多人敬一人，决不可一人敬多人，除非你是领导。细节三：自己敬别人，如果不碰杯，自己喝多少可视乎情况而定，比如对方酒量，对方喝酒态度，切不可比对方喝得少，要知道是自己敬人。细节四：自己敬别人，如果碰杯，一
《创新者的基因》读书笔记 aoyouzi 读书笔记《创新者的基因》
创新者的基因创新者的“基因”，即最具创意的企业家具备的五种“发现技能”：联想，观察，实验，发问，建立人脉。第一部分破坏性创新，从你开始第一章破坏性创新者的基因如何获得启示：发现以下的因素起到了催化剂的作用：(1) -个挑战现状的问题；(2)对某项技术、某个公司或顾客的观察；(3) -次尝试新鲜事物的经验或实验；(4)与某人进行了一次交谈，为他点醒
表单验证技术百合不是茶 JavaScript DOM对象 String对象事件
js最主要的功能就是验证表单,下面是我对表单验证的一些理解,贴出来与大家交流交流 ,数显我们要知道表单验证需要的技术点, String对象,事件,函数一:String对象;通常是对字符串的操作; 1,String的属性; 字符串.length;表示该字符串的长度; var str= "java"
web.xml配置详解之context-param bijian1013 java servlet web.xml context-param
一.格式定义： <context-param> <param-name>contextConfigLocation</param-name> <param-value>contextConfigLocationValue></param-value> </context-param> 作用：该元
Web系统常见编码漏洞（开发工程师知晓） Bill_chen sql PHP Web fckeditor 脚本
1.头号大敌：SQL Injection 原因：程序中对用户输入检查不严格，用户可以提交一段数据库查询代码，根据程序返回的结果，获得某些他想得知的数据，这就是所谓的SQL Injection，即SQL注入。本质: 对于输入检查不充分，导致SQL语句将用户提交的非法数据当作语句的一部分来执行。示例： String query = "SELECT id FROM users
【MongoDB学习笔记六】MongoDB修改器 bit1129 mongodb
本文首先介绍下MongoDB的基本的增删改查操作，然后，详细介绍MongoDB提供的修改器，以完成各种各样的文档更新操作 MongoDB的主要操作 show dbs 显示当前用户能看到哪些数据库 use foobar 将数据库切换到foobar show collections 显示当前数据库有哪些集合 db.people.update，update不带参数，可
提高职业素养，做好人生规划白糖_ 人生
培训讲师是成都著名的企业培训讲师，他在讲课中提出的一些观点很新颖，在此我收录了一些分享一下。注：讲师的观点不代表本人的观点，这些东西大家自己揣摩。 1、什么是职业规划：职业规划并不完全代表你到什么阶段要当什么官要拿多少钱，这些都只是梦想。职业规划是清楚的认识自己现在缺什么，这个阶段该学习什么，下个阶段缺什么，又应该怎么去规划学习，这样才算是规划。
国外的网站你都到哪边看？ bozch 技术网站国外
学习软件开发技术，如果没有什么英文基础，最好还是看国内的一些技术网站，例如：开源OSchina，csdn，iteye,51cto等等。个人感觉如果英语基础能力不错的话，可以浏览国外的网站来进行软件技术基础的学习，例如java开发中常用的到的网站有apache.org 里面有apache的很多Projects,springframework.org是spring相关的项目网站,还有几个感觉不错的
编程之美-光影切割问题 bylijinnan 编程之美
package a; public class DisorderCount { /**《编程之美》“光影切割问题” * 主要是两个问题： * 1.数学公式（设定没有三条以上的直线交于同一点）： * 两条直线最多一个交点，将平面分成了4个区域； * 三条直线最多三个交点，将平面分成了7个区域； * 可以推出：N条直线 M个交点，区域数为N+M+1。
关于Web跨站执行脚本概念 chenbowen00 Web 安全跨站执行脚本
跨站脚本攻击(XSS)是web应用程序中最危险和最常见的安全漏洞之一。安全研究人员发现这个漏洞在最受欢迎的网站,包括谷歌、Facebook、亚马逊、PayPal,和许多其他网站。如果你看看bug赏金计划,大多数报告的问题属于 XSS。为了防止跨站脚本攻击,浏览器也有自己的过滤器,但安全研究人员总是想方设法绕过这些过滤器。这个漏洞是通常用于执行cookie窃取、恶意软件传播,会话劫持,恶意重定向。在
[开源项目与投资]投资开源项目之前需要统计该项目已有的用户数 comsci 开源项目
现在国内和国外,特别是美国那边,突然出现很多开源项目,但是这些项目的用户有多少,有多少忠诚的粉丝,对于投资者来讲,完全是一个未知数,那么要投资开源项目,我们投资者必须准确无误的知道该项目的全部情况,包括项目发起人的情况,项目的维持时间..项目的技术水平,项目的参与者的势力,项目投入产出的效益.....
oracle alert log file（告警日志文件） daizj oracle 告警日志文件 alert log file
The alert log is a chronological log of messages and errors, and includes the following items: All internal errors (ORA-00600), block corruption errors (ORA-01578), and deadlock errors (ORA-00060)
关于 CAS SSO 文章声明 denger SSO
由于几年前写了几篇 CAS 系列的文章，之后陆续有人参照文章去实现，可都遇到了各种问题，同时经常或多或少的收到不少人的求助。现在这时特此说明几点： 1. 那些文章发表于好几年前了，CAS 已经更新几个很多版本了，由于近年已经没有做该领域方面的事情，所有文章也没有持续更新。 2. 文章只是提供思路，尽管 CAS 版本已经发生变化，但原理和流程仍然一致。最重要的是明白原理，然后
初二上学期难记单词 dcj3sjt126com english word
lesson 课 traffic 交通 matter 要紧；事物 happy 快乐的，幸福的 second 第二的 idea 主意；想法；意见 mean 意味着 important 重要的，重大的 never 从来，决不 afraid 害怕的 fifth 第五的 hometown 故乡，家乡 discuss 讨论；议论 east 东方的 agree 同意；赞成 bo
uicollectionview 纯代码布局, 添加头部视图 dcj3sjt126com Collection
#import <UIKit/UIKit.h> @interface myHeadView : UICollectionReusableView { UILabel *TitleLable; } -(void)setTextTitle; @end #import "myHeadView.h" @implementation m
N 位随机数字串的 JAVA 生成实现 FX夜归人 java Math 随机数 Random
/** * 功能描述随机数工具类<br /> * @author FengXueYeGuiRen * 创建时间 2014-7-25<br /> */ public class RandomUtil { // 随机数生成器 private static java.util.Random random = new java.util.R
Ehcache（09）——缓存Web页面 234390216 ehcache 页面缓存
页面缓存目录 1 SimplePageCachingFilter 1.1 calculateKey 1.2 可配置的初始化参数 1.2.1 cach
spring中少用的注解@primary解析 jackyrong primary
这次看下spring中少见的注解@primary注解，例子 @Component public class MetalSinger implements Singer{ @Override public String sing(String lyrics) { return "I am singing with DIO voice
Java几款性能分析工具的对比 lbwahoo java
Java几款性能分析工具的对比摘自：http://my.oschina.net/liux/blog/51800 在给客户的应用程序维护的过程中，我注意到在高负载下的一些性能问题。理论上，增加对应用程序的负载会使性能等比率的下降。然而，我认为性能下降的比率远远高于负载的增加。我也发现，性能可以通过改变应用程序的逻辑来提升，甚至达到极限。为了更详细的了解这一点，我们需要做一些性能
JVM参数配置大全 nickys jvm 应用服务器
JVM参数配置大全 /usr/local/jdk/bin/java -Dresin.home=/usr/local/resin -server -Xms1800M -Xmx1800M -Xmn300M -Xss512K -XX:PermSize=300M -XX:MaxPermSize=300M -XX:SurvivorRatio=8 -XX:MaxTenuringThreshold=5 -
搭建 CentOS 6 服务器(14) - squid、Varnish rensanning varnish
（一）squid 安装 # yum install httpd-tools -y # htpasswd -c -b /etc/squid/passwords squiduser 123456 # yum install squid -y 设置 # cp /etc/squid/squid.conf /etc/squid/squid.conf.bak # vi /etc/
Spring缓存注解@Cache使用 tom_seed spring
参考资料 http://www.ibm.com/developerworks/cn/opensource/os-cn-spring-cache/ http://swiftlet.net/archives/774 缓存注解有以下三个： @Cacheable @CacheEvict @CachePut
dom4j解析XML时出现"java.lang.noclassdeffounderror: org/jaxen/jaxenexception"错误 xp9802
java.lang.NoClassDefFoundError: org/jaxen/JaxenExc 关键字: java.lang.noclassdeffounderror: org/jaxen/jaxenexception 使用dom4j解析XML时，要快速获取某个节点的数据，使用XPath是个不错的方法，dom4j的快速手册里也建议使用这种方式执行时却抛出以下异常： Exceptio