Avery123123

深度聚类 VAE 类方法总结（VAE、GMVAE、VaDE）

Variational AutoEncoders（VAE）

概述
详解VAE

生成模型-----进行分布之间的变换
什么是VAE

GMVAE（GAUSSIAN MIXTURE VARIATIONAL AUTOENCODERS）

概述

生成和识别模型
识别模型的推论
离散潜在变量的KL COST
过度监管问题

实验

SYNTHETIC DATA
无监督的图像聚类

图像生成

VaDE

概述
Variational Deep Embedding

生成过程
变化下界
了解VaDE的ELBO

实验

数据集说明
实验装置
定量比较
通过VaDE生成样本
可视化学习的嵌入
The Impact of the Number of Clusters

Variational AutoEncoders（VAE）

概述

VAE是将变分贝叶斯方法与神经网络提供的灵活性和可扩展性相结合的结果。

变分自编码器是一个扭曲的自编码器。同自编码器的传统编码器和解码器网络一起，它们具有附加的随机层。

编码器网络之后的随机层使用高斯分布对数据进行采样，而解码器网络之后的随机层使用伯努利分布对数据进行采样。

与 GAN 一样，变分自编码器根据它们所接受的分布来生成图像和数字。VAE允许设置潜在的复杂先验，从而学习强大的潜在表征。

现在已经有了 VAE 的基本结构，问题在于如何对它们进行训练，因为训练数据和后验密度的最大可能性是难以处理的。通过最大化 log 数据可能性的下限来训练网络。因此，损失项由两部分组成：通过采样从解码器网络获得的生成损失，以及被称为潜在损失的 KL 发散项。

发生损耗确保了由解码器生成的图像和用于训练网络的图像是相同的，并且潜在损失能够确保后验分布 qφ(z|x) 接近于先验分布 pθ(z)。由于编码器使用高斯分布进行采样，所以潜在损耗测量潜在变量与单位高斯匹配的匹配程度。

一旦 VAE 接受训练，只能使用解码器网络来生成新的图像。

使用变分推理可以将棘手的推理问题转化为优化问题，从而扩展了可用的推理工具集，包括优化技术。尽管如此，经典变分推论的一个关键局限性是需要似然性和先验共轭，以便可以对大多数问题进行合理的优化，这反过来又会限制此类算法的适用性。变分自动编码器引入了使用神经网络来输出条件后验的方法（Kingma＆Welling，2013），因此可以通过随机梯度下降和标准反向传播来精确地优化变分推理目标。提出了这种称为重新参数化技巧的技术，旨在通过连续随机变量进行反向传播。尽管在正常情况下，如果没有蒙特卡罗方法，将无法通过随机变量进行反向传播，但可以通过确定性函数和独立噪声源的组合来构造潜在变量，从而绕过这种情况。

详解VAE

生成模型-----进行分布之间的变换

通常我们会拿 VAE 跟 GAN 比较，的确，它们两个的目标基本是一致的——希望构建一个从隐变量 Z 生成目标数据 X 的模型，但是实现上有所不同。

生成模型的难题就是判断生成分布与真实分布的相似度，因为我们只知道两者的采样结果，不知道它们的分布表达式。

什么是VAE

首先我们有一批数据样本 {X1,…,Xn}，其整体用 X 来描述，我们本想根据 {X1,…,Xn} 得到 X 的分布 p(X)，如果能得到的话，那我直接根据 p(X) 来采样，就可以得到所有可能的 X 了（包括 {X1,…,Xn} 以外的），这是一个终极理想的生成模型了。

当然，这个理想很难实现，于是我们将分布改一改：

这里我们就不区分求和还是求积分了，意思对了就行。此时 p(X|Z) 就描述了一个由 Z 来生成 X 的模型，而我们假设 Z 服从标准正态分布，也就是 p(Z)=N(0,I)。如果这个理想能实现，那么我们就可以先从标准正态分布中采样一个 Z，然后根据 Z 来算一个 X，也是一个很棒的生成模型。

其实，在整个 VAE 模型中，我们并没有去使用 p(Z)（先验分布）是正态分布的假设，我们用的是假设 p(Z|X)（后验分布）是正态分布。

具体来说，给定一个真实样本 Xk，我们假设存在一个专属于 Xk 的分布 p(Z|Xk)（学名叫后验分布），并进一步假设这个分布是（独立的、多元的）正态分布。

VAE 是为每个样本构造专属的正态分布，然后采样来重构。

那怎么找出专属于 Xk 的正态分布 p(Z|Xk) 的均值和方差呢？
神经网络来拟合出来

对应于上图我们发现：Encoder 不是用来 Encode 的，是用来算均值和方差的。

分布标准化

让我们来思考一下，根据上图的训练过程，最终会得到什么结果。

首先，我们希望重构 X，也就是最小化 D(X̂k,Xk)^2，但是这个重构过程受到噪声的影响，因为 Zk 是通过重新采样过的，不是直接由 encoder 算出来的。

显然噪声会增加重构的难度，不过好在这个噪声强度（也就是方差）通过一个神经网络算出来的，所以最终模型为了重构得更好，肯定会想尽办法让方差为0。

而方差为 0 的话，也就没有随机性了，所以不管怎么采样其实都只是得到确定的结果（也就是均值），只拟合一个当然比拟合多个要容易，而均值是通过另外一个神经网络算出来的。

说白了，模型会慢慢退化成普通的 AutoEncoder，噪声不再起作用。

这样不就白费力气了吗？说好的生成模型呢？

其实 VAE 还让所有的 p(Z|X) 都向标准正态分布看齐，这样就防止了噪声为零，同时保证了模型具有生成能力。

怎么理解“保证了生成能力”呢？如果所有的 p(Z|X) 都很接近标准正态分布 N(0,I)，那么根据定义：

这样我们就能达到我们的先验假设：p(Z) 是标准正态分布。然后我们就可以放心地从 N(0,I) 中采样来生成图像了。

VAE本质结构

在 VAE 中，它的 Encoder 有两个，一个用来计算均值，一个用来计算方差，这已经让人意外了：Encoder 不是用来 Encode 的，是用来算均值和方差的，这真是大新闻了，还有均值和方差不都是统计量吗，怎么是用神经网络来算的？

事实上，我觉得 VAE 从让普通人望而生畏的变分和贝叶斯理论出发，最后落地到一个具体的模型中，虽然走了比较长的一段路，但最终的模型其实是很接地气的。

它本质上就是在我们常规的自编码器的基础上，对 encoder 的结果（在VAE中对应着计算均值的网络）加上了“高斯噪声”，使得结果 decoder 能够对噪声有鲁棒性；而那个额外的 KL loss（目的是让均值为 0，方差为 1），事实上就是相当于对 encoder 的一个正则项，希望 encoder 出来的东西均有零均值。

那另外一个 encoder（对应着计算方差的网络）的作用呢？它是用来动态调节噪声的强度的。

直觉上来想，当 decoder 还没有训练好时（重构误差远大于 KL loss），就会适当降低噪声（KL loss 增加），使得拟合起来容易一些（重构误差开始下降）。

反之，如果 decoder 训练得还不错时（重构误差小于 KL loss），这时候噪声就会增加（KL loss 减少），使得拟合更加困难了（重构误差又开始增加），这时候 decoder 就要想办法提高它的生成能力了。

GMVAE（GAUSSIAN MIXTURE VARIATIONAL AUTOENCODERS）

以高斯混合作为先验分布研究变分自动编码器模型（VAE）的变体

本文中，提出了一种在VAE框架内执行无监督聚类的算法。为此，假设可以通过假设观测数据是从多模态先验分布中生成的假设来调整生成模型的无监督聚类，并相应地构建可以使用重新参数化技巧直接优化的推理模型。。同时作者表明，VAE中的过度规范化问题会严重影响聚类的性能，并且可以用Kingma等人引入的最小信息约束来缓解这一问题。

概述

在常规VAE中，潜在变量的先验值通常是各向同性的高斯。这种先验的选择导致多元高斯的每个维度被推向学习来自数据的单独的连续变化因子，这可能导致学习的表示被结构化和解缠结。虽然这允许更多可解释的潜在变量（Higgins等，2016），但高斯先验是有限的，因为学习的表示只能是单峰的，并且不允许更复杂的表示。结果，已经开发了对VAE的许多扩展，其中可以通过指定越来越复杂的先验来学习更复杂的潜在表示（Chung等人，2015; Gregor等人，2015; Eslami等人，2016）。

在本文中，我们选择混合高斯先验作为先验，因为它是单峰高斯先验的直观扩展。如果我们假设观察到的数据是从混合的高斯产生的，则推断数据点的类别等同于推断数据点是从哪种潜势分布模式产生的。虽然这使我们有可能将潜伏空间划分为不同的类，但在此模型中进行推断并非易事。众所周知，通常用于VAE的重新参数化技巧无法直接应用于离散变量。已经提出了几种估计离散变量梯度的可能性（Glynn，1990; Titsias＆Lázaro-Gredilla，2015）。 Graves（2016）还提出了一种通过GMM反向传播的算法。相反，我们表明，通过调整标准VAE的体系结构，可以通过重新参数化技巧通过标准反向传播来优化我们的高斯混合变分自编码器（GMVAE）的变化下限估计量，从而使推理模型保持简单。

生成和识别模型

高斯混合变分自动编码器（GMVAE）的图形模型，显示了生成模型（左）和变体族（右）:

识别模型的推论

用变分推理目标（即对数证据下限（ELBO））训练生成模型，可以将其写为

我们将下限中的术语分别称为重构术语，条件先验条件，w先验条件和z先验条件。

离散潜在变量的KL COST

我们的ELBO中最不常见的术语是z优先级术语。通过询问x与w生成的每个聚类位置相距多远，z后验直接从x和w的值计算聚类分配概率。因此，z先验项可以通过同时操纵聚类的位置和编码点x来减小z后验和统一先验之间的KL散度。凭直觉，它会尝试通过最大程度地重叠聚类，然后将均值靠拢在一起来合并聚类。与其他KL正则化术语相似，该术语与重建术语存在冲突，随着训练数据量的增加，预计该术语将被过度使用。

过度监管问题

在VAE文献中已多次描述了正则化项可能对VAE训练产生的压倒性影响（Bowman等人，2015;Sønderby等人，2016; Kingma等人，2016; Chen等人，2016b）。由于先验的强大影响，获得的潜在表示常常被过度简化，并且不能很好地表示数据的基础结构。

到目前为止，有两种主要的方法可以克服这种影响：一种解决方案是在训练过程中退火KL项，方法是允许重建项训练自动编码器网络，然后再缓慢整合KL项的正则化（Sønderby等人，2016）。另一种主要方法是通过设置一个临界值来修改目标函数，该临界值会在低于某个阈值时消除KL项的影响（Kingma等，2016）。正如我们在下面的实验部分所示，过度规整化问题在GMVAE群集的分配中也很普遍，并在大型简并群集中表现出来。虽然我们显示了Kingma等人建议的第二种方法。（2016年）确实确实减轻了这种合并现象，找到解决过度正规化问题的方法仍然是一个充满挑战的开放问题。

实验

我们的实验的主要目的不仅是评估我们提出的模型的准确性，而且要了解构建有意义的，差异化的潜在数据表示所涉及的优化动力。

本节分为三个部分：
1.首先，我们在一个低维综合数据集中研究推理过程，并特别关注过度规则化问题如何影响GMVAE的聚类性能以及如何缓解该问题；

2.然后，我们根据MNIST无监督聚类任务评估模型；

3.最后，我们显示了由模型生成的图像，这些图像以潜在变量的不同值为条件，这说明GMVAE可以学习解开的，可解释的潜在表示。

在本节中，我们将使用以下数据集：
•综合数据：我们创建一个模仿约翰逊等人介绍的综合数据集。（2016），这是一个2D数据集，具有从5个圆的弧线创建的10,000个数据点。

•MNIST：标准的手写数字数据集，由28x28灰度图像组成，由60,000个训练样本和10,000个测试样本组成（LeCun等，1998）。

•SVHN：门牌号的32x32图像集合（Netzer等，2011）。我们使用标准版和额外的训练集的裁剪版，总共增加了大约600,000张图像。

SYNTHETIC DATA

我们通过绘制等式中描述的z先验项的大小来量化聚类性能。公式 6在训练中。可以将这一数量视为衡量不同群集重叠程度的一种度量。由于我们的目标是在潜在空间中实现有意义的聚类，因此我们希望随着模型学习单独的聚类，该数量会下降。

但是，根据经验，我们发现情况并非如此。我们的模型收敛以将所有类合并到相同的大型群集中的潜在表示，而不是表示有关不同群集的信息，如图5和6所示。 2d和3a。结果，每个数据点都可能属于任何一个群集，这使得我们的潜在表示形式对类结构完全无用。

我们认为，这种现象可以解释为z先验项过度正规化的结果。鉴于此数量是由下限中的KL项的优化推动的，因此达到最大可能值为零，这与通过训练以确保有关类的信息进行编码而减少的相反。我们怀疑先验在初始训练阶段的影响力太大，并且将模型参数驱动到较差的局部最优值，而该最优值随后很难被重建项排除掉。

这种观察从概念上讲与常规VAE中遇到的过度规范化问题非常相似，因此我们假设采用类似的启发式方法可以缓解这一问题。我们在图2f中显示，通过使用先前提到的对Kingma等人提出的下界的修改。（2016），我们可以避免由z优先级引起的过度规范化。这可以通过将z优先级之前的成本保持在恒定值λ直到超过该阈值来实现。正式地，修改后的z优先级术语写为：

此修改抑制了z优先级合并所有群集的初始效果，因此允许它们散布，直到z优先级成本中的成本足够高为止。在这一点上，其效果已大大降低，并且主要限于合并足够重叠的单个群集。这可以在图1和2中清楚地看到。 2e和2f。前者显示的是未考虑z先验成本的集群，因此集群已经能够扩展。一旦激活了z优先级，就可以合并非常靠近的群集，如图2f所示。

最后，为了说明使用神经网络进行分布转换的好处，我们将模型（图2c）与常规GMM（图2c）在数据空间中观察到的密度进行了比较。如图所示，与常规GMM相比，GMVAE可以提供更丰富，因此更准确的表示形式，因此在建模非高斯数据方面更为成功。

图2：合成数据集的可视化：（a）数据在5维模式下分布在二维数据空间上。（b）GMVAE学习密度模型，该模型可以使用数据空间中非高斯分布的混合来对数据建模。（c）由于限制性高斯假设，GMM也无法表示数据。（d）然而，GMVAE受过度正则化的影响，在看潜在空间时可能导致极小的最小值。（e）使用对ELBO的修改（Kingma et al。，2016）可使星团扩展。（f）随着模型收敛，z优先级项被激活，并通过合并过多的聚类在最后阶段对聚类进行正则化。

图3：z先验项的图：（a）由于没有信息约束，GMVAE会过度规范化，因为它收敛到一个较差的最优值，该最优值将所有群集合并在一起以避免KL成本。（b）在达到阈值（虚线）之前，可以先关闭z先验项的梯度，以避免将簇拉在一起（有关详细信息，请参见文本）。到达到阈值时，群集已充分分离。此时，来自z先验项的激活梯度仅将非常重叠的簇合并在一起。即使激活了它的梯度后，z先验的值仍会继续减小，因为它会被其他项所压倒，从而导致有意义的聚类和更好的最佳化。

无监督的图像聚类

现在，我们评估模型在图像聚类任务中表示数据中离散信息的能力。我们在MNIST训练数据集上训练GMVAE，并在测试数据集上评估其聚类性能。为了将GMVAE提供的聚类分配与真实图像标签进行比较，我们遵循Makhzani等人的评估协议。（2015），为清楚起见，在此进行总结。在这种方法中，我们找到属于簇i的概率最高的测试集元素，并将该标签分配给属于i的所有其他测试样本。然后对所有群集i = 1，…，K重复此操作，并将分配的标签与真实标签进行比较，以获得无监督的分类错误率。

在合成数据集上训练GMVAE时，虽然我们观察到了聚类退化问题，但MNIST数据集并未出现该问题。因此，我们直接使用ELBO优化了GMVAE，无需进行任何修改。表1总结了在MNIST基准上使用GMVAE以及其他最新方法获得的结果。除对抗性自动编码器（AAE）之外，我们获得的分类得分与最新技术1相当。。我们怀疑其原因再次与VAE目标中的KL条款有关。正如Hoffman等人所指出的，对抗性自动编码器目标的关键区别在于，ELBO中的KL项被对抗性损失所取代，从而使潜伏空间得以更谨慎地操纵（Hoffman＆Johnson，2016）。这些实验中使用的网络体系结构的详细信息可以在附录A中找到。

从经验上，我们观察到，增加蒙特卡洛样本的数量和聚类的数量可使GMVAE对初始化更鲁棒，更稳定，如图4所示。如果使用较少的样本或聚类，则GMVAE有时会收敛得更快甚至更差。局部最小值，缺少某些数据分发模式。

表1：具有不同簇数（K）的MNIST的无监督分类准确性（报告为正确标签的百分比）

图4：具有不同数量的聚类（K）和蒙特卡洛样本（M）的聚类精度：仅几个时期之后，GMVAE收敛为一个解。增加群集数量可大大提高解决方案的质量。

图像生成

到目前为止，我们认为GMVAE会拾取数据集中的自然聚类，并且这些聚类与图像的实际类别共享某种结构。

现在，我们在MNIST上用K = 10训练GMVAE，以表明潜在空间分布中的学习成分实际上代表了有意义的数据属性。首先，我们注意到从GMVAE采样时，存在两种随机性来源，即

1.从先验采样w，它将通过神经网络β生成x的均值和方差；

2.从由w和z确定的高斯混合中采样x，这将通过神经网络θ生成图像。

在图5a中，我们通过设置w = 0并从产生的高斯混合中多次采样来探索后一种选择。图5a中的每一行对应于来自高斯混合的不同成分的样本，并且可以清楚地看到，来自相同成分的样本始终如一地产生来自相同数字类别的图像。这证实了学习到的潜在表示包含分化良好的簇，每位数正好一个。另外，在图5b中，我们通过平滑地改变w并从同一分量采样来探索所生成图像对高斯混合分量的敏感性。我们看到，虽然z可靠地控制了生成图像的类别，但是w设置了数字的“样式”。
最后，在图6中，我们显示了从在SVHN上训练的GMVAE采样的图像，表明GMVAE将视觉上相似的图像聚在一起。

图5：生成的MNIST样本：（a）每行包含10个随机生成的样本，这些样本来自高斯混合物的不同高斯分量。 GMVAE学习了有意义的生成模型，其中离散潜变量z以无监督的方式直接对应于数字值。（b）通过遍历w空间生成的样本，w的每个位置对应于数字的特定样式。

图6：生成的SVHN样本：每行对应于从不同的高斯分量随机生成的10个样本。 GMVAE将视觉上相似的图像分组在一起。

VaDE

在本文中，提出了变分深度嵌入（VaDE），这是一种在变数自动编码器（VAE）框架内的新型无监督生成聚类方法。

具体来说，VaDE使用高斯混合模型（GMM）和深度神经网络（DNN）对数据生成过程进行建模：
1）GMM选择一个聚类；
2）从中生成潜在嵌入；
3）然后，DNN将潜在的嵌入解码为可观察的。
VaDE的推论是以一种变体的方式进行的：使用不同的DNN编码可观察到的潜在嵌入，因此可以使用随机梯度变异贝叶斯（SGVB）估计器和重新参数化技巧来优化证据下界（ELBO）。。与强基线的定量比较包括在本白皮书中，实验结果表明，VaDE在各种模式下的5个基准上均明显优于最新的聚类方法。此外，根据VaDE的生成性质，我们展示了它可以为任何指定簇生成高度真实的样本的能力，而无需在训练过程中使用监督信息。

概述

在本文中，我们提出了一个聚类框架，即变种深度嵌入（VaDE），它结合了VAE Kingma和Welling [2014]以及用于聚类任务的高斯混合模型。

VaDE通过GMM和DNN对数据生成过程进行建模：
1）GMM拾取了一个集群；
2）从中采样潜在表示z；
3）DNN 将z解码为观测值x。
此外，通过使用另一个DNN 将观测数据x编码为潜在嵌入z来优化VaDE，以便可以使用随机梯度变化贝叶斯（SGVB）估计器和重新参数化技巧Kingma and Welling [2014]来最大化证据。下界（ELBO）。 VaDE通过将高斯混合先验替换单个高斯先验来概括VAE。
因此，VaDE在设计上更适合于群集任务。

具体来说，本文的主要贡献是：
• 我们提出了一个无监督的生成聚类框架VaDE，该框架将VAE和GMM组合在一起。

• 我们展示了如何使用SGVB估计器和重新参数化技巧通过最大化ELBO来优化VaDE。

• 实验结果表明，VaDE在各种模式的5个数据集上的表现优于最新的聚类模型；

• 我们证明，VaDE可以为任何指定的簇生成高度逼真的样本，而无需在训练过程中使用监督信息。

VaDE的示意图如图1所示。

图1：VaDE的示意图。 VaDE的数据生成过程如下：
1）从GMM模型中选择一个聚类；
2）根据选取的簇生成潜在嵌入；
3）DNN f（z;θ）将潜在的嵌入解码为可观察的x。编码器网络g（x;）用于最大化VaDE的ELBO。

Variational Deep Embedding

生成过程

由于VaDE是一种无监督的聚类生成方法，因此我们在此首先描述VaDE的生成过程。具体来说，假设有K个簇，则通过以下过程生成观察样本x∈RD：

变化下界

了解VaDE的ELBO

图2：在MNIST上进行训练时，历元数上的聚类精度。我们还展示了DEC，AAE，LDMGI和GMM的最佳性能。最好以彩色查看图形。

为了证明等式17中KL项的重要性，我们首先训练具有与VaDE相同网络架构的自动编码器（AE），然后将GMM应用于学习到的AE的潜在表示，因为VaDE模型没有KL术语几乎等同于AE。我们将此模型称为AE + GMM。我们还展示了直接在观测空间（GMM）上使用GMM，在观测空间上使用VAE，然后在VAE（VAE + GMM）4的潜在空间上使用GMM的性能，以及LDMGI Yang等的性能。。 [2010]，AAE Makhzani等。 [2016]和DEC Xie等人。 [2016]，图2。VaDE优于AE + GMM（无KL项）和VAE + GMM的事实，充分证明了规范化条款的重要性以及通过VaDE共同优化VAE和GMM的优势。我们还提供了集群的插图及其通过w.r.t.进行更改的方式。图3中MNIST数据集上的训练纪元，其中t-SNE Maaten和Hinton [2008]将潜在表示z映射到2D空间。

图3：有关在MNIST训练期间VaDE在潜在空间中如何聚集数据的图示。不同的颜色表示不同的地面真相类别，并且在相应的纪元处的聚类精度在括号中报告。很明显，潜在的表示越来越适合训练期间的聚类，这也可以通过提高聚类精度来证明。

实验

数据集说明

以下数据集用于我们的经验实验。

•MNIST：MNIST数据集由70000个手写数字组成。图像居中，尺寸为28 x 28像素。我们将每个图像重塑为784维矢量。

•HHAR：异质性人类活动识别（HHAR）数据集包含来自智能手机和智能手表的10299条传感器记录。所有样本都分为6类人类活动，每个样本的维度均为561。

•路透社：在原始的路透数据集中，大约有810000个以类别树标记的英语新闻报道。在DEC之后，我们使用了4个根目录类别：公司/工业，政府/社会，市场和经济学作为标签，并丢弃了具有多个标签的所有文档，这产生了685071条数据集。我们计算了2000个最常用词的tf-idf功能，以表示所有文章。与DEC相似，由于某些频谱聚类方法（例如LDMGI）无法扩展到完整的路透数据集，因此会抽取10000个文档的随机子集，称为Reuters-10K。

•STL-10：STL-10数据集由96 x 96像素大小的彩色图像组成。有10个类别，每个类别有1300个示例。由于直接从高分辨率图像的原始像素进行聚类相当困难，因此我们通过ResNet-50 He等人提取了STL-10图像的特征。 [2016]，然后将其用于测试VaDE和所有基准的性能。更具体地说，我们在ResNet-50的最后一个特征图上应用了3×3的平均池，特征的维数为2048。

实验装置

如前所述，VaDE采用与DEC相同的网络体系结构进行公平比较。具体来说，公式1和公式10中f和g的体系结构分别为10-2000-500-500-D和D-500-500-2000-10，其中D为输入维数。所有层均已完全连接。 Adam优化器Kingma和Ba [2015]用于最大化等式9的ELBO，最小批量大小为100。MNIST，HHAR，Reuters-10K和STL-10的学习率为0.002，并且每10个周期减少衰减率为0.9，路透社的学习率为0.0005，每个时期的衰减率为0.5。至于第3.1节中的生成过程，MNIST数据集使用多元伯努利分布，而其他则使用多元高斯分布。类似于DEC，每个数据集的类数固定为类数。我们将在4.6节中更改群集的数量。

与其他基于VAE的模型Kingma和Salimans [2016]相似； Sønderby等。 [2016]，VaDE遭受的问题是，方程17中的重建项在训练开始时太弱了，以至于模型可能会卡在不良的局部极小值或鞍点中，因此很难逃脱。在这项工作中，可以使用预训练来避免此问题。具体来说，我们使用堆叠式自动编码器对网络f和g进行预训练。然后，所有数据点都通过预训练网络g投影到潜在空间z中，在该网络中，应用GMM初始化{π，μc，σc}，c∈{1，…，K}的参数。在实践中，很少有预训练的时期足以提供VaDE的良好初始化。我们发现，VaDE对预训练后的超参数不敏感。因此，我们没有花费很多精力来调整它们。

定量比较

在DEC之后，VaDE的性能由无监督聚类精度（ACC）来衡量，其定义为：

其中N是样本总数，li是真实标签，ci是模型获得的聚类分配，M是聚类分配和标签之间所有可能的一对一映射的集合。可以通过使用KuhnMunkres算法Munkres [1957]获得最佳映射。与DEC相似，我们在初始化所有聚类模型时执行10次随机重启，并选择具有最佳目标值的结果。至于LDMGI，AAE和DEC，我们使用与其原始论文相同的配置。表2比较了所有数据集中VaDE与其他基准的性能。可以看出，VaDE在所有数据集上的表现都优于所有这些基线。具体来说，在MNIST，HHAR，Reuters-10K，Reuters和STL-10数据集上，VaDE的ACC分别为94.46％，84.46％，79.83％，79.38％和84.45％，相对DEC的表现要好，相对增长率为12.05％，5.76 ％，7.41％，4.96％和4.75％。

我们还将VaDE与SB-VAE Nalisnick和Smyth [2016]和DLGMM Nalisnick等进行了比较。 [2016]关于潜在表示的区分能力，因为这两个基准不能完成聚类任务。在SB-VAE之后，通过在MNIST的潜在表示上运行k最近邻居分类器（kNN）来评估模型的潜在表示的区别力。表3显示了潜在表示形式下kNN分类器的错误率。可以看出，VaDE的性能明显优于SB-VAE和DLGMM5。

请注意，尽管VaDE可以学习样本的判别式表示，但是VaDE的训练是完全不受监督的。因此，我们没有将VaDE与其他监督模型进行比较。

通过VaDE生成样本

VaDE比DEC Xie等人的一大优势。 [2016]认为它本质上是一个生成聚类模型，可以为任何指定的聚类（类）生成高度逼真的样本。在本节中，我们将对VaDE，GMM，VAE和最新的生成方法InfoGAN Gan等人的生成样本进行定性比较。 [2016]。

图4分别说明了GMM，VAE，InfoGAN和VaDE为MNIST的0至9类生成的样本。可以看出，VaDE生成的数字是平滑且多样化的。请注意，无法指定来自VAE的样本类别。我们还可以看到，VaDE的性能与InfoGAN相当。

图4：由GMM，VAE，InfoGAN和VaDE生成的数字。除（b）以外，同一行中的数字来自同一集群。

可视化学习的嵌入

在本节中，我们将MNIST数据集上的VAE，DEC和VaDE的学习表示形式可视化。为此，我们使用t-SNE Maaten和Hinton [2008]将潜在表示z的维数从10减小到2，并在图5中绘制2000个随机采样的数字。图5的第一行说明了地面-每个数字的真实标签，其中不同的颜色表示不同的标签。图5的第二行演示了聚类结果，其中正确聚类的样本以绿色着色，而错误聚类的样本以红色着色。

从图5中可以看到，使用单个高斯先验的原始VAE在聚类任务中表现不佳。还可以观察到，由于不正确聚类的样本数量较少，VaDE所学习的嵌入要比VAE和DEC更好。此外，通过VaDE错误地聚类的样本大多位于每个聚类的边界，通常会在其中出现令人困惑的样本。相反，许多错误地聚类的DEC样本出现在聚类的内部，这表明DEC无法保留数据的固有结构。图5中还标出了DEC和VaDE的一些错误。

图5：分别由VAE，DEC和VaDE在MNIST上学习的嵌入的可视化。第一行显示了每个数字的真实标签，其中不同的颜色表示不同的标签。第二行展示了聚类结果，正确聚类的样本用绿色上色，不正确的样本用红色上色。 GT：4表示数字的真实标签为4，DEC：4表示DEC将数字分配给4的簇，而VaDE：4表示通过VaDE进行的分配为4，依此类推。最好以彩色查看图形。

The Impact of the Number of Clusters

到目前为止，VaDE的聚类数设置为每个数据集的类数，这是一个先验知识。为了演示VaDE作为无监督聚类模型的表示能力，我们特意选择了不同数量的聚类K。图6中的每一行说明了在MNIST数据集上由VaDE分组的聚类的样本，其中K设置为图7和14。分别参见图6（a）和图6（b）。我们可以看到，如果K小于类的数目，则具有相似外观的数字将聚在一起，例如图6（a）中的9和4、3和8。另一方面，如果K大于类别数，则某些数字将被VaDE划分为子类别，例如图6（b）中的0较粗的数字和0较细的数字，以及1和斜线1。

图6：具有不同数量集群的MNIST集群。我们按行说明属于每个群集的样本。

你可能感兴趣的:(研究方向相关)

HarmonyOS Next 安全机制深度剖析 SameX-4869 harmonyos 华为
本文旨在深入探讨华为鸿蒙HarmonyOSNext系统（截止目前API12）的安全机制相关技术细节，基于实际开发实践进行总结。主要作为技术分享与交流载体，难免错漏，欢迎各位同仁提出宝贵意见和问题，以便共同进步。本文为原创内容，任何形式的转载必须注明出处及原作者。第一章：安全体系架构一、整体架构介绍HarmonyOSNext的安全体系架构犹如一座坚固的城堡，从多个层面为系统和应用提供全方位的保护。它
python实现接口自动化一只小H呀の python 自动化开发语言
代码实现自动化相关理论代码编写脚本和工具实现脚本区别是啥?代码：优点：代码灵活方便缺点：学习成本高工具：优点：易上手缺点：灵活度低，有局限性。总结：功能脚本：工具自动化脚本：代码代码接口自动化怎么做的？第一步：python+request+unittest;具体描述？第二步：封装、调用、数据驱动、日志、报告;详细举例:第三步：api\scripts\data\log\report\until…脚本
【集成学习】：Stacking原理以及Python代码实现 Geeksongs 机器学习 python 机器学习深度学习人工智能算法
Stacking集成学习在各类机器学习竞赛当中得到了广泛的应用，尤其是在结构化的机器学习竞赛当中表现非常好。今天我们就来介绍下stacking这个在机器学习模型融合当中的大杀器的原理。并在博文的后面附有相关代码实现。总体来说，stacking集成算法主要是一种基于“标签”的学习，有以下的特点：用法：模型利用交叉验证，对训练集进行预测，从而实现二次学习优点：可以结合不同的模型缺点：增加了时间开销，容
初级：数组与字符串面试题深度剖析佩奇的技术笔记 Java面试小册 java
一、引言在Java开发中，数组和字符串是最常用的数据结构之一。面试官通过相关问题考察候选人对数组和字符串的理解和运用能力，以及在实际开发中解决相关问题的经验。本文将深入剖析常见的数组与字符串面试题，结合实际开发场景，帮助读者全面掌握这些知识点。二、数组面试题：如何对数组进行初始化和遍历？答案：数组的初始化可以使用直接初始化、动态初始化等方式。遍历数组可以使用传统的for循环、增强型for循环（fo
windows使用ssh-copy-id命令的解决方案爱编程的喵喵 Windows实用技巧 windows ssh ssh-copy-id 解决方案
大家好，我是爱编程的喵喵。双985硕士毕业，现担任全栈工程师一职，热衷于将数据思维应用到工作与生活中。从事机器学习以及相关的前后端开发工作。曾在阿里云、科大讯飞、CCF等比赛获得多次Top名次。现为CSDN博客专家、人工智能领域优质创作者。喜欢通过博客创作的方式对所学的知识进行总结与归纳，不仅形成深入且独到的理解，而且能够帮助新手快速入门。本文主要介绍了windows使用ssh-copy-
关于swoole的初步了解记录 snacy swoole php 服务器
今天初步了解了一下关于swoole的相关知识，在这里记录一下。关于swoole的初步了解记录安装swoole扩展swoole扩展需要在Linux环境下安装，目前还不支持在Windows环境下安装，当前操作系统为centOS系统安装swoole需要：PHP、php-pear(这个是为了稍后可以使用pecl来安装swoole)、php-devel、gcc先执行更新操作：yumupdate(已更新过的可
数据库事务：确保数据一致性的关键机制可儿·四系桜数据库 java #MySQL 数据库 java 后端
1.什么是数据库事务定义：事务（Transaction）是数据库管理系统中的一个逻辑工作单元，用于确保一组相关操作要么全部成功执行，要么全部不执行，从而维护数据的一致性和完整性。重要性：在多用户环境下，当多个事务并发执行时，为了保证数据的完整性和一致性，事务的概念变得至关重要。例如，在银行转账系统中，从一个账户扣款并给另一个账户加款这两个操作必须同时成功或者同时失败，否则就会导致资金账目混乱。2.
JAVA刷Leecode-贪心算法-分配问题-分发饼干搬砖的水鱼 leetcode 算法 java python leetcode 贪心算法
JAVA刷Leecode-贪心算法算法思想分配问题-分发饼干（135，hard)算法思想采用贪心的策略，保证每次操作都是局部最优解，从而最终的结果是全局最优。贪心算法不是对所有问题都能得到整体最优解，选择的贪心策略必须具有无后效性，即某个状态以前的过程不会影响以后的状态，只和当前的状态相关。包括分配问题（455，135）和区间问题（435）；练习：605，452，763，122，406。分配问题-
在Spring Boot中实现分布式任务调度微赚淘客系统开发者 spring boot 分布式后端
在SpringBoot中实现分布式任务调度大家好，我是微赚淘客系统3.0的小编，也是冬天不穿秋裤，天冷也要风度的程序猿！使用SpringBoot与Quartz实现分布式任务调度1.引入依赖在SpringBoot项目中，首先需要引入Quartz和相关依赖：org.springframework.bootspring-boot-starter-quartz2.配置Quartz在SpringBoot的配
【二、DeepSeek应用场景与案例】10.农业智能化：DeepSeek如何助力精准种植与养殖？代码世界的浪客人工智能 DeepSeek
一、引言1.1农业智能化的时代背景在全球人口持续增长的大趋势下，粮食需求正以前所未有的速度攀升。据联合国相关预测，到2050年，全球人口有望突破90亿，这无疑给本就压力重重的农业生产带来了更为艰巨的挑战，保障充足的粮食供应成为了迫在眉睫的任务。与此同时，资源短缺问题日益尖锐，耕地面积因城市化进程、土地退化等因素不断缩减，水资源分布不均且浪费严重，进一步加剧了农业生产的困境。根据世界银行的数据，过去
win-服务器部署程序自启动设置 johnrui operation and maintenance win 运维
为了简化应用服务器中项目启动的操作，现对在win操作系统下服务启动设置为开机启动的相关操作，在这里做一次记录和分享。参阅了很多文章，知道win设置开机启动项方式很多，这篇文章只是其中的一种，但是经过了实践测试非常有效。设置步骤如下：1）按住Win键，再按R键(Win+R)，启动"运行"窗口;2）WindowsXP/2003/2008/2008R2输入：controluserpasswords2Wi
网络安全-黑客攻击刘林锋blog 网络规划设计师信息安全安全网络
基本知识黑客（Hacker）、骇客（Cracker）攻击，需要进行信息收集和根据需求选择攻击方式。信息收集攻击的效果和对目标的了解程度有着直接的相关性。因此信息收集在攻击过程中占据着头等重要的位置，包括财务数据、硬件配置、人员结构、网络架构和整体利益等诸多方面。主要方式如下：网络监测。一些监测网络中计算机漏洞的工具，包括嗅探应用软件，能在计算机内部或通过网络来捕捉传输过程中的密码等数据信息。社会工
kafka 的 message 包括哪些信息 weixin-80213251 javaweb java kafka hadoop
一个Kafka的Message由一个固定长度的header和一个变长的消息体body组成header部分由一个字节的magic(文件格式)和四个字节的CRC32(用于判断body消息体是否正常)构成。当magic的值为1的时候，会在magic和crc32之间多一个字节的数据：attributes(保存一些相关属性，比如是否压缩、压缩格式等等)；如果magic的值为0，那么不存在attributes
GTC 2025 中文在线解读扫地的小何尚人工智能 NVIDIA GPU 深度学习机器学习
GTC2025中文在线解读｜CUDA最新特性与未来[WP72383]NVIDIAGTC大会火热进行中，一波波重磅科技演讲让人应接不暇，3月24日，NVIDIA企业开发者社区邀请KenHe、YipengLi两位技术专家，面向开发者，以中文深度拆解GTC2025四场重磅开发技术相关会议，直击AI行业应用痛点，破解前沿技术难题!作为GPU计算领域的基石，CUDA通过其编程语言、编译器、运行时环境及核心库
深度学习与目标检测系列(六) 本文约(4.5万字) | 全面解读复现ResNet | Pytorch | 小酒馆燃着灯深度学习目标检测 pytorch 人工智能 ResNet 残差连接残差网络
文章目录解读Abstract—摘要翻译精读主要内容Introduction—介绍翻译精读背景RelatedWork—相关工作ResidualRepresentations—残差表达翻译精读主要内容ShortcutConnections—短路连接翻译精读主要内容DeepResidualLearning—深度残差学习ResidualLearning—残差学习翻译精读ResNet目的以前方法本文改进本质
设计模式-抽象工厂模式（Abstract Factory Pattern）结构|原理|优缺点|场景|示例 TsengOnce 设计模式抽象工厂模式 java
设计模式（分类）设计模式（六大原则）创建型（5种）工厂方法抽象工厂模式单例模式建造者模式原型模式结构型（7种）适配器模式装饰器模式代理模式外观模式桥接模式组合模式享元模式行为型（11种）策略模式模板方法模式观察者模式迭代器模式责任链模式命令模式备忘录模式状态模式访问者模式中介者模式抽象工厂模式（AbstractFactoryPattern）是一种创建型设计模式，它提供了一个创建一系列相关或相互依赖
23种设计模式-抽象工厂(Abstract Factory)设计模式程序员汉升 #设计模式设计模式 java 抽象工厂模式
抽象工厂设计模式什么是抽象工厂设计模式？抽象工厂模式的特点抽象工厂模式的结构抽象工厂模式的优缺点抽象工厂方法的Java实现代码总结总结什么是抽象工厂设计模式？抽象工厂模式（AbstractFactoryDesignPattern）是一种创建型设计模式，它提供了一种方式来创建一系列相关或相互依赖的对象，而无需指定它们的具体类。与工厂方法模式的区别在于，抽象工厂模式通常用于处理产品族的创建，确保创建的
Golang Goroutine 入门使用 Vongolar golang语言学习 golang 多线程
goroutine(协程)是golang最重要的特性，是唯一在语言层面支持的主流语言，也是golang主打的优势——“高并发”的实现所在。1.为什么要协程？2.goroutine怎么用1.为什么要协程追求cpu的最大利用。同一台设备上同时运行着许多的进程，同时向cpu发出许多条指令，在这些指令中，一部分可以马上执行得到结果，但有一些系统IO相关的，它们需要一些输入，比如服务器监听一个端口，
Java自定义分数类，可以实现分数的自由运算 zhan114514 java 开发语言
/***分数对象的类，有分数相关计算*以String为值，(String)value=(int)up+"/"+(int)down*@authorZhan*/publicclassFraction{//分数标准staticfinalStringstandard1="-?\\d+/-?\\d+";//有分母staticfinalStringstandard2="-?\\d+";//无分母//值Stri
Tinyflow AI 工作流编排框架 v0.0.7 发布自不量力的A同学人工智能
目前没有关于TinyflowAI工作流编排框架v0.0.7发布的相关具体信息。Tinyflow是一个轻量的AI智能体流程编排解决方案，其设计理念是“简单、灵活、无侵入性”。它基于WebComponent开发，前端支持与React、Vue等任何框架集成，后端支持Java、Node.js、Python等语言，助力传统应用快速AI转型。该框架代码库轻量，学习成本低，能轻松应对简单任务编排和复杂多模态推理
Linux内核学习之 -- epoll()一族系统调用分析笔记 lagransun linux 学习笔记
背景linux4.19epoll()也是一种I/O多路复用的技术，但是完全不同于select()/poll()。更加高效，高效的原因其他博客也都提到了，这篇笔记主要是从源码的角度来分析一下实现过程。作为自己的学习笔记，分析都在代码注释中，后续回顾的时候看注释好一点。相关链接：Linux内核学习之–ARMv8架构的系统调用笔记Linux内核学习之–系统调用open()和write()的实现笔记Lin
Linux下arm的安装与使用指南 C嘎嘎嵌入式开发 linux arm开发运维
Linux下arm的安装与使用指南在Linux下安装和使用ARM架构的操作系统或开发环境是一个重要的过程，尤其是在嵌入式开发和移动设备开发中。下面将详细介绍如何在Linux上安装ARM相关的工具链、操作系统，以及如何进行开发和调试。1.准备工作1.1硬件要求开发板：树莓派计算机：一台运行Linux的计算机，用于交叉编译和开发。1.2软件要求Linux发行版：Ubuntu交叉编译工具链：用于编译AR
区块链驱动金融第六章——比特币匿名性：神话还是现实？小DuDu 区块链技术驱动金融区块链金融
在比特币的众多特性中，匿名性无疑是最具争议也最受关注的一点。有人认为它是保护隐私的神器，也有人觉得它与匿名毫不沾边。那么，比特币的匿名性究竟是怎样的呢？让我们结合书中第六章的内容，深入探讨一番。比特币匿名性的定义与争议在讨论比特币的匿名性之前，我们得先明确匿名的定义。在计算机科学领域，匿名意味着具有无关联性的化名，即不同的交互行为之间无法被特定攻击者互相关联。从这个角度看，比特币的匿名性存在一定的
Apache Tomcat 远程代码执行漏洞复现(CVE-2025-24813)（附脚本） iSee857 漏洞复现 apache tomcat java web安全安全
免责申明：本文所描述的漏洞及其复现步骤仅供网络安全研究与教育目的使用。任何人不得将本文提供的信息用于非法目的或未经授权的系统测试。作者不对任何由于使用本文信息而导致的直接或间接损害承担责任。如涉及侵权，请及时与我们联系，我们将尽快处理并删除相关内容。0x01产品描述：ApacheTomcat是一个开源的JavaServlet容器和Web服务器，支持运行JavaServlet、JavaServerP
Angular 动态加载组件与服务注入 t0_54program 编程问题解决手册 angular.js javascript ecmascript 个人开发
在Angular项目中，动态加载组件是一种常见的优化策略，特别是对于那些不常使用但体积庞大的组件。今天我们将探讨如何在Angular16+版本中使用MatDialog来动态加载组件，并解决与服务注入相关的问题。背景介绍假设我们有一个名为TestAComponent的组件，它需要在特定条件下打开一个对话框，显示一个名为TestBComponent的组件。由于TestBComponent非常大，并且使
Python实战：开发经典猜拳游戏（石头剪刀布）藍海琴泉游戏
目录引言：为什么选择猜拳游戏作为入门项目？第一部分：基础知识点与代码实现1.游戏逻辑与流程2.代码分步实现2.1导入必要模块2.2定义游戏规则函数2.3生成计算机选择2.4判断胜负逻辑2.5主循环与交互3.代码运行效果示例第二部分：功能扩展与优化1.添加计分系统2.支持多轮游戏与退出选择3.增加图形化界面（可选）第三部分：进一步学习方向1.深化游戏功能2.学习相关知识3.书籍与资源推荐适合人群：编
Matplotlib| scatter函数漂亮_大男孩 matplotlib
1.简介Matplotlib库中的scatter函数用于在坐标轴上创建散点图。这种图表显示了两个变量之间的关系，每个点代表了数据集中的一个观测值。scatter函数通常用于探索数据，特别是要查看两个变量是否存在某种相关性或模式。基本用法是scatter(x,y)，其中x和y是长度相同的数组或列表，分别代表散点图中点的横坐标和纵坐标。此外，scatter函数还提供了多种可选参数来定制散点图的外观，例
API 测试承悦不会玩 API
前提概要本文章主要用于分享API测试基础学习，以下是对API测试的一些个人解析，请大家结合参考其他文章中的相关信息进行归纳和补充。API测试描述什么是API？API是应用程序编程接口（ApplicationProgrammingInterface）的缩写。它是一组定义、协议和工具，用于让不同的软件应用程序之间进行交互和通信。以下从几个方面为你详细介绍API：功能：1.提供服务接口2.数据交互工作原
向量检索、检索增强生成（RAG）、大语言模型及相关系统架构——典型面试问题及简要答案快撑死的鱼算法工程师宝典（面试学习最新技术必备）语言模型系统架构面试
1.什么是向量检索？它与传统基于关键字的检索相比有什么不同？答案要点：向量检索是将文本、图像、音频等数据映射为向量，在高维向量空间中基于相似度或距离进行搜索。与传统基于关键字的检索（如倒排索引）相比，向量检索更关注“语义”或“特征”，能找出语义上相似但未必包含相同关键词的内容。向量检索非常适合多模态场景（例如“以图搜图”）或自然语言问答（同义词、上下文关联等）。2.什么是检索增强生成（RAG）？核
MDC-Mapped Diagnostic Context（映射诊断上下文） NEUMaple 微服务 spring boot java MDC
MDC，全称为MappedDiagnosticContext（映射诊断上下文），是SLF4J（SimpleLoggingFacadeforJava）提供的一种机制，用于在多线程应用中存储和管理与特定线程相关的上下文信息。这种机制特别适用于需要跨多个方法调用或服务边界传递诊断信息的场景，例如跟踪分布式系统中的请求流。MDC的主要用途日志关联：在分布式系统或多线程应用中，MDC可以用来携带一些上下文信
312个免费高速HTTP代理IP（能隐藏自己真实IP地址） yangshangchuan 高速免费 superword HTTP代理
124.88.67.20:843 190.36.223.93:8080 117.147.221.38:8123 122.228.92.103:3128 183.247.211.159:8123 124.88.67.35:81 112.18.51.167:8123 218.28.96.39:3128 49.94.160.198:3128 183.20
pull解析和json编码百合不是茶 android pull解析 json
n.json文件: [{name:java,lan:c++,age:17},{name:android,lan:java,age:8}] pull.xml文件 <?xml version="1.0" encoding="utf-8"?> <stu> <name>java
[能源与矿产]石油与地球生态系统 comsci 能源
按照苏联的科学界的说法,石油并非是远古的生物残骸的演变产物,而是一种可以由某些特殊地质结构和物理条件生产出来的东西,也就是说,石油是可以自增长的.... 那么我们做一个猜想: 石油好像是地球的体液,我们地球具有自动产生石油的某种机制,只要我们不过量开采石油,并保护好
类与对象浅谈沐刃青蛟 java 基础
类，字面理解，便是同一种事物的总称，比如人类，是对世界上所有人的一个总称。而对象，便是类的具体化，实例化，是一个具体事物，比如张飞这个人，就是人类的一个对象。但要注意的是：张飞这个人是对象，而不是张飞，张飞只是他这个人的名字，是他的属性而已。而一个类中包含了属性和方法这两兄弟，他们分别用来描述对象的行为和性质（感觉应该是
新站开始被收录后，我们应该做什么？ IT独行者 PHP seo
新站开始被收录后，我们应该做什么？百度终于开始收录自己的网站了，作为站长，你是不是觉得那一刻很有成就感呢，同时，你是不是又很茫然，不知道下一步该做什么了？至少我当初就是这样，在这里和大家一份分享一下新站收录后，我们要做哪些工作。至于如何让百度快速收录自己的网站，可以参考我之前的帖子《新站让百
oracle 连接碰到的问题文强chu oracle
Unable to find a java Virtual Machine－－安装64位版Oracle11gR2后无法启动SQLDeveloper的解决方案作者：草根IT网来源：未知人气：813标签：导读：安装64位版Oracle11gR2后发现启动SQLDeveloper时弹出配置java.exe的路径，找到Oracle自带java.exe后产生的路径“C:\app\用户名\prod
Swing中按ctrl键同时移动鼠标拖动组件（类中多借口共享同一数据）小桔子 java 继承 swing 接口监听
都知道java中类只能单继承，但可以实现多个接口，但我发现实现多个接口之后，多个接口却不能共享同一个数据，应用开发中想实现：当用户按着ctrl键时，可以用鼠标点击拖动组件，比如说文本框。编写一个监听实现KeyListener,NouseListener,MouseMotionListener三个接口，重写方法。定义一个全局变量boolea
linux常用的命令 aichenglong linux 常用命令
1 startx切换到图形化界面 2 man命令:查看帮助信息 man 需要查看的命令,man命令提供了大量的帮助信息,一般可以分成4个部分 name:对命令的简单说明 synopsis:命令的使用格式说明 description:命令的详细说明信息 options:命令的各项说明 3 date:显示时间语法：date [OPTION]... [+FORMAT]
eclipse内存优化 AILIKES java eclipse jvm jdk
一基本说明在JVM中，总体上分2块内存区,默认空余堆内存小于 40%时，JVM就会增大堆直到-Xmx的最大限制；空余堆内存大于70%时，JVM会减少堆直到-Xms的最小限制。 1)堆内存(Heap memory):堆是运行时数据区域，所有类实例和数组的内存均从此处分配,是Java代码可及的内存，是留给开发人
关键字的使用探讨百合不是茶关键字
//关键字的使用探讨/*访问关键词private 只能在本类中访问public 只能在本工程中访问protected 只能在包中和子类中访问默认的只能在包中访问*//*final 类方法变量 final 类不能被继承 final 方法不能被子类覆盖，但可以继承 final 变量只能有一次赋值，赋值后不能改变 final 不能用来修饰构造方法*///this()
JS中定义对象的几种方式 bijian1013 js
1. 基于已有对象扩充其对象和方法(只适合于临时的生成一个对象)： <html> <head> <title>基于已有对象扩充其对象和方法(只适合于临时的生成一个对象)</title> </head> <script> var obj = new Object();
表驱动法实例 bijian1013 java 表驱动法 TDD
获得月的天数是典型的直接访问驱动表方式的实例，下面我们来展示一下： MonthDaysTest.java package com.study.test; import org.junit.Assert; import org.junit.Test; import com.study.MonthDays; public class MonthDaysTest { @T
LInux启停重启常用服务器的脚本 bit1129 linux
启动，停止和重启常用服务器的Bash脚本，对于每个服务器，需要根据实际的安装路径做相应的修改 #! /bin/bash Servers=(Apache2, Nginx, Resin, Tomcat, Couchbase, SVN, ActiveMQ, Mongo); Ops=(Start, Stop, Restart); currentDir=$(pwd); echo
【HBase六】REST操作HBase bit1129 hbase
HBase提供了REST风格的服务方便查看HBase集群的信息，以及执行增删改查操作 1. 启动和停止HBase REST 服务 1.1 启动REST服务前台启动（默认端口号8080） [hadoop@hadoop bin]$ ./hbase rest start 后台启动 hbase-daemon.sh start rest 启动时指定
大话zabbix 3.0设计假设 ronin47
What’s new in Zabbix 2.0? 去年开始使用Zabbix的时候，是1.8.X的版本，今年Zabbix已经跨入了2.0的时代。看了2.0的release notes，和performance相关的有下面几个： :: Performance improvements::Trigger related da
http错误码大全 byalias http协议 javaweb
响应码由三位十进制数字组成，它们出现在由HTTP服务器发送的响应的第一行。响应码分五种类型，由它们的第一位数字表示： 1）1xx：信息，请求收到，继续处理 2）2xx：成功，行为被成功地接受、理解和采纳 3）3xx：重定向，为了完成请求，必须进一步执行的动作 4）4xx：客户端错误，请求包含语法错误或者请求无法实现 5）5xx：服务器错误，服务器不能实现一种明显无效的请求
J2EE设计模式-Intercepting Filter bylijinnan java 设计模式数据结构
Intercepting Filter类似于职责链模式有两种实现其中一种是Filter之间没有联系，全部Filter都存放在FilterChain中，由FilterChain来有序或无序地把把所有Filter调用一遍。没有用到链表这种数据结构。示例如下： package com.ljn.filter.custom; import java.util.ArrayList;
修改jboss端口 chicony jboss
修改jboss端口 %JBOSS_HOME%\server\{服务实例名}\conf\bindingservice.beans\META-INF\bindings-jboss-beans.xml 中找到 <!-- The ports-default bindings are obtained by taking the base bindin
c++ 用类模版实现数组类 CrazyMizzz C++
最近c++学到数组类，写了代码将他实现，基本具有vector类的功能 #include<iostream> #include<string> #include<cassert> using namespace std; template<class T> class Array { public: //构造函数
hadoop dfs.datanode.du.reserved 预留空间配置方法 daizj hadoop 预留空间
对于datanode配置预留空间的方法为：在hdfs-site.xml添加如下配置 <property> <name>dfs.datanode.du.reserved</name> <value>10737418240</value>
mysql远程访问的设置 dcj3sjt126com mysql 防火墙
第一步: 激活网络设置你需要编辑mysql配置文件my.cnf. 通常状况，my.cnf放置于在以下目录： /etc/mysql/my.cnf (Debian linux) /etc/my.cnf （Red Hat Linux/Fedora Linux) /var/db/mysql/my.cnf (FreeBSD) 然后用vi编辑my.cnf，修改内容从以下行： [mysqld] 你所需要: 1
ios 使用特定的popToViewController返回到相应的Controller dcj3sjt126com controller
1、取navigationCtroller中的Controllers NSArray * ctrlArray = self.navigationController.viewControllers; 2、取出后，执行， [self.navigationController popToViewController:[ctrlArray objectAtIndex:0] animated:YES
Linux正则表达式和通配符的区别 eksliang 正则表达式通配符和正则表达式的区别通配符
转载请出自出处：http://eksliang.iteye.com/blog/1976579 首先得明白二者是截然不同的通配符只能用在shell命令中,用来处理字符串的的匹配。判断一个命令是否为bash shell(linux 默认的shell)的内置命令 type -t commad 返回结果含义 file 表示为外部命令 alias 表示该
Ubuntu Mysql Install and CONF gengzg Install
http://www.navicat.com.cn/download/navicat-for-mysql Step1: 下载Navicat ，网址：http://www.navicat.com/en/download/download.html Step2：进入下载目录，解压压缩包：tar -zxvf navicat11_mysql_en.tar.gz
批处理，删除文件bat huqiji windows dos
@echo off ::演示：删除指定路径下指定天数之前（以文件名中包含的日期字符串为准）的文件。 ::如果演示结果无误，把del前面的echo去掉，即可实现真正删除。 ::本例假设文件名中包含的日期字符串（比如：bak-2009-12-25.log） rem 指定待删除文件的存放路径 set SrcDir=C:/Test/BatHome rem 指定天数 set DaysAgo=1
跨浏览器兼容的HTML5视频音频播放器天梯梦 html5
HTML5的video和audio标签是用来在网页中加入视频和音频的标签，在支持html5的浏览器中不需要预先加载Adobe Flash浏览器插件就能轻松快速的播放视频和音频文件。而html5media.js可以在不支持html5的浏览器上使video和audio标签生效。 How to enable <video> and <audio> tags in
Bundle自定义数据传递 hm4123660 android Serializable 自定义数据传递 Bundle Parcelable
我们都知道Bundle可能过put****()方法添加各种基本类型的数据，Intent也可以通过putExtras(Bundle)将数据添加进去，然后通过startActivity()跳到下一下Activity的时候就把数据也传到下一个Activity了。如传递一个字符串到下一个Activity 把数据放到Intent
C＃：异步编程和线程的使用（.NET 4.5 ） powertoolsteam .net 线程 C#异步编程
异步编程和线程处理是并发或并行编程非常重要的功能特征。为了实现异步编程，可使用线程也可以不用。将异步与线程同时讲，将有助于我们更好的理解它们的特征。本文中涉及关键知识点 1. 异步编程 2. 线程的使用 3. 基于任务的异步模式 4. 并行编程 5. 总结异步编程什么是异步操作？异步操作是指某些操作能够独立运行，不依赖主流程或主其他处理流程。通常情况下，C＃程序
spark 查看 job history 日志 Stark_Summer 日志 spark history job
SPARK_HOME/conf 下: spark-defaults.conf 增加如下内容 spark.eventLog.enabled true spark.eventLog.dir hdfs://master:8020/var/log/spark spark.eventLog.compress true spark-env.sh 增加如下内容 export SP
SSH框架搭建 wangxiukai2015eye spring Hibernate struts
MyEclipse搭建SSH框架 Struts Spring Hibernate 1、new一个web project。 2、右键项目，为项目添加Struts支持。选择Struts2 Core Libraries -<MyEclipes-Library> 点击Finish。src目录下多了struts