cute_Learner

论文解读（IDEC）《Improved Deep Embedded Clustering with Local Structure Preservation》

Paper Information

Title：《Improved Deep Embedded Clustering with Local Structure Preservation》
Authors：Xifeng Guo, Long Gao, Xinwang Liu, Jianping Yin
Sources：2017, IJCAI
Other：69 Citations, 71 References
Paper：Download
Code：Download

Abstract

　　本文解决的问题：先前根据不同情况设计聚类损失函数的工作可能破坏了特征空间，产生无意义的特征表示从而降低了聚类性能。

　　本文解决的思路：

- 使用聚类损失函数指导代表特征空间的 points 分布；
- 采用 under-complete autoencoder 维护数据的局部结构；
- 联合聚类损失和 AE 损失来训练。

　　IDEC 既可以很好的实现聚类任务，还可以学到能保持局部结构的表示（Representation）。

1 Introduction

　　聚类任务的划时代杰作：

- 1967 MacQueen 的 k-means ；
- 2006 Bishop 的 gaussian mixture model ；
- 2007 Von Luxburg 的 spectral clustering ；

　　由于输入数据的维度很大，通常会有很多不可靠的特征数据，这严重影响力聚类效果。所以一个被普遍接受的想法是：将高维空间的输入数据映射到低维空间，然后再进行聚类。

　　Q1：为什么传统降维方法如 PCA 、LDA等学习表示的能力有限？

　　A1：知道的可以再评论区抒发见解。

　　由于深度学习的发展，DNN model 能很好的实现 feature transformation ，学到有用的表示。

　　然后介绍 DEC ，可以参考《论文解读（DEC）Unsupervised Deep Embedding for Clustering Analysis》。

　　本文贡献：

- 提出了一种深度聚类算法，可以联合进行聚类和学习具有局部结构保存的代表性特征。
- 通过实证证明了局部结构保存在深度聚类中的重要性。
- IDEC 在很大的优势上优于最新的对手。

2 Related Work

2.1 Deep Clustering

　　目前阶段的聚类算法：

1. Two-stage work that applies clustering after having learned a representation；[ 该方法基于良好的表示 ]
2. Approaches that jointly optimize the feature learning and clustering；[ 特征学习的时候同时进行聚类 ]

　　对于 1 举例：

- Tian et al., 2014 ：先使用 AE 学到低维有用表示，然后使用 k-means 进行聚类；
- Chen, 2015 ：层级训练深度信念网络(DBN)，然后将 non-parametric maximum-margin 聚类应用于学习到的中间表示；
- Peng et al., 2016 ：使用稀疏自编码器，同时自适应学习局部和全局结构信息的表示，再采用传统的聚类算法进行聚类；

　　对于 2 举例：

- Yang et al., 2016 ：proposes a recurrent framework in deep representations and image clusters, which integrates two processes into a single model with a unified weighted triplet loss and optimizes it end-to-end.
- Xie et al.，2016 ：DEC 通过深度神经网络学习从观测空间到低维潜在空间的映射，可以同时获得特征表示和聚类分配；

2.2 Autoencoder

　　AE 有两个部分：

- Encoder：编码器函数为 $z=f_{W}(x)$ ，输出表示 $z$ 。

　　　　　　$z=f_{W}(x)$

- Decoder：解码器函数为 $x^{\prime}=g_{W^{\prime}}(z) $，根据表示 $z$ 重构原始输入 $x$ 。

　　　　　　$x^{\prime}=g_{W^{\prime}}(z)$

　　两种常见的自编码器：

- 欠完备自编码器（ Under-complete autoencoder）：$z$ 的维度要小于原始输入的维度。
- 去噪自编码器（ Denoising autoencoder）：$L=\left\|x-g_{W^{\prime}}\left(f_{W}(\tilde{x})\right)\right\|_{2}^{2} \quad \quad \quad (1)$

　　Reference：

1. 欠完备自编码器：从自编码器获得有用特征的一种方法是限制 $h$ 的维度比 $x$ 小，这种编码维度小于输入维度的自编码器称为欠完备（undercomplete）自编码器。学习欠完备的表示将强制自编码器捕捉训练数据中最显著的特征。
2. 去噪自编码器（denoising autoencoder，DAE）是一类接受损坏数据作为输入，并训练来预测原始未被损坏数据作为输入的自编码器。

2.3 Deep Embedded Clustering

　　深度嵌入式聚类(DEC) [Xieetal.，2016] 首先对自动编码器进行预训练，然后删除解码器。其余的编码器通过优化以下目标进行微调：

　　　　$L=K L(P \| Q)=\sum\limits_{i} \sum\limits_{j} p_{i j} \log \frac{p_{i j}}{q_{i j}}\quad \quad \quad (2)$

　　其中：

- $q_{i j}$ 是表示 $z_{i}$ 和聚类中心 $\mu_{j}$ 之间的相似度。定义为：

　　　　　　${\large q_{i j}=\frac{\left(1+\left\|z_{i}-\mu_{j}\right\|^{2}\right)^{-1}}{\sum_{j}\left(1+\left\|z_{i}-\mu_{j}\right\|^{2}\right)^{-1}}}\quad \quad \quad (3) $

- Eq.2 中的 $p_{ij}$ 是目标分布，定义为：

　　　　　　${\large p_{i j}=\frac{q_{i j}^{2} / \sum_{i} q_{i j}}{\sum_{j}\left(q_{i j}^{2} / \sum_{i} q_{i j}\right)}}\quad \quad\quad(4) $

　　DEC算法：

- 首先，对原始数据集 $X$ ，跑一遍 AE ，获得 Encoder 生成的表示 $z_{i}=f_{W}\left(x_{i}\right)$ ；
- 其次，基于 ${z_i}$ ，使用传统的 $k-means$ ，获得若干聚类中心 ${\mu _j}$；
- 然后，根据 Eq.3 和 Eq.4 计算得的 $q_{ij}$ 和 $p_{ij}$ 去计算 Eq.2 中的 $L$；
- 最后，根据 $q_{ij}$ 进行 $label$ 分配。

3 Improved Deep Embedded Clustering

Consider a dataset $X$ with $n$ samples and each sample $x_{i} \in \mathbb{R}^{d}$ where $d$ is the dimension.
The number of clusters $K$ is a priori knowledge and the $j$ th cluster center is represented by $\mu_{j} \in \mathbb{R}^{d}$ . Let the value of $s_{i} \in\{1,2, \ldots, K\}$ represent the cluster index assigned to sample $x_{i}$ .
Define nonlinear mapping $f_{W}: x_{i} \rightarrow z_{i}$ and $g_{W^{\prime}}: z_{i} \rightarrow x_{i}^{\prime}$ where $z_{i}$ is the embedded point of $x_{i}$ in the low dimensional feature space and $x_{i}^{\prime}$ is the reconstructed sample for $x_{i}$ .

　　目标：寻找最佳的 $f_{W}$ 来获得更好的 $\left\{z_{i}\right\}_{i=1}^{n}$ ，以便更好的做聚类任务。

　　本文 model 有两个必不可少的部分：

- Autoencoder；
- clustering loss；

　　模型架构如 Fig.1. 所示：

　　目标函数定义为：

　　　　$L=L_{r}+\gamma L_{c}\quad\quad \quad (6)$

　　其中：

- $L_{r} $ 是重构损失；
- $L_{c}$ 是聚类损失；
- $ \gamma>0$ 是控制 the degree of distorting embedded space 的系数，当 $\gamma=1$ 或 $L_{r} \equiv 0$ 即是DEC的目标函数；

　　Q2：$ \gamma$ 这个系数为什么这么加，看过很多文章这么写，但是不知道为什么一定加这？

　　A2：知道的可以再评论区抒发见解。

3.1 Clustering loss and Initialization

　　回顾 DEC 聚类损失函数（参考前面提到的 Eq.2. 、Eq.3.、Eq.4.）：

　　　　$L_{c}=K L(P \| Q)=\sum\limits_{i} \sum\limits _{j} p_{i j} \log \frac{p_{i j}}{q_{i j}}\quad\quad \quad (7)$

　　通过 DEC model 给的启发：

- 预训练：使用堆叠降噪自编码器（stacked denoising autoencoder）。
- 然后基于预训练生成的有效表示 $\left\{z_{i}=f_{W}\left(x_{i}\right)\right\}_{i=1}^{n}$ 使用 $k-means $ 获得聚类中心 $\left\{\mu_{j}\right\}_{j=1}^{K}$ 。

3.2 Local structure preservation

　　由于 DEC 直接丢弃 Decoder 并通过聚类损失 $L_{c}$ 直接微调编码器，可能造成嵌入空间的扭曲。[ 说白了就是研究 Decoder 的影响 ]

　　所以本文提出保持解码器不变，直接将聚类损失加到嵌入空间中去。

　　本文将堆叠降噪自编码器替换为欠完备自编码器 [ 理由是聚类需要干净的数据，个人感觉就是那个实验效果好选那个 ]，重构损失 [ Mean Squared Error ] ：

　　　　$L_{r}=\sum\limits _{i=1}^{n}\left\|x_{i}-g_{W^{\prime}}\left(z_{i}\right)\right\|_{2}^{2}\quad \quad \quad (8)$

　　这里建议 $ \gamma$ 最好小于 $1$ ，这将在在 4.3 节通过实验证明。

3.3 Optimization

　　Eq.6 采用小批量随机梯度下降法优化，有三个参数需要优化，分别是：

1. 自编码器的权重参数
2. 聚类中心 $u_j$
3. 目标分布 $P$

　　首先阐述：更新自编码器权重参数和聚类中心
　　固定目标分布 $P$ ，优化

　　　　$\frac{\partial L_{c}}{\partial z_{i}}=2 \sum\limits _{j=1}^{K}\left(1+\left\|z_{i}-\mu_{j}\right\|^{2}\right)^{-1}\left(p_{i j}-q_{i j}\right)\left(z_{i}-\mu_{j}\right)\quad\quad\quad (9)$

　　　　$\frac{\partial L_{c}}{\partial \mu_{j}}=2 \sum\limits _{i=1}^{n}\left(1+\left\|z_{i}-\mu_{j}\right\|^{2}\right)^{-1}\left(q_{i j}-p_{i j}\right)\left(z_{i}-\mu_{j}\right)\quad\quad\quad (10)$

　　然后根据上式可以计算出：

- 聚类中心更新公式：

　　　　　　$\mu_{j}=\mu_{j}-\frac{\lambda}{m} \sum\limits _{i=1}^{m} \frac{\partial L_{c}}{\partial \mu_{j}}\quad \quad \quad (11)$

- 解码器权重参数更新公式：

　　　　　　${\large W^{\prime}=W^{\prime}-\frac{\lambda}{m} \sum\limits _{i=1}^{m} \frac{\partial L_{r}}{\partial W^{\prime}}} \quad\quad\quad(12)$

编码器权重更新公式为：

　　　　　　${\large W=W-\frac{\lambda}{m} \sum\limits _{i=1}^{m}\left(\frac{\partial L_{r}}{\partial W}+\gamma \frac{\partial L_{c}}{\partial W}\right)}\quad \quad \quad (13)$ $

　　然后阐述：更新目标分布

　　由于目标分布 $P$ 是基于 soft label [ $p_{ij}$ 依托于 $q_{ij}$ ] ，频繁更新容易造成不稳定，所以 $P$ 的更新并没有在每个 iter 中更新，而是在每个 batch 中更新。但是实际上，本文是在每 T iterations 进行更新。label 分配方法如下：

　　　　$s_{i}=\arg \; \underset{j}{max}\; \; q_{i j}\quad \quad \quad (14)$

　　这里当连续两次分配的百分比小于 $\delta$ 将停止训练。

　　整个算法被总结在算法1中。

论文解读（IDEC）《Improved Deep Embedded Clustering with Local Structure Preservation》_第2张图片

　　IDEC 的算法复杂度为 $O\left(n D^{2}+n d K\right)$ ，其中 $D$、$d$、$K$ 分别为隐层中神经元的最大数量、嵌入层的维数和 cluster 的数量。通常 $ K \leq d \leq D$ ，所以时间复杂度可以简化为 $O\left(n D^{2}\right)$ 。

4 Experiments

4.1 DataSets

MNIST [图像数据集]：70000张手写数字图
USPS [图像数据集]：9298张灰度手写数字图
REUTERS-10K [文本数据集]：810000篇有标签新闻报道，这边采样10000篇报道。

4.2 Results

　　实验1：实验结果如 Table 2 所示：

　　结论：

- 深度聚类方法： AE+k-means, DEC和 IDEC 表现明显优于传统方法，但这三种方法之间仍存在很大的差距。
- AE+k-means 和 DEC 相比证明了聚类损失的指导意义，DEC 和 IDEC 相比证明了自编码器可以提高聚类性能。

　　实验2：DEC 和 IDEC 对比实验：

　　结论：

- IDEC 聚类精度高于 DEC ;
- IDEC 收敛慢于 DEC ;
- IDEC 聚类损失高于 DEC ;
- 最后几次迭代重构损失和初始迭代损失相差不大；

　　实验3：DEC 和 IDEC 可视化对比实验：

　　上下行分别是 IDEC 和 DEC 的 t-SNE 可视化结果。

　　实验4：DEC 和 IDEC 参数 $\lambda$ 和 $ \gamma$ 的对比实验：

　　结论：

- IDEC在最佳学习率 $\lambda=0.1$ 的情况下优于 DEC 在最佳学习率 $\lambda=0.01$ 当 $ \gamma \in [0.05,1.0]$ ；
- 对于较大的 $\lambda$ 需要搭配较小的 $\lambda$ ；

5 Conclusion

　　本文提出了改进的深度嵌入式聚类(IDEC)算法，该算法联合进行了聚类，并学习了适合于聚类的嵌入式特征，并保留了数据生成分布的局部结构。IDEC通过优化基于KL散度的聚类损失来操纵特征空间来散射数据。它通过合并一个自动编码器来维护局部结构。实验实验表明，结构保存对深度聚类算法至关重要，有利于聚类性能。未来的工作包括：在IDEC框架中添加更多的先验知识（如稀疏性），并为图像数据集合并卷积层。

Last modify ：2022-02-13 17:54:31

『总结不易，加个关注呗！』

Python|基于DeepSeek大模型，实现文本内容仿写（8）写python的鑫哥 AI大模型实战应用人工智能 python 大模型 DeepSeek Kimi 文本仿写
前言本文是该专栏的第8篇，后面会持续分享AI大模型干货知识，记得关注。我们在处理文本数据项目的时候，有时可能会遇到这样的需求。比如说，指定某些文本模板样例，需要仿写或者生成该“模板”样例数据。再或者说，通过给予某些指定类型的关键词，生成关键词相关领域的文本素材或内容。如果单单投入人力去完成，这肯定是没问题，但耗费的更多是人力成本。而现阶段，对于这种需求，大大可以选择大模型去完成。而本文，笔者将基于
像素空间文生图之Imagen原理详解 funNLPer AI算法 Imagen stable diffusion AIGC
论文：PhotorealisticText-to-ImageDiffusionModelswithDeepLanguageUnderstanding项目地址：https://imagen.research.google/代码（非官方）：https://github.com/deep-floyd/IF模型权重：https://huggingface.co/DeepFloyd/IF-I-XL-v1.0
ST编程指南详细写作大纲阿凡工控分享 ST编程指南 PLC
从今天开始除了做视频，也是应一些后台观众的需求，希望我将ST编程单独说明，纵观网上这么多教程，大多很零散，而且不全面，所以我打算开个坑，自己写一个ST编程指南，希望能够帮助到大家，这里需要说明一点，这一次创作并不是免费的，因为做视频本身就很占用我的时间了，写作的话，也是希望大家多多赞赏或者付费支持下我，谢谢了！以下是我打算的一个大纲。引言1.1ST语言简介ST（StructuredText）的定义
::v-deep的理解记得早睡~ vue.js 前端 javascript
vue样式穿透在刚开始使用element-ui组件库时，想要修改其内部的样式，但总是不生效，通过查询资料，了解到了深度作用选择器。如果希望scoped样式中的一个选择器能够作用得“更深”，例如影响子组件，可以使用>>>操作符：.a>>>.b{width:100%;height:100%;background:red;}但是像scss等预处理器却无法解析>>>，所以我们使用下面的方式：.a{/dee
保留字-python 殇在山风 python 程序员创富学习方法
保留字也称为关键字，是指被编程语言内部定义并保留使用的标识符python.x有35个保留字，如下and,as,await,break,class,continue,def,del,elif,else,except,False,finally,global,if,import,in,is,lambda,None,nonlocal,not,or,pass,raise,return,True,try,w
java获取IP为0:0:0:0:0:0:0:1的情况某科学的南条 java2
0:0:0:0:0:0:0:1是ipv6的表现形式，对应ipv4来说相当于127.0.0.1，也就是本机访问时是通过localhost来访问，用java获取ip地址可能会出现该问题，这时获取的ip将是0:0:0:0:0:0:0:1要是机器在局域网中，访问时使用自己的ip访问，如我的ip是：192.168.2.177访问url：http://192.168.2.177:8080这时候请求会经过路由器
idea中的tomcat vm_IntelliJ IDEA Tomcat配置详解(图文) 涟雪沧 idea中的tomcat vm
查找该问题的童鞋我相信IntelliJIDEA，Tomcat的下载，JDK等其他的配置都应该完成了，那我直接进入正题了。1>进入EditConfigurations2>点击+，选择Tomcat服务器，如果是本地Tomcat选择Local3>TomcatServer->Unnamed->Server->Applicationserver的Configuration，找到本地Tomcat服务器，再点击
idea的tomcat改端口号_IntelliJ IDEA Tomcat配置详解(图文) weixin_39630880 idea的tomcat改端口号
查找该问题的童鞋我相信IntelliJIDEA，Tomcat的下载，JDK等其他的配置都应该完成了，那我直接进入正题了。1>进入EditConfigurations2>点击+，选择Tomcat服务器，如果是本地Tomcat选择Local3>TomcatServer->Unnamed->Server->Applicationserver的Configuration，找到本地Tomcat服务器，再点击
Windows蓝牙驱动开发-蓝牙 IOCTL 程序员王马 Windows蓝牙驱动开发 windows 驱动开发
蓝牙驱动程序堆栈为配置文件驱动程序提供了多个IOCTL，来收集有关以下内容的信息：本地蓝牙无线电和系统；远程蓝牙设备；会使即插即用(PnP)管理器加载配置文件驱动程序的设备；为收集有关本地蓝牙无线电和系统的信息，配置文件驱动程序会使用IOCTL_BTH_GET_LOCAL_INFO。IOCTL返回后，其AssociatedIrp.SystemBuffer成员包含指向BTH_LOCAL_RADIO_
DynamicDatasource动态数据源实现及使用 m0_74825074 java
文章目录动态数据源DynamicDatasource简介源码分析ThreadLocal和AbstractRoutingDataSourceDynamicRoutingDataSourceDynamicDatasource快速开始项目结构Maven依赖application.yml配置文件sql脚本动态加载数据源动态切换数据源手动实现核心类`DataSourceContextHolder`核心类`D
芝法酱学习笔记（2.5）——elastic-search 8.x初探（自用）芝法酱 elasticsearch spring boot
一、elastic-search的下载官网的下载地址在这里。官网文档地址在这里访问路径是doc/search让人惊呆了，新版的elastic-search竟然需要JDK23。ThelocaledatabaseusedbyElasticsearch,usedtomapfromvariousdateformatstotheunderlyingdatestorageformat,dependsonthe
【已解决】ImportError: libnvinfer.so.8: cannot open shared object file: No such file or directory 小小小小祥 python
问题描述：按照tensorrt官方安装文档：https://docs.nvidia.com/deeplearning/tensorrt/install-guide/index.html#installing-tar安装完成后，使用python测试导入tensorrtimporttensorrt上述代码报错：Traceback(mostrecentcalllast):File“main.py”,li
DeepSeek V3：新一代开源 AI 模型，多语言编程能力卓越 that's boy 人工智能 chatgpt openai claude midjourney deepseek-v3
DeepSeekV3横空出世，以其强大的多语言编程能力和先进的技术架构，引发了业界的广泛关注。这款最新的AI模型不仅在性能上实现了质的飞跃，还采用了开源策略，为广大开发者提供了更广阔的探索空间。本文将深入解析DeepSeekV3的技术原理、主要功能、性能表现及应用场景，带您全面了解这款新一代AI模型。DeepSeekV3的核心亮点DeepSeekV3是一款基于混合专家（MoE）架构的大型语言模型，
VXLAN 基础教程：VXLAN 协议原理介绍 lingshengxiyou 网络 linux 运维 c++开发语言
VXLAN（VirtualeXtensibleLocalAreaNetwork，虚拟可扩展局域网），是一种虚拟化隧道通信技术。它是一种Overlay（覆盖网络）技术，通过三层的网络来搭建虚拟的二层网络。简单来讲，VXLAN是在底层物理网络（underlay）之上使用隧道技术，借助UDP层构建的Overlay的逻辑网络，使逻辑网络与物理网络解耦，实现灵活的组网需求。它对原有的网络架构几乎没有影响，不
深度剖析 DeepSeek V3 技术报告：架构创新与卓越性能表现微凉的衣柜科技头条人工智能大模型语言模型
随着人工智能（AI）技术的不断发展，各种大规模语言模型（LLM）层出不穷，DeepSeekV3作为其中的一员，凭借其出色的性能表现和创新的架构设计，吸引了广泛关注。本文将通过对官方发布的DeepSeekV3技术报告的深入解析，从多个维度剖析DeepSeekV3如何通过先进的技术手段，在保持性能卓越的同时优化计算和内存开销。一、性能卓越，超越同行DeepSeekV3在多个权威基准测试中展现了强大的性
Java中成员变量与局部变量的区别详解菜鸡上道 java jvm java 开发语言
Java中成员变量与局部变量的区别详解一、定义与作用域1.成员变量（MemberVariables）2.局部变量（LocalVariables）二、内存分配与生命周期1.成员变量2.局部变量三、默认值1.成员变量（类加载过程中实现的初始化）2.局部变量四、示例代码五、不同类型变量在JVM中的存储方式1.基本类型2.引用类型六、总结在Java编程中，理解成员变量和局部变量之间的差异对于编写清晰、高效
python 3.12.7 降级到 3.10.0 做不做代码搬运工 python
先将Python3.12.7降级到3.10.0，然后将3.10.0版本设置为默认版本步骤一：要将Python从3.12.7降级到3.10.0，你可以使用以下方法：方法1：从Python官方网站下载并安装（推荐）前往Python3.10.0的下载页面。下载适合macOS的安装包（如.pkg文件），然后按照安装向导进行安装。安装完成后，使用以下命令来验证Python版本：/usr/local/bin/
Windows Phone开发人员必看资料面试精华 Windows Phone Windows mobile 应用技术
完整附件下载：http://down.51cto.com/data/414417附件预览：WindowsEmbeddedStandard开发初体验【课件汇总】http://down.51cto.com/data/65627利用WindowsEmbeddedStandard7构建操作系统映像http://down.51cto.com/data/65761WindowsEmbeddedStandard
SQL语言的数据库交互 C++小厨神包罗万象 golang 开发语言后端
SQL语言的数据库交互在当今的信息时代，数据的管理和处理变得越来越重要，而结构化查询语言（SQL）作为一种用于管理关系型数据库的标准语言，其重要性愈加凸显。本文将深入探讨SQL语言的基本概念、主要功能、常见语法以及在实际数据库交互中的应用。一、SQL语言概述SQL（StructuredQueryLanguage）是一种特定用途的编程语言，主要用于与关系型数据库进行交互。SQL于1970年代初被IB
DeepSeek V3 ChatGPT 国产AI他来啦 Ag大雨人工智能 ai
国产开源之光app：DeepSeekV3强势出圈！各位技术爱好者们，今天必须给大家安利DeepSeekV3，它堪称开源AI领域横空出世的超级新星！研发团队以卓越智慧，用极低的成本打造出这一世界级AI，惊艳全球，让无数业内大佬都为之侧目，妥妥的“国产骄傲”。它的功能堪称全能，日常写作、翻译、问答轻松拿捏，独特的“深度思考”模式加上联网搜索，在编程、解题、文献解读等复杂任务里也游刃有余，推理思考能力一
python中global的用法 Jqlender python python
python变量的作用域：Local局部作用域Enclosing闭包函数外的函数中Global全局作用域查找规则：以Local->Enclosing->Global规则查找，即：同名变量，优先引用的是局部变量，在局部找不到，便会去局部外的局部找（例如闭包），再找不到就会去全局找。global关键字x=5deffun_a():print(x)deffun_b():x=x+1print(x)fun_a
PL/SQL语言的语法糖技术的探险家包罗万象 golang 开发语言后端
PL/SQL语言的语法糖引言PL/SQL（ProceduralLanguage/StructuredQueryLanguage）是Oracle公司为其数据库管理系统（DBMS）设计的一种过程化语言。作为一种扩展SQL的语言，PL/SQL不仅支持数据的查询和操作，还增加了更复杂的编程特性，比如变量声明、控制结构、异常处理等，从而使得程序员能够编写出更加灵活和高效的数据库应用程序。然而在PL/SQL中
麒麟操作系统基础知识保姆级教程（五）系统优化小屁不止是运维基础知识架构 linux 运维服务器
如果你想拥有你从未拥有过的东西，那么你必须去做你从未做过的事情1、查看系统版本两种方法1、使用命令查看[root@localhost~]#hostnamectl Statichostname:localhost.localdomain Iconname:computer-vm Chassis:vm MachineID:372f0bb3bfcd4bd09688fd725b9a085
docker的staut一直是exit1_Docker随笔记—docker run执行后，容器的状态是Exited的一些困惑... 长颈鹿很忙
问题：运行dockerrun-itd-p5000:5000localregistryregistry:2.5/bin/bash命令后，发现容器并没有跑起来，而是变成了Exit状态。如果将末尾的/bin/bash去掉，容器就能正常的start了解决：翻看不少docker资料，到目前位置，对导致此问题的出现算是有了一个比较清晰的认识。1.容器的生命周期。要把docer容器看做是一个单独的进程。它不是一
什么是结构体？什么是联合体？结构体和联合体有什么区别？能否在声明过程当中缺省名字？结构体可以包含函数吗？在 C 和 C++ 中有何不同？ SUN_Gyq c语言 c++开发语言
1）结构体结构体（structure）是一种由不同数据类型的成员组成的数据集合类型，它允许将多个相关的变量组合在一起，形成一个更复杂的数据类型。1.找成员当中最大的类型作为对齐2.按照定义的顺序实现空间分配3.实现地址分配要整数倍对齐4.当结构体当中成员为数组时需要将数组拆分成多个该类型的变量5.当结构体当中包含其他结构体类型的结构时先找到它的对齐数从而确定结构体的对齐数再进行分配位域（不存在地址
Git 的引用规格（refspec）语法张紫娃 GIT git elasticsearch 大数据
目录引用规格语法格式常见用法强制-f和+的区别gitfetchoriginremote-branch:local-branch和gitpushoriginlocal-branch:remote-branch区别引用规格语法格式格式如下：[+]:常见用法#fetchgitfetchorigin:从远程仓库origin的分支拉取最新的提交，并将其创建或更新为本地的分支gitfetchorigin:re
mac运行第一个java_Mac下第一个java－servelet程序老纪聊数码 mac运行第一个java
可学习到：设置环境变量方便运行命令和编译程序。servlet-api.jar中包括了servlet相关的api和类tomcat是servlet的容器，没有容器程序跑不起来。tomcat下载地址：http://tomcat.apache.org/我下载的是：apache-tomcat-7.0.67.tar.gz解压开之后放到usr/local目录中tomcat目录启动/usr/local/apach
YOLOv10-1.1部分代码阅读笔记-base.py 红色的山茶花 YOLO 笔记深度学习
base.pyultralytics\data\base.py目录base.py1.所需的库和模块2.classBaseDataset(Dataset):1.所需的库和模块#UltralyticsYOLO,AGPL-3.0licenseimportglobimportmathimportosimportrandomfromcopyimportdeepcopyfrommultiprocessing.
AUTOSAR汽车电子嵌入式编程精讲300篇-智能网联汽车CAN总线-基于电压信号的CAN总线入侵检测系统设计与实现格图素书汽车网络
目录前言入侵检测系统研究现状入侵检测系统建模CAN总线入侵检测威胁模型DeepSVDD模型入侵检测系统方案设计挑战和解决方案差分信号的采集与处理差分信号的特征提取入侵检测模型的设计入侵检测系统性能评估实验环境设置不同的车辆状态不同数量的攻击目标不同发送频率的攻击消息DeepSVDD模型与SVDD模型的比较本文篇幅较长，分为多篇，文章索引详见智能网联汽车CAN总线-发展现状智能网联汽车CAN总线-智
Windows 11安装DeepSpeed报错（Unable to pre-compile async_io）问题解决 happy coding windows gpt
Windows11安装DeepSpeed报错（Unabletopre-compileasync_io）问题解决报错如下Preparingmetadata(setup.py)...errorerror:subprocess-exited-with-error×pythonsetup.pyegg_infodidnotrunsuccessfully.│exitcode:1╰─>[17linesofout
VMware Workstation 11 或者 VMware Player 7安装MAC OS X 10.10 Yosemite iwindyforest vmware mac os 10.10 workstation player
最近尝试了下VMware下安装MacOS 系统，安装过程中发现网上可供参考的文章都是VMware Workstation 10以下， MacOS X 10.9以下的文章，只能提供大概的思路，但是实际安装起来由于版本问题，走了不少弯路，所以我尝试写以下总结，希望能给有兴趣安装OSX的人提供一点帮助。写在前面的话：其实安装好后发现，由于我的th
关于《基于模型驱动的B/S在线开发平台》源代码开源的疑虑？ deathwknight JavaScript java 框架
本人从学习Java开发到现在已有10年整，从一个要自学 java买成javascript的小菜鸟，成长为只会java和javascript语言的老菜鸟（个人邮箱：[email protected]）一路走来，跌跌撞撞。用自己的三年多业余时间，瞎搞一个小东西（基于模型驱动的B/S在线开发平台，非MVC框架、非代码生成）。希望与大家一起分享，同时有许些疑虑，希望有人可以交流下平台
如何把maven项目转成web项目 Kai_Ge maven MyEclipse
创建Web工程，使用eclipse ee创建maven web工程 1.右键项目,选择Project Facets,点击Convert to faceted from 2.更改Dynamic Web Module的Version为2.5.(3.0为Java7的,Tomcat6不支持). 如果提示错误,可能需要在Java Compiler设置Compiler compl
主管？？？ Array_06 工作
转载：http://www.blogjava.net/fastzch/archive/2010/11/25/339054.html 很久以前跟同事参加的培训，同事整理得很详细，必须得转！前段时间，公司有组织中高阶主管及其培养干部进行了为期三天的管理训练培训。三天的课程下来，虽然内容较多，因对老师三天来的课程内容深有感触，故借着整理学习心得的机会，将三天来的培训课程做了一个
python内置函数大全 2002wmj python
最近一直在看python的document，打算在基础方面重点看一下python的keyword、Build-in Function、Build-in Constants、Build-in Types、Build-in Exception这四个方面，其实在看的时候发现整个《The Python Standard Library》章节都是很不错的，其中描述了很多不错的主题。先把Build-in Fu
JSP页面通过JQUERY合并行 357029540 JavaScript jquery
在写程序的过程中我们难免会遇到在页面上合并单元行的情况，如图所示如果对于会的同学可能很简单，但是对没有思路的同学来说还是比较麻烦的，提供一下用JQUERY实现的参考代码 function mergeCell(){ var trs = $("#table tr"); &nb
Java基础冰天百华 java基础
学习函数式编程 package base; import java.text.DecimalFormat; public class Main { public static void main(String[] args) { // Integer a = 4; // Double aa = (double)a / 100000; // Decimal
unix时间戳相互转换 adminjun 转换 unix 时间戳
如何在不同编程语言中获取现在的Unix时间戳(Unix timestamp)？ Java time JavaScript Math.round(new Date().getTime()/1000) getTime()返回数值的单位是毫秒 Microsoft .NET / C# epoch = (DateTime.Now.ToUniversalTime().Ticks - 62135
作为一个合格程序员该做的事 aijuans 程序员
作为一个合格程序员每天该做的事 1、总结自己一天任务的完成情况最好的方式是写工作日志，把自己今天完成了什么事情，遇见了什么问题都记录下来，日后翻看好处多多 2、考虑自己明天应该做的主要工作把明天要做的事情列出来，并按照优先级排列，第二天应该把自己效率最高的时间分配给最重要的工作 3、考虑自己一天工作中失误的地方，并想出避免下一次再犯的方法出错不要紧，最重
由html5视频播放引发的总结 ayaoxinchao html5 视频 video
前言项目中存在视频播放的功能，前期设计是以flash播放器播放视频的。但是现在由于需要兼容苹果的设备，必须采用html5的方式来播放视频。我就出于兴趣对html5播放视频做了简单的了解，不了解不知道，水真是很深。本文所记录的知识一些浅尝辄止的知识，说起来很惭愧。视频结构本该直接介绍html5的<video>的，但鉴于本人对视频
解决httpclient访问自签名https报javax.net.ssl.SSLHandshakeException: sun.security.validat bewithme httpclient
如果你构建了一个https协议的站点，而此站点的安全证书并不是合法的第三方证书颁发机构所签发，那么你用httpclient去访问此站点会报如下错误 javax.net.ssl.SSLHandshakeException: sun.security.validator.ValidatorException: PKIX path bu
Jedis连接池的入门级使用 bijian1013 redis redis数据库 jedis
Jedis连接池操作步骤如下： a.获取Jedis实例需要从JedisPool中获取； b.用完Jedis实例需要返还给JedisPool； c.如果Jedis在使用过程中出错，则也需要还给JedisPool； packag
变与不变 bingyingao 不变变亲情永恒
变与不变周末骑车转到了五年前租住的小区，曾经最爱吃的西北面馆、江西水饺、手工拉面早已不在，各种店铺都换了好几茬，这些是变的。三年前还很流行的一款手机在今天看起来已经落后的不像样子。三年前还运行的好好的一家公司，今天也已经不复存在。一座座高楼拔地而起，
【Scala十】Scala核心四：集合框架之List bit1129 scala
Spark的RDD作为一个分布式不可变的数据集合，它提供的转换操作，很多是借鉴于Scala的集合框架提供的一些函数，因此，有必要对Scala的集合进行详细的了解 1. 泛型集合都是协变的，对于List而言，如果B是A的子类，那么List[B]也是List[A]的子类，即可以把List[B]的实例赋值给List[A]变量 2. 给变量赋值(注意val关键字，a，b
Nested Functions in C bookjovi c closure
Nested Functions 又称closure，属于functional language中的概念，一直以为C中是不支持closure的，现在看来我错了，不过C标准中是不支持的，而GCC支持。既然GCC支持了closure，那么 lexical scoping自然也支持了，同时在C中label也是可以在nested functions中自由跳转的
Java-Collections Framework学习与总结-WeakHashMap BrokenDreams Collections
总结这个类之前，首先看一下Java引用的相关知识。Java的引用分为四种：强引用、软引用、弱引用和虚引用。强引用：就是常见的代码中的引用，如Object o = new Object();存在强引用的对象不会被垃圾收集
读《研磨设计模式》-代码笔记-解释器模式-Interpret bylijinnan java 设计模式
声明：本文只为方便我个人查阅和理解，详细的分析以及源代码请移步原作者的博客http://chjavach.iteye.com/ package design.pattern; /* * 解释器（Interpreter）模式的意图是可以按照自己定义的组合规则集合来组合可执行对象 * * 代码示例实现XML里面1.读取单个元素的值 2.读取单个属性的值 * 多
After Effects操作&快捷键 cherishLC After Effects
1、快捷键官方文档中文版：https://helpx.adobe.com/cn/after-effects/using/keyboard-shortcuts-reference.html 英文版：https://helpx.adobe.com/after-effects/using/keyboard-shortcuts-reference.html 2、常用快捷键
Maven 常用命令 crabdave maven
Maven 常用命令 mvn archetype:generate mvn install mvn clean mvn clean complie mvn clean test mvn clean install mvn clean package mvn test mvn package mvn site mvn dependency:res
shell bad substitution daizj shell 脚本
#!/bin/sh /data/script/common/run_cmd.exp 192.168.13.168 "impala-shell -islave4 -q 'insert OVERWRITE table imeis.${tableName} select ${selectFields}, ds, fnv_hash(concat(cast(ds as string), im
Java SE 第二讲（原生数据类型 Primitive Data Type） dcj3sjt126com java
Java SE 第二讲： 1. Windows: notepad, editplus, ultraedit, gvim Linux: vi, vim, gedit 2. Java 中的数据类型分为两大类： 1）原生数据类型（Primitive Data Type） 2）引用类型（对象类型）（R
CGridView中实现批量删除 dcj3sjt126com PHP yii
1，CGridView中的columns添加 array( 'selectableRows' => 2, 'footer' => '<button type="button" onclick="GetCheckbox();" style=&
Java中泛型的各种使用 dyy_gusi java 泛型
Java中的泛型的使用：1.普通的泛型使用在使用类的时候后面的<>中的类型就是我们确定的类型。 public class MyClass1<T> {//此处定义的泛型是T private T var; public T getVar() { return var; } public void setVa
Web开发技术十年发展历程 gcq511120594 Web 浏览器数据挖掘
回顾web开发技术这十年发展历程： Ajax 03年的时候我上六年级，那时候网吧刚在小县城的角落萌生。传奇，大话西游第一代网游一时风靡。我抱着试一试的心态给了网吧老板两块钱想申请个号玩玩，然后接下来的一个小时我一直在，注，册，账，号。彼时网吧用的512k的带宽，注册的时候，填了一堆信息，提交，页面跳转，嘣，”您填写的信息有误，请重填”。然后跳转回注册页面，以此循环。我现在时常想，如果当时a
openSession()与getCurrentSession()区别： hetongfei java DAO Hibernate
来自 http://blog.csdn.net/dy511/article/details/6166134 1.getCurrentSession创建的session会和绑定到当前线程,而openSession不会。 2. getCurrentSession创建的线程会在事务回滚或事物提交后自动关闭,而openSession必须手动关闭。这里getCurrentSession本地事务(本地
第一章安装Nginx+Lua开发环境 jinnianshilongnian nginx lua openresty
首先我们选择使用OpenResty，其是由Nginx核心加很多第三方模块组成，其最大的亮点是默认集成了Lua开发环境，使得Nginx可以作为一个Web Server使用。借助于Nginx的事件驱动模型和非阻塞IO，可以实现高性能的Web应用程序。而且OpenResty提供了大量组件如Mysql、Redis、Memcached等等，使在Nginx上开发Web应用更方便更简单。目前在京东如实时价格、秒
HSQLDB In-Process方式访问内存数据库 liyonghui160com
HSQLDB一大特色就是能够在内存中建立数据库，当然它也能将这些内存数据库保存到文件中以便实现真正的持久化。先睹为快！下面是一个In-Process方式访问内存数据库的代码示例：下面代码需要引入hsqldb.jar包（hsqldb-2.2.8） import java.s
Java线程的5个使用技巧 pda158 java 数据结构
Java线程有哪些不太为人所知的技巧与用法？　　萝卜白菜各有所爱。像我就喜欢Java。学无止境，这也是我喜欢它的一个原因。日常工作中你所用到的工具，通常都有些你从来没有了解过的东西，比方说某个方法或者是一些有趣的用法。比如说线程。没错，就是线程。或者确切说是Thread这个类。当我们在构建高可扩展性系统的时候，通常会面临各种各样的并发编程的问题，不过我们现在所要讲的可能会略有不同。
开发资源大整合：编程语言篇——JavaScript（1） shoothao JavaScript
概述：本系列的资源整合来自于github中各个领域的大牛，来收藏你感兴趣的东西吧。程序包管理器管理javascript库并提供对这些库的快速使用与打包的服务。 Bower - 用于web的程序包管理。 component - 用于客户端的程序包管理，构建更好的web应用程序。 spm - 全新的静态的文件包管
避免使用终结函数 vahoa.ma java jvm C++
终结函数（finalizer）通常是不可预测的，常常也是很危险的，一般情况下不是必要的。使用终结函数会导致不稳定的行为、更差的性能，以及带来移植性问题。不要把终结函数当做C++中的析构函数（destructors）的对应物。我自己总结了一下这一条的综合性结论是这样的： 1）在涉及使用资源，使用完毕后要释放资源的情形下，首先要用一个显示的方

论文解读（IDEC）《Improved Deep Embedded Clustering with Local Structure Preservation》

Paper Information

Abstract

1 Introduction

2 Related Work

2.1 Deep Clustering

2.2 Autoencoder

2.3 Deep Embedded Clustering

3 Improved Deep Embedded Clustering

3.1 Clustering loss and Initialization

3.2 Local structure preservation

3.3 Optimization

4 Experiments

4.1 DataSets

4.2 Results

5 Conclusion

你可能感兴趣的:(论文解读（IDEC）《Improved Deep Embedded Clustering with Local Structure Preservation》)