RaymondLove~

从Autoencoder到VAE及其变体

本文主要是对博文1进行翻译；其中“VAE with AF Prior”小节中大部分转自博文2。侵删。

博文1：《From Autoencoder to Beta-VAE》链接
博文2：《干货 | 你的 KL 散度 vanish 了吗？》链接

符号定义

1. Autoencoder, 2006 [paper]

2. Denoising Autoencoder, 2008, [paper]

3. Sparse Autoencoder, [paper]

k-Sparse Autoencoder

4. Contractive Autoencoder, 2011, [paper]

5. VAE: Variational Autoencoder, 2014, [paper]

损失函数推导：ELBO/VLB(変分下界)

方式1: 根据KL散度

方式2: 根据极大似然估计进行推导

Reparameterization Trick重参数技巧

6. VAE with AF Prior, [paper]

补充：博文2：《干货 | 你的 KL 散度 vanish 了吗？》链接

7. β-VAE, 2017, [paper]

8. VQ-VAE, 2017, [paper]

9. VQ-VAE2, 2019, [paper], 比肩BigGAN的生成模型

10. TD-VAE, 2019, [paper]

符号定义

1. Autoencoder, 2006 [paper]

自编码器Autoencoder，是一个神经网络，采用无监督的方式学习一个Identity Function（一致变换）：先对数据进行有效的压缩，然后再重建原始输入。

它由两部分组成：

Encoder网络：它将原始的high-dimensional输入转换为latent low-dimensional code。输入的大小>输出的大小。
Decoder网络：将latent low-dimensional code恢复为原始数据。

Encoder网络主要实现dimensionality reduction,与PCA和Matrix Factorization（矩阵因子分解）的功能类似。

Autoencoder的优化过程就是最小化reconstructed input与input之间的差异。一个好的latent representation不仅能够蕴含隐变量信息，也能很好的进行压缩和解压。

2. Denoising Autoencoder, 2008, [paper]

由于Autoencoder是学习一个Identity function，因此当网络的参数远远大于样本点数量时，会存在过拟合的问题。为了缓解过拟合问题，提高模型的鲁棒性，Denoising Autoencoder被提出。

Inspiration: 算法的思路来源于人类能够很好地识别对象，哪怕这个对象被部分损坏。因此，Denoise Autoencoder的目的是能够发现和捕获输入维度之间的关系，以便推断缺失的片段。

算法思路：为输入数据添加扰动，如：添加噪声/随机遮盖掉输入vector的部分值等方式，构造corrupted data；然后令Decoder恢复original input，而不是被扰动后的数据(corrupted data)。

3. Sparse Autoencoder, [paper]

Sparse Autoencoder(稀疏自编码) 在hidden unit activation上添加一个“sparse”约束，以避免过拟合和提高鲁棒性。它迫使模型在同一时间只有少量的隐藏单元被激活，换句话说，一个隐藏的神经元在大部分时间应该是不激活的。

回顾常用的激活函数，例如：sigmoid, tanh, relu, leaky relu, etc。当激活函数的值接近1时，神经元被激活；当接近于0时，神经元被抑制。

设第l层hidden-layer包含个神经元，那么第l层的第j个神经元的激活函数可以表示为：

k-Sparse Autoencoder

k-Sparse Autoencoder(Makhzani and Frey, 2013)，在bottlenect layer只保留k个神经元被激活，即：units with top k highest activations。

计算过程：

根据encoder network计算compressed code: $z=g(x)$
对code vector z的值进行排序，只保留前k个最大的值，其余的值置为0： $^′=()$ ${z}' = Sparsity(z)$ 。（可以通过ReLU layer withan adjustable threshold实现）
Decoder对′进行解码，重建输入数据

损失函数：

注意，反向传播时梯度只通过top k activated hidden units进行传播。

4. Contractive Autoencoder, 2011, [paper]

好的表征就要具有两个特点：

可以很好地重构输入数据，如：Autoencoder, sparse autoencoder
对输入数据中包含的一定程度的扰动具有鲁棒性，如：denoising autoencoder; contractive autoencoder

Contractive Autoencoder希望模型学到的表征能够具有更好地鲁棒性，对输入数据存在的小扰动具有鲁棒性。为此，在损失函数中添加一个惩罚项，确保latent representation不会对输入数据太敏感。

使用Frobenius norm of Jacobian matrix of the encoder activations with respect to the input来度量sensitivity:

5. VAE: Variational Autoencoder, 2014, [paper]

VAE其实和Autoencoder并没有非常相似，相反，它是基于变分贝叶斯(Vatiational Autoencoder)和图模型的。

与Autoencoder不同，给定一个输入样本x，我们希望得到一个latent distribution，而不是一个固定的latent representation。

我们将该分布表示成 $p_\theta$ ，参数为θ。则输入样本x与latent encoding vector z之间的关系可以通过以下表示来定义：

损失函数推导：ELBO/VLB(変分下界)

方式1: 根据 $D_{KL}(q_{\phi}(z|x)||p_{\theta}(z|x))$

我们期望estimated posterior(近似分布) $q_{\phi}(z|x)$ 能够尽可能的与真实后验分布接近。为了度量两个分部之间的距离，我们使用KL散度。

KL散度 $D_{KL}(X||Y)$ 度量了如果使用分布Y表示分布X，会损失多少信息。KL散度是不对称的，所以不是传统意义上的距离函数。

那么，我们希望最小化 $D_{KL}(q_{\phi}(z|x)||p_{\theta}(z|x))$ with respect to parameter ，公式可写为：

最大化上述公式的左侧式子是我们实际想要优化的目标，即：使得生成的数据似然函数最大，并且近似后验分布于实际后验分布的KL散度最小。对其取负，则可以将其转化为最小化问题：

在VAE中，该损失函数也叫作Variational Lower Bound （変分下界）。可以看到，该损失函数由两部分组成，分别为重构损失和KL损失。

那么，为什么叫变分下界呢？这是因为由于KL散度一定大于0，因此，

这样，通过最小化损失函数，我们可以最大化生成真实数据样本概率的下界。

方式2: 根据极大似然估计进行推导

略；可参考CS294_158 Lecture04.

Reparameterization Trick重参数技巧

Vanila VAE中，假设先验分布为N(0, I)，那么每个近似后验分布都应该向先验分布靠齐，则其损失函数的KL散度项变为：

6. VAE with AF Prior, [paper]

论文内容：利用Autoregressive flow(AF)和Inverse Autoregressive flow (IAF)来生成先验分布。

具体实现：

损失函数：

补充：博文2：《干货 | 你的 KL 散度 vanish 了吗？》链接

当 VAE 和强如RNN/PixelCNN 这样的autoregressive models 在一起训练时，会出现糟糕的 “KL-vanishing problem”，或者说是 “posterior collapse”。

什么会导致KL-Vanishing呢？

回顾VAE的损失函数（如下所示），损失函数由虫谷损失和KL损失两部分组成。我们的目标是最小化损失函数，即：最小化KL的同时，最小化重构损失：

如何应对KL-Vanishing?

答案：两种策略，分别是从KL损失出发和从重构损失出发。

从KL损失出发
- 1. KL cost annealing：
  
  KL cost annealing 在使用上非常简单，只需要在 KL 项上乘以一个权重系数，训练刚开始的时候系数大小为0，给 q(z|x) 多一点时间学会把 x 的信息 encode 到 z 里，再随着训练 step 的增加逐渐系数增大到 1。通常搭配 word drop-out（下面有介绍）一起使用效果最佳。
  
  代表论文：《Generating sentences from a continuous space》. CONLL 2016.
  
  优点：代码改动很小
  
  缺点：需要针对不同数据集调整增大的速度。推荐作为baseline
- 2. Free Bits：
  Free Bits 的想法也非常简单，为了能让更多的信息被 encode 到latent variable 里，我们让KL 项的每一维都“保留一点空间”。具体来说，如果这一维的 KL 值太小，我们就不去碰它，等到它增大超过一个阈值再优化。由此可得损失函数是：
  
  当然，我们也可以在整个KL 上控制而不用细分到每一维度，但是这可能会导致只有很少的维度在起作用，z 的绝大部分维度并没有包含 x 的信息。
  
  代表论文：《Improving variationalinference with inverse autoregressive flow》. NIPS 2016.
  
  优点：Free Bits的方法操作简单
  
  缺点：阈值 ε 也是要不断尝试的，我个人建议选取比如5左右的一个相对较小值。
- 3. Normalizing Flow
  
  Normalizing flow 的思想有很多变种，包括 Autoregressive Flow、Inverse Autoregressive Flow 等等。核心思想是我们先从一个简单分布采样 latent variable's latent vairable，接着通过不断迭代可逆的转换让latent variable 更为flexible。这类方法大多是为了得到一个更好的 posterior，毕竟直接用 Gaussian 建模现实问题是不够准确的。其目的是使得latent vairable的先验分布和后验分布更flexible，更复杂。但是方法复杂度较高，一个可行的替代方案是我们可以用 adversarial learning 的思想来学习 posterior，这里不多做展开。
  
  代表论文：《Variational lossy autoencoder》. ICLR 2017.
  
  优点：不再局限于高斯分布
  
  缺点：方法复杂度较高
- 4. Auxiliary Autoencoder
  
  //待学习
  
  代表论文：
  
  《Improving Variational Encoder-Decoders in Dialogue Generation》. AAAI 2018.
  
  《Z-Forcing: Training Stochastic Recurrent Networks》. NIPS 2017
从重构损失出发
- 1. Word drop-out
  
  Word drop-out 是典型的弱化 decoder 的方法。在训练阶段，我们将decoder 的部分输入词替换为UNK，也就是说 RNN 无法仅依靠前面的生成的词来预测下一个词了，因此需要去多依赖 z。非常有趣的一点在于，这种弱化decoder 方法还带来了性能上的提升，在 ICLR 的《Data noising as smoothing inneural network language models》文中将 Word drop-out 证明为神经网络的平滑技术，因此大家可以放心使用。
  
  代表论文：《Generating sentences from a continuous space》. CONLL 2016.
- 2. CNN Decoder
  
  既然RNN 有问题，那不妨把目光放到 CNN 上。如果只用传统的CNN 可能 contextual capacity 较差，因此可以使用 Dilated CNN decoder，通过调整 CNN 的宽度，从最弱的 Bag-of-words model 到最强的LSTM ，Dilated CNN decoder 都可以无限逼近，因此不断尝试总可以找到最合适的，方法效果也非常的好。
  
  代表论文：《Improved Variational Autoencoders for Text Modeling using Dilated Convolutions》. ICML 2017.
  - 3. Additional Loss
    
    通过引入额外的 loss，例如让 z 额外去预测哪些单词会出现，因此也被称为 bag-of-words loss。之所以将其归类为第二类，因为这个方法可以看做是增大了 reconstruction 的权重，让 model 更多去关注优化reconstruction 项而不是KL。这个方法也可以非常有效避免 KL-vanishing。
    
    代表论文：《Learning discourse-level diversity for neural dialog models using conditional variational autoencoders》.ACL 2017.

7. β-VAE, 2017, [paper]

如果latent representation z的每个变量都只对一个生成因子敏感，对其他因子相对不变，我们称这个表征是disentangled或者factorized。Disentangled representation的好处在于：具有良好的可解释性，并且可以很容易的泛化到其他的task。

例如：在人脸数据集上训练的一个模型，可能捕获gentle, skin, hair color, hair length, 是否戴眼镜等等相对独立的factors。这中disentangled representation对人脸生成任务非常有帮助。

β-VAE是VAE的一个变体，其主要目标是强调发现disentangled latent factors. 和VAE一样，也是希望maximize the probability of generating real data, while keeping the distance between the real prior distribution and the approximate posterior distribution small (say, under a small constant δ):

8. VQ-VAE, 2017, [paper]

VQ-VAE: Vector Quantized-Variational Autoencoder，相对于VAE，VQ-VAE模型的学习一个discrete latent variable by the encoder, 而不是连续的，因为离散的latent表征更适合一些实际场景或问题，如：语言、语音、推断等；VQ-VAE的先验分布是learnable，而不是固定的。

VQ-VAE的核心在于Vector Quantization (VQ): a method to map K-dimensional vectors into a finite set of "code" vectors. 使得先验分布和后验分布是categorial, 而不是连续的。该过程类似KNN算法，为每个feature vector寻找最近的code，并将其替换成该code。

VQ-VAE架构：

学习过程和损失函数：损失函数由三部分组成，包括：

如何更新codebook中的code vector?

答案：使用 EMA (exponential moving average)算法。

训练过程分为两个阶段：

首先，按照如上损失函数训练VQ-VAE
然后，基于现有输入，利用VQ-VAE的encoder+VQ模块生成一个数据集，并用它来训练PixelCNN，用来表示先验概率p(z)。

采样过程：

利用训练好的pixelCNN生成latent representation
将其输入到decoder中，生成样本

9. VQ-VAE2, 2019, [paper], 比肩BigGAN的生成模型

相比于VQ-VAE，VQ-VAE2引入multi-scale hierarchical oragnization of VQ-VAE,并利用更加强大的self-attention autogressive model来学习隐变量的先验分布。

Top-level：对global information进行建模，依赖于bottom latent code，学习它们之间的关系。
- 输出特征大小：如果输入为256*256维度，则将其缩小8倍，得到32*32的输出
Bottom Level：对local information进行建模，如纹理
- 输出特征大小：如果输入为256*256维度，则将其缩小4倍，得到64*64的输出

训练过程：两阶段

Stage1: train a hierarchical VQ-VAE. The design of hierarchical latent variables intends to separate local patterns (i.e., texture) from global information (i.e., object shapes). The training of the larger bottom level codebook is conditioned on the smaller top level code too, so that it does not have to learn everything from scratch.
Stage2: learn a prior over the latent discrete codebook so that we sample from it and generate images. In this way, the decoder can receive input vectors sampled from a similar distribution as the one in training. A powerful autoregressive model enhanced with multi-headed self-attention layers is used to capture the prior distribution (like PixelSNAIL; Chen et al 2017).

10. TD-VAE, 2019, [paper]

// TO DO

DAY 2 字符串与比较运算心落薄荷糖 Python训练营 python 算法
文章目录题目1：字符串的操作小结题目2：比较运算题目1：字符串的操作题目:定义两个字符串变量，str1赋值为“Hello”，str2赋值为“Python”。将这两个字符串拼接起来（中间加一个空格），并将结果存储在变量greeting中；计算greeting字符串的长度，存储在变量length中；获取greeting字符串的第一个字符，存储在变量first_char中。然后，使用f-string分三
Python 常用正则表达式大全朱公子的Note python 爬虫正则表达式
你是否在写Python爬虫时，总是卡在“正则提取”这一步？明明页面源码已经拿到，却怎么也匹配不到目标数据……不是提取失败，就是提取不全，搞得调试半天还抓不到核心字段？别急！今天我们就来一次**“正则一网打尽”**，专为爬虫而生的表达式宝典，让你写起爬虫来如虎添翼！在当下数据驱动时代，网络数据是企业的“金矿”，而Python爬虫则是挖掘这金矿的“利器”！从电商价格到社交媒体评论，爬虫技术让数据采集变
钉钉小程序开发实战：打造一个简约风格的登录页面脑袋大大的钉钉生态创业者专栏钉钉小程序
在上一篇文章中，我们已经介绍了如何搭建钉钉小程序的基础环境，并完成了项目的初始化配置。本文将继续深入，手把手带你实现一个简约风格的登录页面，这是大多数企业级应用不可或缺的一部分。钉钉小程序基于前端Web技术栈，采用类似于Vue的模板语法和组件化结构，非常适合快速构建轻量级企业内部应用。登录页虽然看似简单，但却是用户与系统交互的第一步，良好的体验和简洁的设计往往能给用户留下深刻印象。本章节直接上干货
算法训练营|数组总结慧泽huize 数据结构算法 leetcode python c++
时间复杂度：算法执行语句的次数空间复杂度：算法在运行过程中临时占存储空间大小数组（C++）：存放在连续内存空间的相同类型固定大小的数据的集合，不能删除，只能覆盖列表（Python）：数据可以是不同类型，列表长度可变1.二分查找循环不变量原则，清楚区间定义时间复杂度：O(logn)空间复杂度：O(1)2.双指针法快指针找到新数组元素，慢指针指向新数组下标时间复杂度：O(n)空间复杂度：O(1)3.双
全球覆盖与跨境网络优化：SD-WAN如何助力跨国企业应对通信挑战北极光SD-WAN组网网络
随着全球化的深入发展，跨国企业的业务布局日益广泛，但随之而来的跨境网络通信问题却成为企业数字化转型的难点之一。传统广域网（WAN）架构在面对复杂的跨境通信环境时，常常暴露出高延迟、不稳定以及数据隐私合规性不足的问题。而SD-WAN（软件定义广域网）作为一种新兴的网络解决方案，凭借其智能化、灵活性和安全性，逐渐成为跨国企业的首选方案。一、SD-WAN是否具备全球范围内的覆盖能力？SD-WAN通过其分
SQL Server 中的 GO 及其与其他数据库的对比杨云龙UP 三大数据库学习数据库 sqlserver sql Oracle oracle MySQL mysql
在SQLServer中，GO不是SQL语言的一部分，而是一个批处理分隔符，用于分隔脚本中的多个SQL语句或执行块。它由SQLServerManagementStudio(SSMS)等工具处理，用来指示执行一个批次的SQL语句。1、SQLServer中的GO作用分隔批次（处理多批次脚本）：将SQL脚本中的语句分成多个批次执行。每个GO表示一个独立的执行块。例如，在某些操作中，创建表的语句可能依赖于先
中国地图分幅编号计算工具红衣大叔 gis javascript 分幅
fenfu中国地图分幅编号计算工具，符合GB/T13989-2012国家标准。支持单点计算和范围查询，适用于测绘、GIS开发、城市规划等场景。特性✅支持8种比例尺（100万至5000）✅单点坐标转图幅编号✅矩形范围批量图幅查询✅自动处理高纬度特殊分幅规则✅输入验证与错误处理✅TypeScript类型支持安装npminstallfenfu#或yarnaddfenfu使用示例1.单点计算constMa
推荐几本创业者需要掌握的财务管理类书籍 AI布道师阿彬单独的博客资料创业者财务管理书籍推荐创业
作为创业者，需要建立一个坚实的财务和管理知识体系。这不仅仅是“看书”，而是通过阅读经典来构建商业思维框架。以下是精心挑选的一系列书籍，并按照从**“入门认知”到“高手进阶”**的逻辑进行分类，每本书都附上了推荐理由，确保它们能精准地解决创业者在创业不同阶段可能遇到的问题。第一部分：财务思维篇(让您看懂钱、管好钱、用好钱)对于技术出身的创始人来说，财务知识不是为了让您成为会计，而是为了让您拥有**“
Objective-C面向对象编程：类、对象、方法详解（保姆级教程）帅次 iOS Obj-C objective-c ios iphone safari swift macos flutter
目录一、核心概念二、类的定义（分.h和.m文件）1.头文件（.h）——公开声明2.实现文件（.m）——具体实现3.属性特性解析原子性所有权语义(ARC环境下)读写控制三、对象创建与内存管理1.创建对象的两种方式2.关键步骤解析3.instancetype四、方法调用（消息传递机制）1.基本语法2.关键概念五、self与super关键字六、动手实践：完整工作流1.创建Person对象并调用方法2.项
什么是 QueryGPT？智能查询工具如何重塑信息检索的未来？镜舟科技 StarRocks QueryGPT 数据查询数据分析多模态交互
从客户行为数据到供应链信息，从市场趋势到内部运营指标，这些数据蕴含着巨大的商业价值。然而，数据量的激增也带来了前所未有的检索挑战：如何在海量信息中快速定位所需数据？如何确保查询结果的准确性和时效性？据统计，75%的企业正受困于低效的查询工具，这已成为阻碍企业数字化转型的关键痛点。传统的数据查询方式主要依赖SQL语句或特定的查询语言，这要求用户具备专业的编程知识和对数据结构的深入理解。即使对于数据分
[学习] PID算法原理与实践（代码示例）极客不孤独学习算法 c语言
PID算法原理与实践文章目录PID算法原理与实践一、PID算法原理1.1PID算法概述1.定义2.应用领域3.核心目标1.2基本原理1.3数学表达离散化实现（适用于数字控制）二、实践案例（C语言）1.电机转速控制2.温度控制系统3.时钟驯服系统三、常见问题与优化1.积分饱和（Windup）问题2.噪声干扰问题3.非线性系统适配问题四、扩展方向1.数字PID与模拟PID的差异2.变参数PID（如增益
洛谷木材加工二分查找自由随风飘算法练习算法数据结构 leetcode
题目背景要保护环境题目描述木材厂有n根原木，现在想把这些木头切割成k段长度均为l的小段木头（木头有可能有剩余）。当然，我们希望得到的小段木头越长越好，请求出l的最大值。木头长度的单位是cm，原木的长度都是正整数，我们要求切割得到的小段木头的长度也是正整数。例如有两根原木长度分别为11和21，要求切割成等长的6段，很明显能切割出来的小段木头长度最长为5。输入格式第一行是两个正整数n,k，分别表示原木
使用 pip 命令下载 whl离线安装包、安装三希 pip
使用pip命令直接从线上下载whl离线安装包并转存到离线环境的过程实际上是分两步进行的：第一步：在线环境下载whl包bash#在具有网络连接的环境中pipdownload--only-binary=:all:--wheel--platform--python-version这里的参数说明：：需要下载的Python包名称。--only-binary=:all:：只下载二进制包（即whl文件）。--w
WEB3合约开发以太坊中货币单位科普穗余 Web3 web3
1wei是以太坊中最小的货币单位，就像人民币里的“分”甚至“厘”。✅以太坊单位换算关系：单位数值（与1ether的换算）说明ether1ether=10¹⁸wei主单位（用于显示）gwei1gwei=10⁹wei常用于gasprice设置wei1wei最小单位（基础单位）举个例子：1ether=1,000,000,000,000,000,000wei（10的18次方）0.000000001ethe
Uniapp跟原生android插件交互发信息（二）飞露 uni-app android 交互
一、背景在uni-app开发过程中，有时候会遇到uni-app插件或者提供的api对硬件操作不太友好，需要使用原生Android开发对应模块，为了使得双方通信方便，特意封装了一个接口，可实现Android与Uni-app互相通讯。二、内容做完以下第一、第二部分，即可实现Android与uni-app互相通信，当然双方通信有不同方式，具体情况具体分析，我的采用的方案是写Android原生插件,在un
GEO引领品牌大模型种草：迈向Web3.0与元宇宙的认知新空间 GEO科技经验分享
在数字技术的演进历程中，我们正经历着从Web2.0到Web3.0、从平面互联网到沉浸式元宇宙的范式转变。这一转变不仅重塑了数字空间的形态和交互方式，更深刻改变了品牌与用户的连接模式和价值创造逻辑。而在这个新兴的数字疆域中，生成式引擎优化（GEO）正展现出前所未有的战略价值和应用潜力，成为品牌构建元宇宙和Web3.0存在的关键能力，特别是在“品牌大模型种草”场景下，品牌如何被理解、记住、推荐，正成为
HTML页面设计——动态照片环
#前端开发##html超文本标记语言结构学习他的标签##css美化页面其实一部分的网站首页应用了照片环的原理，使得页面看起来更加美观，这里为大家分享一个简单的照片环编写。一、准备好以下素材：二、新建一个HTML文件，这里就取名“01-照片环”好了。三、现在开始编写具体内容，照片环说白了就是几个照片构成的所以body只要写就可以了，编写的时候注意图片的格式是.jpg、.png还是.gif(动态图)。
鸿蒙开发：一文了解桌面卡片
前言本文基于Api13鸿蒙的桌面卡片功能，也就是服务卡片，和Android端的小部件以及iOS端的小组件功能是一样的，只是叫法不一样，都是将应用内比较核心的功能，或者用户关注度高的功能，通过触发桌面应用进行添加到服务卡片上，进而添加到桌面上，以此达到信息展示的及时性，相关功能直达应用内的便捷效果，可以说在用户体验上，是一个质的提升。触发方式也是十分的简单，无论你是Android、iOS还是Harm
力扣网C语言编程题：搜索二维矩阵（右上角-＞左下角解法）魏劭逻辑编程题 C语言算法 leetcode c语言
一.简介上一篇文章关于"在二维数组中查找某个元素"的问题，提供了两种解题思路，文章如下：力扣网C语言编程题：搜索二维矩阵的普通解法与二分查找法-CSDN博客本文提供第三种解题思路：从左下角->右上角，或者右上角->左下角。二.力扣网C语言编程题：搜索二维矩阵（右上角->左下角解法）解题思路三：（换行或换列）因为题目中，数组中元素是每行元素是递增的，同时，每一行的首元素比上一行最后一个元素大，那么，
基于SIP的视频会议系统研究 weixin_33921089 数据库
摘要根据IETFSIPPING工作组提出的集中式会议模型，设计并实现了基于SIP的视频会议系统。该系统各部分可分别设计，具有良好的可扩展性。详细介绍了此系统的结构和工作原理。关键词SIP视频会议会议控制服务器会场控制媒体服务器0前言近几年来，随着计算机技术、通信技术和互联网技术的飞速发展，视频会议的应用范围正逐渐从传统的专业领域、大型企业等高端用户向中小企业等普通用户和个人用户拓展。据有关机构的分
Linux 驱动开发详解：从入门到实践 Jay_515 Linux 学习 linux 驱动嵌入式
本文带你深入理解Linux内核驱动的核心机制，掌握从零编写字符设备驱动的完整流程一、Linux驱动概述：内核与硬件的桥梁Linux驱动是操作系统内核的一部分，负责管理硬件设备并向上层应用程序提供统一接口。其核心价值在于：抽象硬件细节：让应用程序无需关心硬件具体实现统一设备接口：通过标准接口（如字符设备、块设备）访问硬件内核级资源管理：直接操作硬件寄存器，管理中断、DMA等Linux驱动的类型：驱动
软件架构师论文_论基于架构(ABSD)的软件设计方法及应用 June_Xiao 软件架构师架构
2022年的论文题目是基于CBSD的软件设计方法及应用，本人写了基于ABSD的软件设计方法及应用，论文离题拿了3x分，悲催，这是我的第一次考架构师，是最后一次手写版考试，是最有可能通过的一次。下面是我的论文。论基于架构的软件设计方法及应用摘要2020年5月，我司中标了某省联网收费的省站直传项目，该项目将建设一套全省收费站与省中心相互通信传输数据的平台，主要分为上传、下发、监控三个子系统。，包括收费
HarmonyOS高效数据检索方案全解析：从原理到实战代码 harmonyos
摘要在开发鸿蒙（HarmonyOS）应用的过程中，数据检索是一个绕不开的重要环节。无论是小型本地存储的数据，还是大型缓存数据，检索的效率直接影响到用户体验。本文将介绍两种经典的数据检索方法——哈希表和二分查找，结合实际场景进行分析，并提供可以直接运行的示例代码。引言随着鸿蒙系统的发展，越来越多的开发者投身于原生应用开发。但在处理数据尤其是大量数据时，如何高效地定位目标值就显得非常关键。特别是在智能
PHP ADODB 1.99版手册中文翻译
PHPADODB1.99版手册中文翻译(Tripc)感谢记事PHPADODB1.99版手册中文翻译翻译作者：Tripc------------------ADODBPHP在资料库的支援上是很令人称道的，几乎所有的知名资料库系统都有对应的函数群支援，而且支援的很完整。但很不幸的，每一群资料库支援函数无论在名称或叁数结构上，都有很大的差异，这使得PHP的系统开发者在面临更换资料库时，总会觉得痛苦万分。
虚拟空间中的AI协作与任务 AI天才研究院 ChatGPT AI大模型企业级应用开发实战 AI人工智能与大数据大厂Offer收割机面试题简历程序员读书硅基计算碳基计算认知计算生物计算深度学习神经网络大数据 AIGC AGI LLM Java Python 架构设计 Agent 程序员实现财富自由
虚拟空间与AI概述在当今信息化和数字化的时代，虚拟空间（VirtualSpace）已成为人们生活和工作的重要一部分。虚拟空间是一种通过计算机技术构建的虚拟环境，它能够模拟和增强现实世界中的各种交互和体验。而人工智能（AI）作为计算机科学的一个分支，通过模拟人类的认知能力来实现自动化和智能化的决策。虚拟空间与AI的结合，不仅为人类带来了全新的交互方式，也为各行业的发展注入了强大的动力。虚拟空间的定义
xe-utils使用总结 WebCsDn_TDCode 前端前端 javascript
toNumber(num)的使用在使用toNumber(num)转数值时，测试开发环境正常，正式环境异常对于XEUtils.toNumber("2,234.00")在正式环境出现转换千位分隔符的字符串为2的情况（具体原因不清楚，有能人志士可以答疑解惑以下），开发测试转换2234正常，对于千位分隔符的字符串需要谨慎使用，可以使用parseFloat("2,234.00".replace(/,/g,"
Vue组件自动引入插件——unplugin-vue-components 快速接入教程前端77 vue.js 前端 javascript
1.简介unplugin-vue-components是一款功能十分强大的插件，旨在简化组件的自动导入和使用，可以帮助我们在Vue项目中自动导入并注册我们使用的任何Vue组件，从而提高开发效率。unplugin-vue-components使用RollupAPI作为各种bundler/ebuild`工具API的抽象层，将Rollup风格的构建hooks和调用函数转换为与目标构建打包工具兼容的形式。
NCSC发现针对FortiGate防火墙的隐蔽反向SSH与DoH后渗透工具 FreeBuf- ssh 运维
英国国家网络安全中心（NCSC）近日发现一款名为SHOERACK的新型恶意软件工具。这款后渗透恶意软件通过隐蔽的反向SSH隧道、自定义协议滥用和DNS-over-HTTPS（DoH）技术来维持远程访问并规避检测，引发了企业安全团队的高度警惕。恶意软件来源与功能该恶意软件最初在FortiGate100D系列防火墙上被发现，被认为是开源NHAS反向SSH工具的修改版本，但增加了显著的后渗透功能增强。分
Maven 多模块项目调试与问题排查总结
博主简介：CSDN博客专家，历代文学网（PC端可以访问：https://literature.sinhy.com/#/?__c=1000，移动端可微信小程序搜索“历代文学”）总架构师，15年工作经验，精通Java编程，高并发设计，Springboot和微服务，熟悉Linux，ESXI虚拟化以及云原生Docker和K8s，热衷于探索科技的边界，并将理论知识转化为实际应用。保持对新技术的好奇心，乐于分
小米YU7 3分钟大定20万台东风日产高管吐槽米粉：愚忠财经三剑客人工智能汽车
6月27日，针对“小米YU73分钟大定20万台”，东风日产三电和动力开发负责人黄照昆今日发文称，这种数据的背后意味着用户交车时间要等待一年以上，并称“任何国家都没有这种愚忠的品牌粉丝”。他还表示，再次验证了“群体会降低智慧”，这种手机行业套路很容易拉动情绪。6月27日，小米在周四发布会上推出首款SUV车型YU7，开售三分钟内大定订单突破20万台。东风日产三电和动力开发负责人黄照昆微博全文如下：小米
关于旗正规则引擎中的MD5加密问题何必如此 jsp MD5 规则加密
一般情况下，为了防止个人隐私的泄露，我们都会对用户登录密码进行加密，使数据库相应字段保存的是加密后的字符串，而非原始密码。在旗正规则引擎中，通过外部调用，可以实现MD5的加密，具体步骤如下： 1.在对象库中选择外部调用，选择“com.flagleader.util.MD5”，在子选项中选择“com.flagleader.util.MD5.getMD5ofStr({arg1})”； 2.在规
【Spark101】Scala Promise/Future在Spark中的应用 bit1129 Promise
Promise和Future是Scala用于异步调用并实现结果汇集的并发原语，Scala的Future同JUC里面的Future接口含义相同，Promise理解起来就有些绕。等有时间了再仔细的研究下Promise和Future的语义以及应用场景，具体参见Scala在线文档：http://docs.scala-lang.org/sips/completed/futures-promises.html
spark sql 访问hive数据的配置详解 daizj spark sql hive thriftserver
spark sql 能够通过thriftserver 访问hive数据，默认spark编译的版本是不支持访问hive，因为hive依赖比较多，因此打的包中不包含hive和thriftserver,因此需要自己下载源码进行编译，将hive，thriftserver打包进去才能够访问，详细配置步骤如下： 1、下载源码 2、下载Maven,并配置此配置简单，就略过
HTTP 协议通信周凡杨 java httpclient http 通信
一：简介 HTTPCLIENT，通过JAVA基于HTTP协议进行点与点间的通信！二：代码举例测试类： import java
java unix时间戳转换 g21121 java
把java时间戳转换成unix时间戳： Timestamp appointTime=Timestamp.valueOf(new SimpleDateFormat("yyyy-MM-dd HH:mm:ss").format(new Date())) SimpleDateFormat df = new SimpleDateFormat("yyyy-MM-dd hh:m
web报表工具FineReport常用函数的用法总结（报表函数）老A不折腾 web报表 finereport 总结
说明：本次总结中，凡是以tableName或viewName作为参数因子的。函数在调用的时候均按照先从私有数据源中查找，然后再从公有数据源中查找的顺序。 CLASS CLASS(object):返回object对象的所属的类。 CNMONEY CNMONEY(number,unit)返回人民币大写。 number:需要转换的数值型的数。 unit:单位，
java jni调用c++ 代码报错墙头上一根草 java C++jni
# # A fatal error has been detected by the Java Runtime Environment: # # EXCEPTION_ACCESS_VIOLATION (0xc0000005) at pc=0x00000000777c3290, pid=5632, tid=6656 # # JRE version: Java(TM) SE Ru
Spring中事件处理de小技巧 aijuans spring Spring 教程 Spring 实例 Spring 入门 Spring3
Spring 中提供一些Aware相关de接口，BeanFactoryAware、 ApplicationContextAware、ResourceLoaderAware、ServletContextAware等等，其中最常用到de匙ApplicationContextAware.实现ApplicationContextAwaredeBean，在Bean被初始后，将会被注入 Applicati
linux shell ls脚本样例 annan211 linux linux ls源码 linux 源码
#! /bin/sh - #查找输入文件的路径 #在查找路径下寻找一个或多个原始文件或文件模式 # 查找路径由特定的环境变量所定义 #标准输出所产生的结果通常是查找路径下找到的每个文件的第一个实体的完整路径 # 或是filename :not found 的标准错误输出。 #如果文件没有找到则退出码为0 #否则即为找不到的文件个数 #语法 pathfind [--
List,Set,Map遍历方式 (收集的资源,值得看一下) 百合不是茶 list set Map遍历方式
List特点：元素有放入顺序，元素可重复 Map特点：元素按键值对存储，无放入顺序 Set特点：元素无放入顺序，元素不可重复（注意：元素虽然无放入顺序，但是元素在set中的位置是有该元素的HashCode决定的，其位置其实是固定的） List接口有三个实现类：LinkedList，ArrayList，Vector LinkedList：底层基于链表实现，链表内存是散乱的，每一个元素存储本身
解决SimpleDateFormat的线程不安全问题的方法 bijian1013 java thread 线程安全
在Java项目中，我们通常会自己写一个DateUtil类，处理日期和字符串的转换，如下所示： public class DateUtil01 { private SimpleDateFormat dateformat = new SimpleDateFormat("yyyy-MM-dd HH:mm:ss"); public void format(Date d
http请求测试实例（采用fastjson解析） bijian1013 http 测试
在实际开发中，我们经常会去做http请求的开发，下面则是如何请求的单元测试小实例，仅供参考。 import java.util.HashMap; import java.util.Map; import org.apache.commons.httpclient.HttpClient; import
【RPC框架Hessian三】Hessian 异常处理 bit1129 hessian
RPC异常处理概述 RPC异常处理指是，当客户端调用远端的服务，如果服务执行过程中发生异常，这个异常能否序列到客户端？如果服务在执行过程中可能发生异常，那么在服务接口的声明中，就该声明该接口可能抛出的异常。在Hessian中，服务器端发生异常，可以将异常信息从服务器端序列化到客户端，因为Exception本身是实现了Serializable的
【日志分析】日志分析工具 bit1129 日志分析
1. 网站日志实时分析工具 GoAccess http://www.vpsee.com/2014/02/a-real-time-web-log-analyzer-goaccess/ 2. 通过日志监控并收集 Java 应用程序性能数据(Perf4J) http://www.ibm.com/developerworks/cn/java/j-lo-logforperf/ 3.log.io 和
nginx优化加强战斗力及遇到的坑解决 ronin47 nginx 优化
　　　先说遇到个坑，第一个是负载问题，这个问题与架构有关，由于我设计架构多了两层，结果导致会话负载只转向一个。解决这样的问题思路有两个：一是改变负载策略，二是更改架构设计。　　　由于采用动静分离部署，而nginx又设计了静态，结果客户端去读nginx静态，访问量上来，页面加载很慢。解决：二者留其一。最好是保留apache服务器。　　　来以下优化：　　　
java-50-输入两棵二叉树A和B，判断树B是不是A的子结构 bylijinnan java
思路来自： http://zhedahht.blog.163.com/blog/static/25411174201011445550396/ import ljn.help.*; public class HasSubtree { /**Q50. * 输入两棵二叉树A和B，判断树B是不是A的子结构。例如，下图中的两棵树A和B，由于A中有一部分子树的结构和B是一
mongoDB 备份与恢复开窍的石头 mongDB备份与恢复
Mongodb导出与导入 1: 导入/导出可以操作的是本地的mongodb服务器,也可以是远程的. 所以,都有如下通用选项: -h host 主机 --port port 端口 -u username 用户名 -p passwd 密码 2: mongoexport 导出json格式的文件
[网络与通讯]椭圆轨道计算的一些问题 comsci 网络
如果按照中国古代农历的历法，现在应该是某个季节的开始，但是由于农历历法是3000年前的天文观测数据，如果按照现在的天文学记录来进行修正的话，这个季节已经过去一段时间了。。。。。也就是说，还要再等3000年。才有机会了，太阳系的行星的椭圆轨道受到外来天体的干扰，轨道次序发生了变
软件专利如何申请 cuiyadll 软件专利申请
软件技术可以申请软件著作权以保护软件源代码，也可以申请发明专利以保护软件流程中的步骤执行方式。专利保护的是软件解决问题的思想，而软件著作权保护的是软件代码（即软件思想的表达形式）。例如，离线传送文件，那发明专利保护是如何实现离线传送文件。基于相同的软件思想，但实现离线传送的程序代码有千千万万种，每种代码都可以享有各自的软件著作权。申请一个软件发明专利的代理费大概需要5000-8000申请发明专利可
Android学习笔记 darrenzhu android
1.启动一个AVD 2.命令行运行adb shell可连接到AVD,这也就是命令行客户端 3.如何启动一个程序 am start -n package name/.activityName am start -n com.example.helloworld/.MainActivity 启动Android设置工具的命令如下所示： # am start -
apache虚拟机配置，本地多域名访问本地网站 dcj3sjt126com apache
现在假定你有两个目录，一个存在于 /htdocs/a，另一个存在于 /htdocs/b 。现在你想要在本地测试的时候访问 www.freeman.com 对应的目录是 /xampp/htdocs/freeman ,访问 www.duchengjiu.com 对应的目录是 /htdocs/duchengjiu。 1、首先修改C盘WINDOWS\system32\drivers\etc目录下的
yii2 restful web服务[速率限制] dcj3sjt126com PHP yii2
速率限制为防止滥用，你应该考虑增加速率限制到您的API。例如，您可以限制每个用户的API的使用是在10分钟内最多100次的API调用。如果一个用户同一个时间段内太多的请求被接收，将返回响应状态代码 429 (这意味着过多的请求)。要启用速率限制, [[yii\web\User::identityClass|user identity class]] 应该实现 [[yii\filter
Hadoop2.5.2安装——单机模式 eksliang hadoop hadoop单机部署
转载请出自出处：http://eksliang.iteye.com/blog/2185414 一、概述 Hadoop有三种模式单机模式、伪分布模式和完全分布模式，这里先简单介绍单机模式，默认情况下，Hadoop被配置成一个非分布式模式，独立运行JAVA进程，适合开始做调试工作。二、下载地址 Hadoop 网址http:
LoadMoreListView+SwipeRefreshLayout（分页下拉）基本结构 gundumw100 android
一切为了快速迭代 import java.util.ArrayList; import org.json.JSONObject; import android.animation.ObjectAnimator; import android.os.Bundle; import android.support.v4.widget.SwipeRefreshLayo
三道简单的前端HTML/CSS题目 ini html Web 前端 css 题目
使用CSS为多个网页进行相同风格的布局和外观设置时，为了方便对这些网页进行修改，最好使用（）。http://hovertree.com/shortanswer/bjae/7bd72acca3206862.htm 在HTML中加入<table style=”color:red; font-size:10pt”>，此为（）。http://hovertree.com/s
overrided方法编译错误 kane_xie override
问题描述：在实现类中的某一或某几个Override方法发生编译错误如下： Name clash: The method put(String) of type XXXServiceImpl has the same erasure as put(String) of type XXXService but does not override it 当去掉@Over
Java中使用代理IP获取网址内容（防IP被封，做数据爬虫） mcj8089 免费代理IP 代理IP 数据爬虫 JAVA设置代理IP 爬虫封IP
推荐两个代理IP网站： 1. 全网代理IP：http://proxy.goubanjia.com/ 2. 敲代码免费IP：http://ip.qiaodm.com/ Java语言有两种方式使用代理IP访问网址并获取内容，方式一，设置System系统属性 // 设置代理IP System.getProper
Nodejs Express 报错之 listen EADDRINUSE qiaolevip 每天进步一点点学习永无止境 nodejs 纵观千象
当你启动 nodejs服务报错： >node app Express server listening on port 80 events.js:85 throw er; // Unhandled 'error' event ^ Error: listen EADDRINUSE at exports._errnoException (
C++中三种new的用法 _荆棘鸟_ C++new
转载自：http://news.ccidnet.com/art/32855/20100713/2114025_1.html 作者: mt 其一是new operator，也叫new表达式；其二是operator new，也叫new操作符。这两个英文名称起的也太绝了，很容易搞混，那就记中文名称吧。new表达式比较常见，也最常用，例如： string* ps = new string("
Ruby深入研究笔记1 wudixiaotie Ruby
module是可以定义private方法的 module MTest def aaa puts "aaa" private_method end private def private_method puts "this is private_method" end end

从Autoencoder到VAE及其变体

符号定义

1. Autoencoder, 2006 [paper]

2. Denoising Autoencoder, 2008, [paper]

3. Sparse Autoencoder, [paper]

k-Sparse Autoencoder

4. Contractive Autoencoder, 2011, [paper]

5. VAE: Variational Autoencoder, 2014, [paper]

损失函数推导：ELBO/VLB(変分下界)

方式1: 根据

方式2: 根据极大似然估计进行推导

Reparameterization Trick重参数技巧

6. VAE with AF Prior, [paper]

补充：博文2：《干货 | 你的 KL 散度 vanish 了吗？》链接

7. β-VAE, 2017, [paper]

8. VQ-VAE, 2017, [paper]

9. VQ-VAE2, 2019, [paper], 比肩BigGAN的生成模型

10. TD-VAE, 2019, [paper]

你可能感兴趣的:(自编码器,VAE,变分自编码器,VQ-VAE,VQ-VAE2)

方式1: 根据 $D_{KL}(q_{\phi}(z|x)||p_{\theta}(z|x))$