ran337287

变分自编码器（Variational Autoencoder, VAE）通俗教程

安利一篇邓范鑫的关于变分自编码器VAE的讲解文，易读，读完觉得受益匪浅。码住，以后可以温故知新~
以下均转载自邓范鑫的文章内容
【1】变分自编码器（Variational Autoencoder, VAE）通俗教程
http://www.dengfanxin.cn/?p=334

1. 神秘变量与数据集
现在有一个数据集DX(dataset, 也可以叫datapoints)，每个数据也称为数据点。
我们假定这个样本受某种神秘力量操控，但是我们也无从知道这些神秘力量是什么？那么我们假定这股神秘力量有n个，起名字叫power1,power2,…,powern吧，他们的大小分别是z1,z2,…,zn，称之为神秘变量表示成一个向量就是

z也起个名字叫神秘组合。

一言以蔽之：神秘变量代表了神秘力量的神秘组合关系。
用正经的话说就是：隐变量(latent variable)代表了隐因子(latent factor)的组合关系。

这里我们澄清一下隶属空间，假设数据集DX是m个点，这m个点也应该隶属于一个空间，比如一维的情况，假如每个点是一个实数，那么他的隶属空间就是实数集，所以我们这里定义一个DX每个点都属于的空间称为XS，我们在后面提到的时候，你就不再感到陌生了。

神秘变量z可以肯定他们也有一个归属空间称为ZS。

下面我们就要形式化地构造X与Z的神秘关系了，这个关系就是我们前面说的神秘力量，直观上我们已经非常清楚，假设我们的数据集就是完全由这n个神秘变量全权操控的，那么对于X中每一个点都应该有一个n个神秘变量的神秘组合 z_j来神秘决定。

接下来我们要将这个关系再简化一下，我们假设这n个神秘变量不是能够操控X的全部，还有一些其他的神秘力量，我们暂时不考虑，那么就可以用概率来弥补这个缺失，为什么呢？举个例子，假设我们制造了一个机器可以向一个固定的目标发射子弹，我们精确的计算好了打击的力量和角度，但由于某些难以控制的因素，比如空气的流动，地球的转动导致命中的目标无法达到精准的目的，而这些因素可能十分巨大和繁多，但是他们并不是形成DX的主因素，根据大数定理，这些所有因素产生的影响可以用高斯分布的概率密度函数来表示。它长这样：

p (x | μ, σ 2) = 1 2 π - - \sqrt σ e - ( x - μ ) 2 2 σ 2

当μ=0时，就变成了这样：

p (x | σ 2) = 1 2 π - - \sqrt σ e - x 2 2 σ 2

这是一维高斯分布的公式，那么多维的呢？比较复杂，推导过程见知乎，长这样：

变分自编码器（Variational Autoencoder, VAE）通俗教程_第2张图片

不管怎样，你只要记住我们现在没有能力关注全部的神秘变量，我们只关心若干个可能重要的因素，这些因素的分布状况可以有各种假设，我们回头再讨论他们的概率分布问题，我们现在假定我们对他们的具体分布情况也是一无所知，我们只是知道他们处于ZS空间内。
前面说到了一个神秘组合，如果一个数据集X对应的神秘组合完全一样，那么这个数据集就是一个单一的分类数据集，如果是多个，那么就是多分类数据集，但如果是一个连续的组合数据，那么就是一个有点分不清界限的复杂数据集，就好比，我们这个数据集是一条线段的集合，线段的长度是唯一的神秘变量，那么只要长度在一个范围内连续变化，那么这个集合里的线段你就会发现分散的很均匀，你几乎没有办法区分开他们，也没法给他们分成几类，但如果这个长度值只能选择1,3,5，那么当你观察这个数据集的时候，你会发现他们会聚在三堆儿里。如果这个线段的生成完全依靠的是计算机，那么每一堆儿都是完全重合的，但如果是人画的，就可能因为误差，没法完全重合，这没法重合的部分就是我们说的其他复杂因素，我们通常用一个高斯分布来把它代表了。好，我们已经基本清晰了，我们该给这个神秘组合一个形式化的描述了。
假设有两个变量，z∈ZS 和 x∈XS，存在一个确定性函数族f(z;θ)，族中的每个函数由θ∈Θ唯一确定，f:ZS×Θ→XS，当θ固定，z是一个随机变量(概率密度函数为P_(z)(z))时，那么f(z;θ)就是定义在XS上的随机变量x，对应的概率密度函数可以写成g(x)。
那么我们的目标就是优化θ从而寻找到一个f，能够是随机变量x的采样和X非常的像。这里需要注意一下，x是一个变量,DX是已经现成的数据集，x不属于DX，我特意将名字起的有区分度。
这样，f就是那个神秘力量通道，他把这些神秘力量的力度，通过f变成了x变量，而这个x变量就是与数据集DX具有直接关系的随机变量。

设一个数据集为DX，那么这个数据集存在的概率为P_t(DX)，则根据贝叶斯公式有：

好了，其实公式(1)就是我们的神秘力量与观察到的数据集之间的神秘关系，这个关系的意思我们直白的说就是：当隐秘变量按照某种规律存在时，就非常容易产生现在我们看到的这个数据集。那么，我们要做的工作就是当我们假定有n个神秘力量时，我们能够找到一个神奇的函数f，将神秘力量的变化转化成神奇的x的变化，这个x能够轻而易举地生成数据集DX。
从上面的描述里面我们看到，f是生成转换函数，公式(1)不表示这种转换关系，而是这种关系的最大似然估计(maximum likelihood)，它的意思是找到最有可能生成DX这个数据集的主导函数f。

接下来我们回到讨论P_xz(DX|z;θ)这个概率密度函数上来，我们前面说过，如果z是全部的神秘力量，那么它产生的变量x就一定固定的，即当z取值固定时，x取值固定，但是现实中还有很多其他的因素，因而x的取值还与他们有关，他们的影响力，最终反映成了高斯函数，所以我们大胆假定P_xz是一个高斯分布的概率密度函数，即P_xz(DX|z;θ)=N(DX|f(x;θ),σ2∗I)
注意z的分布我们依然是未知的。

假定我们知道z现在取某一个或几个特定值，那么我们就可以通过Gradient Descent来找到一个θ尽量满足z能够以极高的概率生成我们希望的数据集DX。再一推广，就变成了，z取值某一范围，但去几个特定值或某一取值范围是就面临z各种取值的概率问题，我们回头再讨论这个棘手的问题，你现在只要知道冥冥之中，我们似乎可以通过学习参数θ寻找最优解就行了。

OK，我们还要说一个关键问题，就是我们确信f是存在的，我们认为变量与神秘变量之间的关系一定可以用一个函数来表示。

2. 变分自编码器(VAE)
本节，我们探讨如何最大化公式(1)。首先，我们要讨论怎样确定神秘变量z，即z应该有几个维度，每个维度的作用域是什么？更为较真的，我们可能甚至要追究每一维度都代表什么？他们之间是不是独立的？每个维度的概率分布是什么样的？

如果我们沿着这个思路进行下去，就会陷入泥潭，我们可以巧妙地避开这些问题，关键就在于让他们继续保持“神秘”！

我们不关心每一个维度代表什么含义，我们只假定存在这么一群相互独立的变量，维度我们也回到之前的讨论，我们虽然不知道有多少，我们可以假定有n个主要因素，n可以定的大一点，比如假设有4个主因素，而我们假定有10个，那么最后训练出来，可能有6个长期是0。最后的问题需要详细讨论一下，比较复杂，就是z的概率分布和取值问题。

既然z是什么都不知道，我们是不是可以寻找一组新的神秘变量w，让这个w服从标准正态分布N(0,I)。I是单位矩阵，然后这个w可以通过n个复杂函数，转换成z呢？有了神经网络这些也是可行的，假设这些复杂函数分别是h₁,h₂,…,h_n，那么有z₁=h₁(w₁),…,z_n=h_n(w_n)。而z的具体分布是什么，取值范围是多少我们也不用关心了，反正由一个神经网络去算。回想一下P(DX|z;θ)=N(DX|f(z;θ),σ²×I)，我们可以想象，如果f(z;θ)是一个多层神经网络，那么前几层就用来将标准正态分布的w变成真正的隐变量z，后面几层才是将z映射成x，但由于w和z是一一对应关系，所以w某种意义上说也是一股神秘力量。就演化成w和x的关系了，既然w也是神秘变量，我们就还是叫回z，把那个之前我们认为的神秘变量z忘掉吧。

好，更加波澜壮阔的历程要开始了，请坐好。

我们现在已经有了

P_z(z)=N(0,I),

P_xz(DX|z;θ)=N(DX|f(x;θ),σ²∗I),

P_t(DX)=∫P_xz(DX|z;θ)P_z(z)dz,

我们现在就可以专心攻击f了，由于f是一个神经网络，我们就可以梯度下降了。但是另一个关键点在于我们怎么知道这个f生成的样本，和DX更加像呢？如果这个问题解决不了，我们根本都不知道我们的目标函数是什么。

3. 设定目标函数
我们先来定义个函数 Q(z|DX)，数据集DX的发生，z的概率密度函数，即如果DX发生，Q(z|DX)就是z的概率密度函数，比如一个数字图像0，z隐式代表0的概率就很大，而那些代表1的概率就很小。如果我们有办法搞到这个Q的函数表示，我们就可以直接使用DX算出z的最佳值了。为什么会引入Q呢？其实道理很简单，如果DX是x这个变量直接生成的，要想找回x的模型，就要引入一个概率密度函数T(x|DX)，亦即针对DX，我们要找到一个x的最佳概率密度函数。
现在的问题就变成了，我们可以根据DX计算出Q(z|DX)来让他尽量与理想的Pz(z|DX)尽量的趋同，这就要引入更加高深的功夫了——相对熵，也叫KL散度(Kullback-Leibler divergence,用 D表示)。

离散概率分布的KL公式

K L (p ∥ q) = \sum p (x) l o g p ( x ) q ( x )

连续概率分布的KL公式

K L (p ∥ q) = \int p (x) l o g p ( x ) q ( x ) d x

P_z(z|DX)和Q(z|DX)的KL散度为

D [Q (z | D X) ∥ P z (z | D X)] = \int Q (z | D X) [l o g Q (z | D X) - l o g P z (z | D X)]

也可写成

D [Q (z | D X) ∥ P z (z | D X)] = E z \sim Q [l o g Q (z | D X) - l o g P z (z | D X)]

通过贝叶斯公式

P z (z | D X) = P ( D X | z ) P ( z ) P ( D X )

这里不再给P起名，其实Pz(z)直接写成P(z)也是没有任何问题的，前面只是为了区分概念，括号中的内容已经足以表意。

D [Q (z | D X) ∥ P z (z | D X)] = E z \sim Q [l o g Q (z | D X) - l o g P (D X | z) - l o g P (z)] + l o g P (D X)

因为logP(DX)与z变量无关，直接就可以提出来了，进而得到闪闪发光的公式(2)：

l o g P (D X) - D [Q (z | D X) ∥ P z (z | D X)] = E z \sim Q [l o g P (D X | z)] - D [Q (z | D X) ∥ P (z)]

; (2)
公式(2)是VAE的核心公式，我们接下来分析一个这个公式。
公式的左边有我们的优化目标P(DX)，同时携带了一个误差项，这个误差项反映了给定DX的情况下的真实分布Q与理想分布P的相对熵，当Q完全符合理想分布时，这个误差项就为0，而等式右边就是我们可以使用梯度下降进行优化的，这里面的Q(z|DX)特别像一个DX->z的编码器，P(DX|z)特别像z->DX的解码器，这就是VAE架构也被称为自编码器的原因。

由于DX早已不再有分歧，我们在这里把所有的DX都换成了X。

我们现在有公式(2)的拆分：
– 左侧第一项：

l o g P (X)

– 左侧第二项：

D (Q (z | X ∥ P (z | X))

– 右边第一项：

E z \sim Q [l o g P (X | z)]

– 右边第二项：

D [Q (z | X) ∥ P (z)]

还有下面这些：
– P(z)=N(0,I),
– P(X|z)=N(X|f(z),σ ²∗I),
– Q(z|X)=N(z|μ(X),Σ(X))
我们再明确一下每个概率的含义：
– P(X)——当前这个数据集发生的概率，但是他的概率分布我们是不知道，比如，X的空间是一个一维有限空间，比如只能取值0-9的整数，而我们的 X = { 0, 1, 2, 3, 4 }，那么当概率分布是均匀的时候，P(X)就是0.5，但是如果不是这个分布，就不好说是什么了，没准是0.1, 0.01，都有可能。P(X)是一个函数，就好像是一个人，当你问他X=某个值的时候，他能告诉发生的概率。
– P(z) —— 这个z是我们后来引入的那个w，还记得吗？他们都已经归顺了正态分布，如果z是一维的，那他就是标准正态分布N(0, I)。
– P(X|z) —— 这个函数的含义是如果z给定一个取值，那么就知道X取某个值的概率，还是举个例子，z是一个神奇的变量，可以控制在计算机屏幕上出现整个屏幕的红色并且控制其灰度，z服从N(0,1)分布，当z=0时代表纯正的红色，z越偏离0，屏幕的红色就越深，那么P(X|z)就表示z等于某个值时X=另一值的概率，由于计算机是精确控制的，没有额外的随机因素，所以如果z=0能够导致X取一个固定色值0xFF0000，那么P(X=0xFF0000|z=0)=1，P(x!=0xFF0000|z=0) = 0，但如果现实世界比较复杂附加其他的随机因素，那么就可能在z确定出来的X基础值之上做随机了。这就是我们之前讨论的，大数定理，P(X|z)=N(X|f(x),σ ²∗I)。f(z)就是X与z直接关系的写照。
– P(z|X) —— 当X发生时，z的概率是多少呢？回到刚才计算机屏幕的例子，就非常简单了P(z=0|X=0xFF0000) = 1, P(z!=0|X=0xFF0000) = 0，但是由于概率的引入，X|z可以简化成高斯关系，相反，也可以简化高斯关系。这个解释对下面的Q同样适用。
– Q(z) —— 对于Q的分析和P的分析是一样的，只不过Q和P的不同时，我们假定P是那个理想中的分布，是真正决定X的最终构成的背后真实力量，而Q是我们的亲儿子，试着弄出来的赝品，并且希望在现实世界通过神经网络，让这个赝品能够尝试控制产生X。当这个Q真的行为和我们理想中的P一模一样的时候，Q就是上等的赝品了，甚至可以打出如假包换的招牌。我们的P已经简化成N(0,I)，就意味着Q只能向N(0, I)靠拢。
– Q(z|X) —— 根据现实中X和Q的关系推导出的概率函数，当X发生时，对应的z取值的概率分布情况。
– Q(X|z) —— 现实中z发生时，取值X的概率。

我们的目标是优化P(X)，但是我们不知道他的分布，所以根本没法优化，这就是我们没有任何先验知识。所以有了公式(2)，左边第二项是P(z|X)和Q(z|X)的相对熵，意味着X发生时现实的分布应该与我们理想的分布趋同才对，所以整个左边都是我们的优化目标，只要左边越大就越好，那么右边的目标就是越大越好。

右边第一项：E_z∼Q[logP(X|z)]就是针对面对真实的z的分布情况(依赖Q(z|X)，由X->z的映射关系决定)，算出来的X的分布，类似于根据z重建X的过程。
右边第二项:D[Q(z|X)||P(z)] 就是让根据X重建的z与真实的z尽量趋近，由于P(z)是明确的N(0, I)，而Q(z|X)是也是正态分布，其实就是要让Q(z|X)趋近与标准正态分布。

现在我们对这个公式的理解更加深入了。接下来，我们要进行实现的工作。

4. 实现
针对右边两项分别实现
第二项是Q(z|X)与N(0, I)的相对熵，X->z构成了编码器部分。
Q(z|x)是正态分布，两个正态分布的KL计算公式如下（太复杂了，我也推不出来，感兴趣的看[1]）：

K L (N (μ, Σ) ∥ N (0, I)) = 1 2 [- l o g [d e t (Σ)] - d + t r (Σ) + μ T μ]

det是行列式，tr是算矩阵的秩，d是I的秩即d=tr(I)。

变成具体的神经网络和矩阵运算，还需要进一步变化该式：

K L (N (μ, Σ) ∥ N (0, I)) = 1 2 Σ i [- l o g (Σ i) + Σ i + μ 2 i - 1]

OK，这个KL我们也会计算了，还有一个事情就是编码器网络，μ(X)和Σ(X)都使用神经网络来编码就可以了。

第一项是E_z∼Q[logP(X|z)]代表依赖z重建出来的数据与X尽量地相同，z->X重建X构成了解码器部分，整个重建的关键就是f函数，对我们来说就是建立一个解码器神经网络。

到此，整个实现的细节就全都展现在下面这张图里了

由于这个网络传递结构的一个环节是随机采样，导致无法反向传播，所以聪明的前辈又将这个结构优化成了这样：

这样就可以对整个网络进行反向传播训练了。

具体的实现代码，我实现在了这里：

https://github.com/vaxin/TensorFlow-Examples/blob/master/examples/3_NeuralNetworks/variational_autoencoder.py

里面的每一步，都有配合本文章的对照解释。

5. 延伸思考
之所以关注VAE，是从文献[4]引发的，由于视觉早期的概念形成对于之后的视觉认知起了十分关键的作用，我们有理由相信，在神经网络训练时，利用这种递进关系，先构建具有基础认知能力的神经网络，再做高级认知任务时会有极大的效果提升。但通过前面神秘变量的分析，我们发现，为了充分利用高斯分布，我们将w替换成了z，也就是说真正的隐变量隐藏在f的神经网络里面，而现在的z反而容易变成说不清楚的东西，这一不利于后续的时候，二来我们需要思考，是否应该还原真实的z，从而在层次化递进上有更大的发挥空间。

[1] http://stats.stackexchange.com/questions/60680/kl-divergence-between-two-multivariate-gaussians
[2] https://arxiv.org/abs/1606.05908
[3] https://zhuanlan.zhihu.com/p/22464768
[4] https://arxiv.org/abs/1606.05579
微信公众号: 深度学习
qrcode_for_gh_79a66349c8c4_258
版权所有，转载请注明出处: dengfanxin.cn

Serverless不香了？深扒其背后的巨大骗局！人工智能
Serverless解决方案正逐渐回归到服务器上。我最近在《Serverless悼词》（AEulogyForServerless）一文中讨论了这个问题。这篇文章的最初想法是我对另一篇关于微服务的文章的更新。但后来我开始写这篇文章时，就有了一些创意。最终的结果就是这篇观点多于事实的文章。我还以为这没什么。我的意思是，每个人都知道Serverless是个骗局，对吗？看来不是。所以我收到了很多负面评论。
Windows基础命令_组策略开启80瑞口 2401_84300239 程序员 windows
-a:查询-d:删除————arp–d169.254.155.18-s:添加主机————arp–a127.127.127.12701-01-01-01-01shutdown-s（立刻关机）shutdown-t180（180秒后关机）shutdown-s-t180（180秒后关机，shutdown-a取消上一个操作）startwww.baidu.com（访问百度网站（start——打开））copy文
一文梳理基础概念：ARM指令集、ARM架构、ARM内核、Cortex、SOC、芯片、单片机之间的关系【科普】 CHD-grl 嵌入式知识科普 arm开发单片机 linux
0前言：ARM公司简介1、ARM既可以认为是一个公司的名字，也可以认为是对一类微处理器的通称，还可以认为是一种技术的名字。2、ARM公司是专门从事基于RISC（精简指令集）技术芯片设计开发的公司，作为知识产权供应商，本身不直接从事芯片生产，而是转让设计许可，由合作公司生产各具特色的芯片。3、ARM处理器的内核是统一的，由ARM公司提供，而片内部件则是多样的，由各大半导体公司设计，这使得ARM设计嵌
ReactNative0.75版本发布，一文快速了解 wayne214 ReactNative react native
ReactNative0.75版本的更新包含了多个方面的内容，以下是一些详细信息：亮点Yoga3.1和布局改进：支持%值在布局中的应用，如gap、translation等属性，但仅适用于新架构。新架构稳定化：修复了一些Bug，提高了稳定性，并在ReactNativeDirectory中添加了新架构支持信息，还发布了关于支持新架构中UIManager的文章。使用框架：推荐通过框架（如Expo）构建R
后端方向初阶入门——MySQL 小羊一定要努力变强 mysql 数据库
各位帅哥美女，编辑不易，动动发财小手，来个三连加关注，后续会有更加优秀的推文推出~Mysql：用的最多的数据库，项目都用此数据库(Oracle：大型数据库，用的不多，因为收费，大公司难免会遇到。目录1.MySQL简介2.MySQL安装与配置2.1下载与安装2.2配置与启动3.数据库基础操作3.1创建数据库3.2选择数据库3.3创建表3.4插入数据3.5查询数据3.6更新数据3.7删除数据3.8.添
文心一言 vs gpt-4 全面横向比较周盛欢文心一言
文心一言是中国百度公司研发的大规模语言模型，它有超多的参数，就像一个超级大脑，特别擅长理解并生成中文内容。在聊天啊、写文章啊、答题这些任务上表现不错，对中国文化和国情有更深的理解和适应能力。GPT-3.5是OpenAI公司的上一代大模型，比GPT-3更智能一些。而GPT-4作为其升级版，大家预计它会有更大的模型参数量，更强的学习和推理能力，可能会在各种语言任务上实现更大突破。所以，如果拿文心一言跟
Kubuntu 初始配置 weixin_34071713 开发工具 git php
1.中文配置系统设置中地区选择中国。语系使用简体中文（一開始可能仅仅有英文选项，似乎是更新后能够选择其它语言了）安装中文字体：sudoapt-getinstallttf-wqy-microhei#文泉驿-微米黑sudoapt-getinstallttf-wqy-zenhei#文泉驿-正黑sudoapt-getinstallxfonts-wqy#文泉驿-点阵宋体中文输入法（fcitx确实好用）sud
送礼得慎重——别不小心送没了工作 Clarkbrave #与上级相处篇职场发展求职招聘
快过中秋了，同事给小马说了一个前辈的故事，这为前辈因为送礼送掉了工作。故事的主人公因为名字里带“文”，人称文子。文子在公司已经工作了半年，眼看着中秋节将至，他心里开始盘算起一件事：给上司送点礼。公司之前没有这个先例，文子之所以这么做完全是受家风影响。他家里是做生意的，逢年过节、求人办事免不了送礼，文子也是耳濡目染。于是，他精心挑选了一份不算太贵重但也体面的礼物，直接送到了上司小区楼下。当上司看到文
深度学习项目--基于LSTM的火灾预测研究(pytorch实现) 羊小猪~~ RNN LSTM神经网络案例机器学习/数据分析案例深度学习 lstm pytorch 人工智能机器学习 rnn gru
本文为365天深度学习训练营中的学习记录博客原作者：K同学啊前言LSTM模型一直是一个很经典的模型，这个模型当然也很复杂，一般需要先学习RNN、GRU模型之后再学，GRU、LSTM的模型讲解将在这两天发布更新，其中：深度学习基础–一文搞懂RNN深度学习基础–GRU学习笔记(李沐《动手学习深度学习》)这一篇：是基于LSTM模型火灾预测研究，讲述了如何构建时间数据、模型如何构建、pytorch中LST
一文了解IBM WebSphere Application Server (WAS)、IBM HTTP Server (IHS)、Tomcat、Apache HTTP Server 和 Nginx 自由鬼运维技术产品分析对比 http tomcat apache was wasliberty 中间件 nginx
一、IBMWASND、HTTP、Tomcat、Nginx配置SSL对比IBMWebSphereApplicationServerNetworkDeployment（WASND）和HTTP（如IBMHTTPServer）之间配置SSL与Tomcat和Nginx相比更复杂的原因，主要在于它们架构设计、组件交互机制和安全管理的不同。以下是详细讲解它们之间配置逻辑和机制的区别：1.IBMWASND和HTT
一文搞定postgreSQL m0_74825172 java
一文搞定postgreSQLPostgreSQL全面指南一、什么是PostgreSQL？二、PostgreSQL的核心概念三、安装PostgreSQL1.在Linux上安装（例如Ubuntu）2.在macOS上安装（使用Homebrew）3.在Windows上安装四、基本操作1.启动和停止PostgreSQL服务2.连接到PostgreSQL3.创建数据库和用户4.基本SQL操作五、高级功能1.事
174道Node.js面试八股文（答案、分析和深入提问）整理 ocean2103 面试题 node.js 面试职场和发展
1.简述Node.js中的模块化编程思想？回答Node.js中的模块化编程思想是指将代码分解为独立的、可重用的模块，以提高代码的可维护性、可读性和可复用性。模块化编程允许开发者将不同的功能逻辑封装在独立的文件中，并通过明确的接口进行交互。下面是Node.js中模块化编程的几个关键点：模块化结构：每个文件都可以视为一个独立的模块，默认情况下，Node.js中的每个文件都是一个模块。开发者可以将相关的
我的秋招总结今天不coding 秋招秋招总结大厂秋招建议秋招准备
我的秋招总结个人背景双非本，985硕，科班准备情况以求职为目的学习Java的时间大概一年。八股，一开始主要是看B站黑马的八股文课程，背JavaGuide和小林coding还有面试鸭。算法，250+，刷了3遍左右项目，API开放平台+OJ在线判题系统+实习项目（检索+大模型）实习，华为线上算法实习4个月，小厂Java实习5个月，滴滴后端实习9个月offer京东零售-供应链sp美团到家-履约sp快手-
【Astro】如何在Astro上借助Cloudflare D1和Drizzle ORM打造全栈应用？一文带你搞定！ eclipsercp 毕业设计开发环境搭建开发语言全栈
如何在Astro上借助CloudflareD1和DrizzleORM打造全栈应用？一文带你搞定！文章目录如何在Astro上借助CloudflareD1和DrizzleORM打造全栈应用？一文带你搞定！前言一、Astro简介与优势二、CloudflareD1简介三、DrizzleORM简介四、在Astro上实现全栈开发的步骤1.安装Astro2.添加Cloudflare适配器3.部署到Cloudfl
云起无垠荣获第八届“强网杯”高阶技术专项赛优秀奖网络安全
近日，第八届“强网杯”全国网络安全挑战赛线下赛于郑州高新区的网络安全科技馆赛博厅圆满落幕。云起无垠创始人兼CEO沈凯文博士在活动中发表了题为《安全智能体技术实践与内生安全问题思考》的精彩演讲。沈凯文博士指出，当前数字化时代下网络安全领域面临深刻变革与挑战，AI的快速发展使其成为网络安全创新的核心动力，促使安全智能体出现。但大模型在安全场景落地时存在诸多难题，为此云起无垠构建了AI安全智能体平台。该
产品解读 | 无涯问知AI PC开启个人大模型应用新篇章人工智能大模型
星环科技推出无涯问知AIPC版，这是一款专为个人用户设计的大模型应用产品，标志着个人智能应用时代的全面展开。无涯问知AIPC版基于星环科技先进的大模型技术，可以在配备英特尔®酷睿™Ultra的主流个人电脑上，基于集成显卡和NPU流畅运行。它不仅具备强大的本地化向量库，支持多格式、不限长度的文件资料入库，还支持影、音、图、文等多模态数据的“知识化”处理，以及“语义化”查询和应用能力，极大地丰富了知识
一文详解：springboot集成websocket fanzhang_vip0723 程序员面试后端 java
微服务架构第1章微服务概述什么是微服务常见的微服务组件常用的微服务框架微服务架构设计模式如何实施微服务从微服务的起源和现实业务的角度探讨微服务第2章微服务设计原则设计原则之分层架构设计原则之统一通信协议设计原则之单一职责设计原则之服务拆分设计原则之前后端分离设计原则之版本控制设计原则之围绕业务构建设计原则之并发流量控制设计原则之CAP设计原则之EDA事件驱动设计原则之CQRS设计原则之基础设施自动
dice系数交叉熵_一文搞懂交叉熵损失 weixin_39721853 dice系数交叉熵
本文从信息论和最大似然估计得角度推导交叉熵作为分类损失函数的依据。从熵来看交叉熵损失信息量信息量来衡量一个事件的不确定性，一个事件发生的概率越大，不确定性越小，则其携带的信息量就越小。设$X$是一个离散型随机变量，其取值为集合$X={x_0,x_1,\dots,x_n}$，则其概率分布函数为$p(x)=Pr(X=x),x\inX$，则定义事件$X=x_0$的信息量为：\[I(x_0
想做黑客？先来学习 SQL 注入，一文带你学会！黑客技术零基础入门到精通教程建议收藏！认真写程序的强哥 sql 数据库网络安全网络攻防黑客技术 web安全 SQL注入
SQL注入（SQLInjection）是一种常见的网络攻击手段，攻击者通过在Web应用程序的输入字段中插入恶意SQL代码，欺骗后台数据库执行非授权的SQL语句。SQL注入可以用于获取、篡改或删除数据库中的数据，甚至可以用于执行系统命令，导致数据泄露、数据破坏或服务器被控制等严重后果。我给大家准备了一份全套的《网络安全入门+进阶学习资源包》包含各种常用工具和黑客技术电子书以及视频教程，需要的小伙伴可
远程工作时代的文件安全管理挑战与机遇够快云库企业数据安全 1024程序员节文件安全企业文件安全
随着远程办公的普及，企业的工作方式发生了巨大变化，全球分布的员工、灵活的工作时间和跨区域的协作成为了新常态。然而，这种灵活性同时也带来了文件安全管理的新挑战。企业需要在保持高效远程协作的同时，确保文件在不同设备、网络环境和个人使用习惯下的安全性。1.远程工作带来的文件安全管理挑战1.1分散的工作环境远程工作意味着员工不再集中在统一的办公网络中，而是在各自的家中或其他地方通过公共或家庭网络访问公司文
ubuntu 系统，docker建的服务，其他局网机器可以通过IP：端口的方式访问。不是docker的不行。 PyAIGCMaster 我买了个服务器 ubuntu docker tcp/ip
根据您的描述，docker建的服务可以通过IP：端口的方式被局网其他机器访问，而非docker的服务不行，以下是可能的原因及解决方法：网络配置方面•检查非docker服务的网络监听配置：确保非docker服务是监听在0.0.0.0上，而不是仅监听在127.0.0.1（localhost）上。如果服务只监听在127.0.0.1上，那么只有本机能够访问，局网其他机器无法访问。您可以通过查看服务的配置文
# RAG 框架 | 技术栈 #一文读懂Xinference架构！优秀开源项目技术栈分析向日葵花籽儿 RAG 优秀开源项目技术栈分析架构人工智能 AIGC RAG
这是原文内容这是知识点解读一、概述Xinference是一个利用actor编程框架Xoscar来管理机器、设备和模型推理进程的系统。每个actor都是模型推理的基本单元，可以集成多种推理后端。它支持多种推理引擎和硬件，并且具有异步和非阻塞的特性。RESTfulAPI：使用FastAPI实现，提供了一个示例API/status对应函数get_status。命令行：通过Click实现，允许用户在终端与
CMAC原理剖析小冯要快乐密码学密码学 mac
NOTE可用于数据完整性校验和保证消息来源合法性，算法强度取决于分组算法强度、消息鉴别码长度以及消息鉴别算法参考GB/T15852.1-2008信息技术安全技术消息鉴别码第1部分：采用分组密码的机制MAC长度大于零并且小于等于密码算法分组长度如果消息既需要加密有需要校验完整性，必须使用不同密钥进行运算当前硬件厂商多是采用对称加密算法结合CBC模式实现，后取最后一块密文作为mac值原理消息填充：需要
2024最新前端面试题(八股文)一阶段总结（html，css）!!!!新手必看必背!通俗易通!全面!全是干货！沐光M 前端面试题 css html es6 前端
1.网络中使用最多的图片格式有哪些•gif支持动画，只有全透明和不透明两种模式，只有256种颜色,适用于简单动画、徽标和简单图形等应用场景。•jpeg常见格式,采用有损压缩算法，保持图像质量的同时减小文件大小,体积较小，不支持透明，不支持动画•png采用无损压缩算法，体积也相对较小，支持透明背景，不支持动画•svg一般会保存颜色及形状相对简单的图片，可任意放大图形显示，边缘异常清晰•BMP画质最好
《Python内置模块010：gzip、zipfile用于处理压缩文件的模块》大大大钢琴 #Python：各类模块（代码）python 数据库服务器
gzip、zipfile：用于处理压缩文件的模块一、常用方法（一）gzip模块（1）功能:主要用于处理GNUzip格式的压缩文件（.gz）。它支持单一文件的压缩和解压缩。（2）常用方法:gzip.open(filename,mode):打开一个gzip压缩文件，支持读（'r'）、写（'w'）、追加（'a'）等模式。gzip.compress(data):压缩数据并返回压缩后的字节对象。gzip.d
推荐一款牛逼的Windows神器！功能很强大！编程IT圈编程语言软件测试 javascript linux css
嗨喽，各位新来的小伙伴们，你们好！由于公众号做了改版，为了保证公众号的资源推送，能够第一时间及时送达，大家记得将搜罗哥的公众号加星标置顶，在此真诚的感谢！上篇推文：LeetCode1-50题汇总，速度收藏！职场上办公，最讲究的就是效率了，很多小伙伴没有一个合适的工具来帮助自己，提升工作的效率，一会需要处理图片，一会需要识别一些文字，今天搜罗哥就给小伙伴介绍一款提升效率的工具：万彩办公大师。1软件简
电脑报错quazip.dll缺失，详细解决方法与预防措施 OP4KPLUS 电脑
在使用Windows操作系统时，有时会遇到报错提示“找不到quazip.dll文件”。这个问题通常是由于该动态链接库文件丢失或损坏导致的。本文将详细介绍quazip.dll文件、其对电脑的影响以及多种解决方法和预防措施，帮助用户顺利解决问题。文件介绍quazip.dll是QuaZip库的一部分，QuaZip是一个用于处理ZIP文件的C++库，广泛应用于各种应用程序中以实现压缩和解压功能。该DLL文
天天酷跑电脑版代码C语言,Java实现天天酷跑小游戏完整代码(附源码).pdf 小麦的天空天天酷跑电脑版代码C语言
Java实实现现天天天天酷酷跑跑小小游游戏戏完完整整代代码码(附附源源码码)首首先先，，写写一一个个需需求求文文档档：：一、项目名称：《天天酷跑》(RunDay)二、功能介绍：闯类游戏，玩家登录后，选择进入游戏，通过键盘控制玩家的上下左右移动，来躲避障碍物和吃金币，玩家躲避的障碍物越多跑酷距离越远，玩家吃的金币越多，得分越高。三、功能模块：1、登录界面用户名(输入框，明文)密码(输入框，密文)登录
【华为OD技术面试手撕真题】- C++手撕技术面试八股文（3） KJ.JK 华为OD技术面试手撕真题华为od 面试 c++华为od机试真题华为od机试E卷 C++面试八股文 C++手撕技术面试八股文
文章目录一、常见的STL容器有哪些？1、序列容器2、关联容器3、无序关联容器4、容器适配器二、STL中map和set的原理1、基本数据结构（红黑树）2、map3、set4、特点和应用三、深拷贝和浅拷贝的区别1、浅拷贝2、深拷贝四、什么情况下会调用拷贝构造函数五、C++11有哪些新特性？1、自动类型推导(auto)2、范围for循环3、智能指针4、移动语义5、初始化列表6、线程支持7、Lambda表
华为OD机试 - 特殊的加密算法 - 深度优先搜索DFS（Python/JS/C/C++ 2024 D卷 200分）哪吒华为od 深度优先 python
一、题目描述有一种特殊的加密算法，明文为一段数字串，经过密码本查找转换，生成另一段密文数字串。规则如下明文为一段数字串由0-9组成密码本为数字0-9组成的二维数组需要按明文串的数字顺序在密码本里找到同样的数字串，密码本里的数字串是由相邻的单元格数字组成，上下和左右是相邻的，注意:对角线不相邻，同一个单元格的数字不能重复使用。每一位明文对应密文即为密码本中找到的单元格所在的行和列序号(序号从0开始)
ztree异步加载 3213213333332132 JavaScript Ajax json Web ztree
相信新手用ztree的时候,对异步加载会有些困惑，我开始的时候也是看了API花了些时间才搞定了异步加载，在这里分享给大家。我后台代码生成的是json格式的数据，数据大家按各自的需求生成，这里只给出前端的代码。设置setting，这里只关注async属性的配置 var setting = { //异步加载配置
thirft rpc 具体调用流程 BlueSkator 中间件 rpc thrift
Thrift调用过程中，Thrift客户端和服务器之间主要用到传输层类、协议层类和处理类三个主要的核心类，这三个类的相互协作共同完成rpc的整个调用过程。在调用过程中将按照以下顺序进行协同工作：（1）将客户端程序调用的函数名和参数传递给协议层（TProtocol），协议
异或运算推导, 交换数据 dcj3sjt126com PHP 异或 ^
/* * 5 0101 * 9 1010 * * 5 ^ 5 * 0101 * 0101 * ----- * 0000 * 得出第一个规律: 相同的数进行异或, 结果是0 * * 9 ^ 5 ^ 6 * 1010 * 0101 * ---- * 1111 * * 1111 * 0110 * ---- * 1001
事件源对象周华华 JavaScript
<!DOCTYPE html PUBLIC "-//W3C//DTD XHTML 1.0 Transitional//EN" "http://www.w3.org/TR/xhtml1/DTD/xhtml1-transitional.dtd"> <html xmlns="http://www.w3.org/1999/xhtml&q
MySql配置及相关命令 g21121 mysql
MySQL安装完毕后我们需要对它进行一些设置及性能优化，主要包括字符集设置，启动设置，连接优化，表优化，分区优化等等。一修改MySQL密码及用户
[简单]poi删除excel 2007超链接 53873039oycg Excel
采用解析sheet.xml方式删除超链接，缺点是要打开文件2次,代码如下: public void removeExcel2007AllHyperLink(String filePath) throws Exception { OPCPackage ocPkg = OPCPac
Struts2添加 open flash chart 云端月影
准备以下开源项目： 1. Struts 2.1.6 2. Open Flash Chart 2 Version 2 Lug Wyrm Charmer (28th, July 2009) 3. jofc2，这东西不知道是没做好还是什么意思，好像和ofc2不怎么匹配，最好下源码，有什么问题直接改。 4. log4j 用eclipse新建动态网站，取名OFC2Demo，将Struts2 l
spring包详解 aijuans spring
下载的spring包中文件及各种包众多，在项目中往往只有部分是我们必须的，如果不清楚什么时候需要什么包的话，看看下面就知道了。 aspectj目录下是在Spring框架下使用aspectj的源代码和测试程序文件。Aspectj是java最早的提供AOP的应用框架。 dist 目录下是Spring 的发布包，关于发布包下面会详细进行说明。 docs&nb
网站推广之seo概念 antonyup_2006 算法 Web 应用服务器搜索引擎 Google
持续开发一年多的b2c网站终于在08年10月23日上线了。作为开发人员的我在修改bug的同时，准备了解下网站的推广分析策略。所谓网站推广，目的在于让尽可能多的潜在用户了解并访问网站，通过网站获得有关产品和服务等信息，为最终形成购买决策提供支持。网站推广策略有很多，seo，email，adv
单例模式,sql注入,序列百合不是茶单例模式序列 sql注入预编译
序列在前面写过有关的博客,也有过总结,但是今天在做一个JDBC操作数据库的相关内容时需要使用序列创建一个自增长的字段居然不会了,所以将序列写在本篇的前面 1,序列是一个保存数据连续的增长的一种方式; 序列的创建; CREATE SEQUENCE seq_pro 2 INCREMENT BY 1 -- 每次加几个 3
Mockito单元测试实例 bijian1013 单元测试 mockito
Mockito单元测试实例： public class SettingServiceTest { private List<PersonDTO> personList = new ArrayList<PersonDTO>(); @InjectMocks private SettingPojoService settin
精通Oracle10编程SQL(9)使用游标 bijian1013 oracle 数据库 plsql
/* *使用游标 */ --显示游标 --在显式游标中使用FETCH...INTO语句 DECLARE CURSOR emp_cursor is select ename,sal from emp where deptno=1; v_ename emp.ename%TYPE; v_sal emp.sal%TYPE; begin ope
【Java语言】动态代理 bit1129 java语言
JDK接口动态代理 JDK自带的动态代理通过动态的根据接口生成字节码(实现接口的一个具体类)的方式，为接口的实现类提供代理。被代理的对象和代理对象通过InvocationHandler建立关联 package com.tom; import com.tom.model.User; import com.tom.service.IUserService;
Java通信之URL通信基础白糖_ java jdk webservice 网络协议 ITeye
java对网络通信以及提供了比较全面的jdk支持，java.net包能让程序员直接在程序中实现网络通信。在技术日新月异的现在，我们能通过很多方式实现数据通信，比如webservice、url通信、socket通信等等，今天简单介绍下URL通信。学习准备：建议首先学习java的IO基础知识 URL是统一资源定位器的简写，URL可以访问Internet和www，可以通过url
博弈Java讲义 - Java线程同步 (1) boyitech java 多线程同步锁
在并发编程中经常会碰到多个执行线程共享资源的问题。例如多个线程同时读写文件，共用数据库连接，全局的计数器等。如果不处理好多线程之间的同步问题很容易引起状态不一致或者其他的错误。同步不仅可以阻止一个线程看到对象处于不一致的状态，它还可以保证进入同步方法或者块的每个线程，都看到由同一锁保护的之前所有的修改结果。处理同步的关键就是要正确的识别临界条件（cri
java-给定字符串，删除开始和结尾处的空格，并将中间的多个连续的空格合并成一个。 bylijinnan java
public class DeleteExtraSpace { /** * 题目：给定字符串，删除开始和结尾处的空格，并将中间的多个连续的空格合并成一个。 * 方法1.用已有的String类的trim和replaceAll方法 * 方法2.全部用正则表达式，这个我不熟 * 方法3.“重新发明轮子”，从头遍历一次 */ public static v
An error has occurred.See the log file错误解决！ Kai_Ge MyEclipse
今天早上打开MyEclipse时，自动关闭！弹出An error has occurred.See the log file错误提示！很郁闷昨天启动和关闭还好着！！！打开几次依然报此错误，确定不是眼花了！打开日志文件！找到当日错误文件内容： --------------------------------------------------------------------------
[矿业与工业]修建一个空间矿床开采站要多少钱? comsci
地球上的钛金属矿藏已经接近枯竭........... 我们在冥王星的一颗卫星上面发现一些具有开采价值的矿床..... 那么,现在要编制一个预算,提交给财政部门..
解析Google Map Routes dai_lm google api
为了获得从A点到B点的路劲，经常会使用Google提供的API，例如 [url] http://maps.googleapis.com/maps/api/directions/json?origin=40.7144,-74.0060&destination=47.6063,-122.3204&sensor=false [/url] 从返回的结果上，大致可以了解应该怎么走，但
SQL还有多少“理所应当”？ datamachine sql
转贴存档，原帖地址：http://blog.chinaunix.net/uid-29242841-id-3968998.html、http://blog.chinaunix.net/uid-29242841-id-3971046.html！ ------------------------------------华丽的分割线--------------------------------
Yii使用Ajax验证时，如何设置某些字段不需要验证 dcj3sjt126com Ajax yii
经常像你注册页面,你可能非常希望只需要Ajax去验证用户名和Email,而不需要使用Ajax再去验证密码,默认如果你使用Yii 内置的ajax验证Form,例如: $form=$this->beginWidget('CActiveForm', array( 'id'=>'usuario-form',&
使用git同步网站代码 dcj3sjt126com crontab git
转自:http://ued.ctrip.com/blog/?p=3646?tn=gongxinjun.com 管理一网站，最开始使用的虚拟空间，采用提供商支持的ftp上传网站文件，后换用vps，vps可以自己搭建ftp的，但是懒得搞，直接使用scp传输文件到服务器，现在需要更新文件到服务器，使用scp真的很烦。发现本人就职的公司，采用的git+rsync的方式来管理、同步代码，遂
sql基本操作蕃薯耀 sql sql基本操作 sql常用操作
sql基本操作 >>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>> 蕃薯耀 2015年6月1日 17:30:33 星期一 &
Spring4+Hibernate4+Atomikos3.3多数据源事务管理 hanqunfeng Hibernate4
Spring3+后不再对JTOM提供支持，所以可以改用Atomikos管理多数据源事务。Spring2.5+Hibernate3+JTOM参考：http://hanqunfeng.iteye.com/blog/1554251Atomikos官网网站：http://www.atomikos.com/ 一.pom.xml <dependency> <
jquery中两个值得注意的方法one()和trigger()方法 jackyrong trigger
在jquery中，有两个值得注意但容易忽视的方法，分别是one()方法和trigger()方法,这是从国内作者<<jquery权威指南》一书中看到不错的介绍 1） one方法 one方法的功能是让所选定的元素绑定一个仅触发一次的处理函数，格式为 one(type,${data},fn) &nb
拿工资不仅仅是让你写代码的 lampcy 工作面试咨询
这是我对团队每个新进员工说的第一件事情。这句话的意思是，我并不关心你是如何快速完成任务的，哪怕代码很差，只要它像救生艇通气门一样管用就行。这句话也是我最喜欢的座右铭之一。这个说法其实很合理：我们的工作是思考客户提出的问题，然后制定解决方案。思考第一，代码第二，公司请我们的最终目的不是写代码，而是想出解决方案。话粗理不粗。付你薪水不是让你来思考的，也不是让你来写代码的，你的目的是交付产品
架构师之对象操作----------对象的效率复制和判断是否全为空 nannan408 架构师
1.前言。如题。 2.代码。 (1)对象的复制，比spring的beanCopier在大并发下效率要高，利用net.sf.cglib.beans.BeanCopier Src src=new Src(); BeanCopier beanCopier = BeanCopier.create(Src.class, Des.class, false);
ajax 被缓存的解决方案 Rainbow702 JavaScript jquery Ajax cache 缓存
使用jquery的ajax来发送请求进行局部刷新画面，各位可能都做过。今天碰到一个奇怪的现象，就是，同一个ajax请求，在chrome中，不论发送多少次，都可以发送至服务器端，而不会被缓存。但是，换成在IE下的时候，发现，同一个ajax请求，会发生被缓存的情况，只有第一次才会被发送至服务器端，之后的不会再被发送。郁闷。解决方法如下： ① 直接使用 JQuery提供的 “cache”参数，
修改date.toLocaleString()的警告 tntxia String
我们在写程序的时候，经常要查看时间，所以我们经常会用到date.toLocaleString()，但是date.toLocaleString()是一个过时的API，代替的方法如下： package com.tntxia.htmlmaker.util; import java.text.SimpleDateFormat; import java.util.
项目完成后的小总结 xiaomiya js 总结项目
项目完成了，突然想做个总结但是有点无从下手了。做之前对于客户端给的接口很模式。然而定义好了格式要求就如此的愉快了。先说说项目主要实现的功能吧 1，按键精灵 2，获取行情数据 3，各种input输入条件判断 4，发送数据（有json格式和string格式） 5，获取预警条件列表和预警结果列表， 6，排序， 7，预警结果分页获取 8，导出文件（excel，text等） 9，修

变分自编码器（Variational Autoencoder, VAE）通俗教程

你可能感兴趣的:(安利文)