guoxinxin0605

2021李宏毅机器学习笔记--23 Theory behind GAN

摘要
一、Maximum Likelihood Estimation(最大似然估计)
二、MLE=Minimize KL Divergence（最小KL散度）
三、Generator
四、Discriminator
五、D*和divergence的关系证明
六、知识回顾:KL散度、JS散度和交叉熵
七、G*的目标
八、GD Algorithm for GAN
九、In practice(实做中)
十、Algorithm for GAN
总结

摘要

本章节主要介绍GAN理论后的数学原理，GAN可以根据很多的example来生成新的东西，但其实它生成的东西里面，可能只有一个固定的区域里sample出来的是我们想要的，而现在GAN的工作就是找到这个区域distribution。在GAN之前主要使用Maximum Likelihood Estimation(最大似然估计)，假如说我们的数据集的分布是 $P_{data}(x)$ ，我们定义一个分布 $P_G(x;\theta)$ ,我们想要找到一组参数 θ,使得 $P_G(x;\theta)$ 越接近 $P_{data}(x)$ 越好。Minimize KL Divergence其实最大似然估计的另一种解释，它只不过是在MLE的函式基础上加了一项然后重新整理得到的。但问题是采用高斯混合模型定义 $P_G$ ,生成的图片会非常模糊。所以就有了Generator的方法，它是从一个简单的分布（比如正态分布）中sample出样本，然后扔进一个network(即generator)，然后得到输出，把这些输出统统集合起来，我们会得到一个与目标十分接近的distribution。我们可以从 $P_G$ 与 $P_{data}$ 中sample出一些样本出来，那么问题就变成了从sample的数据来求 $P_G$ 与 $P_{data}$ ，怎么求呢，可以使用Discriminator（生成器）来衡量二者之间的的Divergence散度。而生成器训练的目标是找到一个 $G^*$ ,去最小化 $P_G$ 与 $P_{data}$ 的差异。

一、Maximum Likelihood Estimation(最大似然估计)

首先考虑一下，GAN到底生成的是什么呢？比如说，假如我们想要生成一些人脸图，实际上，我们是想找到一个分布，从这个分部内sample出来的图片，像是人脸，而不属于这个distribution（分布）的，生成的就不是人脸。而GAN要做的就是找到这个distribution。

在GAN出生之前，我们怎么做这个事情呢？
之前用的是Maximum Likelihood Estimation，最大似然估计来做生成的，我们先看一下最大似然估计做的事情。

最大似然估计的理念是，假如说我们的数据集的分布是 $P_{data}(x)$ ，我们定义一个分布 $P_G(x;\theta)$ ,我们想要找到一组参数 θ,使得 $P_G(x;\theta)$ 越接近 $P_{data}(x)$ 越好。比如说，加入 $P_G(x;\theta)$ 如果是一个高斯混合模型，那么 θ 就是均值和方差。

具体的操作步骤如下：

首先我们不知道真实的数据分布是什么样的，但是我们可以从 $P_{data}(x)$ 抽样出一些样本（真实图片）
对每一个sample出来的x，我们都可以计算它的likelihood，也就是给定一组参数θ ,我们就能够知道 $P_G(x;\theta)$ 长什么样，然后我们就可以计算出在这个分布里面sample出某一个x的几率。
我们把在某个分布可以产生 $x_i$ 的likelihood乘起来，可以得到总的likelihood： $\prod_{i=1}^m P_G(x^i;\theta)$ ,我们要找到一组 $θ^*$ ，可以最大化L

二、MLE=Minimize KL Divergence（最小KL散度）

其实最大似然估计的另一种解释是Minimize KL Divergence

前面我们已经解释过，我们要找到一组 $θ^*$ ，使得 $θ^*=arg\max\limits_{\theta}\prod_{i=1}^mP_G(x_i,\theta)$ ，我们对其做一些变换, 加一个Log，再把Log乘进去：

$θ^*=arg\max\limits_{\theta}\prod_{i=1}^mP_G(x_i,\theta)$ = $arg\log\max\limits_{\theta}\prod_{i=1}^mP_G(x_i,\theta)$ =
$arg\max\limits_{\theta}\sum_{i=1}^mlogP_G(x_i,\theta)$

其中, $\sum_{i=1}^m$ 就相当于我从 $P_{data}(x)$ 中sample出m个样本出来。
这个事情就相当于求从 $P_{data}(x)$ 采样出x xx的期望：
≈ $arg\max\limits_{\theta}E_{x\sim P_{data}}[logP_G(x;\theta)]$

接下来我们把 $E_{x\sim P_{data}}$ 这一项展开，做一个积分，得到：
$arg\max\limits_{\theta}\int_xP_{data}logP_G(x,\theta)dx$

接下来我们在上个式子的基础上加一项和 θ \thetaθ 无关的项，不影响求最大值：

$arg\max\limits_{\theta}\int_xP_{data}logP_G(x,\theta)dx$ - $\int_xP_{data}logP_G(x,\theta)dx$

为什么要加上这一项看上去没用的项呢？因为加上这一项后，会发现把 $int_xP_{data}$ 提取出来，就是一个 $P_{data}$ 和 $P_G$ 的KL divergence，这里把两个分布位置换一下，就变成求最小值。数学上KL divergence使用来衡量两个分布的差异程度的，那么现在我们的目标就是找一组 θ来最小化 $P_{data}$ 和 $P_G$ 的KL divegence：= $arg\max\limits_{\theta}KL(P_{data}||P_G)$

但是我们常常要先假定一个具体的分布去逼近实际分布，我们的分布 $P_G$ 不一定是高斯分布，如果 $P_G$ 是一个NN，就没有办法算likelihood。因此我们需要一个通用的分布，去逼近这个复杂的图像真实分布。因此要用GAN的Generator来解决这个问题。

三、Generator

过去如果使用最大似然估计，采用高斯混合模型定义 $P_G$ ,生成的图片会非常模糊。而现在我们用的Generator的方法，是从一个简单的分布（比如正态分布）中sample出样本，然后扔进一个network(即generator)，然后得到输出，把这些输出统统集合起来，我们会得到一个distribution, 这个distribution就是我们要找的 $P_G$ ，而我们的目标是使得 $P_G$ $$越接近越好。

优化目标是最小化 $P_{data}$ 之间的差异：

$^∗ = arg\max\limits_GDiv(P_G，P_{data}) )$

四、Discriminator

虽然我们不知道 $P_G$ 与 $P_{data}$ 的公式，但是我们可以从这两个分布中sample出一些样本出来。对于 $P_{data}$ 来说，我们从给定的数据集中sample出一些样本就可以了。对于 $P_G$ 来说，我们随机sample一些向量，扔到Generator里面，然后generator会输出一些图片，这就是从 $P_G$ 里面sample了。

问题就变成我们怎么从sample的数据求 $P_G$ 与 $P_{data}$

其实我们可以使用Discriminator来衡量 $P_G$ 与 $P_{data}$ 的Divergence

蓝色星星： data sampled from $P_{data}$
橙色星星： data sampled from $P_G$

我们可以用Discriminator来区分两个Distribution，公式：

$V(G,D)=E_{x∼P_data}[logD(x)]+ E_{x∼P_G}[log(1−D(x))]$

前面一项是表示数据sampled from $P_{data}$ ，值越大越好，后面一项是表示数据sampled from $P_G$ ，值越小越好
上面公式的形式和训练一个二分类Classifier的目标函数长得一样，就是说可以把 $P_G$ 与 $P_{data}$ 看成两个分类。
训练Discriminator就好比训练一个二分类：

$D^∗=arg\max\limits_DV(D,G)$

而训练出来的 $\max\limits_DV(D,G)$ 就相当于与JS divergence，来看下为什么是JS divergence。

如果两个分布的数据很接近（small divergence），那么Discriminator很难把数据分开，也就是上面的公式很难找到一个D，使得 $D^*$ 取得很大的值。那么就找到最大的divergence，使得两个分布的数据相隔ed远一些，我们的Discriminator就能容易的将数据分开。

也就是 $D^*$ 和divergence程度有关系，下面用数学来证明。

五、D*和divergence的关系证明

给定Generator, 我们要找到能最大化目标函数 $V (D, G)$ 的 $D^*$ :
$V=E_{x∼P_data}[logD(x)] + E_{x∼P_G}[log(1−D(x))]$
= $\int_xP_{data}logD（x）dx + \int_xP_G(x)log(1-D(x))$
= $\int_x[P_{data}(x)logD(x) + P_G(x)log(1-D(x))]dx$

上面等同于，我们将某一个X拿出来，我们可以让之前积分内部的式子越大越好；其实就是所有的X就是分开来算；
$P_{data}(x)logD(x)+P_Glog(1−D(x))$

我们想要找到一组参数 $D^*$ ,让这一项最大。我们把这个式子简写一下，将$ P_{data} $用 a 表示，$ P_G$用b表示，那么上式可写为：
$f (D) = a l o g D + b l o g (1 - D)$
接下来对其求导，并让其等于=0，即求梯度，有:

$\frac{df(D}{dD}=a*\frac1D+b*\frac1{1-D}*(-1)$

最终求解得到 $D^*$ :

$D^∗= \frac{a}{a+b}=\frac{P_{data(x)}}{P_{data}(x)+P_G(x)}$

我们求出了这个D，把它代到 $V(G,D^*)$ 里面，然后将分子分母同时除以2，然后提出来（这一步是为了之后方便化简）,之后可以将其化简成Jensen-Shannon divergence(某一种计算分部差异的公式）的形式：

通过这一系列的化简，我们可以知道，最大化 $V(G,D^*)$ ，其实就是求解分布 $P G ,P_{data}$ 的JS divergence。所以当去训练一个distriminator，就是通过 $P_G, P_{data},$ sample出来的样本去求这两个分布的差异。

六、知识回顾:KL散度、JS散度和交叉熵

KL散度、JS散度和交叉熵：三者都是用来衡量两个概率分布之间的差异性的指标。不同之处在于它们的数学表达。
对于概率分布P(x)和Q(x)

KL散度（Kullback–Leibler divergence）又称KL距离，相对熵。
当P(x)和Q(x)的相似度越高，KL散度越小。
KL散度主要有两个性质：
- 不对称性
  尽管KL散度从直观上是个度量或距离函数，但它并不是一个真正的度量或者距离，因为它不具有对称性，即D(P||Q)!=D(Q||P)。
- 非负性
  相对熵的值是非负值，即D(P||Q)>0。
JS散度（Jensen-Shannon divergence）JS散度也称JS距离，是KL散度的一种变形。
但是不同于KL主要又两方面：
- 值域范围
  JS散度的值域范围是[0,1]，相同则是0，相反为1。相较于KL，对相似度的判别更确切了。
- 对称性
  即 JS(P||Q)=JS(Q||P)，从数学表达式中就可以看出。
交叉熵（Cross Entropy）
在神经网络中，交叉熵可以作为损失函数，因为它可以衡量P和Q的相似性。

交叉熵和相对熵的关系：

以上都是基于离散分布的概率，如果是连续的数据，则需要对数据进行Probability Density Estimate来确定数据的概率分布，就不是求和而是通过求积分的形式进行计算了。

七、G*的目标

生成器训练的目标是找到一个 $G^*$ ,去最小化 $P_G$ 与 $P_{data}$ 的差异。也就是：

$G^∗ =arg\underset G{max}Div(P_G,P_{data})$

而这个divergence我们没有办法直接去算，我们不知道 $P_G$ 与 $P_{data}$ 的公式具体是什么。于是我们通过一个discriminator来计算两个分布间的差异：
$D^∗ =arg \underset D{max}(D,G)$

那么我们的优化目标就变为:
$G^∗ =arg \underset G{min} \underset D{max}V(G,D)$

这个看起来很复杂，其实直观理解一下，如下图，我们假设已经把Generator固定住了，图片的曲线表示，红点表示固定住G后的 $\underset D{max}V(G,D)$ , 也就是 $P_G$ 与 $P_{data}$ 的差异。而我们的目标是最小化这个差异，所以下图的三个网络中 $G_3$ 是最优秀的。

八、GD Algorithm for GAN

Step1：首先固定生成器，找到一个能够使V最大的D；
Step2：然后固定D，找到能够使这个最大D情况下V最小的G。不停的迭代…

从数学看为什么这个算法是在解上面的最小最大过程：

用函数 $L (G)$ 替代 $G^*$ 中的 $\underset D{max}V(G,D)$ ：

$G^∗ =arg\underset G{min} L(G)$

那么找最好的G的话就用梯度下降（和一般的train是一样的）；θ是表示G的参数

但是L（G）有个max操作，但是它依然也是可以做微分的：假设有个函数f(x)是max三个子函数，f（x）其实就是每个阶段取最大值最终求微分的过程就是在每一个点x，先看哪个子函数在这个点最大，微分值就是最大的那个子函数的微分值。也就是梯度下降依然适用，就是每次更新参数的时候先看自己在那个范围，再用这个范围的函数求梯度，然后更新；重复…

也就是说函数中有max操作，也是可以做梯度下降的。
明白这个之后我们继续来看整个 $G^*$ 如何算：

给定一个 $G_0$ 找到可以使得 $V(G_0,D)$ 最大的 $D^*$ ，这个过程可以用梯度上升来求解。 $V(G_0,D_0^*)$ 就是在求 $P_G$ 与 $P_{data}$ 的JS divergence（前面已经证明过了）
找到 $\underset D{max}V(G,D)$ 后，对
$G^∗ =arg \underset G{min} \underset D{max}V(G,D)$ 求导， $\theta_G \leftarrow \theta_G - \eta\frac{\partial{V(G,D_0^*)}}{\partial\theta_G}$ 更新参数得到 $G_1$ , 这个过程其实是在最小化JSd ivergence
重新寻找 $D_1^*$ 可以最大化 $V(G_1,D)$ 。这个过程求的是 $P_G$ 与 $P_{data}$ 的JS divergence
$\theta_G \leftarrow \theta_G - \eta\frac{\partial{V(G,D_0^*)}}{\partial\theta_G}$ 得到 $G_1$ ,这个过程可以看做是在最小化JS divergence，这个过程需要注意不要让G 变化得太大，尽量让 $G_0,G_1$ 的差别不要太大(下面的注意说明了原因)。这也是训练过程中的一个tricks
然后不断循环……

注意：

其实在train过程中不是真正的minimize JS散度，为什么呢？

刚开始的第一步，先找一个 $G_0$ ，然后找 $G_0$ 的最大V就是 $G_0$ 下的散度；当你的G在train时变了一点，你的function V（G,D）就变了；此时由于D固定，所以JS散度会变得不再是此刻G下的JS散度了。

因此前提假设是 $V(G_0,D)$ 和 $V(G_1,D)$ 是很像的；（G的参数变化很小）

因此在train生成器的时候不能更新的太多次，因为这个过程中D是不变的

但是在train判别器的时候要train到底，因为你在找当前G的JS散度。

假设在 $G_0$ 的时候， $V(G_0,D)$ 的曲线如上图左边所示，然后 $D_0^*$ 使得 $V(G_0,D)$ 最大，这个时候的JSD是 $V(G_0,D_0^*)$ between $P_G$ and $P_{data}$ ，然后我们用梯度下降更新 $G_0$ ，将其变成 $G_1$ ，这个时候由于G的值变化后， $V ( G_1 , D )$ 的曲线发生了变化（参考上面 $f ( x ) = \max \{ f_1 ( x ) , f_2 ( x ) , f_3 ( x ) \}$ 的例子），这个新曲线 $V(G_1,D_1^*)$ 如上图的右边所示，这个时候的最大值就不在 $D_0^*$ 了，离它很远，这个时候的JSD变成了 $V(G_1,D_1^*)$ ，可以看到后面的JSD明显要变大了，这样是不对的，因此我们做了假设，假设：
$D_0^∗ ≈D_1^*$

这个时候从， $V(G_0,D)$ 到， $V(G_1,D)$ 的曲线变化不会很大。也就是G这个参数只变化了一点点。
我们同样可以用来 $D_0^*$ 衡量变化后JSD between $P_G$ and $P_{data}$

也就是说GAN的训练技巧：

Generator不要一次update太多，也不需要太多的iteration(迭代)；
而Discriminator可以训练到收敛。因为要找到最大值才能衡量出JSD。

九、In practice(实做中)

理论上V是要取期望值，但是实际上是不可能的。只能用样本的均值进行估计：

从 $P_{data}(x)$ 从抽取样本 ${x^1,x^2,...,x^m\}$ ，从 $P_G(x)$ 中抽取样本 $\{\widetilde{x}^1,\widetilde{x}^2,...,\widetilde{x}^m\}$
$\ \ \ \widetilde{V} = \frac{1}{m}\sum_{i=1}^mlogD(x^i)+\frac{1}{m}\sum_{i=1}^mlog(1-D(\widetilde{x}^i))$
上面这个事情实际上就是在训练一个Binary Classifier，记为D，D后面接一个sigmoid函数，使得输出值在[0,1]之间

我们把 ${x^1,x^2,...,x^m\}$ from $P_{data}(x)$ 看做Positive examples；

我们把 $\{\widetilde{x}^1,\widetilde{x}^2,...,\widetilde{x}^m\}$ from generator $P_G(x)$ 看做Negative examples

目标是最小化上面两组数据的Cross-entropy，计算这个交叉熵的公式推导出来就是上面那个公式 $\tilde{V}$

十、Algorithm for GAN

首先train判别器，实际上没办法train到收敛，可以定义训练k次；（JS散度是什么）

之后train生成器：其中第一项是与生成器无关的，由于G不能训练太多，所以updata一次就好（最小化JS散度）

因为这些步骤在前面的GAN基础中已经说过了，这里就不细说了，我将之前的解说复制了一下：

首先初始化判别器和生成器
然后从database中抽取m个图片（like batch size）；

从一个分布中抽取m个vector

使用m个vector产生m个image。之后去调整判别器：

首先把m张真实图片都拿出来，经过判别器得到分数，然后经过log再统统平均起来（当然希望这个越大越好，因为希望真实的图片得分高）；对于生成器生成的m张图片当然希望值越小越好，因此用1-值，其越大越好。因此使用梯度上升的方法，调节判别器参数。（实际训练过程是给真实图片赋值为1，生成图片赋值为0；训练二分类器；等同于上述过程）
从一个分布中抽取m个vector

重新生成m张图片，G（Z）就是一张图片，再把它丢到判别器中D（G(Z)）;再对所有的生成的求平均，在D不改变的情况下，希望这个值越小越好

按上面的算法：，我们可以知道Generator目标函数应该是：

$V=E_{x∼P_{data}}[logD(x)]+ E_{x∼P_G}[log(1−D(x))]$
然后第一项和G GG函数无关，所以在求最小值的时候可以忽略：
$V=E_{x∼P_G}[log(1−D(x))]$

但是，在论文原文在实作的时候把这个函数改为：

$V=E_{x∼P_G}[-log(D(x))]$

上图中我们给出了两个函数的图像。

红色曲线对应 $l o g (1 - D (x))$ ：江湖人称Minimax GAN (MMGAN)

蓝色曲线对应 $- l o g (D (x))$ ：江湖人称Non-saturating GAN (NSGAN) (saturating /ˈsætʃəreɪtɪŋ/:饱和的；浸透的)

我们可以看到，红色曲线由于刚开始的Generator 没有训练过，它的生成对象都很假，很容易被识破，因此刚开始的 $l o g (1 - D (x))$ 值很小。

不好训练，换成蓝色曲线后，两个曲线都是下降趋势，没有变，但是蓝色曲线刚开始的值很大，适合做梯度下降。
其实后来实验证明两种结果都差不多。

老师给出了他的猜想，蓝色曲线其实就是把label x from $P_G$ as positive.就是把生成对象和真实对象的标签换一下。

总结

本章主要介绍GAN的数学理论。GAN可以看过很多例子之后自己生成新的信息，这些信息在高维空间中有一定的分布范围，那么我们的目标就是要找到它的分布，使得我们寻找的分布越靠近真实的数据集分布越好。在GAN之前，也有很多方法可以生成，比如最大似然估计和最小KL散度，其中我们自定义的分布如果采用高斯混合模型，则有非常多的限制，会导致我们生成的图会比较糊，但如果是其他普遍的，也可能会导致算式中的项比较难计算，可以用生成器和鉴别器解决这个问题。在进行数学推论过程中，一定要看仔细，进行提取或者合并的时候不要漏掉。

在推论的部分上要多进行研究推算。

LeetCode算法题：电话号码的字母组合吱屋猪_ 算法 leetcode java
题目描述：给定一个仅包含数字2-9的字符串，返回所有它能表示的字母组合。答案可以按任意顺序返回。给出数字到字母的映射如下（与电话按键相同）。注意1不对应任何字母。2->"abc"3->"def"4->"ghi"5->"jkl"6->"mno"7->"pqrs"8->"tuv"9->"wxyz"例如，给定digits="23"，返回["ad","ae","af","bd","be","bf","cd
Java设计模式实战：高频场景解析与避坑指南 mckim_ 笔记学习 java 设计模式
引言设计模式是软件开发的基石，但许多开发者面对23种模式时容易陷入“学完就忘”或“滥用模式”的困境。本文从工业级项目视角出发，精选10种高频设计模式，结合真实代码案例与主流框架应用，帮你建立模式思维，拒绝纸上谈兵。一、创建型模式：告别new的暴力美学1.工厂方法模式（FactoryMethod）核心痛点：对象创建逻辑散落各处，难以统一管理。场景案例：电商平台需要支持多种支付方式（支付宝、微信、银联
redis中什么是bigkey？会有什么影响？ Vic2334 redis
什么是bigkey？会有什么影响？bigkey是指key对应的value所占的内存空间比较大，例如一个字符串类型的value可以最大存到512MB，一个列表类型的value最多可以存储23-1个元素。如果按照数据结构来细分的话，一般分为字符串类型bigkey和非字符串类型bigkey。字符串类型：体现在单个value值很大，一般认为超过10KB就是bigkey，但这个值和具体的OPS相关。非字符串
2025年的RAG技术发展趋势与演进码农Q！云计算人工智能 ai agi 自然语言处理语言模型
本文将分享作为大模型应用创业者的经历与观察，讨论RAG技术和市场环境在2024年的变化。一、RAG技术的演进RAG（检索增强生成）由“检索”和“大模型生成”两部分组成，而检索之前的索引创建（如chunking、embedding等）是核心基础。我们早在2021年便通过Java技术栈实现了RAG的“RA”部分。2023年中，RAG概念突然走红，并迅速在企业应用中显示出更强的实用性。1.主流架构的变化
数字经济时代科技创业的巨大潜力
2025年3月，42岁的字节跳动创始人张一鸣以655亿美元身家成为中国新首富。这位"80后"企业家白手起家的故事，展现了数字经济时代科技创业的巨大潜力。本文将带您了解张一鸣的成功秘诀，分析网络安全行业的最新趋势，并为计算机专业学生提供实用建议。张一鸣的成功之道张一鸣的财富增长主要得益于字节跳动的全球化布局和技术创新。2024年上半年，公司营收达730亿美元，其中海外收入占比23%。旗下TikTok
jmeter的时间戳函数使用 flower_1111 代码 jmeter jmeter
原文：https://blog.csdn.net/jocleyn/article/details/834144331、__time：获取时间戳、格式化时间（1）、${__time(yyyy-MM-ddHH:mm:ss:SSS,time)}：格式化生成时间格式2018-10-2611:08:23:635（2）、${__time(,)}：默认该公式精确到毫秒级别，13位数1527822855323（3
编写文生视频提示词，制作抖音爆款视频才华横溢caozy 提示词生成人工智能 deepseek 文生视频
编写文生视频提示词，制作抖音爆款视频一、理解文生视频提示词1.1定义提示词1.1.1提示词与创作工具的关系1.1.2文生视频的功能1.2提示词的组成1.2.1主体（Subject）1.2.2动作（Action）1.2.3场景（Scene）1.2.4镜头语言（Cinematography）1.2.5光影效果（LightingandShadows）1.2.6氛围（MoodandAtmosphere）1
跨越十年的C++演进：C++20新特性全解析十年编程老舅 C++Linux后端 c++c++20 c++新特性 c++11 c++14 c++17 c++23
跨越十年的C++演进系列，分为5篇，本文为第四篇，后续会持续更新C++23~前3篇如下：跨越十年的C++演进：C++11新特性全解析跨越十年的C++演进：C++14新特性全解析跨越十年的C++演进：C++17新特性全解析C++20标准是C++语言的第四个正式标准，于2020年12月正式发布。首先先上C++20特性思维导图：接下来将从关键字、语法、宏、属性、弃用这5个类目来讲解~1、关键字1.1、c
SPGAN: Siamese projection Generative Adversarial Networks 这张生成的图像能检测吗优质GAN模型训练自己的数据集人工智能生成对抗网络计算机视觉深度学习神经网络算法
简介简介：该论文针对传统GANs中鉴别器采用硬边际分类导致的误分类问题，提出了基于Siameseprojection网络的SPGAN方法。主要创新点包括：（1）设计Siameseprojection网络来测量特征相似性；（2）提出相似特征对抗学习框架，将相似性测量融入生成器和鉴别器的损失函数；（3）通过相似特征对抗学习，鉴别器能最大化真实图像和生成图像特征的差异性，生成器能合成包含更多真实图像特征
debian 安装 mysql5.7 你会忘记吃饭吗 debian 运维
cd/usr/local/src:wgethttps://downloads.mysql.com/archives/get/p/23/file/mysql-server_5.7.29-1debian10_amd64.deb-bundle.tartar-xvfxx.tarcdxx:执行dpkg-imysql-community-client_5.7.29-1debian10_amd64.deb返回S
Python 生态发展之路仓颉编程语言技术文章 python
目录#Python是如何炼成的##生态系统持续扩张##Python开发的开源社区运作#更加广义的Python社区#广泛应用##Web开发、数据科学##不得不提的人工智能#支持Python成长的商业公司#Python成功之路小结##附：Python生态发展大事记#参考Python是现今最受欢迎的编程语言之一，2021年8月的TIOBE编程语言排行榜中，Python排名第二，仅次于C[1]。2017年
23种设计模式 buyue__ 设计模式
创建型模式1.单例模式(Singleton)：确保有且只有一个对象被创建2.工厂方法模式(FactoryMethod)：由子类决定要创建的具体类是哪一个3.抽象工厂模式(AbstractFactory)：允许客户创建对象的家族，而无需指定他们的具体类4.原型模式(Prototype)5.建造者模式(Builder)结构型模式1.适配器模式(Adapter)2.装饰器模式(Decorator)：包装
大四学生的前端实习记录
我的第一次实习经历吐槽一下:2022年2月23号在拉钩上投的某所的前端实习生的岗位，一面：24号安排的面试，25号面试完，面试官说回答的很不错。二面：奇葩的一批：发了个数据可视化的页面，让做出来这个静态页面的效果，给了三天，因为我以前做过这个，然后两天就做完了。发过去了。三面：更是奇葩，又让用vue脚手架写二面数据可视化的页面。无语至极，然后我两天之后交了，就不吱声了。当时我们班还有个女生也投的是
queryWapper的时间类型比较方法 Coder-thinking 数据库数据库 mybatis
QueryWrapper是MyBatis-Plus中的一个非常实用的工具类，它可以帮助我们构建更加灵活的查询条件。在QueryWrapper中，我们可以使用各种比较操作符来进行时间比较。以下是一些常用的时间比较操作：等于（eq）：queryWrapper.eq("create_time","2021-08-01");不等于（ne）：queryWrapper.ne("create_time","20
线性稳压电路：从理论到实践的全维度深度解析陆冠旭澪622 数学建模
摘要本文提出创新的"电源完整性四维分析法"，系统性地解构线性稳压器设计。通过建立量子-经典混合稳压模型，开发动态压差补偿算法和PSRR频率折叠技术，解决了纳米级工艺下的稳压挑战。包含12个设计黄金法则、23个跨领域应用案例和完整的验证方法论，为工程师提供从基础到前沿的全套解决方案。**关键词**：四维电源分析、量子稳压、自愈合LDO、动态热管理、光子-电子协同##1.量子化稳压理论###1.1载流
【零基础学AI】第36讲：GPT模型原理 1989 0基础学AI 人工智能 gpt lstm rnn YOLO 目标检测
本节课你将学到理解GPT模型的基本原理掌握Transformer解码器的工作机制实现一个简单的文本生成应用开始之前环境要求Python3.8+安装包：pipinstalltransformerstorch硬件：CPU即可运行（GPU可加速）前置知识了解基本的神经网络概念（第23讲内容）熟悉Python编程基础核心概念什么是GPT？GPT（GenerativePre-trainedTransform
算法题合并 K 个升序链表
LeetCode23.合并K个升序链表问题描述给定一个包含k个升序链表的数组，将这些链表合并为一个新的升序链表并返回。示例：输入:lists=[[1,4,5],[1,3,4],[2,6]]输出:[1,1,2,3,4,4,5,6]算法思路方法一：最小堆（优先队列）核心思想：使用最小堆维护当前所有链表头节点每次取出最小节点加入结果链表将该节点的下一个节点加入堆中步骤：初始化：将所有非空链表头节点入堆循
达摩院发布2022十大科技趋势！俺是一个也看不懂鸭！ xhmj12 人工智能网络大数据机器学习编程语言
上一篇：MVVM已过时？MVVM升级版：MVI架构来了来源|达摩院/阿里技术小伙伴们大家好。2021年12月28日，阿里巴巴达摩院发布了2022年的十大科技趋势预测(https://damo.alibaba.com/techtrends/2022)，作为一个打工人，俺也第一时间追了一波。虽说很多都看不懂，但是我想着多了解了解趋势和方向总是好的，所以咱们这里也分享一波。这次应该是达摩院连续第四年发
BEV开山之作Lift-Splat-Shot (LSS) 深度详解 shuaishuaideyuzi 3D视觉入门人工智能 python pytorch 3d 计算机视觉
在自动驾驶感知系统中，将多视角图像转换为鸟瞰图（BEV）是一个关键步骤。Lift-Splat-Shot（LSS）是一种高效的视角转换方法，能够将透视视图特征转换为BEV空间，从而实现更准确的3D物体检测。本文将详细解析LSS的工作原理、技术细节及其应用场景。一、LSS概述LSS（Lift-Splat-Shot）是由PhilippHenzler等人于2021年提出的一种用于自动驾驶感知系统的视角转换
Jasminer茉莉简析：元宇宙到底是什么？科技新观察区块链
元宇宙是2021年最热闹的话题之一，国内外各大互联网公司均已布局，Facebook更是宣布将公司改名为“Meta”。为何元宇宙会大火？下面一起来探究一下。到底什么是元宇宙“元宇宙（Metaverse）”这个概念最早来自尼奥·斯蒂文森写的科幻小说《雪崩（SnowCrash）》，小说这样写道：“现在，阿弘正朝着大街走去，那是元宇宙的百老汇，元宇宙的香榭丽舍大街…这条大街与真实世界唯一的差别就是，它并不
【氮化镓】低剂量率对GaN HEMT栅极漏电的影响北行黄金橘氮化镓器件可靠性 GaN HEMT 氮化镓可靠性辐照栅极漏电 γ射线辐照损伤
2024年2月22日，中国科学院新疆理化技术研究所的Li等人在《IEEEACCESS》期刊发表了题为《DegradationMechanismsofGateLeakageinGaN-BasedHEMTsatLowDoseRateIrradiation》的文章，基于实验分析和TCAD仿真，研究了低剂量率辐照下基于GaN的p型栅高电子迁移率晶体管（HEMTs）的栅漏电退化机制。实验采用60Coγ射线源
【氮化镓】p-GaN栅极退化的温度和结构相关性北行黄金橘氮化镓器件可靠性人工智能机器学习学习科学研究科技
论文总结：本文献深入研究了带有p-GaN栅极的正常关断型(normally-off)高电子迁移率晶体管(GaN-HEMTs)在恒定电压应力下的时序退化行为。通过直流特性分析和温度依赖性分析，研究了故障时间(TTF)与应力温度和器件几何结构的依赖性。结果显示，p-GaN栅极晶体管在7.2V的栅偏压下可达到20年的使用寿命，表明了良好的稳定性。故障时间与应力电压呈指数关系，且退化主要发生在栅极边缘而非
销售假冒注册商标商品罪的有效辩护上海王韧律师人工智能区块链智能合约 AI作画金融生活学习
销售假冒注册商标商品罪的有效辩护一、引言：随着2021年《刑法修正案（十一）》的生效，对销售假冒注册商标商品罪进行了调整，近几年也爆出多起重大售假案件，近期，团队正在接待和处理几起售假案件，也主要集中在一些奢侈品类的案件，我们结合过往辩护经验，对售假案件的辩护进行了总结。二、销售假冒注册商标商品罪的调整《刑法修正案（十一）》于2021年3月1日生效，对销售假冒注册商标的商品罪进行了调整，规定：“销
Chromium 引擎启用 Skia Graphite后性能飙升罗光记百度 facebook 数据库经验分享 oneapi
在一项被许多开发者关注的性能优化进展中，Chromium项目正逐步将其图形渲染后台从经典的Ganesh迁移至Skia新一代图形后端Graphite，而最新测试结果显示，这一举措带来了显著的性能提升。Skia是谷歌主导的跨平台2D图形库，长期以来一直是Chromium浏览器的核心组成部分。Ganesh是Skia的传统渲染后端，而Graphite是为现代GPU和图形API（如Vulkan和Metal）
【算法专题】双指针算法之18. 四数之和（力扣） CILMY23 算法专题算法 leetcode 双指针算法 c++四数之和
欢迎来到CILMY23的博客本篇主题为：双指针算法之18.四数之和（力扣）个人主页：CILMY23-CSDN博客系列专栏：Python|C++|C语言|数据结构与算法|贪心算法|Linux|算法专题|代码训练营感谢观看，支持的可以给个一键三连，点赞收藏+评论。如果你觉得有帮助，还可以点点关注题目：18.四数之和-力扣（LeetCode）给你一个由n个整数组成的数组nums，和一个目标值target
量子化学仿真软件：ORCA_（7）.密度泛函理论DFT计算 kkchenjj 化工仿真2 化工仿真模拟算法人工智能机器学习化工仿真
密度泛函理论DFT计算密度泛函理论（DensityFunctionalTheory,DFT）是量子化学中一种重要的方法，用于研究多电子系统的电子结构。DFT通过将电子密度作为基本变量，而不是波函数，大大简化了多电子系统的计算复杂度。在ORCA中，DFT计算是常用的计算方法之一，可以用于优化分子结构、计算电子密度、能级、振动频率等。1.基本概念1.1电子密度电子密度定义为单位体积内的电子数。在DFT
量子计算突破：8比特扩散模型实现指数级加速晨曦543210 人工智能
目录一、量子扩散模型（QuantumDiffusion）二、DNA存储生成（Biological-GAN）三、光子计算加速四、神经形态生成五、引力场渲染六、分子级生成七、星际生成网络八、元生成系统极限挑战方向一、量子扩散模型（QuantumDiffusion）量子线路模拟经典扩散过程fromqiskitimportQuantumCircuitfromqiskit_machine_learning.
AI让我焦虑，可有解药？大虫小呓人工智能 AIGC
被AI相关的信息搞焦虑了？这波以生成式人工智能为核心的生产力变革浪潮，从23年开始短短的两年时间里一浪接一浪的奔涌而来，从ChatGPT、AGI，到多模态大模型、Agent、Cursor，到DeepSeek、Manus，到近期的MCP协议、A2A协议等各种新概念、应用或工具的信息接连不断的往我们的脑子冲进来。就像被连续扇耳光，上一个还没反应过来下一个又来了，被扇得脑袋瓜子嗡嗡的！我发现一个普遍的现
全球人工智能与机器学习大会PPT a flying bird 论文解读和大咖技术号记录人工智能
大会演讲PPT合集https://ppt.infoq.cn/list/93PPT分享|ppt|人工智能|aicon|infoq|机器学习PPT分享,前段时间的AICon北京站2021全球人工智能与机器学习大会（https://aicon.infoq.cn/2021/beijing），汇集了很多业界大佬，工业界多个方向的从业人员分享了他们在实际业……https://xw.qq.com/cmsid/2
Java 17 新特性笔记笑衬人心。 JAVA学习笔记 java 笔记开发语言
Java17是一个长期支持版本（LTS），于2021年9月发布，是继Java11之后的重要里程碑。它整合了Java12~16的众多特性，并引入新的语言增强、JDKAPI改进、性能优化和安全增强。Java17版本信息发布时间：2021年9月类型：LTS（长期支持）前一个LTS：Java11JDK编号：JEP306~JEP412等官网文档：https://openjdk.org/projects/jd
Spring中@Value注解，需要注意的地方无量 spring bean @Value xml
Spring 3以后,支持@Value注解的方式获取properties文件中的配置值，简化了读取配置文件的复杂操作 1、在applicationContext.xml文件(或引用文件中)中配置properties文件 <bean id="appProperty" class="org.springframework.beans.fac
mongoDB 分片开窍的石头 mongodb
mongoDB的分片。要mongos查询数据时候先查询configsvr看数据在那台shard上，configsvr上边放的是metar信息，指的是那条数据在那个片上。由此可以看出mongo在做分片的时候咱们至少要有一个configsvr,和两个以上的shard（片）信息。第一步启动两台以上的mongo服务 &nb
OVER(PARTITION BY)函数用法 0624chenhong oracle
这篇写得很好，引自 http://www.cnblogs.com/lanzi/archive/2010/10/26/1861338.html OVER(PARTITION BY)函数用法 2010年10月26日 OVER(PARTITION BY)函数介绍开窗函数 &nb
Android开发中，ADB server didn't ACK 解决方法一炮送你回车库 Android开发
首先通知：凡是安装360、豌豆荚、腾讯管家的全部卸载，然后再尝试。一直没搞明白这个问题咋出现的，但今天看到一个方法，搞定了！原来是豌豆荚占用了 5037 端口导致。参见原文章：一个豌豆荚引发的血案——关于ADB server didn't ACK的问题简单来讲，首先将Windows任务进程中的豌豆荚干掉，如果还是不行，再继续按下列步骤排查。 &nb
canvas中的像素绘制问题换个号韩国红果果 JavaScript canvas
pixl的绘制，1.如果绘制点正处于相邻像素交叉线，绘制x像素的线宽，则从交叉线分别向前向后绘制x/2个像素，如果x/2是整数，则刚好填满x个像素，如果是小数，则先把整数格填满，再去绘制剩下的小数部分，绘制时，是将小数部分的颜色用来除以一个像素的宽度，颜色会变淡。所以要用整数坐标来画的话（即绘制点正处于相邻像素交叉线时），线宽必须是2的整数倍。否则会出现不饱满的像素。 2.如果绘制点为一个像素的
编码乱码问题灵静志远 java jvm jsp 编码
1、JVM中单个字符占用的字节长度跟编码方式有关，而默认编码方式又跟平台是一一对应的或说平台决定了默认字符编码方式；2、对于单个字符：ISO-8859-1单字节编码，GBK双字节编码，UTF-8三字节编码；因此中文平台(中文平台默认字符集编码GBK)下一个中文字符占2个字节，而英文平台(英文平台默认字符集编码Cp1252(类似于ISO-8859-1))。 3、getBytes()、getByte
java 求几个月后的日期 darkranger calendar getinstance
Date plandate = planDate.toDate(); SimpleDateFormat df = new SimpleDateFormat("yyyy-MM-dd"); Calendar cal = Calendar.getInstance(); cal.setTime(plandate); // 取得三个月后时间 cal.add(Calendar.M
数据库设计的三大范式（通俗易懂） aijuans 数据库复习
关系数据库中的关系必须满足一定的要求。满足不同程度要求的为不同范式。数据库的设计范式是数据库设计所需要满足的规范。只有理解数据库的设计范式，才能设计出高效率、优雅的数据库，否则可能会设计出错误的数据库. 目前，主要有六种范式：第一范式、第二范式、第三范式、BC范式、第四范式和第五范式。满足最低要求的叫第一范式，简称1NF。在第一范式基础上进一步满足一些要求的为第二范式，简称2NF。其余依此类推。
想学工作流怎么入手 atongyeye jbpm
工作流在工作中变得越来越重要，很多朋友想学工作流却不知如何入手。很多朋友习惯性的这看一点，那了解一点，既不系统，也容易半途而废。好比学武功，最好的办法是有一本武功秘籍。研究明白，则犹如打通任督二脉。系统学习工作流，很重要的一本书《JBPM工作流开发指南》。本人苦苦学习两个月，基本上可以解决大部分流程问题。整理一下学习思路，有兴趣的朋友可以参考下。 1 首先要
Context和SQLiteOpenHelper创建数据库百合不是茶 android Context创建数据库
一直以为安卓数据库的创建就是使用SQLiteOpenHelper创建,但是最近在android的一本书上看到了Context也可以创建数据库,下面我们一起分析这两种方式创建数据库的方式和区别,重点在SQLiteOpenHelper 一:SQLiteOpenHelper创建数据库: 1,SQLi
浅谈group by和distinct bijian1013 oracle 数据库 group by distinct
group by和distinct只了去重意义一样，但是group by应用范围更广泛些，如分组汇总或者从聚合函数里筛选数据等。譬如：统计每id数并且只显示数大于3 select id ,count(id) from ta
vi opertion 征客丶 mac opration vi
进入 command mode （命令行模式）按 esc 键再按 shift + 冒号注：以下命令中带 $ 【在命令行模式下进行】，不带 $ 【在非命令行模式下进行】一、文件操作 1.1、强制退出不保存 $ q! 1.2、保存 $ w 1.3、保存并退出 $ wq 1.4、刷新或重新加载已打开的文件 $ e 二、光标移动 2.1、跳到指定行数字
【Spark十四】深入Spark RDD第三部分RDD基本API bit1129 spark
对于K/V类型的RDD,如下操作是什么含义？ val rdd = sc.parallelize(List(("A",3),("C",6),("A",1),("B",5)) rdd.reduceByKey(_+_).collect reduceByKey在这里的操作，是把
java类加载机制 BlueSkator java 虚拟机
java类加载机制 1.java类加载器的树状结构引导类加载器 ^ | 扩展类加载器 ^ | 系统类加载器 java使用代理模式来完成类加载，java的类加载器也有类似于继承的关系，引导类是最顶层的加载器，它是所有类的根加载器，它负责加载java核心库。当一个类加载器接到装载类到虚拟机的请求时，通常会代理给父类加载器，若已经是根加载器了，就自己完成加载。虚拟机区分一个Cla
动态添加文本框 BreakingBad 文本框
<script> var num=1; function AddInput() { var str=""; str+="<input
读《研磨设计模式》-代码笔记-单例模式 bylijinnan java 设计模式
声明：本文只为方便我个人查阅和理解，详细的分析以及源代码请移步原作者的博客http://chjavach.iteye.com/ public class Singleton { } /* * 懒汉模式。注意，getInstance如果在多线程环境中调用，需要加上synchronized，否则存在线程不安全问题 */ class LazySingleton
iOS应用打包发布常见问题 chenhbc ios iOS发布 iOS上传 iOS打包
这个月公司安排我一个人做iOS客户端开发，由于急着用，我先发布一个版本，由于第一次发布iOS应用，期间出了不少问题，记录于此。 1、使用Application Loader 发布时报错：Communication error.please use diagnostic mode to check connectivity.you need to have outbound acc
工作流复杂拓扑结构处理新思路 comsci 设计模式工作算法企业应用 OO
我们走的设计路线和国外的产品不太一样，不一样在哪里呢？国外的流程的设计思路是通过事先定义一整套规则(类似XPDL)来约束和控制流程图的复杂度(我对国外的产品了解不够多，仅仅是在有限的了解程度上面提出这样的看法)，从而避免在流程引擎中处理这些复杂的图的问题，而我们却没有通过事先定义这样的复杂的规则来约束和降低用户自定义流程图的灵活性，这样一来，在引擎和流程流转控制这一个层面就会遇到很
oracle 11g新特性Flashback data archive daizj oracle
1. 什么是flashback data archive Flashback data archive是oracle 11g中引入的一个新特性。Flashback archive是一个新的数据库对象，用于存储一个或多表的历史数据。Flashback archive是一个逻辑对象，概念上类似于表空间。实际上flashback archive可以看作是存储一个或多个表的所有事务变化的逻辑空间。
多叉树:2-3-4树 dieslrae 树
平衡树多叉树,每个节点最多有4个子节点和3个数据项,2,3,4的含义是指一个节点可能含有的子节点的个数,效率比红黑树稍差.一般不允许出现重复关键字值.2-3-4树有以下特征: 1、有一个数据项的节点总是有2个子节点(称为2-节点) 2、有两个数据项的节点总是有3个子节点(称为3-节
C语言学习七动态分配 malloc的使用 dcj3sjt126com c language malloc
/* 2013年3月15日15:16:24 malloc 就memory(内存) allocate(分配)的缩写本程序没有实际含义，只是理解使用 */ # include <stdio.h> # include <malloc.h> int main(void) { int i = 5; //分配了4个字节静态分配 int * p
Objective-C编码规范[译] dcj3sjt126com 代码规范
原文链接 : The official raywenderlich.com Objective-C style guide 原文作者 : raywenderlich.com Team 译文出自 : raywenderlich.com Objective-C编码规范译者 : Sam Lau
0.性能优化-目录 frank1234 性能优化
从今天开始笔者陆续发表一些性能测试相关的文章，主要是对自己前段时间学习的总结，由于水平有限，性能测试领域很深，本人理解的也比较浅，欢迎各位大咖批评指正。主要内容包括：一、性能测试指标吞吐量、TPS、响应时间、负载、可扩展性、PV、思考时间 http://frank1234.iteye.com/blog/2180305 二、性能测试策略生产环境相同基准测试预热等 htt
Java父类取得子类传递的泛型参数Class类型 happyqing java 泛型父类子类 Class
import java.lang.reflect.ParameterizedType; import java.lang.reflect.Type; import org.junit.Test; abstract class BaseDao<T> { public void getType() { //Class<E> clazz =
跟我学SpringMVC目录汇总贴、PDF下载、源码下载 jinnianshilongnian springMVC
----广告-------------------------------------------------------------- 网站核心商详页开发掌握Java技术，掌握并发/异步工具使用，熟悉spring、ibatis框架；掌握数据库技术，表设计和索引优化，分库分表/读写分离；了解缓存技术，熟练使用如Redis/Memcached等主流技术；了解Ngin
the HTTP rewrite module requires the PCRE library 流浪鱼 rewrite
./configure: error: the HTTP rewrite module requires the PCRE library. 模块依赖性Nginx需要依赖下面3个包 1. gzip 模块需要 zlib 库 ( 下载: http://www.zlib.net/ ) 2. rewrite 模块需要 pcre 库 ( 下载: http://www.pcre.org/ ) 3. s
第12章 Ajax（中） onestopweb Ajax
index.html <!DOCTYPE html PUBLIC "-//W3C//DTD XHTML 1.0 Transitional//EN" "http://www.w3.org/TR/xhtml1/DTD/xhtml1-transitional.dtd"> <html xmlns="http://www.w3.org/
Optimize query with Query Stripping in Web Intelligence blueoxygen BO
http://wiki.sdn.sap.com/wiki/display/BOBJ/Optimize+query+with+Query+Stripping+in+Web+Intelligence and a very straightfoward video http://www.sdn.sap.com/irj/scn/events?rid=/library/uuid/40ec3a0c-936
Java开发者写SQL时常犯的10个错误 tomcat_oracle java sql
1、不用PreparedStatements 　　有意思的是，在JDBC出现了许多年后的今天，这个错误依然出现在博客、论坛和邮件列表中，即便要记住和理解它是一件很简单的事。开发者不使用PreparedStatements的原因可能有如下几个：　　他们对PreparedStatements不了解　　他们认为使用PreparedStatements太慢了　　他们认为写Prepar
世纪互联与结盟有感阿尔萨斯
10月10日，世纪互联与（Foxcon）签约成立合资公司，有感。全球电子制造业巨头（全球500强企业）与世纪互联共同看好IDC、云计算等业务在中国的增长空间，双方迅速果断出手，在资本层面上达成合作，此举体现了全球电子制造业巨头对世纪互联IDC业务的欣赏与信任，另一方面反映出世纪互联目前良好的运营状况与广阔的发展前景。众所周知，精于电子产品制造（世界第一），对于世纪互联而言，能够与结盟

2021李宏毅机器学习笔记--23 Theory behind GAN