iwill323

对抗生成网络（GAN）

基本概念介绍

生成器（generator）

为什么需要输出一个分布

Generative Adversarial Network (GAN)

discriminator（鉴别器）

GAN的基本思想

计算分布距离与训练

计算 Divergence靠 Discriminator 的力量

从Objective Function到JS divergence

使用其他的divergence

JS divergence存在的问题

PG和Pdata重叠的范围很小

重叠部分少导致的问题

Wasserstein distance

Wasserstein distance概念

Wasserstein distance好处

计算方法和WGAN

GAN is still challenging

GAN for Sequence Generation

Conditional Generation(CGAN)

cycle GAN

实现方式

应用

生成器效能评估

图片质量：使用分类判别

图像的多样性

Mode Collapse

Mode Dropping

Mode Collapse与Mode Dropping的区别

如何衡量生成图片的多样性

Frechet Inception Distance (FID)

We don’t want memory GAN

总结

基本概念介绍

生成器（generator）

区别于之前给定x输出y的神经网络，现在给神经网络的输入添加一个从简单分布（Simple Distribution）中采的 sample，生成一个复杂的满足特定分布规律的输出（Complex Distribution）

为什么需要输出一个分布

当我们的任务需要一点创造力的时候，一个输入有多种可能的输出，这些不同的输出都是对的，但又只需要输出一个对象，这时就需要使用generator，在网络中加入随机输入，让网络在复杂分布中随机选择一个对象输出（输出有几率的分布）。

Generative Adversarial Network (GAN)

GAN是众多generator中比较有代表性的一个，而GAN的种类也非常多，常常会出现重名的GAN和奇奇怪怪的GAN名字。

以unconditional generation（不考虑x，只考虑z）为例，假设Z是从一个normal distribution里采样出来的向量，通常会是一个low dimensional的向量，维度是你自己决定的，丢到generator裡面，输出一个非常高维的向量，希望是一个二次元人物的脸

discriminator（鉴别器）

Discriminator也是一个神经网络（可以考虑使用CNN、transformer等），可以将generator输出的图像转换成数字，越接近于1，说明图像越真实，品质越高。

GAN的基本思想

generator和discriminator是对抗关系，discriminator通过真实的图像来监督generator的图形生成，两者不断相互进化。

1、随机初始化generator和discriminator。

2、固定generator不变，更新discriminator。

将generator产生的图像和数据库样本比较，让discriminator分辨二者之间的差异，把二者区分开。具体地说，就是 real ones 经过 D，输出值大（接近 1），generator 产生的数据 (generated ones) 经过 D，输出值小（接近 0）。该训练可以当作分类的问题来做（把样本当作类别1，Generator產生的图片当作类别2），也可以当作regression的问题来做（样本对应输出1，generator產生的图形对应输出0）

3、固定discriminator不变，更新generator。

从gaussian distribution采样作為generator输入，產生一个图片，把这个图片丢到Discriminator裡面，Discriminator会给这个图片一个分数，Generator训练的目标是要Discriminator的输出值越大越好，说明产生的“假”数据让 discriminator 误认为是真的

4、不断循环上述过程，直至产生很好的图像

实际中可以把 generator 和 discriminator 组成一个大的网络结构，如下图所示，前几层为 generator，后几层为 discriminator，中间 hidden Layer 的输出就是 generator 的输出，更新generator的时候就只更改前面几层，而更新discriminator的时候就只更改后面几层。

Generator 或 Discriminator每次只有一个在训练。训练时，所掌握的是对方上一轮训练的信息。其实这就像是双方每一次交手后，知道对方最新的技术水平，然后回去提升自己。精妙，但是对训练过程提出了更高要求：如果其中一个训练过程中某几步loss上升，就会对另一个的训练会产生负面影响，后者又可能会对前者产生负面影响，恶性循环，导致训练“坏掉”。

计算分布距离与训练

GAN 的训练目标：从给定简单的 Normal Distribution 采样的数据，经过 Generator，得到的输出分布PG，使其接近目标分布Pdata。于是要计算PG与Pdata这两个分布之间的距离，用Divergence表征，找一个genenrator尽量使Divergence小。

问题在于我们无法知道PG和Pdata的分布。GAN 告诉我们，不需要知道 PG 跟Pdata的分布具体长什麼样子，只要能从 PG 和 Pdata这两个分布中采样，就有办法算 Divergence。

关于采样：从数据库裡面随机采样一些图片出来，就得到 Pdata；从 Normal Distribution 裡面采样向量丢给 Generator，让 Generator 產生一堆图片出来，那这些图片就是从 PG采样出来的结果

计算 Divergence靠 Discriminator 的力量

Discriminator训练目标是看到Pdata给一个较高的分数，看到PG给一个比较低的分数。这个 Optimization 的问题如下（要Maximize 的东西叫 Objective Function，如果 Minimize 就叫它 Loss Function）：

之所以写成这个样子，是因为在最开始设计时，希望在训练Discriminator时能够按照分类问题的方式考虑，事实上这个 Objective Function 就是 Cross Entropy 乘一个负号。Discriminator可以当做是一个分类器，它做的事情就是把从 Pdata 采样出来的真实 Image当作 Class 1，把从 PG 采样出来的假 Image当作 Class 2，训练这个 Binary Classifier 就等同於解了这一个 Optimization 的问题。

从Objective Function到JS divergence

(,)的最大值和JS divergence相关，详细的证明请参见 GAN 原始的 Paper。直观上也可以理解：如果Discriminator 很难分辨 PG 和 Pdata，没办法准确打分，那么Objective Function的最大值就比较小，所以小的 Divergence对应小的Max (,)，反之假如PG 和 Pdata的 divergence大，Discriminator 很容易就把两者分开了，得到的Max (,)大。

本来，Generator的目标是使PG 和 Pdata的 JS divergence 尽量小

卡在不知道怎麼计算 Divergence。现在因为maxV(D, G)与divergence有关，所以可以用maxV(D, G)代替Div(PG, Pdata)，这样就实现了不用了解PG和Pdata具体样貌即可计算divergence。
于是Generator的目标函数写成如下。

使用其他的divergence

改变objective function即V(D, G)就可以计算其他类型的divergence。这里有一篇文章https://arxiv.org/abs/1606.00709，会告诉你不同的divergence要怎样设计Objective Function

JS divergence存在的问题

PG和Pdata重叠的范围很小

大多数情况下，PG和Pdata重叠的范围很小。理由如下：

1、PG和Pdata在高维空间中时低维的形态

在高维空间裡面随便采样一个点，它通常都没有办法构成一个二次元人物的头像，所以二次元人物的头像的分布，在高维的空间中其实是非常狭窄的，除非PG 跟 Pdata 刚好重合，不然它们相交的范围几乎是可以忽略的

2、采样的数量可能不够多

也许 PG 跟 Pdata有非常大的 Overlap 的范围，但是在计算 PG和Pdata的 Divergence 的时候，从 Pdata和PG 裡面分布采样一些点出来，如果采样的点不够多、不够密，那么就算是这两个Distribution 实际上有重叠，对 Discriminator 来说，它也是没有重叠的

重叠部分少导致的问题

如果两个分布不重合，不管这两个分布长什麼样，他们计算出来的JS divergence永远都是log2，所以改变了generator之后，根本看不出generator有没有更好，永远无法进化generator。用 Binary Classifier当作 Discriminator，训练 GAN 的时候会发现，几乎每次训练完Discriminator 以后，正确率都是 100%。两组 Image 都是采样出来的，它硬背都可以得到100% 的正确率,

Wasserstein distance

Wasserstein distance概念

考虑换一种计算divergence的方法。把分布想象成一个小土堆，从土堆P 变换到土堆Q有很多种变换的方式，最小的平均移动距离(smallest average distance)就是Wasserstein distance

Wasserstein distance好处

假如我们能算出Wasserstein distance，与JS divergence相比，能看出改进之后的generator是否更好。这样，Generator 就可以根据结果来一点点提高。

计算方法和WGAN

WGAN就是用W distance取代JS distance的GAN

其中的D有限制条件：D必须要是一个 1-Lipschitz 的 Function，即D 不可以是变动很剧烈的 Function，必须要是一个足够平滑的 Function。

原因：W distance计算公式要求Pdata的 D(y) 越大越好，让 PG 的 D(y) 越小越好，所以在Pdata分布和PG分布没有任何重叠的地方，对于Pdata采样，Discriminator 会让D(y) = +∞，对于PG采样， Discriminator 会让D(y) = -∞，算出来的Maximum 值都是无限大，训练中学不到东西。1-Lipschitz限制条件让曲线要连续而不能剧烈变化，保证真实与生成之间的差异不太大，于是它们不会都跑到无限大。

其中的1-lipschitz是怎么实现的呢？有以下三种主要方式：

Train Network 的时候，参数要求在 C跟 -C 之间，用 Gradient Descent Update 后，如果超过 C，设為 C，小於 -C，就直接设為 -C。这个方法并不一定真的能够让 Discriminator变成 1-Lipschitz Function
Improved WGAN是指，从PG中取一个点，从Pdata中取一个点，两个点连线中间取一个点，让这个点的梯度为1，具体为什么这么做，见原始论文。
还有一种是谱归一化（Spectral Normalization）的方式，具体也是见原始论文

GAN is still challenging

虽然说已经有 WGAN，但GAN 的训练仍然不是一件容易的事情。Generator 跟 Discriminator是互相砥砺才能互相成长的，只要其中一者发生什麼问题停止训练，另外一者就会跟著停下训练。假设在训练Discriminator 的时候一下子没有训练好，Discriminator 没有办法分辨真的跟產生出来的图片的差异，那么 Generator就失去了可以进步的目标，没有办法再进步了。如果 Generator 没有办法再进步，它没有办法再產生更真实的图片，那么 Discriminator 就没有办法再跟著进步了。

训练过程中没有办法保证 Loss 就一定会下降，如果有一次没有下降，就会出现连锁反应，整个结构都不再改进。要让 Network训练起来，往往需要调一下 Hyperparameter

Train GAN 的诀窍有关的文献：

• Tips from Soumith

• https://github.com/soumith/ganhacks

• Tips in DCGAN: Guideline for network architecture design for image generation

• https://arxiv.org/abs/1511.06434

• Improved techniques for training GANs

• https://arxiv.org/abs/1606.03498

• Tips from BigGAN

• https://arxiv.org/abs/1809.11096

GAN for Sequence Generation

最难的是拿 GAN 来生成文字。如果要生成一段文字，可以把 Transformer 的 Decoder 部分看成是 GAN 的 Generator，生成的 sequence 送入 Discriminator 中判断是不是真的文字

真正的的难点在於，如果要用 Gradient Descent去训练Decoder，会发现loss 没办法做微分。

如果Decoder 的参数有一点小小的变化，那么它现在输出的这个 Distribution也会有小小的变化，Generator 的输出是取概率最大的那个Token（Token是產生一个句子的单位），会发现概率最大的那个 Token没有改变，那对 Discriminator 来说，它输出的就没有改变，所以没有办法算微分，也就没有办法做 Gradient Descent。

一篇 Paper 叫做 ScrachGAN，可以直接从随机的初始化参数开始Train 它的 Generator，然后让 Generator 產生文字，最关键的就是爆调 Hyperparameter,跟一大堆的 Tips

Conditional Generation(CGAN)

unconditional generation 产生的图片天马行空，可能不是我们想要的，所以要加入一些限制条件x，操控 Generator 的输出。

unconditional generation 是不需要标注的，这里的 conditional GAN 则需要一些标注，也就是说引入了有监督学习。这也好理解，既然对机器产生的数据有一定要求，肯定要有示例告诉机器应该怎么做。

以文字生成图片 (Text-to-image) 为例，Discriminator 的输入为带有标签的图片（paired image）。标签要有多样性，这样条件式生成器的效果才好。Discriminator 的训练目标是：输入为（文字，对应的训练图片）时，输出为 1；输入为（文字，生成的图片）时，输出为 0。除此之外，还需要一种 negative sample：（文字，不对应的训练图片），输出为 0。如下图所示：

更多应用例子：

1.Image translation (pix2pix)，比如：黑白到彩色，白天景物到夜景，轮廓素描到实物图。

例如：从建筑结构图到房屋照片的转换效果如下图所示，如果用 supervised learning，得到的图片很模糊，为什么？因为一个建筑结构图对应有多种房屋外形，Generator学到的就是把不同的可能平均起来，结果变成一个模糊的结果。如果用 GAN，机器有点自由发挥了，房屋左上角有一个烟囱或窗户的东西。而用 GAN+supervised，也就是 conditional GAN，生成的图片效果就很好。

2.sound-to image：从声音生成相应的图片，比如输入水声，生成溪流图片。

3.talking head generation：静态图转动态，让照片里的人物动起来。

cycle GAN

实际中，常常有大量未标注数据，怎么利用上这部分数据呢？有一个方法是 semi-supervised learning，只需要少量标注数据，未标注数据可以用模型标注 (pseudo label)。但是尽管是少量，还是要用标注数据来训练模型，否则模型效果不好，标注也不好。

有的时候连一点标注数据都没有，例如图像风格转换，假设我们有一些人脸图片，另外有一些动漫头像，两者没有对应关系，也就是 unpaired data，如下图所示。Cycle GAN 就是为了解决这个问题。

实现方式

与前面介绍的 GAN 不同，Cycle GAN 的输入不是从 Gaussian Distribution 采样，而是从 original data 采样，生成动漫头像图片，如下图所示：

如果我们完全只套用一般的GAN的做法，显然是不够的，因為discriminator只会鉴别y是不是二次元图片，训练出来的generator可以產生二次元人物的头像，但是跟输入的真实的照片没有什麼特别的关係。又不能用 conditional GAN 来做，因為在conditional GAN裡面是有成对的资料

Cycle GAN 增加了一个generator，把生成的动漫图片再变换到人物图片，训练使生成的人物图片与原图尽量接近，以此达到了原图和生成动漫头像的对应。怎麼让两张图片越接近越好呢？两张图片就是两个向量，这两个向量之间的距离越接近，两张图片就越像，叫做Cycle consistency

可能会有的一个问题就是，Cycle GAN只保证有一些关係，也许机器会学到很奇怪的转换（比如将图像左右翻转），反正只要第二个generator可以转得回来就好了，怎么确保这个关係是我们要的呢。目前没有什麼特别好的解法。但是在真实的实作上，即使没有用cycle的普通GAN，训练出来的结果也还是不错，输入跟输出往往非常像（因为模型很懒，不想改动太多）

此外，还可以反向训练，从动漫图片到人物图片，再到动漫图片，依然要让输入跟输出越接近越好。要训练一个discriminator，看一张图片像不像是真实人脸。训练 Cycle GAN 时可以两个方向同时训练。

Cycle GAN、Disco GAN、Dual GAN是一样的，不同研究团队在同一时间提出，因此有不同命名。

效果

应用

可以做影像风格转换的版本，叫做StarGAN，可以在多种风格间做转换

Text Style Transfer：把消极的文字都转换为积极的文字

有很多长的文章和另外一堆摘要，这些摘要不是这些长的文章的摘要，是不同的来源，让机器学习文字风格的转换，可以让机器学会把长的文章变成简短的摘要，让它学会怎麼精简的写作，把长的文章变成短的句子
unsupervised的翻译，收集一堆英文的句子，一堆中文的句子，没有任何成对的资料，用Cycle GAN做，机器学会把中文翻成英文

非督导式的语音辨识，机器只听了一堆声音，这些声音没有对应的文字，机器上网爬一堆文字,这些文字没有对应的声音，用Cycle GAN做，看看机器有没有办法把声音转成文字

生成器效能评估

对于监督学习，模型输出可以和 label 比对，而 Generator 生成的图片与原来的图片相似但不相同，怎么去判断呢

图片质量：使用分类判别

输入图片y，经过图片分类系统Classifier，得出一个概率分布P(c|y)，虽然我们不知道產生的图片裡面有什麼东西，但是如果概率分布集中在某个类别，说明 Classifier 对于输出的类别很确定，也许是比较接近真实的图片，所以Classifier才辨识得出来，也就是这张图片质量好。如果概率分布平均，说明Classifier 不太确定看到的图片属于哪个类别，Generator 生成的图片可能是一个四不像，质量不佳，故而Classifier 都认不出这是什么。

图像的多样性

Mode Collapse

只采用P(c|y)评估方法则会产生Mode Collapse问题，即生成的分布只学习到真实分布的很小一部分。当 Generator 產生可以骗过Discriminator图片以后，它就可以反复地生成这种图片来骗过Discriminator，最后发现生成的图片里面有很多同一张脸，只是有头发等细节的微小变化而已，造成了多样性的降低。

解决：在训练Generator的时候，一路上都会把Model的checkpoint 存下来，在 Mode Collapse 之前把训练停下来，然后就把之前的 Model 拿出来用

Mode Dropping

產生出来的资料只有真实资料的一部分，单纯看產生出来的资料，可能会觉得还不错，而且它的多样性也够，但真实的资料的多样性的分布其实是更大的。比如下图，人的多样性也有，但还是远小于实际上人的多样性，因为产生的人脸总是这么几十个人，每一个训练轮次之间只是有肤色等整体细节的细微差别而已。

Mode Collapse与Mode Dropping的区别

前者是针对一张图片而言的，generator针对一张真实图片反复生成能骗过discriminator的图片；后者是针对一堆图片而言，generator针对几十张真实图片反复生成能骗过discriminator的图片。但两者都是多样性问题。

如何衡量生成图片的多样性

每一张照片经过图片辨识系统后Classifier，会产生几率分布，也就是图片是属于哪一类。把一组 generated data 输入Classifier，将这些几率分布做平均，用P(y)表示。如果P(y)非常集中，就代表现在多样性不够，如果平均之后的分布平坦，表明图片的多样性足够了。

疑问：为什么前面 Quality of Image 说要概率分布集中在某个类别好，这里 Diversity 又说要概率分布均匀好，这不是互相矛盾吗？

看 Quality of Image 时，Classifier 的输入是一张图片。看 Diversity 时，Classifier 的输入是 Generater 生成的所有图片，对所有的输出取平均来衡量。

Inception Score (IS) 就是结合了 Quality of Image 和 Diversity。Quality 高，Diversity 大，对应的 IS 就大。

Frechet Inception Distance (FID)

而对于作业中的生成二次元人物头像图片，不能用 Inception Score，因为都是人脸图片，Classifier 都识别为一类，因此 Diveristy 不高。

用 Frechet Inception Distance (FID)。FID与IS的区别是，IS是采用图片分类的分布情况来评估，而FID不取最后的类别，而是取在决定这个类别之前的一个高维向量（即 Softmax 的输入）来评估。下图中的红点代表：真实图片的Hidden Layer输出，蓝点代表：生成图片的Hidden Layer
输出。假设这两个分布都是高斯分布，计算出两者之间的Frechet Distance就行了，越小越好

We don’t want memory GAN

有时生成图片的 Quality 和 FID 都不错，可是你看图片总觉得哪里不对，比如下图中第二行的图片：

和训练图片 (real data) 一对比，发现机器学到的是和训练图片一模一样。

应对方法：把 generated data 和 real data 计算相似度，看是不是一样。

新的问题：机器可能会学到把训练图片左右反转一下，如图中第三行图片所示，计算相似度是不同，其实还是原图片。

所以说，衡量 Generative Model 的好坏挺难的。https://arxiv.org/abs/1802.03446裡面列举了
二十几种GAN Generator 的评估的方式

总结

参考：

李宏毅机器学习笔记05 GAN - 知乎

李宏毅老师《机器学习》课程笔记-6 GAN - 知乎

Conditional Generation

你可能感兴趣的:(李宏毅深度学习笔记,1024程序员节)

【动手学深度学习】#1PyTorch基础操作 -一杯为品- 机器学习深度学习人工智能
主要参考学习资料：《动手学深度学习》阿斯顿·张等著【动手学深度学习PyTorch版】哔哩哔哩@跟李牧学AI目录1.1数据操作1.1.1入门1.1.2运算符1.1.3广播机制1.1.4索引和切片1.1.5节省内存1.1.6转换为其他Python对象1.2数据预处理1.2.1读取数据集1.2.2处理缺失值1.2.3转换为张量格式1.3线性代数1.3.1标量1.3.2向量1.3.3矩阵1.3.4张量1.
vue 父组件和子组件中v-model和props的使用和区别 zpjing~.~ vue.js 前端 javascript
一、v-model1、v-model可以在组件上使用以实现双向绑定。即父组件的值可以传递给子组件，子组件的值修改后，父组件的值会同步更新。从Vue3.4开始，推荐的实现方式是使用defineModel()宏；2、示例：最常用的使用方式：父组件的值，传值给子组件，子组件的input绑定了此字段，这样子组件input的内容修改时，父组件里的值便会同步更新，示例如下VueSFCPlayground父组件
【虚幻C++笔记】打印输出的方式 OSwich 虚幻C++笔记虚幻 c++笔记
目录UE_LOGGEngine->AddOnScreenDebugMessageUE_LOGUE_LOG宏是UnrealEngine中用于日志记录的标准方式。它可以输出日志信息到控制台和日志文件，支持多种日志级别（如Log，Warning，Error")UE_LOG(LogCategory,LogVerbosity,Format,...)voidAMyActor::BeginPlay(){Supe
【C语言开源库】lw_oopc：轻量级的C语言面向对象编程框架机载软件与适航 C语言 C/C++开源库 c语言
文章目录轻量级的面向对象C语言编程框架LW_OOPC介绍摘要s为什么要用面向对象?为什么不直接使用C++?LW_OOPC是什么?LW_OOPC宏介绍问题描述解决方案方案的可扩展性如何?LW_OOPC最佳实践LW_OOPC的优点LW_OOPC的缺点总结幕后花絮参考资料轻量级的面向对象C语言编程框架LW_OOPC介绍轻量级的面向对象C语言编程框架LW_OOPC介绍摘要s本文介绍一种轻量级的面向对象的C
VUE3中defineExpose的使用方法云隙阳光i vue.js javascript 前端
使用的组件是默认关闭的——即通过模板引用或者$parent链获取到的组件的公开实例，不会暴露任何在中声明的绑定。可以通过defineExpose编译器宏来显式指定在组件中要暴露出去的属性官网传送门在vue3的setup中，组件默认是关闭的，对一个子组件使用ref，不能获取任何在中声明的绑定。defineExpose是编译宏，用于显式地指定在组件中要暴露出去的属性。如下示例父组件import{ref
Deepseek 使用攻略隔窗听雨眠人工智能
人工智能飞速发展的时代，新的技术和工具不断涌现，Deepseek便是其中备受瞩目的存在。它以强大的功能和出色的表现，吸引了众多用户的关注。今天，就让我们一起来深入了解一下Deepseek究竟是什么，以及如何使用它。一、什么是DeepseekDeepseek（深度求索）是一家位于杭州的人工智能公司，同时也是一系列大语言模型的统称。它由中国对冲基金高毅资产创立并提供支持，其模型均以开源形式发布。Dee
提出机器人自主学习新范式，深大团队最新顶会论文，刷新6大复杂任务SOTA 量子位
关注前沿科技量子位让机器人轻松学习复杂技能有新框架了！深圳大学大数据系统计算技术国家工程实验室李坚强教授团队联合鹏城国家实验室、北京理工莫斯科大学，提出了奖励函数与策略协同进化框架ROSKA。在多个高维度机器人任务上，在仅使用89%训练样本的情况下，比现有SOTA方法平均性能提升95.3%。众所周知，随着机器人技术的快速发展，其应用已渗透至日常生活和工业生产场景。然而在多自由度机器人控制领域，传统
程序编译生成的文件石油人单挑所有 Linux系统编程算法
目录.i文件.s文件.o文件总结在C++编程中，.i、.s和.o文件是编译过程中生成的不同阶段的文件，它们代表不同的含义：.i文件全称：预处理后的文件（IntermediateFile）。含义：.i文件是源代码文件（如.cpp文件）经过预处理阶段生成的文件。预处理阶段主要处理源代码中的预处理指令，如#include、#define等。.i文件包含了经过预处理后的代码，即所有头文件被展开，宏被替换，
C语言可变参数/不定参函数无职转生真好看 c语言
一：不定参宏函数#defineLOG(fmt,...)printf("[%s,%d]"fmt,__FILE__,__LINE__,##__VA_ARGS__);//##是允许你不用%s，我注释的那句就是没有##的写法intmain(){printf("[%s,%d]:%s,%d\n",__FILE__,__LINE__,"加油",666);//LOG("%s","你好");LOG("你好");re
C语言：define定义常量和定义宏（详解）橘颂TA C语言 c语言开发语言
本篇博客给大家带来的是#define定义常量和#define定义宏的方法文章专栏：C语言若有问题评论区下讨论，我会及时回答❤❤欢迎大家点赞、收藏、分享你们的支持就是我创造的动力今日思想：本来就一无所有，何必瞻前顾后呢！1、预定义符号intmain(){printf("%s\n",__FILE__);//打印当前编译的源文件printf("%d\n",__LINE__);//代码的行号printf(
Python漂浮爱心代码 Want595 趣味编程 python 开发语言
目录系列文章前言小海龟漂浮爱心完整代码尾声系列文章序号直达链接表白系列1Python无法拒绝的表白界面（完整代码）_python玫瑰花雨编程-CSDN博客2Python满屏飘字表白代码（完整代码）_抖音同款满屏飘字表白代码(python版)-CSDN博客3Python无限弹窗满屏表白代码（完整代码）_python弹窗满屏幕-CSDN博客4Python李峋同款跳动的爱心（完整代码）_python绘制
SQLMesh 系列教程：解锁SQLMesh的宏与变量魔法梦想画家 #python 数据分析工程 sqlmesh 数据工程分析工程
在数据库流水线开发中，代码复用与动态配置是提升效率的核心诉求。SQLMesh以其独特的宏系统与用户定义变量机制，重新定义了SQL生成的灵活性。与传统模板引擎不同，SQLMesh的宏并非简单的字符串替换，而是基于语义理解的智能代码重构——通过sqlglot库解析SQL结构，结合Python逻辑处理能力，让用户能够以声明式语法实现复杂查询的动态组装。引言无论是全局配置、网关级参数还是模型内局部变量，S
C语言之宏和函数不为人知的那些事 strive-debug 算法 c语言
个人主页：strive-debug宏的补充https://blog.csdn.net/2401_85286030/article/details/146239880?spm=1001.2014.3001.5501宏定义注意事项-括号的重要性：在定义宏时，务必加上括号。这是因为在使用宏进行运算时，会涉及到运算符的优先级问题。如果不加括号，可能会得到意想不到的结果。例如：#defineDEFULL(n
Vim忍者速成秘卷：让你的键盘冒出残影の奥义 ivwdcwso 操作系统与云原生 vim 编辑器程序员忍道终端美学效率革命 linux
核心原理通过超低延迟配置+肌肉记忆优化+视觉欺骗技术，达成行云流水的操作体验。就像《火影忍者》结印般流畅！⚡残影生成术（基础篇）"️贴地飞行模式（.vimrc极速配置）settimeoutlen=300"快捷键响应时间压缩至300ms（武士刀级响应）setttyfast"激活终端极速传输模式setlazyredraw"执行宏时暂停界面刷新（性能提升50%）"手里剑光标追踪术autocmdCurso
信息学奥赛一本通 1395：烦人的幻灯片(slides) 第四章图论长春高老师编程信息学奥赛一本通-数据结构图论算法
1395：烦人的幻灯片(slides)时间限制:1000ms内存限制:65536KB【题目描述】李教授将于今天下午作一次非常重要的演讲。不幸的事他不是一个非常爱整洁的人，他把自己演讲要用的幻灯片随便堆在了一起。因此，演讲之前他不得不去整理这些幻灯片。作为一个讲求效率的学者，他希望尽可能简单地完成它。教授这次演讲一共要用n张幻灯片（nusingnamespacestd;structnode{intx
C语言中的可变参数宏（Variadic Macros）人才程序员杂谈 c语言服务器前端开发语言 c c++软件
文章目录C语言中的可变参数宏（VariadicMacros）1.什么是可变参数宏？可变参数宏的语法2.定义和使用可变参数宏2.1基本示例示例：一个简单的可变参数宏输出：3.可变参数宏的细节3.1`__VA_ARGS__`关键字示例：使用`__VA_ARGS__`输出：3.2`##`操作符与可变参数示例：使用`##`操作符4.可变参数宏的应用场景4.1日志和调试输出示例：实现一个日志宏输出：4.2动
windows 内核层简单 map 实现与测试爱学习的大牛123 windows驱动内核开发 map windows内核
KernelDataStructs.h#pragmaonce#pragmaonce#include//内存标签定义#defineKERNEL_MAP_TAG'KMap'#defineKERNEL_VECTOR_TAG'KVec'//安全内存分配宏#defineSAFE_ALLOC(ptr,size,tag)\(ptr)=ExAllocatePoolWithTag(NonPagedPoolNx,(s
VSCode配置C/C++环境 Redamancy_Xun 基本知识储备 vscode c语言 c++
VSCode配置C/C++环境推荐参考：vscode配置C/C++环境（超详细保姆级教学）_vscodec+±CSDN博客C/C++编译原理C和C++编译运行的过程通常包括以下几个主要步骤：预处理（Preprocessing）：编译器首先会处理源代码中的预处理指令（如#include、#define等）。包括导入头文件、宏替换、条件编译等操作。生成一个经过预处理的源代码文件（通常以.i或.ii为扩
大模型时代的数据智能新趋势｜章文嵩、蒋晓伟、李飞飞、张凯巅峰对谈 ProtonBase 大数据数据库系统人工智能
4月11日，由极客邦旗下InfoQ中国主办的QCon全球软件开发大会暨智能软件开发生态展在北京国测国际会议会展中心正式召开。主论坛压轴的圆桌对话环节，AutoMQ联合创始人&首席战略官章文嵩、ProtonBase研究员蒋晓伟、阿里云数据库产品事业部负责人李飞飞、蚂蚁集团AI安全商业化总经理张凯围绕“大模型时代的数据智能新趋势”主题展开了巅峰对谈。以下是对谈实录，经过不改变原意的整理和简化：1、AI
前部分知识复习01 太妃糖耶 unity
一、关于变体1.#pragmamulti_compileA2.#pragmashader_featureAUnity提供了两个关键字来定义宏multi_compile和shader_feature，Unity会根据宏定义来生成不同种类的shader，这些不同种类的shader就是所谓的变体。multi_compile的特点如下：1、会组合爆炸#pragmamulti_compileAB#pragm
动手深度学习笔记（二十九）5.5. 读写文件落花逐流水 pytorch实践 pytorch pytorch
动手深度学习笔记（二十九）5.5.读写文件5.深度学习计算5.5.读写文件5.5.1.加载和保存张量5.5.2.加载和保存模型参数5.5.3.小结5.5.4.练习5.深度学习计算5.5.读写文件到目前为止，我们讨论了如何处理数据，以及如何构建、训练和测试深度学习模型。然而，有时我们希望保存训练的模型，以备将来在各种环境中使用（比如在部署中进行预测）。此外，当运行一个耗时较长的训练过程时，最佳的做法
【C++】Operator Overloading bryant_meng C /C++c++开发语言运算符重载重载规则友元函数
《C++程序设计基础教程》——刘厚泉，李政伟，二零一三年九月版，学习笔记文章目录1、什么是运算符重载2、运算符重载规则3、运算符重载的实现形式3.1、重载为类的成员函数3.2、重载为友元函数4、应用实例更多有趣的代码示例，可参考【Programming】1、什么是运算符重载在C++中，运算符重载是一种允许程序员为用户定义的类型（如类和结构体）指定如何使用标准运算符（如+,-,*,/,==,>等）的
GDB使用总结 mzhan017 gcc gdb/coredump linux gdb
文章目录gdb版本信息建议环境变量问题gdb命令的参数--configuration--argskillset设置要调试的文件设置源码路径set还可以设置当前程序变量值如果第一个参数前没有选项-segdbthread类大小端问题调试.gdbinit加载.gdbinit失败设值汇编格式调试daemon程序设置参数dir技巧catchcatchsyscallptypeunionstruct如何查看宏定
基于Pytorch深度学习——Softmax回归 EchoToMe 深度学习 pytorch 回归 python
本文章来源于对李沐动手深度学习代码以及原理的理解，并且由于李沐老师的代码能力很强，以及视频中讲解代码的部分较少，所以这里将代码进行尽量逐行详细解释并且由于pytorch的语法有些小伙伴可能并不熟悉，所以我们会采用逐行解释+小实验的方式来给大家解释代码大家都知道二分类问题我们在机器学习里面使用到的是逻辑回归这个算法，但是针对于多分类问题，我们常用的是Softmax技术，大家不要被这个名字给迷惑了，s
AIGC视频生成模型：ByteDance的PixelDance模型好评笔记 AIGC 音视频机器学习人工智能深度学习计算机视觉 transformer
大家好，这里是好评笔记，公主号：Goodnote，专栏文章私信限时Free。本文详细介绍ByteDance的视频生成模型PixelDance，论文于2023年11月发布，模型上线于2024年9月，同时期上线的模型还有Seaweed（论文未发布）。热门专栏机器学习机器学习笔记合集深度学习深度学习笔记合集优质专栏回顾：机器学习笔记深度学习笔记多模态论文笔记AIGC—图像文章目录热门专栏机器学习深度学习
1.动手学习深度学习课程安排及深度学习数学基础 Unknown To Known 动手学习深度学习深度学习人工智能
视频资源B站：动手学习深度学习——李沐目录目标内容将学到什么1.N维数组样例2.访问2维数组元素3.数据操作4.线性代数5.矩阵计算6.自动求导目标介绍深度学习景点和最新模型LeNetAlexNetVGGResNetLSTMBERT…机器学习基础损失函数，目标函数，过拟合，优化实践使用pytorch实现介绍的知识点在真实数据上体验算法效果内容深度学习基础——线性神经网络，多层感知机卷积神经网络——
ROS实践（三）xacro文件基础（urdf扩展）简约少年 ROS 机器人 xacro
目录一、定义二、xacro文件常见组成部分1.命名空间声明2.定义宏3.调用宏4.定义参数5.条件语句6.转换xacro文件为urdf7.gazebo标签三、代码示例1.gazebo标签使用（仿真参数配置）2.引用仿真配置并定义机器人模型（结构）四、加载仿真模型（含传感器的机器人）1.编写launch文件。2.实际效果。一、定义通俗来说，xacro就是urdf文件的一种“进阶版”，它是用来简化和优
空间智能数据集（不定期更新）数据集
在人工智能领域的顶级会议NeurIPS上，斯坦福大学的杰出教授李飞飞发表了题为《FromSeeingtoDoing:AscendingtheLadderofVisualIntelligence》的主题演讲。在这次演讲中，李飞飞教授探讨了机器视觉的未来以及人工智能如何塑造我们的现实世界。她强调了空间智能的重要性，并将其视为全面智能的基石。李飞飞教授指出，解决空间智能问题是迈向全面智能的基础性、关键性
代理MS1861 宏晶微适用于各种视频显示和控制应用，提供了高性能的视频处理和显示控制功能提供样品+数据手册 li15817260414 宏晶微音视频图像处理信号处理
量子视讯提供宏晶微以下更多芯片：MS1820MS1823MS1824MS1825MS1826MS1826AMS1826BMS1830MS1835MS1836SMS1850MS1851MS1858EMS2100EMS2106MS2107MS2108MS2109MS2130MS2131MS3220MS7023MS7024MS7123MS7124MS7200MS7210MS9120MS9121MS912
2025精选VS经典：10款项目管理软件横评榜单
为什么90%的项目经理都在用错工具？深夜11点，项目经理李然盯着甘特图上交错的红色预警线，第6次推翻项目排期——这已是本季度因工具协作不畅导致的第3次交付延期。在敏捷开发成为主流的2025年，“工具选型偏差”正以每年23%的速度吞噬着企业效率（数据来源：PMI2025年行业报告）。作为操盘过金融、IT、制造业等全领域项目的战略官，我发现“工具适配度”比功能强大更重要。本文将用WBS（工作分解结构）
java观察者模式 3213213333332132 java 设计模式游戏观察者模式
观察者模式——顾名思义，就是一个对象观察另一个对象，当被观察的对象发生变化时，观察者也会跟着变化。在日常中，我们配java环境变量时，设置一个JAVAHOME变量,这就是被观察者，使用了JAVAHOME变量的对象都是观察者，一旦JAVAHOME的路径改动，其他的也会跟着改动。这样的例子很多，我想用小时候玩的老鹰捉小鸡游戏来简单的描绘观察者模式。老鹰会变成观察者，母鸡和小鸡是
TFS RESTful API 模拟上传测试 ronin47
TFS RESTful API 模拟上传测试。　　细节参看这里：https://github.com/alibaba/nginx-tfs/blob/master/TFS_RESTful_API.markdown 模拟POST上传一个图片： curl --data-binary @/opt/tfs.png http
PHP常用设计模式单例, 工厂, 观察者, 责任链, 装饰, 策略,适配,桥接模式 dcj3sjt126com 设计模式 PHP
// 多态, 在JAVA中是这样用的, 其实在PHP当中可以自然消除, 因为参数是动态的, 你传什么过来都可以, 不限制类型, 直接调用类的方法 abstract class Tiger { public abstract function climb(); } class XTiger extends Tiger { public function climb()
hibernate 171815164 Hibernate
main,save Configuration conf =new Configuration().configure(); SessionFactory sf=conf.buildSessionFactory(); Session sess=sf.openSession(); Transaction tx=sess.beginTransaction(); News a=new
Ant实例分析 g21121 ant
下面是一个Ant构建文件的实例，通过这个实例我们可以很清楚的理顺构建一个项目的顺序及依赖关系，从而编写出更加合理的构建文件。下面是build.xml的代码： <?xml version="1
[简单]工作记录_接口返回405原因 53873039oycg 工作
最近调接口时候一直报错，错误信息是: responseCode:405 responseMsg:Method Not Allowed 接口请求方式Post.
关于java.lang.ClassNotFoundException 和 java.lang.NoClassDefFoundError 的区别程序员是怎么炼成的
真正完成类的加载工作是通过调用 defineClass来实现的；而启动类的加载过程是通过调用 loadClass来实现的；就是类加载器分为加载和定义 protected Class<?> findClass(String name) throws ClassNotFoundExcept
JDBC学习笔记-JDBC详细的操作流程 aijuans jdbc
所有的JDBC应用程序都具有下面的基本流程：　　1、加载数据库驱动并建立到数据库的连接。　　2、执行SQL语句。　　3、处理结果。　　4、从数据库断开连接释放资源。下面我们就来仔细看一看每一个步骤：其实按照上面所说每个阶段都可得单独拿出来写成一个独立的类方法文件。共别的应用来调用。 1、加载数据库驱动并建立到数据库的连接： Html代码 St
rome创建rss antonyup_2006 tomcat cms xml struts Opera
引用 1.RSS标准 RSS标准比较混乱，主要有以下3个系列 RSS 0.9x / 2.0 : RSS技术诞生于1999年的网景公司(Netscape)，其发布了一个0.9版本的规范。2001年，RSS技术标准的发展工作被Userland Software公司的戴夫温那(Dave Winer)所接手。陆续发布了0.9x的系列版本。当W3C小组发布RSS 1.0后，Dave W
html表格和表单基础百合不是茶 html 表格表单 meta 锚点
第一次用html来写东西,感觉压力山大,每次看见别人发的都是比较牛逼的再看看自己什么都还不会, html是一种标记语言,其实很简单都是固定的格式 _----------------------------------------表格和表单表格是html的重要组成部分,表格用在body里面的主要用法如下; <table> &
ibatis如何传入完整的sql语句 bijian1013 java sql ibatis
ibatis如何传入完整的sql语句？进一步说，String str ="select * from test_table"，我想把str传入ibatis中执行，是传递整条sql语句。解决办法： <
精通Oracle10编程SQL(14)开发动态SQL bijian1013 oracle 数据库 plsql
/* *开发动态SQL */ --使用EXECUTE IMMEDIATE处理DDL操作 CREATE OR REPLACE PROCEDURE drop_table(table_name varchar2) is sql_statement varchar2(100); begin sql_statement:='DROP TABLE '||table_name;
【Linux命令】Linux工作中常用命令 bit1129 linux命令
不断的总结工作中常用的Linux命令 1.查看端口被哪个进程占用通过这个命令可以得到占用8085端口的进程号，然后通过ps -ef|grep 进程号得到进程的详细信息 netstat -anp | grep 8085 察看进程ID对应的进程占用的端口号 netstat -anp | grep 进程ID &
优秀网站和文档收集白糖_ 网站
集成 Flex, Spring, Hibernate 构建应用程序性能测试工具-JMeter Hmtl5-IOCN网站 Oracle精简版教程网站鸟哥的linux私房菜 Jetty中文文档 50个jquery必备代码片段 swfobject.js检测flash版本号工具
angular.extend boyitech AngularJS angular.extend AngularJS API
angular.extend 复制src对象中的属性去dst对象中. 支持多个src对象. 如果你不想改变一个对象，你可以把dst设为空对象{}: var object = angular.extend({}, object1, object2). 注意: angular.extend不支持递归复制. 使用方法: angular.extend(dst, src); 参数:
java-谷歌面试题-设计方便提取中数的数据结构 bylijinnan java
网上找了一下这道题的解答，但都是提供思路，没有提供具体实现。其中使用大小堆这个思路看似简单，但实现起来要考虑很多。以下分别用排序数组和大小堆来实现。使用大小堆： import java.util.Arrays; public class MedianInHeap { /** * 题目：设计方便提取中数的数据结构 * 设计一个数据结构，其中包含两个函数，1.插
ajaxFileUpload 针对 ie jquery 1.7+不能使用问题修复版本 Chen.H ajaxFileUpload ie6 ie7 ie8 ie9
jQuery.extend({ handleError: function( s, xhr, status, e ) { // If a local callback was specified, fire it if ( s.error ) { s.error.call( s.context || s, xhr, status, e ); }
[机器人制造原则]机器人的电池和存储器必须可以替换 comsci 制造
机器人的身体随时随地可能被外来力量所破坏,但是如果机器人的存储器和电池可以更换,那么这个机器人的思维和记忆力就可以保存下来,即使身体受到伤害,在把存储器取下来安装到一个新的身体上之后,原有的性格和能力都可以继续维持..... 另外,如果一
Oracle Multitable INSERT 的用法 daizj oracle
转载Oracle笔记-Multitable INSERT 的用法 http://blog.chinaunix.net/uid-8504518-id-3310531.html 一、Insert基础用法语法： Insert Into 表名 (字段1,字段2,字段3...） Values (值1,
专访黑客历史学家George Dyson datamachine on
20世纪最具威力的两项发明——核弹和计算机出自同一时代、同一群年青人。可是，与大名鼎鼎的曼哈顿计划（第二次世界大战中美国原子弹研究计划）相比，计算机的起源显得默默无闻。出身计算机世家的历史学家George Dyson在其新书《图灵大教堂》（Turing’s Cathedral）中讲述了阿兰·图灵、约翰·冯·诺依曼等一帮子天才小子创造计算机及预见计算机未来
小学6年级英语单词背诵第一课 dcj3sjt126com english word
always 总是 rice 水稻，米饭 before 在...之前 live 生活，居住 usual 通常的 early 早的 begin 开始 month 月份 year 年 last 最后的 east 东方的 high 高的 far 远的 window 窗户 world 世界 than 比...更
在线IT教育和在线IT高端教育 dcj3sjt126com 教育
codecademy http://www.codecademy.com codeschool https://www.codeschool.com teamtreehouse http://teamtreehouse.com lynda http://www.lynda.com/ Coursera https://www.coursera.
Struts2 xml校验框架所定义的校验文件蕃薯耀 Struts2 xml校验 Struts2 xml校验框架 Struts2校验
>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>> 蕃薯耀 2015年7月11日 15:54:59 星期六 http://fa
mac下安装rar和unrar命令 hanqunfeng mac
1.下载：http://www.rarlab.com/download.htm 选择 RAR 5.21 for Mac OS X 2.解压下载后的文件 tar -zxvf rarosx-5.2.1.tar 3.cd rar sudo install -c -o $USER unrar /bin #输入当前用户登录密码 sudo install -c -o $USER rar
三种将list转换为map的方法 jackyrong list
在本文中，介绍三种将list转换为map的方法： 1）传统方法假设有某个类如下 class Movie { private Integer rank; private String description; public Movie(Integer rank, String des
年轻程序员需要学习的5大经验 lampcy 工作 PHP 程序员
在过去的7年半时间里，我带过的软件实习生超过一打，也看到过数以百计的学生和毕业生的档案。我发现很多事情他们都需要学习。或许你会说，我说的不就是某种特定的技术、算法、数学，或者其他特定形式的知识吗？没错，这的确是需要学习的，但却并不是最重要的事情。他们需要学习的最重要的东西是“自我规范”。这些规范就是：尽可能地写出最简洁的代码；如果代码后期会因为改动而变得凌乱不堪就得重构；尽量删除没用的代码，并添加
评“女孩遭野蛮引产致终身不育 60万赔偿款1分未得”医腐深入骨髓 nannan408
先来看南方网的一则报道：再正常不过的结婚、生子，对于29岁的郑畅来说，却是一个永远也无法实现的梦想。从2010年到2015年，从24岁到29岁，一张张新旧不一的诊断书记录了她病情的同时，也清晰地记下了她人生的悲哀。　　粗暴手术让人发寒　　2010年7月，在酒店做服务员的郑畅发现自己怀孕了，可男朋友却联系不上。在没有和家人商量的情况下，她决定堕胎。　　12月5日，
使用jQuery为input输入框绑定回车键事件 VS 为a标签绑定click事件 Everyday都不同 jsp input 回车键绑定 click enter
假设如题所示的事件为同一个，必须先把该js函数抽离出来，该函数定义了监听的处理： function search() { //监听函数略...... } 为input框绑定回车事件，当用户在文本框中输入搜索关键字时，按回车键，即可触发search(): //回车绑定 $(".search").keydown(fun
EXT学习记录 tntxia ext
1. 准备（1）官网：http://www.sencha.com/ 里面有源代码和API文档下载。 EXT的域名已经从www.extjs.com改成了www.sencha.com ，但extjs这个域名会自动转到sencha上。（2）帮助文档：想要查看EXT的官方文档的话，可以去这里h
mybatis3的mapper文件报Referenced file contains errors xingguangsixian mybatis
最近使用mybatis.3.1.0时无意中碰到一个问题： The errors below were detected when validating the file "mybatis-3-mapper.dtd" via the file "account-mapper.xml". In most cases these errors can be d